大语言模型

一个处女座的程序猿12 小时前
大语言模型·缩放定律
LLMs:《Scaling Laws for Precision精度感知的缩放定律》翻译与解读LLMs:《Scaling Laws for Precision精度感知的缩放定律》翻译与解读导读:这篇论文研究了低精度训练和推理对大型语言模型(LLM)的影响。通过大量的实验,建立了精度感知型缩放定律,为低精度训练和推理提供了理论指导,并指出了现有实践中的一些潜在问题,例如盲目追求极低精度训练和过度训练带来的负面影响。 论文的贡献在于它系统地研究了精度、参数量和数据量之间的复杂相互作用,为未来的 LLM 训练和部署提供了重要的参考。
知来者逆19 小时前
人工智能·语言模型·自然语言处理·llm·大语言模型·生物制药
DrugLLM——利用大规模语言模型通过 Few-Shot 生成生物制药小分子小分子由于能够与特定的生物靶点结合并调节其功能,因此在药物发现领域发挥着至关重要的作用。根据美国食品和药物管理局(FDA)过去十年的审批记录,小分子药物占所有获批上市药物的 76%。小分子药物的特点是合成相对容易,生物利用度高,易于到达预定靶点。然而,设计具有理想特性的分子非常困难,需要耗费大量的资源和时间。例如,找到一种有效的药物需要 9-12 年的药物开发过程和数十亿美元。
mslion2 天前
人工智能·语言模型·自然语言处理·大语言模型·多模态
整理:4篇专注于多模态大语言模型(MLLM)的瘦身变体论文近年来,随着人工智能技术飞速发展,大语言模型(LLM)和多模态大语言模型(MLLM)成为了炙手可热的明星。它们不仅能处理文字,还能看图识字,简直是“全能选手”。这种能力得益于模型中加入的“视觉编码器”和“特征投影仪”,就好比给大脑装上了“眼睛”和“理解工具”。不过,模型越大,就越像个贪吃的怪兽,耗费大量资源,让使用它的人直呼“吃不消”。所以,如何让这些模型既聪明又省钱,成了大家绞尽脑汁的挑战。
youcans_2 天前
人工智能·计算机视觉·大语言模型·多模态·视觉模型
【微软:多模态基础模型】(4)统一视觉模型欢迎关注[【youcans的AGI学习笔记】](https://blog.csdn.net/youcans/category_12244543.html)原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微软:多模态基础模型】(4)统一视觉模型 【微软:多模态基础模型】(5)多模态大模型 【微软:多模态基础模型】(6)多模态代理
冻感糕人~3 天前
人工智能·程序人生·llm·问答系统·大语言模型·大模型微调·ragflow
利用RAGflow和LM Studio建立食品法规问答系统食品企业在管理标准、法规,特别是食品原料、特殊食品法规时,难以通过速查法规得到准确的结果。随着AI技术的发展,互联网上出现很多AI知识库的解决方案。
SpikeKing3 天前
人工智能·大语言模型·llama·参数量·qwen2-vl·多模态大语言模型·numel
LLM - 计算 多模态大语言模型 的参数量(Qwen2-VL、Llama-3.1) 教程欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/143749468
youcans_3 天前
人工智能·计算机视觉·大语言模型·多模态·视觉生成
【微软:多模态基础模型】(3)视觉生成欢迎关注【youcans的AGI学习笔记】原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微软:多模态基础模型】(4)统一视觉模型
youcans_3 天前
人工智能·计算机视觉·大模型·大语言模型·多模态
【微软:多模态基础模型】(1)从专家到通用助手欢迎关注【youcans的AGI学习笔记】原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微软:多模态基础模型】(4)统一视觉模型
AI小白龙*5 天前
人工智能·语言模型·程序员·架构·llm·大语言模型·ai大模型
AI工业大模型报告:体系架构、关键技术与典型应用研究意义随着新一代人工智能的发展, 大模型(如 GPT-4o 等)凭借大规模训练数据、网络参数和算 力涌现出强大的生成能力、泛化能力和自然交互能力, 展现出改变工业世界的巨大潜力. 尽管大模型 已在自然语言等多个领域取得突破性进展, 但其在工业应用中的探索仍处于初级阶段, 当前工业大模 型的系统性研究仍属空白. 工业应用中特有的异质数据模态、复杂多样的专业化场景、长流程的关 联性决策、以及对于可信性实时性的高要求, 使得通用大模型无法直接用于解决复杂的工业问题, 亟 需开展全新的工业大模型基础理论和关键技
冻感糕人~6 天前
人工智能·程序人生·金融·llm·大语言模型·ai大模型·大模型研究报告
大模型研究报告 | 2024年中国金融大模型产业发展洞察报告|附34页PDF文件下载随着生成算法、预训练模型、多模态数据分析等AI技术的聚集融合,AIGC技术的实践效用迎来了行业级大爆发。通用大模型技术的成熟推动了新一轮行业生产力变革,在投入提升与政策扶植的双重作用下,以大模型技术为底座、结合专业化金融能力的金融大模型产品应运而生。对此,《2024年中国金融大模型产业发展洞察报告》将关注国内金融大模型产业的发展情况,分析金融大模型结构特征与优势能力,预判未来的产业趋势及业务应用方向。同时,本篇报告优选国内金融大模型领域的头部企业,深度剖析其金融大模型产品力与实践能力,评选出TOP20金融
youcans_6 天前
人工智能·计算机视觉·大语言模型·多模态·视觉理解
【微软报告:多模态基础模型】(2)视觉理解欢迎关注【youcans的AGI学习笔记】原创作品 【微软报告:多模态基础模型】(1)从专家到通用助手 【微软报告:多模态基础模型】(2)视觉理解 【微软报告:多模态基础模型】(3)视觉生成
Just Jump7 天前
llm·大语言模型
大语言模型LLM综述基于统计学习方法,基本思想是基于马尔可夫假设HMM建立词概率预测模型。如n-gram语言模型基于神经网络来做词的分布式表示。如word2vec模型
deephub7 天前
人工智能·深度学习·大语言模型·moa
SMoA: 基于稀疏混合架构的大语言模型协同优化框架在大语言模型(LLM)快速发展的背景下,研究者们越来越关注如何通过多代理系统来增强模型性能。传统的多代理方法虽然避免了大规模再训练的需求,但仍面临着计算效率和思维多样性的挑战。本文提出的稀疏代理混合(Sparse Mixture-of-Agents, SMoA)框架,通过借鉴稀疏专家混合(Sparse Mixture-of-Experts, SMoE)的设计理念,有效解决了这些问题。
OpenBayes8 天前
人工智能·深度学习·机器学习·自然语言处理·开源·数据集·大语言模型
OpenBayes 一周速览丨VASP 教程上线!HPC 助力材料计算;AllClear 公共云层去除数据集发布,含超 23k 个全球分布的兴趣区域公共资源速递5 个数据集:* AFAD 亚洲面孔数据集* AllClear 公共云层去除数据集* MyAnimeList 热门动漫信息数据集
少喝冰美式8 天前
人工智能·程序人生·自然语言处理·大模型·大语言模型·计算机技术·大模型应用
大语言模型在序列推荐中的应用序列推荐技术通过分析用户的过往交互历史,能够有效挖掘出用户可能感兴趣的项目,对于提升各类应用的服务质量具有重要作用。近期,大语言模型(LLMs)的发展在应对复杂的推荐问题上展现出了显著的优势。不过,这种方法也面临一些挑战。本篇文章将重点探讨两项将大语言模型应用于序列推荐领域的相关研究。
AI_小站10 天前
人工智能·开源·prompt·大语言模型·产品经理·ai大模型·fastgpt
【AI开源项目】FastGPT - 快速部署FastGPT以及使用知识库的两种方式!在人工智能的浪潮中,生成式预训练变换器(GPT)正以其强大的文本生成能力引领潮流。今天,我们将深入探讨FastGPT,这一由FastAI团队开发的前沿大模型,了解其架构、应用场景以及与其他大模型的对比,帮助你更好地掌握这一技术的价值和应用。
知来者逆11 天前
人工智能·深度学习·神经网络·算法·自然语言处理·大语言模型
CelebV-Text——从文本生成人脸视频的数据集近年来,生成模型在根据文本生成和编辑视频方面受到了广泛关注。然而,由于缺乏合适的数据集,生成人脸视频领域仍然是一个挑战。特别是,生成的视频帧质量较低,与输入文本的相关性较弱。在本文中,我们通过开发 CelebV-Text来解决这些问题,CelebV-Text 是一个根据文本生成人脸视频的大型数据集。这是一个包含文本和视频对的大型高质量数据集。
企业通用软件开发12 天前
人工智能·chatgpt·大语言模型·提示词·模版
ChatGPT进阶:提示工程~读书笔记目录GPT常见的自然语言处理任务书中总结的常用的GPT应用场景及提示词模版1.文本摘要(Text Summarization)
SpikeKing13 天前
人工智能·llm·大语言模型·llama·环境配置·llamafactory·训练框架
LLM - 使用 LLaMA-Factory 微调大模型 环境配置与训练推理 教程 (1)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/143388189
我爱学Python!21 天前
人工智能·程序人生·语言模型·自然语言处理·llm·大语言模型·计算机技术
大语言模型(LLM)快速理解自2022年,ChatGPT发布之后,大语言模型(Large Language Model),简称LLM掀起了一波狂潮。作为学习理解LLM的开始,先来整体理解一下大语言模型。