语言模型

Kakaxiii6 小时前
人工智能·语言模型·自然语言处理
【2025.8 npj】图检索增强的大型语言模型用于面部表型相关的罕见遗传疾病https://www.nature.com/articles/s41746-025-01955-x?error=cookies_not_supported&code=37605f54-d943-4353-8d5f-0f5253f44b3f#:~:text=In%20diagnostic%20tests%2C%20RAG%20LLMs,latter%20was%20unrecorded%20in%20FPKG
renhongxia114 小时前
人工智能·语言模型·自动化
从文本到仿真:多智能体大型语言模型(LLM)自动化化学工艺设计工作流程过程模拟是化工设计的核心基石。当前自动化化工设计方法主要集中于各类流程图的表达形式。然而,将这些图示转化为可执行的模拟流程图,仍是一项耗时费力的任务,需要在模拟软件中进行大量手动参数配置。
Kakaxiii15 小时前
人工智能·语言模型·知识图谱
【2024ACL】Mind Map :知识图谱激发大型语言模型中的思维图谱https://aclanthology.org/2024.acl-long.558/#:~:text=challenges%2C%20we%20propose%20a%20novel,LLMs%20and%20KGs%20for%20combined
___波子 Pro Max.15 小时前
人工智能·语言模型·自然语言处理
LLM大语言模型定义与核心特征解析LLM 是 “Large Language Model” 的缩写,中文译为“大语言模型”。简单来说:在书面表达中,需要根据语境来区分:
weixin_4374977717 小时前
人工智能·语言模型
部分LLM小参数模型特征汇总ollama网站模型(主要的 <3b 模型)特征汇总(2026.01采集)
AndrewHZ18 小时前
人工智能·语言模型·大模型·cpu·访存·计算逻辑
【AI黑话日日新】什么是访存bound?在后端高性能开发、算法性能调优、大数据处理等场景中,我们总会遇到一个共性问题:明明CPU配置很高,程序运行速度却始终上不去。
狮子座明仔18 小时前
人工智能·深度学习·学习·机器学习·语言模型
PRL:让大模型推理不再“开盲盒“——过程奖励学习的理论与实践论文标题: PRL: Process Reward Learning Improves LLMs’ Reasoning Ability and Broadens the Reasoning Boundary 作者: Jiarui Yao, Ruida Wang, Tong Zhang 机构: 伊利诺伊大学厄巴纳-香槟分校 (UIUC) 论文链接: https://arxiv.org/abs/2601.10201
博思云为18 小时前
人工智能·语言模型·云原生·数据挖掘·云计算·语音识别·aws
企业级智能PPT生成:Amazon云+AI驱动,全流程自动化提效PPT是企业业务沟通、数据呈现、对外展示的核心载体,但传统制作流程早已成为效率瓶颈:财务熬夜整合财报、市场耗时适配多区域推广、技术跨部门对接数据才能完成汇报……
莱昂纳多迪卡普利奥18 小时前
人工智能·语言模型·自然语言处理
LLM学习指南(四)—— 预训练语言模型(PLM)本章围绕Transformer架构衍生的三大主流PLM类型(Encoder-Only、Encoder-Decoder、Decoder-Only)展开,系统讲解各类型代表模型的架构设计、预训练任务、优化方向及发展历程,揭示现代大语言模型(LLM)的技术根基。
Swift社区18 小时前
人工智能·深度学习·语言模型
AI赋能智汇高校 - 从零掌握大模型本地部署与微调全流程大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。
Watermelo61719 小时前
javascript·数据结构·人工智能·语言模型·自然语言处理·数据挖掘·json
面向大模型开发:在项目中使用 TOON 的实践与流式处理目录面向大模型开发:在项目中使用 TOON 的实践与流式处理一、使用 npx 快速体验:将 JSON 转换为 TOON
renhongxia119 小时前
人工智能·信息可视化·语言模型·自然语言处理·数据分析·制造
数据可视化实战:用AI工具制作专业数据分析图表使用AI工具进行数据可视化并制作专业的数据分析图表,可以帮助你更好地理解数据、展示分析结果。以下是一些流行的工具和步骤指南,帮助你在实战中高效地创建美观且具有洞察力的图表。
gorgeous(๑>؂<๑)1 天前
人工智能·语言模型·自然语言处理
【电子科大-李晶晶组-AAAI26】利用专用提示引导泛化视觉 - 语言模型文章:Generalizing Vision-Language Models with Dedicated Prompt Guidance
程序员果子1 天前
人工智能·git·语言模型·aigc·知识图谱
GraphRAG:让大模型在知识图谱中精准导航目录第一部分:GraphRAG 基础认知1.1 什么是 GraphRAG?1.2 GraphRAG vs 传统 RAG:关键差异对比
可乐要加冰^-^2 天前
人工智能·语言模型·自然语言处理
RL for LLM(large language model)本文主要讲在LLM中RL的应用。合成数据与model collapse 在介绍LLM中RL的应用前,先来讲一下LLM中的一些问题和技巧; 1)介绍一下Nature调研正刊的文章; 这篇文章有兴趣大家可以去读一下,论文通过控制变量(是否包含真实数据):加10%的真实数据和完全使用合成数据的两组,分别在数据集上训练得到如下的结果: b组完全使用生成数据,c组添加10%的真实数据,可以从图中看出两组的表现从generation0-generation9,PPL都在降低,这是一个好的现象,b组的分布比c组的分布均
大模型最新论文速读2 天前
人工智能·深度学习·机器学习·语言模型·自然语言处理
ProFit: 屏蔽低概率 token,解决 SFT 过拟合问题大语言模型(LLM)在完成预训练后,通常需要通过监督微调(SFT)来适配特定的下游任务。然而,传统SFT存在一个被长期忽视的根本性问题:语言的 "一对多"特性与训练目标的 "一对一"强制对齐之间的矛盾。
yangpipi-2 天前
人工智能·语言模型·自然语言处理
第一章 语言模型基础历史:规则模式—》统计模型–》神经网络 规则模型(ELIZA 时代)的做法: 翻阅语法书 -> 查找“eat”是动词 -> 后面应该接名词 -> 查找食物列表 -> 随机填入“apple”。(即使填入“concrete(混凝土)”符合语法,但没意义)。 统计模型(N-gram 时代)的做法: 你完全不懂语法。你只是疯狂翻阅那本巨型账本,查找历史上大家说完 “I like to eat” 之后都接了什么词。
lizhenning872 天前
人工智能·语言模型·自然语言处理
语言模型与动词知识库协同创新近年来,基于端到端神经网络的深度学习方法在自然语言处理领域取得了显著成功,但大型语言模型(LLMs)暴露出的幻觉问题、缺乏可解释性和可控性等缺陷,促使研究者重新审视词汇知识库的重要性。特别是在医疗诊断、法律判决等高风险场景中,将知识库与LLMs结合使用被证明能有效弥补这些不足。这一趋势推动了计算词汇语义学领域对半自动和自动构建词汇知识库的研究热潮,其中动词知识库的构建尤为关键。
大模型任我行2 天前
人工智能·语言模型·自然语言处理·论文笔记
亚马逊:对话Agent轨迹学习框架WISE-Flow📖标题:WISE-Flow: Workflow-Induced Structured Experience for Self-Evolving Conversational Service Agents 🌐来源:arXiv, 2601.08158v1
码上掘金2 天前
人工智能·yolo·语言模型
基于YOLO和大语言模型的交通标识智能识别系统基于 YOLO 和 LLaVA 大模型的智能交通标识检测与分析平台代码获取:https://mbd.pub/o/bread/YZWamZ9pag==