自然语言处理

Kakaxiii1 小时前
人工智能·语言模型·自然语言处理
【2025.8 npj】图检索增强的大型语言模型用于面部表型相关的罕见遗传疾病https://www.nature.com/articles/s41746-025-01955-x?error=cookies_not_supported&code=37605f54-d943-4353-8d5f-0f5253f44b3f#:~:text=In%20diagnostic%20tests%2C%20RAG%20LLMs,latter%20was%20unrecorded%20in%20FPKG
数据分享者10 小时前
人工智能·自然语言处理·数据挖掘·easyui·新闻文本
新闻文本智能识别数据集:40587条高质量标注数据推动自然语言处理技术发展-新闻信息提取、舆情分析、媒体内容理解-机器学习模型训练-智能分类系统在当今信息爆炸的时代,新闻文本的自动识别与分类已成为自然语言处理领域的重要研究方向。一个高质量的新闻文本分类数据集对于推动新闻信息提取、舆情分析、媒体内容理解等应用具有重要价值。本数据集为新闻文本智能识别提供了强有力的数据支撑,包含了40,587条精心标注的新闻文本样本,涵盖Reuters官方新闻与非Reuters类型的文本内容,为机器学习模型训练提供了丰富而多样化的训练素材。
___波子 Pro Max.10 小时前
人工智能·语言模型·自然语言处理
LLM大语言模型定义与核心特征解析LLM 是 “Large Language Model” 的缩写,中文译为“大语言模型”。简单来说:在书面表达中,需要根据语境来区分:
goBivvhok12 小时前
自然语言处理
Ansys maxwell 变压器教学资料 包含 两套文件 1.全部基础功能的操作教学以及模型...Ansys maxwell 变压器教学资料 包含 两套文件 1.全部基础功能的操作教学以及模型文件 包含 静态场,涡流场,瞬态场,静电场等所有基础功能 步骤教学 2. 以正激变压器及平面pcb变压器为例 进行Pemag, maxwell, simplorer, icepak 对变压器进行参数设计,结构设计,电性仿真(感量,漏感,磁通密度,磁芯损耗,涡流损耗,寄生电容等),一步一步教学,并带模型文件
iwgh13 小时前
人工智能·自然语言处理·开源
开源全能意图、指令识别框架 OddAgent 更新上周四下午领导说公司的某个助手项目准备启用自研的备用方案,然后我的 OddAgent 项目就开始从备胎出现转机,有可能会成为正式方案了。
莱昂纳多迪卡普利奥13 小时前
人工智能·语言模型·自然语言处理
LLM学习指南(四)—— 预训练语言模型(PLM)本章围绕Transformer架构衍生的三大主流PLM类型(Encoder-Only、Encoder-Decoder、Decoder-Only)展开,系统讲解各类型代表模型的架构设计、预训练任务、优化方向及发展历程,揭示现代大语言模型(LLM)的技术根基。
二号小明14 小时前
人工智能·计算机视觉·自然语言处理·智能手机
AutoGLM-Phone 9B 端侧智能体:基于 vLLM 与 Docker 的云端部署与 ADB 联调指南AutoGLM-Phone 是智谱 AI 推出的端侧智能体模型,具备通过自然语言指令直接操作手机 GUI(图形用户界面)的能力。根据官方资料,它是一种基于图形用户界面(GUI)的自主任务完成智能体,能够模拟人类操作手机,执行社交媒体互动、在线购物、酒店预订等跨应用任务。
名为沙丁鱼的猫72914 小时前
人工智能·python·深度学习·机器学习·自然语言处理·nlp
【万文超详A2A 协议】从个体赋能到群体智能,智能体间的“TCP/IP协议“在 A2A 出现前,智能体协作面临三大核心痛点:🔴框架不兼容:LangGraph、CrewAI、Google ADK 等框架各自为战,智能体间缺乏统一通信接口;
2301_8002561114 小时前
自然语言处理
全球气候与环境变化考试知识点梳理(2)
Watermelo61714 小时前
javascript·数据结构·人工智能·语言模型·自然语言处理·数据挖掘·json
面向大模型开发:在项目中使用 TOON 的实践与流式处理目录面向大模型开发:在项目中使用 TOON 的实践与流式处理一、使用 npx 快速体验:将 JSON 转换为 TOON
renhongxia114 小时前
人工智能·信息可视化·语言模型·自然语言处理·数据分析·制造
数据可视化实战:用AI工具制作专业数据分析图表使用AI工具进行数据可视化并制作专业的数据分析图表,可以帮助你更好地理解数据、展示分析结果。以下是一些流行的工具和步骤指南,帮助你在实战中高效地创建美观且具有洞察力的图表。
gorgeous(๑>؂<๑)1 天前
人工智能·语言模型·自然语言处理
【电子科大-李晶晶组-AAAI26】利用专用提示引导泛化视觉 - 语言模型文章:Generalizing Vision-Language Models with Dedicated Prompt Guidance
清铎1 天前
前端·javascript·人工智能·深度学习·自然语言处理·easyui
大模型训练_week3_day15_Llama概念_《穷途末路》碎碎念:我翻山越岭,纵然这世间再也无人像你梳理llama架构,和transformer很像,新学到 embedding后的词向量RMSnorm,和qk矩阵融合的Rope旋转编码,SwiGLU激活函数,GQA分组查询注意力机制
可乐要加冰^-^1 天前
人工智能·语言模型·自然语言处理
RL for LLM(large language model)本文主要讲在LLM中RL的应用。合成数据与model collapse 在介绍LLM中RL的应用前,先来讲一下LLM中的一些问题和技巧; 1)介绍一下Nature调研正刊的文章; 这篇文章有兴趣大家可以去读一下,论文通过控制变量(是否包含真实数据):加10%的真实数据和完全使用合成数据的两组,分别在数据集上训练得到如下的结果: b组完全使用生成数据,c组添加10%的真实数据,可以从图中看出两组的表现从generation0-generation9,PPL都在降低,这是一个好的现象,b组的分布比c组的分布均
大模型最新论文速读1 天前
人工智能·深度学习·机器学习·语言模型·自然语言处理
ProFit: 屏蔽低概率 token,解决 SFT 过拟合问题大语言模型(LLM)在完成预训练后,通常需要通过监督微调(SFT)来适配特定的下游任务。然而,传统SFT存在一个被长期忽视的根本性问题:语言的 "一对多"特性与训练目标的 "一对一"强制对齐之间的矛盾。
yangpipi-1 天前
人工智能·语言模型·自然语言处理
第一章 语言模型基础历史:规则模式—》统计模型–》神经网络 规则模型(ELIZA 时代)的做法: 翻阅语法书 -> 查找“eat”是动词 -> 后面应该接名词 -> 查找食物列表 -> 随机填入“apple”。(即使填入“concrete(混凝土)”符合语法,但没意义)。 统计模型(N-gram 时代)的做法: 你完全不懂语法。你只是疯狂翻阅那本巨型账本,查找历史上大家说完 “I like to eat” 之后都接了什么词。
lizhenning871 天前
人工智能·语言模型·自然语言处理
语言模型与动词知识库协同创新近年来,基于端到端神经网络的深度学习方法在自然语言处理领域取得了显著成功,但大型语言模型(LLMs)暴露出的幻觉问题、缺乏可解释性和可控性等缺陷,促使研究者重新审视词汇知识库的重要性。特别是在医疗诊断、法律判决等高风险场景中,将知识库与LLMs结合使用被证明能有效弥补这些不足。这一趋势推动了计算词汇语义学领域对半自动和自动构建词汇知识库的研究热潮,其中动词知识库的构建尤为关键。
大模型任我行1 天前
人工智能·语言模型·自然语言处理·论文笔记
亚马逊:对话Agent轨迹学习框架WISE-Flow📖标题:WISE-Flow: Workflow-Induced Structured Experience for Self-Evolving Conversational Service Agents 🌐来源:arXiv, 2601.08158v1
蓝海星梦2 天前
人工智能·深度学习·自然语言处理·强化学习
【强化学习】深度解析 DAPO:从 GRPO 到 Decoupled Clip & Dynamic Sampling随着大规模语言模型(LLM)的发展,强化学习(RL)在提升模型推理能力方面发挥了重要作用,尤其在复杂任务如长链条推理(Long-CoT)中。然而,现有的强化学习方法(如PPO和GRPO)面临以下问题:
程序员:钧念2 天前
人工智能·python·深度学习·语言模型·自然语言处理·transformer·agent
深度学习与大语言模型LLM的区别这是一个展示 AI 技术演进层级的重要问题。简单来说:深度学习 (DL) 是“技术底座”,大语言模型 (LLM) 是基于这个底座造出来的“超级工程”。