自然语言处理

努力毕业的小土博^_^2 小时前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
【AI课程领学】基于SmolVLM2与Qwen3的多模态模型拼接实践:从零构建视觉语言模型(一)【AI课程领学】基于SmolVLM2与Qwen3的多模态模型拼接实践:从零构建视觉语言模型(一)欢迎铁子们点赞、关注、收藏! 祝大家逢考必过!逢投必中!上岸上岸上岸!upupup
fishfuck3 小时前
人工智能·语言模型·自然语言处理
MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct多模态指令数据进化框架。该框架通过对精细化感知、认知推理和交互进化的有机结合进行迭代优化,从而生成更加复杂、多样的图文指令数据集,并显著提升 MLLM 的能力。
阿正的梦工坊12 小时前
人工智能·语言模型·自然语言处理
ProRL:延长强化学习训练,扩展大语言模型推理边界——NeurIPS 2025论文解读一段话总结: 这篇论文来自NVIDIA团队,标题是《ProRL:延长强化学习扩展大语言模型的推理边界》,发表于NeurIPS 2025。它直击当前AI热点:强化学习(RL)在提升语言模型推理能力时,到底是真正“解锁”新策略,还是只是优化了基础模型中已有的高奖励输出?作者挑战了后者的观点,认为过去研究训练太短、任务太窄。通过“ProRL”方法,他们证明了延长RL训练能让模型发现基础模型采样中完全缺失的新推理路径,甚至在某些任务上从0%成功率飙升到100%。他们开源了1.5B参数的Nemotron-Resea
MARS_AI_21 小时前
人工智能·自然语言处理·交互·信息与通信·agi
大模型呼叫技术:客服行业的智能化演进与云蝠实践呼叫中心产业正展现强大市场活力,到2025年,其产业价值规模预计将达到9528亿元人民币。随着信息通信技术快速发展和用户需求深刻变化,AI特别是大模型技术正成为行业转型升级的核心驱动力。
渡我白衣1 天前
人工智能·深度学习·神经网络·机器学习·计算机视觉·自然语言处理·语音识别
AI应用层革命(六)——智能体的伦理边界与法律框架:当机器开始“做决定”本文为《AI应用层革命》系列第六篇,延续前五篇对智能体自主演化、生命特征、社会结构变革的探讨。本篇将聚焦于一个更为紧迫且复杂的议题:当智能体具备自主决策能力时,我们该如何界定其伦理边界?又该如何构建一套适应智能文明的法律框架?
测试人社区-千羽1 天前
运维·人工智能·自然语言处理·分类·数据挖掘·自动化·ux
自动化缺陷修复的建议生成:赋能软件测试新范式随着DevOps和持续集成/持续部署(CI/CD)流程的普及,自动化测试已成为软件质量保障的核心环节。然而,自动化测试脚本自身的缺陷修复仍高度依赖人工分析,成为制约测试效率的关键瓶颈。本文基于当前自动化测试发展趋势,针对缺陷定位、根因分析和修复建议生成等关键环节,提出一套系统化的解决方案。
1024小神1 天前
人工智能·语言模型·自然语言处理
xcode也有了自己独有的Ai本地大语言模型支持了开启这个功能,就会提示需要下载一个2G的本地大语言模型,下载完成后重启xcode,写代码就会有提示。比如下面的示例:
无妄无望1 天前
人工智能·语言模型·自然语言处理
思维链:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models论文地址:思维链摘要 我们探讨了生成思维链——一系列中间推理步骤——如何显著提升大型语言模型执行复杂推理的能力。具体而言,我们展示了这种推理能力如何通过一种称为“思维链提示”的简单方法在足够大规模的语言模型中自然涌现。该方法在提示中提供少量思维链示例作为示范。
郭庆汝2 天前
人工智能·自然语言处理·命名实体识别
(九)自然语言处理笔记——命名实体的识别加载数据集,每一行至少包含一个汉字和一个标记,句子和句子之间是以空格进行分割项目代码下载地址:本项目使用的深度学习框架是Tensorflow-1.13cpu版本
海边夕阳20062 天前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·llm
【每天一个AI小知识】:什么是大语言模型(LLM)?目录一、小明的论文摘要风波:从故事说起二、大语言模型的基本概念2.1 什么是大语言模型?2.2 大语言模型的特点
这张生成的图像能检测吗2 天前
人工智能·自然语言处理·视觉语言模型·持续学习
(论文速读)MoE-Adapters++: 过动态混合专家适配器实现更有效的视觉语言模型的持续学习论文题目:MoE-Adapters++: Towards More Efficient Continual Learning of Vision-Language Models via Dynamic Mixture-of-Experts Adapters(通过动态混合专家适配器实现更有效的视觉语言模型的持续学习)
~~李木子~~2 天前
自然语言处理
法律RAG智能问答系统设计与实现摘 要:伴随时代的发展、科技的突破、人们的物质水平的提高,法律智能问答系统作为人工智能与法律领域的交叉应用,正逐渐成为法律服务领域的重要工具。本文设计并实现了一个基于检索增强生成(RAG)技术的法律智能问答系统,该系统能够处理多格式法律文档,实现高效的法律文档检索和智能问答功能。系统采用模块化架构设计,包括数据预处理模块、向量数据库构建模块、高性能检索系统、智能问答系统和多模态交互界面。实验结果表明,该系统能够提供准确、专业的法律回答,具有良好的性能和用户体验。
沃丰科技2 天前
人工智能·机器学习·自然语言处理
以全栈AI能力重塑智能客服服务效能在电商驱动全球商业的时代,企业服务正面临关键瓶颈:传统机器人虽能承接基础咨询,却陷入不能同时满足“效率、质量、成本”的困境—要么单点响应、要么应答机械、要么维护成本高。其核心在于传统机器人仅停留在“关键词匹配+固定流程”的浅层应用,难以应对复杂场景的动态需求。
hans汉斯2 天前
人工智能·深度学习·机器学习·语言模型·自然语言处理·机器人·匿名
【计算机科学与应用】预训练语言模型在日文文本难易度自动分类中的应用在日语教学过程中,选择难易度合适的日文文本作为教学材料有利于提高日语学习者的学习兴趣及效率。日语具有词汇量大、语法复杂等特征,对文本难易度分类提出了挑战。本文尝试采用多种基于神经网络的日语预训练语言模型,通过收集历年日本语能力测试真题以及模拟题作为数据集以训练日文文本难易度自动分类模型。实验结果表明,预训练语言模型在日文文本难易度自动分类任务上能够表现出较好的性能。基于预训练语言模型的日文文本难易度自动分类方法将为计算机辅助日语学习系统以及电子化教材开发等提供有力的技术保障。
亚里随笔2 天前
人工智能·语言模型·自然语言处理·llm·rl·agentic
推理语言模型训练策略的协同作用:预训练、中间训练与强化学习的交互机制近年来,强化学习技术在语言模型推理能力提升方面取得了显著进展,但后训练是否真正扩展了模型在预训练期间获得的推理能力仍存在争议。这项研究通过完全可控的实验框架,揭示了预训练、中间训练和强化学习后训练之间的因果贡献关系,为理解推理语言模型训练策略提供了重要基础。
海森大数据2 天前
人工智能·语言模型·自然语言处理
超越简单问答:SUPERChem基准揭示大语言模型化学深度推理的机遇与挑战随着以DeepSeek-R1为代表的大语言模型步入“深度思考”的新范式,人工智能在自然科学领域的探索正从表层信息检索迈向深层的复杂逻辑推理。然而,一个关键问题随之凸显:我们如何科学、精准地评估这些模型在专业科学领域,尤其是化学这门充满抽象概念与多步推演学科中的真实“理解力”?近日,北京大学跨学科团队发布的化学大模型基准SUPERChem,如同一把精心锻造的“尺规”,不仅系统测量了当前顶尖模型的化学推理高度,更深刻揭示了其与人类专业认知之间尚存的沟壑,为AI赋能科学研究的下一阶段指明了方向。
墨染星辰云水间2 天前
人工智能·语言模型·自然语言处理
Extracting Latent Steering Vectors from Pretrained Language Models论文地址:Extracting Latent Steering Vectors from Pretrained Language Models - ACL Anthology
Francek Chen2 天前
人工智能·pytorch·深度学习·自然语言处理
【自然语言处理】应用01:情感分析及数据集【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据分析、科学探索等领域都取得了很多成果。本专栏介绍基于PyTorch的深度学习算法实现
TracyCoder1232 天前
人工智能·语言模型·自然语言处理·n-gram·词嵌入·bag-of-words
语言模型基础技术的开端:N-Gram与Bag-of-words详解在自然语言处理(NLP)的发展历程中,基础语言模型是构建复杂任务的基石。无论是早期的文本分类、机器翻译,还是如今大模型的预训练,都能看到N-Gram模型和Bag-of-words词袋模型的影子。本文将从这两个经典模型出发,深入剖析其核心技术原理、相关支撑技术及适用场景,为理解更复杂的语言模型奠定基础。
LDG_AGI2 天前
人工智能·pytorch·分布式·深度学习·语言模型·自然语言处理·推荐算法
【推荐系统】深度学习训练框架(十六):模型并行——推荐系统的TorchRec和大语言模型的FSDP(Fully Sharded Data Parallel)TorchRec是PyTorch的领域库,专为大规模推荐系统设计。其核心是解决超大规模嵌入表在多GPU/多节点上的高效训练问题。