自然语言处理

TracyCoder12312 小时前
人工智能·自然语言处理·word2vec
词嵌入来龙去脉:One-hot、Word2Vec、GloVe、ELMo词嵌入(Word Embedding)是自然语言处理(NLP)中的一项核心技术,它将文本中的词语转换为低维实数向量,使得语义相近的词语在向量空间中距离相近。
dog25014 小时前
人工智能·语言模型·自然语言处理·高尔顿板
LLM(大语言模型)和高尔顿板先了解一下 高尔顿板,这是个展示中心极限定理的物理装置,这装置比代码更直观。我将大数定律和中心极限定理视作宇宙的根本规则,不禁用它们解释一切。
2401_8414956416 小时前
人工智能·python·自然语言处理·语音助手·翻译工具·自然语言理解·企业服务
【自然语言处理】自然语言理解:从技术基础到多元应用的全景探索目录一、引言二、自然语言理解的基础:语言的复杂性与技术挑战1. 语言结构的差异:从分词到词形变化2. 低资源语言的生存困境
阿杰学AI16 小时前
人工智能·ai·语言模型·自然语言处理·aigc·模型量化·ai-native
AI核心知识52——大语言模型之Model Quantization(简洁且通俗易懂版)模型量化 (Model Quantization) 是大语言模型落地应用中最实用、最接地气的技术。如果说预训练和微调是在打造一个“天才大脑”,那么量化就是给这个大脑做“瘦身手术”。
FF-Studio17 小时前
pytorch·自然语言处理·cuda·unsloth·rtx 50 series
解决 NVIDIA RTX 50 系列 (sm_120) 架构下的 PyTorch 与 Unsloth 依赖冲突发布日期: 2025年12月12日 分类: AI Infrastructure / LLM Training / Troubleshooting 关键词: NVIDIA RTX 5060 Ti, CUDA 13.1, PyTorch 2.9, Unsloth, Dependency Hell, Poetry
努力毕业的小土博^_^20 小时前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
【AI课程领学】基于SmolVLM2与Qwen3的多模态模型拼接实践:从零构建视觉语言模型(一)【AI课程领学】基于SmolVLM2与Qwen3的多模态模型拼接实践:从零构建视觉语言模型(一)欢迎铁子们点赞、关注、收藏! 祝大家逢考必过!逢投必中!上岸上岸上岸!upupup
fishfuck21 小时前
人工智能·语言模型·自然语言处理
MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct多模态指令数据进化框架。该框架通过对精细化感知、认知推理和交互进化的有机结合进行迭代优化,从而生成更加复杂、多样的图文指令数据集,并显著提升 MLLM 的能力。
阿正的梦工坊1 天前
人工智能·语言模型·自然语言处理
ProRL:延长强化学习训练,扩展大语言模型推理边界——NeurIPS 2025论文解读一段话总结: 这篇论文来自NVIDIA团队,标题是《ProRL:延长强化学习扩展大语言模型的推理边界》,发表于NeurIPS 2025。它直击当前AI热点:强化学习(RL)在提升语言模型推理能力时,到底是真正“解锁”新策略,还是只是优化了基础模型中已有的高奖励输出?作者挑战了后者的观点,认为过去研究训练太短、任务太窄。通过“ProRL”方法,他们证明了延长RL训练能让模型发现基础模型采样中完全缺失的新推理路径,甚至在某些任务上从0%成功率飙升到100%。他们开源了1.5B参数的Nemotron-Resea
MARS_AI_2 天前
人工智能·自然语言处理·交互·信息与通信·agi
大模型呼叫技术:客服行业的智能化演进与云蝠实践呼叫中心产业正展现强大市场活力,到2025年,其产业价值规模预计将达到9528亿元人民币。随着信息通信技术快速发展和用户需求深刻变化,AI特别是大模型技术正成为行业转型升级的核心驱动力。
渡我白衣2 天前
人工智能·深度学习·神经网络·机器学习·计算机视觉·自然语言处理·语音识别
AI应用层革命(六)——智能体的伦理边界与法律框架:当机器开始“做决定”本文为《AI应用层革命》系列第六篇,延续前五篇对智能体自主演化、生命特征、社会结构变革的探讨。本篇将聚焦于一个更为紧迫且复杂的议题:当智能体具备自主决策能力时,我们该如何界定其伦理边界?又该如何构建一套适应智能文明的法律框架?
测试人社区-千羽2 天前
运维·人工智能·自然语言处理·分类·数据挖掘·自动化·ux
自动化缺陷修复的建议生成:赋能软件测试新范式随着DevOps和持续集成/持续部署(CI/CD)流程的普及,自动化测试已成为软件质量保障的核心环节。然而,自动化测试脚本自身的缺陷修复仍高度依赖人工分析,成为制约测试效率的关键瓶颈。本文基于当前自动化测试发展趋势,针对缺陷定位、根因分析和修复建议生成等关键环节,提出一套系统化的解决方案。
1024小神2 天前
人工智能·语言模型·自然语言处理
xcode也有了自己独有的Ai本地大语言模型支持了开启这个功能,就会提示需要下载一个2G的本地大语言模型,下载完成后重启xcode,写代码就会有提示。比如下面的示例:
无妄无望2 天前
人工智能·语言模型·自然语言处理
思维链:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models论文地址:思维链摘要 我们探讨了生成思维链——一系列中间推理步骤——如何显著提升大型语言模型执行复杂推理的能力。具体而言,我们展示了这种推理能力如何通过一种称为“思维链提示”的简单方法在足够大规模的语言模型中自然涌现。该方法在提示中提供少量思维链示例作为示范。
郭庆汝3 天前
人工智能·自然语言处理·命名实体识别
(九)自然语言处理笔记——命名实体的识别加载数据集,每一行至少包含一个汉字和一个标记,句子和句子之间是以空格进行分割项目代码下载地址:本项目使用的深度学习框架是Tensorflow-1.13cpu版本
海边夕阳20063 天前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·llm
【每天一个AI小知识】:什么是大语言模型(LLM)?目录一、小明的论文摘要风波:从故事说起二、大语言模型的基本概念2.1 什么是大语言模型?2.2 大语言模型的特点
这张生成的图像能检测吗3 天前
人工智能·自然语言处理·视觉语言模型·持续学习
(论文速读)MoE-Adapters++: 过动态混合专家适配器实现更有效的视觉语言模型的持续学习论文题目:MoE-Adapters++: Towards More Efficient Continual Learning of Vision-Language Models via Dynamic Mixture-of-Experts Adapters(通过动态混合专家适配器实现更有效的视觉语言模型的持续学习)
~~李木子~~3 天前
自然语言处理
法律RAG智能问答系统设计与实现摘 要:伴随时代的发展、科技的突破、人们的物质水平的提高,法律智能问答系统作为人工智能与法律领域的交叉应用,正逐渐成为法律服务领域的重要工具。本文设计并实现了一个基于检索增强生成(RAG)技术的法律智能问答系统,该系统能够处理多格式法律文档,实现高效的法律文档检索和智能问答功能。系统采用模块化架构设计,包括数据预处理模块、向量数据库构建模块、高性能检索系统、智能问答系统和多模态交互界面。实验结果表明,该系统能够提供准确、专业的法律回答,具有良好的性能和用户体验。
沃丰科技3 天前
人工智能·机器学习·自然语言处理
以全栈AI能力重塑智能客服服务效能在电商驱动全球商业的时代,企业服务正面临关键瓶颈:传统机器人虽能承接基础咨询,却陷入不能同时满足“效率、质量、成本”的困境—要么单点响应、要么应答机械、要么维护成本高。其核心在于传统机器人仅停留在“关键词匹配+固定流程”的浅层应用,难以应对复杂场景的动态需求。
hans汉斯3 天前
人工智能·深度学习·机器学习·语言模型·自然语言处理·机器人·匿名
【计算机科学与应用】预训练语言模型在日文文本难易度自动分类中的应用在日语教学过程中,选择难易度合适的日文文本作为教学材料有利于提高日语学习者的学习兴趣及效率。日语具有词汇量大、语法复杂等特征,对文本难易度分类提出了挑战。本文尝试采用多种基于神经网络的日语预训练语言模型,通过收集历年日本语能力测试真题以及模拟题作为数据集以训练日文文本难易度自动分类模型。实验结果表明,预训练语言模型在日文文本难易度自动分类任务上能够表现出较好的性能。基于预训练语言模型的日文文本难易度自动分类方法将为计算机辅助日语学习系统以及电子化教材开发等提供有力的技术保障。
亚里随笔3 天前
人工智能·语言模型·自然语言处理·llm·rl·agentic
推理语言模型训练策略的协同作用:预训练、中间训练与强化学习的交互机制近年来,强化学习技术在语言模型推理能力提升方面取得了显著进展,但后训练是否真正扩展了模型在预训练期间获得的推理能力仍存在争议。这项研究通过完全可控的实验框架,揭示了预训练、中间训练和强化学习后训练之间的因果贡献关系,为理解推理语言模型训练策略提供了重要基础。