自然语言处理

MARS_AI_5 小时前
人工智能·自然语言处理·交互·信息与通信·agi
云蝠智能 VoiceAgent 2.0:全栈语音交互能力升级在人工智能语音交互技术日益成熟的今天,云蝠智能正式推出 VoiceAgent 2.0,标志着其在语音识别、情感合成、多模态交互、知识理解与生态整合等多个维度实现了跨越式升级。本次升级不仅是对技术细节的打磨,更是对“智能语音助手”这一角色在真实业务场景中价值的重新定义。VoiceAgent 2.0 旨在构建一个“听得懂、答得准、有情感、能协同、全链路”的语音智能体,为企业和个人用户提供更加自然、高效、可信的语音交互体验。
汗流浃背了吧,老弟!9 小时前
深度学习·语言模型·自然语言处理
预训练语言模型(Pre-trained Language Model, PLM)介绍预训练语言模型是自然语言处理(NLP)领域的里程碑技术,其核心思想是先在大规模无标注文本上进行通用语言知识学习(预训练阶段),再针对具体下游任务进行微调(微调阶段),实现“一次预训练,多任务复用”的高效开发模式。
余俊晖16 小时前
人工智能·算法·语言模型·自然语言处理·多模态
英伟达开源多模态视觉语言模型-Nemotron Nano V2 VL模型架构、训练方法、训练数据英伟达的技术报告一般细节都比较多,本次开源的12B的参数模型-Nemotron Nano V2 VL专为文档理解、长视频理解及推理任务而设计。下面来快速过一下。
小oo呆19 小时前
人工智能·自然语言处理
【自然语言处理与大模型】主题建模 Topic Modeling主题建模在干这样一件事:假设你收到了1000封没有标题、也没有分类的信件。这些信里有的在聊“健康饮食”,有的在讨论“股票投资”,有的在讲“旅游攻略”,还有的在吐槽“职场压力”……但你并不知道每封信具体属于哪一类话题。你的任务是:不靠人工阅读,而是让计算机自动帮你把这些信分成几类,并给每一类起个名字(比如“健康”、“理财”、“旅行”等)。这就是主题建模要解决的问题!
Chunyyyen1 天前
笔记·学习·自然语言处理
【第二十二周】自然语言处理的学习笔记06本周主要学习模型训练优化、核心技术优化以及轻量化模型。 模型训练优化主要通过对CPU 与 GPU 的核心差异以及内部数据流向的学习引入显卡部分内容,显卡部分主要学习了显卡显存的四大占用组成,多张显卡的五大协作算子。以及四种模型训练优化方式:数据并行,模型并行,ZeRO,流水线并行。 核心技术优化方案包括,混合精度训练,Offloading,计算重叠,检查点 + 重计算 轻量化模型本周只来得及学习知识蒸馏,通过知识蒸馏可以在教师模型的基础上对数据有深层的理解后再进行进一步的学习。
2401_841495642 天前
人工智能·深度学习·机器学习·自然语言处理·大语言模型·moe·混合专家模型
MoE算法深度解析:从理论架构到行业实践目录一、引言二、MoE算法的基础理论三、MoE算法的核心架构设计(一)专家网络的专业化分工(二)门控网络的动态路由机制
青云交2 天前
自然语言处理·迁移学习·跨境电商·元学习·少样本学习·java 大数据·医疗语义分析
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的少样本学习与迁移学习融合嘿,亲爱的 Java 和 大数据爱好者们,大家好!我是CSDN(全区域)四榜榜首青云交!当视线转向自然语言处理(NLP),医疗、跨境电商等领域正陷入 “数据冰川” 困境 —— 罕见病标注数据不足千条、小语种商品描述仅数百条,传统模型在这样的 “数据沙漠” 中举步维艰。
iamohenry2 天前
python·自然语言处理
古早味的心理咨询聊天机器人大模型大行其道的今天,我借鉴最早的计算机聊天程序Elisa,写了一个中文版的心理咨询程序。这个程序有什么优势呢?首先非常轻量化,只有三个文件,代码只有一个文件,很容易看懂(在deepseek的帮助下,不懂编程的人也可以看懂);其次,除了采用Elisa替换词,模式识别的方法以外,增加了情感识别,能够对来访者的情绪做简单的识别和处理;第三,整个咨询更有结构,采用了助人三阶段理论,按照探索->领悟->行动 模型来组织咨询,使得咨询更有层次;接下来,这个程序主要面向中文用户,对国人非常友好;最后,这个程序完全开源
汗流浃背了吧,老弟!3 天前
人工智能·语言模型·自然语言处理
语言模型(Language Model)介绍语言模型是自然语言处理(NLP)的基础技术,核心能力是判断文本的“合理性”并计算其成句概率。掌握某门语言的人能直观判断一句话是否“通顺”,比如“今天天气不错”符合语言逻辑,而“今错不天气天”完全无意义。语言模型正是将这种直觉转化为数学计算的工具。
野生面壁者章北海3 天前
人工智能·语言模型·自然语言处理
ICML2025|基于Logits的大语言模型端到端文本水印方法由澳门大学研究者联合完成的论文《An End-to-End Model for Logits-Based Large Language Models Watermarking》发表于2025年ICML国际机器学习大会。该研究针对当前大语言模型生成内容在版权溯源与真实性验证方面的难题,提出了一种创新性的端到端logits扰动水印模型。论文首次实现了编码器与解码器的联合优化,显著提升了水印检测的鲁棒性与文本质量之间的平衡。为解决端到端训练中的非可微问题,研究者提出了一种“在线提示”技术,使模型能够通过运行时大
野生面壁者章北海4 天前
人工智能·语言模型·自然语言处理
NeurIPS 2024|大语言模型高保真文本水印新范式由法国雷恩大学研究者联合完成的论文《WaterMax: Breaking the LLM Watermark Detectability–Robustness–Quality Trade-off》发表于2024年NeurIPS大会。该研究聚焦于大语言模型文本生成的可追溯性与版权保护难题,提出了一种全新的水印框架WaterMax,突破了以往检测性–鲁棒性–文本质量三者无法兼得的瓶颈。与现有通过修改 logits 或采样分布的方案不同,该方法完全不改变模型权重与采样机制,而是通过多候选文本生成与选择策略实现水
Francek Chen4 天前
人工智能·pytorch·深度学习·自然语言处理·子词嵌入
【自然语言处理】预训练06:子词嵌入【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据分析、科学探索等领域都取得了很多成果。本专栏介绍基于PyTorch的深度学习算法实现
Ma0407134 天前
人工智能·语言模型·自然语言处理
【论文阅读17】-LLM-TSFD:一种基于大型语言模型的工业时间序列人机回路故障诊断方法题目:Brain-Like Cognition-Driven Model Factory for IIoT Fault Diagnosis by Combining LLMs With Small Models
喜欢吃豆4 天前
人工智能·语言模型·自然语言处理·大模型·parquet
Parquet 范式:大语言模型训练数据格式优化的基础解析将数据格式转换为 Apache Parquet 并非一种随意的偏好,而是针对大规模数据处理(尤其是大语言模型 (LLM) 训练)的一项基础性能优化。Parquet 格式通过其列式存储架构,在 I/O 效率、存储成本和查询性能方面提供了数量级的提升。
电科_银尘4 天前
人工智能·语言模型·自然语言处理
【大语言模型】-- 私有化部署文章目录一、按交付形态 一体机 整机柜出厂即交付,插电即用 纯软件 仅授权模型+推理框架,客户自购服务器 私有化 SaaS 模型以容器/Helm 包交付,部署在客户私有 K8s 上
大千AI助手4 天前
人工智能·神经网络·自然语言处理·llm·prefix-tuning·大千ai助手·前缀微调
Prefix-Tuning:大语言模型的高效微调新范式本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
雾江流4 天前
人工智能·语言模型·自然语言处理·软件工程
RikkaHub 1.6.11 | 开源的本地大型语言模型聚合应用,支持多种AI服务提供商RikkaHub是一款专为Android设计的一体化AI助手应用。作为一款开源的本地大型语言模型聊天客户端,它让用户可以自由配置多种AI服务提供商(例如OpenAI、Anthropic、Google等),并支持文字、图片、文档等多种形式的输入。该应用不仅内置了Markdown渲染、Latex支持、代码高亮显示以及Mermaid流程图绘制等功能,还提供了诸如消息分支、Prompt变量设定、搜索引擎集成及角色卡导入等高级功能,极大地丰富了用户的对话与创作体验。
2401_841495644 天前
人工智能·python·自然语言处理·规则·文本·语言·句子边界检测算法
【自然语言处理】基于规则基句子边界检测算法目录一、引言二、核心类与初始化:RuleBasedSentenceSplitter三、辅助方法:规则判断的具体实现
leafff1235 天前
设计模式·自然语言处理·系统架构
一文读懂:如何选择适合的RAG系统架构设计模式?RAG(检索增强生成)系统核心架构模式可归为 4 类,核心逻辑是 “检索外部知识 + 生成式 AI 融合”,解决大模型知识滞后、事实不准确的问题。选择 RAG 架构模式的核心逻辑是 “需求优先级排序 + 资源约束匹配”,优先根据查询复杂度、知识库规模、精准度要求筛选,再结合开发成本、迭代需求最终确定。
蓝海星梦5 天前
论文阅读·人工智能·深度学习·自然语言处理·大型推理模型
【论文笔记】R-HORIZON:重塑长周期推理评估与训练范式原文链接:《R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth?》