nlp

uncle_ll2 天前
人工智能·自然语言处理·nlp·李宏毅·hmm
李宏毅NLP-6-seq2seq&HMM隐马尔可夫模型(HMM)在语音识别中的应用,具体内容如下:整体流程:公式推导:隐马尔可夫模型(HMM)在语音识别中对声学模型 P ( X ∣ Y ) P(X|Y) P(X∣Y) 的建模思路,通过引入状态序列 S S S简化建模过程,具体内容如下:
架构师那点事儿3 天前
人工智能·python·nlp
从字典到词频-NLP词向量演技解析本文章来源于:github.com/Zeb-D/my-re… ,请star 强力支持,你的支持,就是我的动力。
Q同学4 天前
llm·nlp·强化学习
字节ReTool:大模型也要学会善于利用工具尽管强化学习训练的推理模型在纯文本推理任务中表现突出,但在需要精确计算或符号操作的结构化问题上仍显不足。为此,本文提出 ReTool 框架,通过将实时代码执行与自然语言推理交叉集成,并采用结果驱动的强化学习策略,让模型自主学习何时、如何调用计算工具。训练过程分为两阶段:一是利用合成数据进行代码增强的监督微调,二是在沙箱环境中以任务正确性为奖励,迭代优化工具使用策略。在国际数学竞赛基准 AIME 上的实验显示,ReTool 在训练效率和最终准确率上均大幅领先于纯文本强化学习和多种竞争基线,并在模型中观察到诸
机器学习Zero5 天前
人工智能·python·自然语言处理·nlp
自然语言处理(9)—— 共现词矩阵及Python实现共现词矩阵(Co-occurrence Matrix)是自然语言处理(NLP)中用于捕捉词语间语义关系的重要工具。共现矩阵通过统计词语在特定上下文窗口内的共现频率,揭示文本中词汇的关联性,并为关键词提取、词向量表示等任务提供支持。
uncle_ll6 天前
人工智能·自然语言处理·nlp·语音识别·ctc
李宏毅NLP-4-语音识别part3-CTC基于连接主义时间分类(CTC)的语音识别架构,具体描述如下:该架构通过 CTC 解决语音帧与文本标签的对齐问题,适用于端到端的语音识别任务,特别是需要实时处理的流式场景。 介绍连接主义时间分类(CTC)的核心特性及处理规则:
Q同学6 天前
llm·nlp·强化学习
OpenAI发布o3和o4-mini模型:全面工具访问的最强大模型几天前,OpenAI 发布了最新的o3和o4-mini模型,这些推理模型能够主动使用和结合ChatGPT内的所有工具(包括网页搜索、上传文件分析、使用Python分析数据、深入推理视觉输入,甚至生成图像)。这些模型经过训练,能够推理何时以及如何使用工具,以快速生成详细且深思熟虑的答案。o3和o4-mini在学术基准测试和实际任务中的表现大大增强,树立了智能性和实用性的新标准。
@程序员ALMJ8 天前
nlp
自然语言处理(NLP)技术。自然语言处理(NLP)技术可以应用于多个领域,以下是一些示例:情感分析:NLP可以用来分析文本中包含的情感,帮助企业了解用户对他们产品或服务的感受。例如,社交媒体平台可以利用情感分析技术来监测用户对特定话题的情绪反馈。
終不似少年遊*12 天前
人工智能·自然语言处理·大模型·nlp·transformer·注意力机制
【NLP解析】多头注意力+掩码机制+位置编码:Transformer三大核心技术详解目录多头注意力:让模型化身“多面手”技术细节:多头注意力如何计算?实际应用:多头注意力在Transformer中的威力
uncle_ll13 天前
人工智能·自然语言处理·nlp·语音识别·李宏毅
李宏毅NLP-2-语音识别part1这是一篇名为 “Speech Recognition is Difficult?”(语音识别很难吗? )的文章。作者是 J.R. Pierce,来自贝尔电话实验室(Bell Telephone Laboratories, Inc.) 。文中提到语音识别虽有吸引力,但仅具备某些条件是不够的。还将其吸引力类比为水变汽油、从海水中提取黄金、治愈癌症、登月等极具吸引力的设想 ,暗示语音识别虽诱人但并非易事。
崔高杰13 天前
论文阅读·人工智能·语言模型·nlp
LEARNING DYNAMICS OF LLM FINETUNING【论文阅读笔记】作者将LLM的学习动力机制拆解成AKG三项,并分别观察了SFT和DPO训练过程中正梯度信号和负梯度信号的变化及其带来的影响,并得到以下结论:
小马过河R14 天前
人工智能·深度学习·机器学习·语言模型·nlp
通俗理解CLIP模型如何实现图搜图乃至文搜图图搜图和文搜图的场景相信大家并不少见,比如度娘的搜索框就可以直接上传图片找到相似的图片,还有某宝某团都有这种上传图片匹配到相似商品或者商品页的推荐的功能。那比如我想搜一张“正在跳舞的狗”的图片,是不是就能搜出来呢? 我们可以看到搜是搜出来了,但是基本图片的标题都涵盖了关键字“跳舞”、“狗”等。那么问题来了,度娘的图片搜索用的是图片标签的关键词匹配还是深度学习的文搜图?这个小马目前也不得而知,但丝毫不影响今天的主题。
uncle_ll16 天前
人工智能·nlp·语音识别·asr
达摩院Paraformer-ONNX模型:一站式高精度中文语音识别工业级解决方案阿里达摩院推出的speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx模型,通过ONNX运行时优化,集语音端点检测、实时转写、标点恢复等核心功能于一体,为工业场景提供开箱即用的高并发语音识别服务。本文详解其技术优势与落地实践。
数据智能老司机17 天前
深度学习·llm·nlp
使用Python和PyTorch的生成式AI——文本生成方法的崛起在过去的几年里,自然语言处理(NLP)或文本数据处理在研究圈和特别是在工业界引起了广泛的关注。文本不仅仅是另一种非结构化的数据类型;它所代表的内容远远超过眼见的。文本数据是我们思想、理念、知识和交流的表现。
MARS_AI_17 天前
人工智能·自然语言处理·nlp·语音识别·信息与通信
AI 智能外呼系统的智能体现在当今数字化时代,AI 智能外呼系统凭借其强大的功能和显著的优势,正逐渐成为企业提升运营效率、优化客户服务的得力助手。那么,AI 智能外呼系统的智能究竟体现在哪些方面呢?本文将从技术原理、核心功能以及实际应用等多个角度进行剖析。
黎明鱼儿19 天前
docker·容器·大模型·nlp·xinference
基于 docker 的 Xinference 全流程部署指南Xorbits Inference (Xinference) 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理,并创建强大的 AI 应用。
Thomas_Cai19 天前
人工智能·深度学习·nlp·bert·transformer
Bert论文解析论文:https://arxiv.org/abs/1810.04805引入一种新的语言表示模型BERT,它源于Transformers的双向编码器表示。Bidirectional Encoder Representations from Transformers。
鲲志说21 天前
人工智能·nlp·aigc·paddlepaddle·飞桨·paddle·deepseek
本地化部署DeepSeek-R1蒸馏大模型:基于飞桨PaddleNLP 3.0的实战指南在大模型时代的浪潮中,开源框架与推理优化的深度融合,正推动人工智能从“可用”走向“高效可部署”。飞桨(PaddlePaddle)作为国内领先的自主深度学习平台,在3.0版本中重构了模型开发与部署链路,面向大模型时代提供了更智能的编译调度、更高效的资源利用与更统一的训推体验。
weixin_4352081622 天前
人工智能·python·算法·自然语言处理·面试·nlp·aigc
通过 Markdown 改进 RAG 文档处理作者:Tableau原文地址:https://zhuanlan.zhihu.com/p/29139791931