nlp

江小皮不皮3 天前
人工智能·llm·nlp·aigc·sse·mcp·fastmcp
为何选择MCP?自建流程与Anthropic MCP的对比分析在当前的AI技术浪潮中,如何高效、可靠地让大型语言模型(LLM)与外部工具和服务进行交互,是一个核心议题。Anthropic提出的模型组件协议(Model Component Protocol, MCP)旨在为此提供一个标准化的解决方案。然而,一个关键问题随之而来:采用MCP与我们自行构建一套类似的工具调用流程,究竟有何本质区别?我们选择MCP的驱动力是什么? 本文将深入剖析这两者之间的异同,并探讨MCP背后的潜在意义。
zeroporn3 天前
macos·分类·数据挖掘·nlp·transformer·预训练模型·文本分类
在Mac M1/M2上使用Hugging Face Transformers进行中文文本分类(完整指南)随着Apple Silicon芯片(M1/M2)的普及,越来越多的开发者希望在Mac上运行深度学习任务。本文将详细介绍如何在Mac M1/M2设备上使用Hugging Face Transformers库进行中文文本分类任务,包括环境配置、数据处理、模型训练和性能优化等完整流程。
老朋友此林4 天前
人工智能·python·nlp
MiniMind:3块钱成本 + 2小时!训练自己的0.02B的大模型。minimind源码解读、MOE架构大家好,我是此林。目录1. 前言2. minimind模型源码解读1. MiniMind Config部分
老马啸西风4 天前
vue.js·ui·ai·nlp·github·word
sensitive-word-admin v2.0.0 全新 ui 版本发布!vue+前后端分离sensitive-word-admin 最初的定位是让大家知道如何使用 sensitive-word,所以开始想做个简单的例子。
Alfred king8 天前
llm·nlp·vllm部署
华为昇腾910B通过vllm部署InternVL3-8B教程本文主要借鉴:VLLM部署deepseek,结合自身进行整理auto-dl上选择单卡910B即可,Pytorch框架只有一个CANN版本选择,选这个即可。
io_T_T9 天前
python·nlp
(NLP)关键词提取之——TF-IDF解析概要tf-idf(英语:term frequency–inverse document frequency)是一种用于信息检索与文本挖掘的常用加权技术。tf-idf是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。tf-idf加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了tf-idf以外,互联网上的搜索引擎还会使用基于链接分析的评级方法,以确定文
John15915113 天前
gpt·llm·nlp·deepseek
#Paper Reading# DeepSeek-R1论文题目: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 论文地址: https://arxiv.org/pdf/2501.12948 论文发表于: arXiv 2025年1月 论文所属单位: DeepSeek
老马啸西风14 天前
人工智能·ai·nlp·中文分词·openai·deepseek·mcp
敏感词 v0.25.0 新特性之 wordCheck 策略支持用户自定义敏感词核心 https://github.com/houbb/sensitive-word敏感词控台 https://github.com/houbb/sensitive-word-admin
崔高杰18 天前
论文阅读·人工智能·笔记·语言模型·nlp
On the Biology of a Large Language Model——Claude团队的模型理解文章【论文阅读笔记】其二——数学计算部分这篇内容的源博文是 On the Biology of a Large Language Model 这是Anthropic,也就是Claude的团队的一遍技术博客。他的主要内容是用一种改良版的稀疏编码器来解释LLM在inference过程中内部语义特征的激活模式。因为原文太长,我把原文分成了几份来写阅读笔记。上一篇笔记可见: On the Biology of a Large Language Model——Claude团队的模型理解文章【论文阅读笔记】其一CLT与LLM知识推理
人月新话20 天前
nlp
AI翻译LangChain实现的一点思考在B站学习 图灵程序员-诸葛 的LangChain入门课程《深度定制本地工具》。在实践Chain.as_tool代码的时候,程序的运行逻辑让我困惑了好一会儿,写文章记录一下这个有趣的点。下面是代码,主要示意了如何构建自己的chain作为tool来用英语回答的问题。
uncle_ll23 天前
人工智能·自然语言处理·nlp·李宏毅·hmm
李宏毅NLP-6-seq2seq&HMM隐马尔可夫模型(HMM)在语音识别中的应用,具体内容如下:整体流程:公式推导:隐马尔可夫模型(HMM)在语音识别中对声学模型 P ( X ∣ Y ) P(X|Y) P(X∣Y) 的建模思路,通过引入状态序列 S S S简化建模过程,具体内容如下:
架构师那点事儿24 天前
人工智能·python·nlp
从字典到词频-NLP词向量演技解析本文章来源于:github.com/Zeb-D/my-re… ,请star 强力支持,你的支持,就是我的动力。
Q同学25 天前
llm·nlp·强化学习
字节ReTool:大模型也要学会善于利用工具尽管强化学习训练的推理模型在纯文本推理任务中表现突出,但在需要精确计算或符号操作的结构化问题上仍显不足。为此,本文提出 ReTool 框架,通过将实时代码执行与自然语言推理交叉集成,并采用结果驱动的强化学习策略,让模型自主学习何时、如何调用计算工具。训练过程分为两阶段:一是利用合成数据进行代码增强的监督微调,二是在沙箱环境中以任务正确性为奖励,迭代优化工具使用策略。在国际数学竞赛基准 AIME 上的实验显示,ReTool 在训练效率和最终准确率上均大幅领先于纯文本强化学习和多种竞争基线,并在模型中观察到诸
机器学习Zero1 个月前
人工智能·python·自然语言处理·nlp
自然语言处理(9)—— 共现词矩阵及Python实现共现词矩阵(Co-occurrence Matrix)是自然语言处理(NLP)中用于捕捉词语间语义关系的重要工具。共现矩阵通过统计词语在特定上下文窗口内的共现频率,揭示文本中词汇的关联性,并为关键词提取、词向量表示等任务提供支持。
uncle_ll1 个月前
人工智能·自然语言处理·nlp·语音识别·ctc
李宏毅NLP-4-语音识别part3-CTC基于连接主义时间分类(CTC)的语音识别架构,具体描述如下:该架构通过 CTC 解决语音帧与文本标签的对齐问题,适用于端到端的语音识别任务,特别是需要实时处理的流式场景。 介绍连接主义时间分类(CTC)的核心特性及处理规则:
Q同学1 个月前
llm·nlp·强化学习
OpenAI发布o3和o4-mini模型:全面工具访问的最强大模型几天前,OpenAI 发布了最新的o3和o4-mini模型,这些推理模型能够主动使用和结合ChatGPT内的所有工具(包括网页搜索、上传文件分析、使用Python分析数据、深入推理视觉输入,甚至生成图像)。这些模型经过训练,能够推理何时以及如何使用工具,以快速生成详细且深思熟虑的答案。o3和o4-mini在学术基准测试和实际任务中的表现大大增强,树立了智能性和实用性的新标准。
@程序员ALMJ1 个月前
nlp
自然语言处理(NLP)技术。自然语言处理(NLP)技术可以应用于多个领域,以下是一些示例:情感分析:NLP可以用来分析文本中包含的情感,帮助企业了解用户对他们产品或服务的感受。例如,社交媒体平台可以利用情感分析技术来监测用户对特定话题的情绪反馈。
終不似少年遊*1 个月前
人工智能·自然语言处理·大模型·nlp·transformer·注意力机制
【NLP解析】多头注意力+掩码机制+位置编码:Transformer三大核心技术详解目录多头注意力:让模型化身“多面手”技术细节:多头注意力如何计算?实际应用:多头注意力在Transformer中的威力