nlp

AI技术控2 天前
人工智能·python·语言模型·自然语言处理·nlp
ReAct 论文解读:大模型 Agent 如何通过“推理 + 行动”完成复杂任务《ReAct: Synergizing Reasoning and Acting in Language Models》是 ICLR 2023 的一篇经典论文,也是理解大模型 Agent、工具调用、RAG 和外部环境交互时绕不开的一篇工作。
王_teacher5 天前
人工智能·gru·llm·nlp
GRU (Gated Recurrent Unit,门控循环单元) 原理详解 并且手写GRU模型GRU (Gated Recurrent Unit,门控循环单元) 是一种改进的循环神经网络(RNN),旨在解决传统 RNN 的梯度消失问题,并简化 LSTM 的复杂结构。
王_teacher5 天前
人工智能·llm·nlp·lstm
LSTM 原理详解手动编写LSTM模型代码b站手把手编写lstm模型普通 RNN 有长依赖遗忘问题: 序列很长时,梯度反向传播会梯度消失/梯度爆炸,RNN 记不住很早之前的信息,就像鱼的记忆只有7秒。 LSTM(长短期记忆网络) 就是为了解决:长序列记忆、梯度消失 问题,就像添加一个日记本,将记忆写到本子上。
Resistance丶未来6 天前
人工智能·ai·语言模型·自然语言处理·nlp·多模态大模型·ai工具
从零构建大语言模型:核心原理与实战落地在动手构建大语言模型之前,很多开发者往往被庞大的参数量和复杂的架构图劝退,觉得这必须是顶级实验室才能触碰的领域。但实际上,剥离掉工业级的工程外壳,大模型的核心骨架其实由几个清晰且优雅的数学模块组成。当你真正尝试从零开始,用几百行代码复现一个微型模型时,那种对“智能”如何从数据中涌现的理解,远比直接调用 API 来得深刻。
Jmayday6 天前
人工智能·rnn·深度学习·nlp
RNN案例之:人名分类器目录一、需求分析二、整体步骤三、代码实现四、模型预测五、总结1、背景关于人名分类问题:以一个人名为输入, 使用模型帮助我们判断它最有可能是来自哪一个国家的人名, 这在某些国际化公司的业务中具有重要意义, 在用户注册过程中, 会根据用户填写的名字直接给他分配可能的国家或地区选项, 以及该国家或地区的国旗, 限制手机号码位数等等.
Jmayday7 天前
人工智能·自然语言处理·nlp
NLP第三章:注意力机制目录一、注意力机制的由来以及解决的问题二、什么是注意力机制三、自注意力机制四、注意力机制规则五、什么是深度学习注意力机制
极光代码工作室10 天前
python·深度学习·自然语言处理·nlp
基于NLP的智能问答系统设计随着人工智能技术的快速发展,自然语言处理(NLP)在人机交互领域展现出巨大潜力。智能问答系统作为NLP的核心应用场景之一,正逐步从传统基于规则和检索的方法向深度学习驱动的端到端理解与生成范式演进。本文围绕“基于NLP的智能问答系统设计”这一主题,构建了一个融合语义匹配、意图识别与答案生成能力的轻量级企业知识库问答系统。系统采用BERT微调实现问题分类与语义相似度计算,结合BiLSTM-CRF完成实体识别,并基于T5模型实现结构化答案生成;前端采用Vue3+Element Plus构建响应式Web界面,后端
Resistance丶未来13 天前
python·大模型·nlp·github·copilot·claude·gemini
Agency-Agents 多智能体协作系统落地指南在实际的企业开发场景中,我们常常遇到这样的困境:一个复杂的业务需求摆在那里,单靠一个大模型往往顾此失彼,要么逻辑链条断裂,要么在处理长上下文时丢失关键信息。比如处理一个跨部门的客户投诉,既需要查询订单历史,又要核对库存状态,还得生成安抚话术并触发退款流程。传统的单体智能体架构在这种多线程、高并发且逻辑耦合度极高的任务面前,显得力不从心。这正是多智能体协作系统(Multi-Agent Systems)大显身手的时刻。通过将宏大的目标拆解为多个具备特定技能的“角色”,让它们像一支训练有素的特种部队一样协同作战
极光代码工作室15 天前
人工智能·深度学习·神经网络·nlp·情感分析
基于深度学习的微博情感分析系统随着社交媒体的迅猛发展,微博已成为中国最具影响力的公共舆论场之一,日均产生超5亿条文本数据。海量用户评论、热搜话题、突发事件讨论中蕴含丰富的情感倾向信息,对舆情监控、品牌口碑管理、政府决策支持及金融情绪预测具有重要价值。传统基于词典或机器学习的情感分析方法在处理微博短文本、网络新词、表情符号、反讽与隐喻等复杂语言现象时泛化能力弱、准确率低。本文设计并实现了一套端到端的微博情感分析系统,融合BERT预训练语言模型与BiLSTM-CRF序列建模能力,提出一种面向中文微博场景的双通道特征增强机制(语义通道+句法
小敬爱吃饭21 天前
人工智能·python·目标检测·自然语言处理·flask·nlp·知识图谱
知识图谱实战第一章:知识图谱全景解析其定义、技术演进与十大应用场景知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,成为建立大规模知识的杀手锏应用,在搜索、自然语言处理、智能助手、电子商务等领域发挥着重要作用。知识图谱与大数据、深度学习,这三大“秘密武器”已经成为推动互联网和人工智能发展的核心驱动力之一。
Hello未来22 天前
python·深度学习·语言模型·自然语言处理·nlp
llamafactory 的使用和安装Llamafactory已经出来很久了,自己也用了比较长的时间,一直想着写一遍博客用于记录,然后一直拖着(小声BB:主要还是懒了)以下内容用于个人使用的总结文档,感觉应该属于比较保姆级别的总结了,希望可以帮到需要的朋友。当然,也可以看下Llamafactory的GitHub链接,对应的GitHub中文文档,对应的官方推荐中文视频
user_admin_god1 个月前
java·人工智能·自然语言处理·nlp·idea
Opencode常见问题与优化排查本篇整理大家在使用AI编码工具的时候经常遇到的一些问题,如有补充。🔌确定安装成功后运行命令却找不到命令:优先安装目录是否真的存在下载的文件信息,然后就是配置环境变量。🔌
深圳市快瞳科技有限公司1 个月前
nlp·ocr
医保OCR与医保审核系统融合:智能校验规则设计与实现传统医保审核依赖人工录入、逐条核对,存在效率低、易出错、政策适配慢等核心痛点。本文聚焦医保OCR与医保审核系统的深度融合,详细讲解结构化信息抽取、配置化规则引擎、自动化校验逻辑的工程实现方案,内容兼顾理论与实战,可直接为医保审核数字化、智能化升级提供落地参考。
王_teacher1 个月前
人工智能·rnn·nlp
RNN 循环神经网络 计算过程(通俗+公式版+运行实例)RNN 的核心是对序列数据按时间步依次计算,每个时刻都复用同一套权重,并把上一时刻的状态传给下一时刻。
Luca_kill1 个月前
人工智能·python·机器学习·nlp·舆情监控
实战指南:用 Python + NLP 搭建一套轻量级 AI 舆情监控系统在信息爆炸的 2026 年,舆情风险已成为企业品牌管理的“头号杀手”。传统的关键词匹配早已无法应对多模态、碎片化的传播环境。作为一名技术负责人,如何快速构建一套具备情感分析、热点聚类和实时预警能力的 AI 舆情系统?本文将带你通过 Python 与主流 NLP 模型,落地一套工程化方案。
墨心@1 个月前
人工智能·自然语言处理·nlp·datawhale·cs336·组队学习
Byte-Pair Encoding (BPE) TokenizerUnicode是一种文本编码标准,它将字符映射到整数代码点。(2024年9月发布),该标准在168个脚本中定义了154,998个字符。(通常表示为U+0073,其中U+是常规前缀,0073是十六进制的115),字符“”的代码点为29275。在Python中,你可以使用ord()函数将单个Unicode字符转换为它的整数表示。chr()函数将整数Unicode码位转换为具有相应字符的字符串。
Shen Planck1 个月前
nlp·大语言模型·baai·语义相似度
BAAI/bge-m3部署磁盘不足?模型缓存清理操作指南你刚拉取完 BAAI/bge-m3 镜像,兴冲冲启动服务,准备测试语义相似度分析——结果系统突然报错:“No space left on device”? 或者更隐蔽些:WebUI能打开,但第一次点击“分析”就卡住十几秒,接着提示加载失败、内存溢出,甚至容器自动退出?
xcLeigh1 个月前
人工智能·ai·自然语言处理·重构·大模型·nlp·标书
AI标书底层技术全解析:NLP+大模型落地,喜鹊标书AI如何重构投标效率AI标书底层技术,本质是一套将招标文件解析、评分点映射、大纲生成、正文写作与合规审核串成自动化闭环的专业系统,由 OCR/NLP、行业大模型、RAG 知识库与规则引擎协同完成,替代资深投标专家的完整工作流。
华农DrLai1 个月前
数据库·人工智能·大模型·nlp·prompt
怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!