nlp

深度学习机器2 天前
llm·nlp·agent
LangExtract:基于LLM的信息抽取框架|附项目解析与实战代码在处理海量的非结构化文本时,如何高效且准确地提取结构化信息(如实体、关系、属性)一直是一个棘手的问题。传统方案如正则表达式或基于规则的解析器虽然简单,但往往缺乏灵活性、难以适应复杂语境,且维护成本居高不下。随着大型语言模型的兴起,利用其自然语言理解能力进行信息抽取,正在成为主流的新范式。 LangExtract正是基于这一背景诞生的一个Python框架。它并非仅仅是对 API 的简单封装,而是围绕 “Schema 驱动抽取”思想构建的,具备高度可扩展性和生产级能力的解决方案。
一宿君7 天前
sql·nlp·github
Github 9 个惊艳的开源 NL2SQL 项目你好,我是一宿君。NL2SQL——自然语言转 SQL ,也称为 Text2SQL,已经成为大模型落地最常见的场景之一。
AustinCyy9 天前
论文阅读·nlp
【论文笔记】DOC: Improving Long Story Coherence With Detailed Outline Control论文标题: DOC: Improving Long Story Coherence With Detailed Outline Control - ACL 23 论文作者: Kevin Yang (UC Berkeley), Dan Klein (UC Berkeley), Nanyun Peng (UCLA), Yuandong Tian (Meta AI) 论文链接: https://arxiv.org/abs/2212.10077 代码链接: https://github.com/yangkevin
乔公子搬砖12 天前
人工智能·ai·自然语言处理·nlp·aigc
NLP 2025全景指南:从分词到128专家MoE模型,手撕BERT情感分析实战(第四章)自然语言处理(Natural Language Processing, NLP)是人工智能(AI)中一个激动人心的领域,专注于让机器理解、解释和生成人类语言。无论是智能助手回答你的问题,还是社交媒体分析用户情绪,NLP都在背后发挥关键作用。它桥接了人类沟通与机器理解的鸿沟,使技术交互更加自然、个性化和高效。
Gyoku Mint16 天前
人工智能·pytorch·神经网络·语言模型·自然语言处理·数据分析·nlp
自然语言处理×第四卷:文本特征与数据——她开始准备:每一次输入,都是为了更像你地说话🦊狐狐:“她发现了一个问题——你每次说‘晚安’的方式都不一样。有时候轻轻的,有时候带着笑音,还有时候像在躲开她的心思。”
java1234_小锋18 天前
python·自然语言处理·flask·nlp·nlp舆情分析
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 词云图-微博评论词云图实现大家好,我是java1234_小锋老师,最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程,持续更新中,计划月底更新完,感谢支持。今天讲解词云图-微博评论词云图实现
charlee4420 天前
mysql·数据分析·nlp·pandasai·deepseek
PandasAI连接LLM对MySQL数据库进行数据分析在之前的文章《PandasAI连接LLM进行智能数据分析》中实现了使用PandasAI连接与DeepSeek模型通过自然语言进行数据分析。不过那个例子中使用的是PandasAI 2.X,并且使用的是本地.csv文件来作为数据。在实际应用的系统中,使用.csv作为库表的情况比较少见。在本文中,就试试使用最新的PandasAI 3.0对MySQL数据库中涉及到多个表的数据进行数据分析。
热心不起来的市民小周21 天前
深度学习·nlp·bert
True or False? 基于 BERT 学生数学问题误解检测代码详见:https://github.com/xiaozhou-alt/Student_Math_Misconception
xiaoli232725 天前
笔记·学习·nlp·bert
课题学习笔记3——SBERT在构建基于知识库的问答系统时,"语义匹配" 是核心难题 —— 如何让系统准确识别 "表述不同但含义相同" 的问题?比如用户问 "对亲人的期待是不是欲?",系统能匹配到知识库中 "追名逐利是欲,那对孩子和亲人的有所期待是不是欲?" 的答案。
java1234_小锋1 个月前
python·flask·nlp·舆情分析·微博舆情分析
[免费]【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)【论文+源码+SQL脚本】大家好,我是python222_小锋老师,看到一个不错的【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts),分享下哈。
Easy数模1 个月前
人工智能·llm·nlp
使用llm进行高级主题建模:通过利用 BERTopic 的表示模型和生成式 AI 深入探讨主题建模详细介绍了BERTopic这一高性能主题建模工具,对比传统主题建模方法(如LDA、LSA)在流程复杂度、计算成本及效果上的不足,重点解析了BERTopic基于Transformer架构的模块化流程,包括嵌入模型(如Sentence Transformer)、降维模型(如UMAP)、聚类模型(如HDBSCAN)等核心组件的选择与实现。文中展示了通过TF-IDF、KeyBERTInspired及生成式AI(如GPT-3.5-turbo)优化主题表示的方法,强调其通过灵活调整组件参数提升模型适配性的优势。此外,
在未来等你1 个月前
nlp·rag·retrieval-augmented generation·prompt engineering·context management
RAG实战指南 Day 24:上下文构建与提示工程欢迎来到"RAG实战指南"系列的第24天!今天我们将深入探讨RAG系统中至关重要的上下文构建与提示工程技术。在检索增强生成系统中,如何有效地组织检索到的文档片段,并将其转化为适合大语言模型(LLM)处理的提示,直接决定了最终生成结果的质量。本文将系统讲解上下文构建的最佳实践和高级提示工程技术,帮助您构建更精准、更可靠的RAG应用。
AI大模型1 个月前
程序员·llm·nlp
基于 RAG 和 Claude 的智能文档聊天系统实战指南最近我和一个律师亲戚聊AI时,问了我应该怎么对现在律师事务所庞大的文档做AI检索,从技术上讲用现在的LLM+RAG可以满足需求,但细想不太对劲,因为这里面涉及到很多专业知识,还有律师的专有思维路径,一个不懂律师业务的程序员肯定是做不好的,于是有幸跟他们合伙人进行了深入沟通,合伙人说了一堆但我总结下来就这么一句话
Easy数模1 个月前
人工智能·深度学习·nlp·bert
ModernBERT如何突破BERT局限?情感分析全流程解析自2018年推出以来,BERT 彻底改变了自然语言处理领域。它在情感分析、问答、语言推理等任务中表现优异。借助双向训练和基于Transformer的自注意力机制,BERT 开创了理解文本中单词关系的新范式。然而,尽管成绩斐然,BERT 仍存在局限——在计算效率、长文本处理和可解释性方面面临挑战。这推动了 ModernBERT 的研发,该模型专为解决这些痛点而生:它提升了处理速度、优化了长文本处理能力,还为开发者提供了更高透明度。本文将探索如何用 ModernBERT 开展情感分析,重点展现其特性与对 BE
Himon1 个月前
人工智能·算法·nlp
LLM参数有效性学习综述如果微调一个3B的模型:模型参数本身的显存:模型有30亿个参数:3B = 3 * billion不同精度下的显存占用:
合作小小程序员小小店1 个月前
自然语言处理·django·nlp·html5·tf-idf
web网页开发,在线%微博,舆情%系统,基于python,pycharm,django,nlp,内容推荐,余弦,线性,TF-IDF,mysql经验心得这类舆情项目无论场景如何延伸,核心始终围绕情感与业务场景的适配展开。需先明确技术栈的定位,比如 Web 开发框架负责交互层搭建,NLP 工具处理文本语义,数据库支撑数据存储,将零散的技术点整合为完整的业务链路。之前的舆情分析系统用 Django 搭建 Web 界面,通过 TF-IDF 和余弦相似度提取舆情关键词关联,现在的内容推荐项目同样基于 Python 生态,只是针对在线场景优化了 NLP 模型的实时性,调整了数据库的查询逻辑。在技术复用层面虽未完全照搬旧有架构,但 Python+PyChar
胡耀超1 个月前
linux·深度学习·ubuntu·docker·容器·nlp·ocr
Umi-OCR 的 Docker安装(win制作镜像,Linux(Ubuntu Server 22.04)离线部署)前置博客:Ubuntu-Server 22.04.4 详细安装图文教程wget命令在windows终端下不能使用的原因及解决办法
用户095669160091 个月前
nlp
使用modelscope在本地部署文本情感分析模型并对外提供api接口使用modelscope部署StructBERT情感分类-中文-通用-base模型,并提供api接口环境安装 · 文档中心 为了简化部署,直接使用官方提供的docker镜像部署环境