nlp

极光代码工作室3 小时前
python·深度学习·自然语言处理·nlp
基于NLP的论文关键词提取系统随着学术文献数量呈指数级增长,科研人员面临信息过载与知识发现效率低下的双重挑战。关键词作为论文内容的高度凝练,是文献检索、知识图谱构建、学术推荐及跨学科研究的核心元数据。传统人工标引方式成本高、一致性差、时效性弱;而现有自动化方法(如TF-IDF、TextRank)在专业领域语义理解不足,难以捕捉学科术语层级关系与上下文依赖特征。本文设计并实现了一套融合规则驱动与深度学习的混合式论文关键词提取系统。系统以中文计算机领域学术论文为对象,集成预处理、词性过滤、候选词生成、多模型融合排序与后处理四大模块,创新性
不好听6133 天前
设计模式·node.js·nlp
Prompt 驱动 NLP:用大语言模型重新定义自然语言处理开发范式探讨如何利用 Prompt Engineering 构建 NLP 系统,深入分析情感分析、信息提取、主题推断、文本摘要等典型任务的 Prompt 设计思路。
Goodbye3 天前
nlp
基于 Prompt 工程的 NLP 系统开发实践 —— 以 DeepSeek 大模型为例摘要:传统自然语言处理(NLP)任务的开发往往需要机器学习专家耗费数天甚至数周的时间。如今,借助大语言模型(LLM)和精心设计的 Prompt,开发者仅需几分钟即可构建出功能强大的 NLP 系统。本文以 nlp-demo 项目为例,深入剖析如何通过模块化架构、Prompt 工程技巧与 DeepSeek 大模型,快速实现情感分析、信息提取、主题推断与文本总结等核心 NLP 能力。
jimi11263 天前
人工智能·深度学习·nlp
从零理解 TransformerTransformer 架构彻底改变了自然语言处理领域,从 BERT 到 GPT-4,从 T5 到 LLaMA,几乎所有现代大语言模型都建立在 Transformer 之上。但很多开发者对它的理解停留在"调用 API"层面——本文从直觉出发,带你真正理解注意力机制的核心原理,并通过代码实现加深认知。
元拓数智4 天前
数据库·人工智能·ai·nlp·agent·llama
跨库NL2SQL可信落地的核心:用IntaLink破解数据关系“迷雾”上周数据部的小张又被业务部门找上门——市场部要的“全国各区域线上线下销售额对比”报表,AI生成的SQL把电商库的“交易金额”和线下POS库的“实收金额”直接关联求和,结果差了近20%。小张只能加班排查,发现是两个库的金额字段统计口径不同,且表间关联关系没有被AI识别到。这样的场景,几乎每天都在企业数据部门上演:跨库智能问数看似高效,却常常因为数据关系混乱导致结果失真,最终还是要数据工程师兜底。
yuanyuan2o26 天前
人工智能·算法·自然语言处理·nlp·github
Transformers NLP 任务:阅读理解问答模型预训练:Hugging Face Transformers 基础我们已经了解了 Hugging Face Transformers 的基础组件,包括 Pipeline、Tokenizer、Model、Datasets、Evaluate、Trainer
m沐沐8 天前
人工智能·python·机器学习·自然语言处理·nlp·中文分词·tf-idf
【机器学习】NLP---用 Python+TF-IDF 给《红楼梦》自动提取关键词在信息爆炸的时代,快速从文本中抓取核心信息的能力非常重要。TF-IDF 是 NLP 领域最经典、也最容易上手的关键词提取算法之一。本文将带你从零开始,完成从文本读取、分词、去停用词,到使用 TF-IDF 提取每一回关键词的全过程,代码清晰易懂,有需要可直接运行。
「維他檸檬茶」8 天前
学习·算法·大模型·nlp
大模型算法学习2026.6.1主播是双非本211硕研0,计科本软工硕,之前了解过简单的机器学习和深度学习,目前打算冲大模型算法,同时准备agent应用开发作为planB。暂时打算是学cs224n、cs336和之前准备复试买的一个深度学习课,学完后做2个项目投小厂的算法实习,以后会不定期更新学习内容。
yuanyuan2o29 天前
算法·ai·语言模型·自然语言处理·nlp·深度优先
模型预训练:Hugging Face Transformers 基础0. 环境安装1. Pipeline2. Tokenizer3. Model4. Config5. Datasets
极光代码工作室12 天前
python·深度学习·自然语言处理·nlp
基于NLP的招聘信息关键词分析系统随着数字经济快速发展与就业市场结构持续演化,海量招聘文本数据呈爆发式增长。据智联招聘《2023中国雇主需求与白领人才供给报告》显示,仅主流平台日均新增职位信息超120万条,其中非结构化文本占比达98.7%。传统人工筛选与关键词粗筛已难以支撑企业HR高效识别核心能力画像、高校就业指导中心精准匹配岗位趋势、求职者个性化能力诊断等多元需求。本研究聚焦“招聘信息关键词提取与语义分析”这一关键问题,设计并实现了一套融合规则驱动与深度学习的混合式NLP分析系统。系统以中文招聘文本为处理对象,集成Jieba分词、TF-
YUDAMENGNIUBI15 天前
nlp
day30_fasttext分类任务FastText主要用于训练词向量和文本分类,其最大优势在于:保持较高精度的情况下,实现快速的训练和预测。 FastText速度快的原因主要有三点:
Lyn_Li16 天前
nlp·bert·词向量·sif·句子向量
给句子做个“语义审计”:从词向量到句子向量的方法论上一篇从独热向量到词向量:彻底搞懂 AI 如何理解语言我们理解了:词向量是给每个词拍一张“证件照”。但现实中的任务,往往是处理一整句话。一句话里有一叠“证件照”,怎么看出这句话到底代表什么?这就是本文要解决的问题。 这篇笔记不是冰冷的技术罗列,而是一次用审计思维对“语义融合”进行的阐述,本文将像分析公司一样分析句子,看看如何将词向量合并,得到代表整句话的句子向量。
AI技术控18 天前
人工智能·语言模型·自然语言处理·langchain·nlp
NeuroH-TGL 论文解读:面向脑疾病诊断的神经异质性引导时序图学习方法论文标题:《NeuroH-TGL: Neuro-Heterogeneity Guided Temporal Graph Learning Strategy for Brain Disease Diagnosis》 会议:NeurIPS 2025 研究方向:动态功能脑网络、时序图学习、图神经网络、脑疾病诊断、fMRI 分析 本文基于上传论文原文整理。:contentReference[oaicite:0]{index=0}
kcuwu.18 天前
自然语言处理·nlp
FastText技术博客:从原理到实战在自然语言处理(NLP)领域,词向量和文本分类是两个最基础也最重要的任务。从 2013 年 Word2Vec 横空出世,到 2016 年 Facebook AI Research(FAIR)推出 FastText,这个看似简单的模型却在工业界获得了空前成功。
AI技术控19 天前
人工智能·语言模型·自然语言处理·langchain·nlp
LangChain 是什么?从零开始学会 LangChain 的工程实践指南在大模型应用开发中,很多人第一次接触 LangChain,是因为想快速做一个“基于大模型的应用”:例如知识库问答、RAG 检索增强生成、智能客服、Agent 工具调用、文档总结、SQL 问答、企业内部助手等。
AI技术控21 天前
人工智能·语言模型·自然语言处理·oracle·nlp
RAG 怎么做 Query 改写?从工程实践看检索增强生成的第一道关键关卡在 RAG(Retrieval-Augmented Generation,检索增强生成)系统中,很多人一开始会把重点放在向量数据库、Embedding 模型、文档切分、召回算法、重排序模型和大模型生成上,但真正落地以后会发现:用户输入的 Query 质量,往往直接决定整个 RAG 系统的上限。
AI技术控23 天前
人工智能·python·语言模型·自然语言处理·nlp
ReAct 论文解读:大模型 Agent 如何通过“推理 + 行动”完成复杂任务《ReAct: Synergizing Reasoning and Acting in Language Models》是 ICLR 2023 的一篇经典论文,也是理解大模型 Agent、工具调用、RAG 和外部环境交互时绕不开的一篇工作。
王_teacher1 个月前
人工智能·gru·llm·nlp
GRU (Gated Recurrent Unit,门控循环单元) 原理详解 并且手写GRU模型GRU (Gated Recurrent Unit,门控循环单元) 是一种改进的循环神经网络(RNN),旨在解决传统 RNN 的梯度消失问题,并简化 LSTM 的复杂结构。
王_teacher1 个月前
人工智能·llm·nlp·lstm
LSTM 原理详解手动编写LSTM模型代码b站手把手编写lstm模型普通 RNN 有长依赖遗忘问题: 序列很长时,梯度反向传播会梯度消失/梯度爆炸,RNN 记不住很早之前的信息,就像鱼的记忆只有7秒。 LSTM(长短期记忆网络) 就是为了解决:长序列记忆、梯度消失 问题,就像添加一个日记本,将记忆写到本子上。
Resistance丶未来1 个月前
人工智能·ai·语言模型·自然语言处理·nlp·多模态大模型·ai工具
从零构建大语言模型:核心原理与实战落地在动手构建大语言模型之前,很多开发者往往被庞大的参数量和复杂的架构图劝退,觉得这必须是顶级实验室才能触碰的领域。但实际上,剥离掉工业级的工程外壳,大模型的核心骨架其实由几个清晰且优雅的数学模块组成。当你真正尝试从零开始,用几百行代码复现一个微型模型时,那种对“智能”如何从数据中涌现的理解,远比直接调用 API 来得深刻。