自然语言处理

醒醒该学习了!9 小时前
人工智能·语言模型·自然语言处理
大语言模型(理论篇)人类输入的是自然语言,模型真正处理的是数字。文本进入大模型通常经历以下步骤:这条链路里最重要的认识是:大模型并不是“直接读汉字或英文单词”,而是先把文本转换成可计算的数字表示,再进行预测和生成。
星贝爱科生物科研小能手12 小时前
人工智能·自然语言处理·机器翻译
CS-PLGA@褪黑素纳米粒(CS-PLGA@MT NPs)的应用场景有哪些?CS-PLGA@MT 是壳聚糖(CS)修饰 PLGA复合纳米粒,包载褪黑素(MT),兼具 PLGA 长效缓释与壳聚糖黏膜黏附、正电荷靶向、生物相容优势,显著改善 MT 水溶性差、半衰期短、易代谢缺陷,主打睡眠调节、神经保护、黏膜递送。
极光代码工作室12 小时前
python·深度学习·自然语言处理·nlp
基于NLP的论文关键词提取系统随着学术文献数量呈指数级增长,科研人员面临信息过载与知识发现效率低下的双重挑战。关键词作为论文内容的高度凝练,是文献检索、知识图谱构建、学术推荐及跨学科研究的核心元数据。传统人工标引方式成本高、一致性差、时效性弱;而现有自动化方法(如TF-IDF、TextRank)在专业领域语义理解不足,难以捕捉学科术语层级关系与上下文依赖特征。本文设计并实现了一套融合规则驱动与深度学习的混合式论文关键词提取系统。系统以中文计算机领域学术论文为对象,集成预处理、词性过滤、候选词生成、多模型融合排序与后处理四大模块,创新性
财经资讯数据_灵砚智能13 小时前
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月8日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
叫我:松哥15 小时前
人工智能·语言模型·自然语言处理·架构·flask·bootstrap
基于deepseek大语言模型的项目架构图设计与绘制系统第1章 引 言1.1 研究背景与意义在软件工程领域,系统架构图作为传达设计意图、指导开发实施的关键载体,其绘制质量直接影响团队协作效率与系统演进能力。当前行业实践中,架构图的创建与维护主要依赖人工操作,开发人员借助通用绘图工具或专用建模软件,通过拖拽、连线等方式逐项构建架构元素。这一过程不仅耗时费力,还面临需求理解偏差导致的架构偏差风险,尤其在敏捷开发模式下,需求频繁变更使得架构图同步更新的成本进一步放大。据Stack Overflow开发者调查报告,约67%的开发团队仍以静态文档形式维护架构图,超过半数
财经资讯数据_灵砚智能15 小时前
人工智能·python·ai·信息可视化·自然语言处理·ai编程·灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月9日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)
东方佑15 小时前
人工智能·语言模型·自然语言处理
递归创世:条件随机、自指递归与分形——一个贯穿真实世界、自然语言和大型语言模型的统一原理真实世界并非完全随机的混沌,也不是一部严格确定的钟表。本文将论证,真实世界的底层动力学是一个条件随机过程——在不变规律划定的疆域内不断进行随机试错。在这种永恒的扰动中,唯有那些恰好处于分形临界态的结构才能动态幸存。而分形本身,则是由自指与递归操作所必然生成的几何与统计指纹。这一原理不仅解释了物理世界中分形的普遍存在,更穿透了自然语言的本质:语言正是递归自指规则下的条件随机抽样,其表层统计必然涌现幂律、长程相关与结构自相似的分形特征。最终,我们揭示,当今大语言模型的自回归设计,正是这一原理在硅基上的完美映射
zhumin7261 天前
人工智能·语言模型·自然语言处理
一种基于人类行为—内分泌映射的大语言模型动态情绪系统:从生理数据标定到虚拟激素驱动决策的工程化框架当前大语言模型(LLM)的具身智能与情感计算(Affective Computing)高度依赖于静态提示词(Prompt)工程或外部规则模板,缺乏人类情感固有的连续性、时滞性及环境累积效应。本研究提出一种全新的数据驱动型大模型动态情绪系统。该系统彻底摆脱传统情感计算的先验规则设定,开创性地设计了一条“人类生理数据标定 高维行为聚类 时间序列内分泌状态空间 LLM决策调制”的完整工程化路径。通过建立以“交互步(Interaction Step)”为单位的虚拟内分泌池,并引入基因种子(Seed)与环境积分(E
半兽先生1 天前
人工智能·自然语言处理
05阶段:NLP自然语言处理基础1)什么是自然语言处理?● 自然语言处理(Natural Language Processing,简称NLP)是计算机科学与语言学中关注于计算机与人类语言间转换的领域
DXM05211 天前
人工智能·python·随机森林·机器学习·支持向量机·arcgis·自然语言处理
第8期| 传统机器学习遥感解译:SVM & 随机森林分类全流程实操在前两期内容中,我们系统学习了遥感影像全流程预处理与人工目视解译判读体系。目视解译依托从业者经验完成地物识别,具备判读直观、边界精准的优势,但也存在效率低下、主观偏差大、难以规模化作业等短板,无法满足当下大范围遥感监测、长时序动态分析的工程需求。
宝贝儿好1 天前
人工智能·深度学习·神经网络·自然语言处理
【NLP】第七章:项目实操案例:智能输入法项目说明:本篇是根据 https://www.bilibili.com/video/BV1k44LzPEhU?spm_id_from=333.788.player.switch&vd_source=b6780e06031ac609460f6fbf017bbb39&p=38 视频中的案例爆改重构而成的,很多细节地方加入了自己的想法和操作。anyway,感谢并致敬原作者!
樱花的浪漫2 天前
前端·javascript·人工智能·语言模型·自然语言处理·typescript
Typescript、Zod基础初始化项目目录与 package.json可指定 package.json中TS和zod的版本,然后下载
AI人工智能+2 天前
深度学习·语言模型·自然语言处理·ocr·药品注册证识别
药品注册证识别技术利用深度学习和多模态融合架构,实现药品注册证信息的自动化精准提取在医药监管与行业数字化进程中,药品注册证是药品合法上市的核心凭证。然而,随着海量历史档案的数字化以及新批文的高频发布,人工录入和核对注册证信息(如药品名称、证书编号、剂型、规格、受理号等)面临着效率低、易出错、标准不统一等痛点。
大模型最新论文速读2 天前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
06-08 · LLM 最新论文速览今日候选池 86 篇,硬过滤 + LLM 打分后通过评估 12 篇,精选 Top-10,另列 2 篇速览。
财经资讯数据_灵砚智能2 天前
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月8日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)
P-ShineBeam2 天前
数据库·人工智能·语言模型·自然语言处理·langchain
智能体-LangChain框架-Tools工具的使用指南Tools(工具)是 LangChain 中让大模型与外部世界交互的核心机制。模型本身只会“说话”,而工具让它能够真正“动手”——搜索、计算、查数据库、调 API。通过工具,Agent 可以执行搜索、计算、数据库查询等操作,极大扩展了 AI 的能力边界。
财经资讯数据_灵砚智能2 天前
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月7日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
宝贝儿好2 天前
人工智能·python·深度学习·算法·自然语言处理
【NLP】第八章:项目实操案例:文本情感分析本案例是基于LSTM架构,搭建一个文本情感分析模型,对评论内容进行二分类判断(正面或负面)。说明:本篇是根据https://www.bilibili.com/video/BV1k44LzPEhU?spm_id_from=333.788.videopod.episodes&vd_source=b6780e06031ac609460f6fbf017bbb39&p=73 案例重构而成,致谢原作者!
东方佑2 天前
人工智能·语言模型·自然语言处理
碱基互补语言模型用 DNA 配对规则,从无标注文本中发现语法“如果语言也有一条双螺旋——我们只是还没有找到它?”有一个事实如此明显,以至于没有人想到去质疑它。
zhangfeng11332 天前
人工智能·语言模型·自然语言处理
大语言模型思维链技术研究报告 CoT | 推理模型 | 思维树 | 强化学习 | o1 / R1思维链(Chain of Thought,简称CoT)是一种提示工程技术,其核心思想是在向大语言模型提出问题时,不仅要求模型给出最终答案,还要求模型在回答过程中生成一系列中间推理步骤,就像人类在解决复杂问题时会逐步思考一样。这种方法通过将复杂的推理任务分解为多个可管理的子步骤,显著提升了大语言模型在数学推理、常识推理、符号推理等任务上的表现。思维链的本质是让模型的推理过程变得"可见"和"可追溯",从而不仅提高了答案的准确性,还增强了模型输出的可解释性和可信度。 在思维链提出之前,大语言模型通常采用"直接回