自然语言处理

Jmayday2 小时前
人工智能·自然语言处理·nlp
NLP第三章:注意力机制目录一、注意力机制的由来以及解决的问题二、什么是注意力机制三、自注意力机制四、注意力机制规则五、什么是深度学习注意力机制
2301_780029047 小时前
人工智能·语言模型·自然语言处理
A survey on large language model based autonomous agents —— 论文精读论文标题:A survey on large language model based autonomous agents
财经资讯数据_灵砚智能8 小时前
大数据·人工智能·python·信息可视化·自然语言处理
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月11日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
皮卡丘ZPC9 小时前
人工智能·语言模型·自然语言处理
GAIA2: BENCHMARKING LLM AGENTS ON DYNAMIC AND ASYNCHRONOUS ENVIRONMENTS摘要 我们介绍了Gaia2,这是一项用于在真实的、异步环境中评估大型语言模型代理的基准测试。与之前的静态或同步评估不同,Gaia2引入了环境独立于代理行为演变的场景,要求代理在时间约束下运行,适应噪声和动态事件,解决模糊问题,并与其他代理协作。每个场景都配备了写入操作验证器,实现了细粒度的操作级评估,使Gaia2能够直接用于基于可验证奖励的强化学习。我们对最先进的专有和开源模型的评估表明,没有任何模型在能力上占优:GPT-5(高)以42%的pass@1得分达到总体最强,但在时间敏感任务上表现不佳;Clau
victory04319 小时前
人工智能·语言模型·自然语言处理
DeepSeek LLM Scaling Open-Source Language Models with Longtermism 中文翻译开源大语言模型(LLMs)的快速发展确实令人瞩目。然而,既有文献中描述的缩放定律(scaling laws)得出了不同的结论,这给扩展 LLMs 蒙上了一层阴影。我们深入研究了缩放定律,并提出了独特的发现,这些发现有助于在两种常用的开源配置——7B 和 67B——中扩展大规模模型。在缩放定律的指导下,我们推出了 DeepSeek LLM,这是一个致力于以长期视角推进开源语言模型发展的项目。
Omics Pro11 小时前
人工智能·算法·机器学习·支持向量机·自然语言处理
柳叶刀|参考文献不存在学术文献的可靠性依赖引文完整性。伪造引文(指向不存在的出版物)源于论文工厂、故意学术不端或对人工智能写作工具的不当使用;大语言模型生成的生物医学引文中,30%~69%为伪造。本研究采用自动化引文验证系统,核查了2023—2026年的250万篇生物医学论文、9,710万条带PubMed识别号的引文,在2,810篇论文中检出4,046条伪造引文。受大语言模型普及与论文工厂活动驱动,伪造率飙升12倍以上,从2023年每万篇约4条升至2026年初每万篇56.9条。伪造引文格式规范、难以检测,98.4%的涉事论文未
财经资讯数据_灵砚智能14 小时前
人工智能·python·信息可视化·自然语言处理·ai编程
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月12日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)
小何code14 小时前
人工智能·深度学习·自然语言处理·机器翻译·注意力机制·seq2seq
人工智能【第22篇】Seq2Seq模型与注意力机制:机器翻译的基石作者的话:在前面的文章中,我们学习了RNN、LSTM以及NLP的基础知识。现在让我们进入NLP的核心应用——机器翻译。Seq2Seq(Sequence to Sequence)模型是机器翻译的基石,而注意力机制(Attention)的出现更是将翻译质量提升到了新的高度。本文将详细讲解这两个核心技术,帮助你理解现代NLP的基础!
imbackneverdie1 天前
人工智能·自然语言处理·aigc·ai写作·论文写作·论文投稿·科研工具
一天怎么完成论文初稿写论文这件事,从选题到完稿,哪一步都能卡掉你半条命。我身边不少读研读博的同学,白天泡实验室做实验,晚上挤时间写论文,熬了一两个月出初稿,结果格式不对、文献零散,还要和同门改来改去,版本乱到分不清哪个是最终稿;临床方向的医生朋友更难,手里攒了一堆宝贵的临床数据,想整理成论文发出去,却抽不出大块时间整理文献、梳理逻辑,缺专业的写作辅助工具,往往折腾大半年还没出成型的初稿。
财经资讯数据_灵砚智能1 天前
大数据·人工智能·python·信息可视化·自然语言处理
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月10日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
这张生成的图像能检测吗1 天前
人工智能·计算机视觉·语言模型·自然语言处理·故障诊断
(论文速读)LogInsight:基于大语言模型的准确可解释日志故障诊断论文题目:Accurate and Interpretable Log-Based Fault Diagnosis Using Large Language Models(基于大语言模型的准确可解释日志故障诊断)
财经资讯数据_灵砚智能1 天前
大数据·人工智能·python·信息可视化·自然语言处理
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月11日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)
risc1234561 天前
自然语言处理·中文分词
Viterbi 算法直接用在中文分词上我们把 Viterbi 算法直接用在中文分词上,用你熟悉的“字”和“词”来解释,保证比天气例子更贴近你的直觉。
clarance20151 天前
人工智能·经验分享·自然语言处理·数据分析
基于NLP的BI工具DataFocus实战:从自然语言查询到智能数据分析在企业数据分析场景中,开发团队经常面临以下挑战:DataFocus是杭州汇数智通科技有限公司开发的基于自然语言处理的商业智能产品,其核心特点是:
Zzj_tju2 天前
人工智能·语言模型·自然语言处理
视觉语言模型技术指南:LLaVA、Qwen-VL、MiniCPM-V 等主流方案差别在哪?上一篇我们把“图像到底是怎么接进语言模型”的底层链路拆开了。现在可以往前走一步,进入很多人真正关心的问题:
小糖学代码2 天前
人工智能·pytorch·python·rnn·深度学习·神经网络·自然语言处理
LLM系列:3.nlp基础入门:nlp与循环神经网络自然语言处理(Natural Language Processing, NLP)是人工智能领域中最具挑战性也最迷人的分支之一。它不仅是实现机器智能的象征,更是人类通往真正人工智能的必经之路。
weixin_435208162 天前
人工智能·深度学习·自然语言处理·面试·职场和发展·aigc
大模型 Agent 面试高频100题——基础篇原文转载:https://mp.weixin.qq.com/s/Lv5n69-o-j8B_mp6636qlw
孙同学_2 天前
人工智能·语言模型·自然语言处理
【AI应用开发框架】大语言模型(LLM)与嵌入模型背景 当我们自己构建AI应用时,无法直接使用大语言模型的客户端,那么就需要我们通过代码的方式,接入原生LLM的方式
Honey Ro2 天前
深度学习·神经网络·自然语言处理·cnn
深度学习中的参数更新方法在深度学习中,随机梯度下降法是优化的最常见方式,其公式表达为:θ t + 1 = θ t − η ⋅ g t \theta_{t+1} = \theta_t - \eta \cdot g_t θt+1=θt−η⋅gt
金井PRATHAMA2 天前
自然语言处理
基于“指称—陈述”二元互补的汉语形式语义学体系构建及其哲学基础摘要:西方形态中心主义与实体中心主义语言学在汉语研究中长期存在削足适履的理论困境,无法合理解释汉语“重语义、轻文法”的核心特征、文言文的词类活用现象及“谓词—论元”结构的本质。本文以“指称—陈述”二元对立与互补为核心形式语义学框架,构建了涵盖语言起源、语义本质、汉语特征与哲学基础的统一解释体系。研究表明:“指称—陈述”的最初分化是人类语言诞生的根本标志;其二元互补是完整句义的充要条件,其本体论根基为客观世界“存在—运动”的二元基本结构;语义的核心是陈述而非指称,实体的本质内涵是其全部行为与属性特征的总和,