自然语言处理

悟道心3 小时前
人工智能·自然语言处理
1.自然语言处理NLP - 入门NLP = Natural Language Processing中文:自然语言处理你可以把它想象成:让机器学会“说话”和“理解人话”。
代码洲学长6 小时前
人工智能·python·rnn·自然语言处理·gru·lstm
RNN模型01RNN的工作流程:首先会对输入的文本进行分词,然后将分词按照顺序依次进行单个的处理,每个分词的处理的处理结果分为两部分一种是当前时刻的输出和当前时刻的隐藏状态,当前时刻的输出会进行输出,当前时刻的隐藏状态会传输到下一层,后续会重复这样的步骤直到处理玩所有的特征。
容智信息7 小时前
大数据·人工智能·自然语言处理·自动驾驶
容智信息加入大模型产业联盟,Hyper Agent推动企业级智能体规模化落地容智信息是一家专注于企业级智能体落地的智能自动化厂商,核心产品Hyper Agent超级智能体已在央国企、金融、制造等行业实现规模化应用。
imbackneverdie8 小时前
数据库·人工智能·自然语言处理·aigc·ai写作·课题·国家自然科学基金
2025国自然资助率12.29%创新低!2026年如何用数据与AI“破局”?一封结题报告里藏着一份科研路线图,一个获批项目的背后是趋势洞察与规范书写的智慧。国自然基金数据库正在成为科研工作者最高效的武器。
时光轻浅,半夏挽歌11 小时前
人工智能·语言模型·自然语言处理
小分子的语言模型MolT5的使用提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档这是MolT5的安装和embedding获取(gpu版)。
weixin_446260859 小时前
人工智能·语言模型·自然语言处理
探索大语言模型:基础知识与应用指南在人工智能的浪潮中,大语言模型(LLM)逐渐成为了技术发展的热点。无论是科研、课程设计,还是学生的创新项目,掌握大语言模型的基本原理和应用技巧都显得尤为重要。为此,我们推荐一本极具价值的学习资料——《大模型基础》。这本书旨在系统性地讲解大语言模型的相关基础知识,并融入前沿技术的介绍,适合所有对这一领域感兴趣的读者。
WitsMakeMen11 小时前
人工智能·语言模型·自然语言处理
大语言模型在线推理过程大语言模型(如 Qwen3)的输出过程本质是基于自回归机制的逐 token 生成循环,从 “输入预处理” 到 “最终文本输出” 可拆解为「预处理→初始化→逐 token 生成→后处理」四大阶段,每个阶段都对应具体的张量计算、缓存更新和采样逻辑。以下结合 Qwen3 的实际推理流程,详细拆解输出的完整过程:
渡我白衣11 小时前
人工智能·python·机器学习·自然语言处理·numpy·pandas·matplotlib
Python 与数据科学工具链入门:NumPy、Pandas、Matplotlib 快速上手“工欲善其事,必先利其器。” ——在机器学习的世界里,你的“器”就是 Python 数据科学工具链。想象你要做一道菜。即使你背熟了所有食谱,如果厨房里只有生锈的刀、没校准的秤、漏底的锅,你依然做不出好菜。
后端小张12 小时前
人工智能·深度学习·神经网络·opencv·学习·自然语言处理·cnn
【AI 学习】深入解析卷积神经网络(CNN):理论、实现与应用在人工智能计算机视觉(CV)领域,图像识别、目标检测等核心任务的突破,离不开卷积神经网络(Convolutional Neural Network, CNN)的发展与成熟。早期的图像识别模型依赖手工设计的特征提取器(如SIFT、HOG),不仅耗时耗力,而且对复杂场景的适应性极差。随着深度学习的兴起,CNN凭借其“自动特征提取”的核心优势,彻底改变了计算机视觉的发展格局。
心疼你的一切12 小时前
目标检测·microsoft·机器学习·ai·语言模型·自然语言处理
多模态AI与视觉语言模型人类感知世界是多模态的:我们同时看到图像、听到声音、阅读文字、感受触觉。传统人工智能往往专注于单一模态——要么处理图像,要么理解文本。然而,真实世界的智能需要跨越感官的界限,实现视觉、语言、声音等多种信息的统一理解与生成。多模态AI正是这一方向的核心技术,CLIP、DALL-E、GPT-4V等模型的出现标志着我们进入了多模态智能的新时代。本文将深入解析多模态学习的原理、架构和应用,并通过实战代码帮助读者掌握这一前沿技术。
胡伯来了1 天前
人工智能·语言模型·自然语言处理
16 Transformers - 使用大语言模型NLP 是一个更广泛的领域,专注于使计算机能够理解、解释和生成人类语言。NLP 包含许多技术和任务,如情感分析、命名实体识别和机器翻译。
容智信息1 天前
人工智能·自然语言处理·金融·自动驾驶
荣膺ISC.AI 2025创新百强!容智信息HyperAgent超级智能体,引领企业级智能体落地新范式12月17日,以“安全智变AI赋能新力场”为主题的[ISC.AI] 2025第六届创新百强颁奖典礼在北京圆满落幕。作为数字安全与AI领域的年度权威盛会,活动由[ISC.AI]平台、大模型产业联盟主办,联合赛迪顾问、数世咨询等60余家产业、教育、投融资机构及科研院校共同支持,汇聚政企学研多方力量,成为行业创新趋势的核心风向标。容智信息凭借在企业级智能体领域的深度布局与硬核技术实力,成功斩获企业智能体应用创新百强奖,生态合作部总监师杰梅代表公司登台领奖,这一荣誉是行业对容智信息技术创新与场景落地能力的双重权威
aitoolhub1 天前
人工智能·深度学习·自然语言处理·节日
AI生成圣诞视觉图:从节日元素到创意落地的路径圣诞作为全球最具影响力的节日之一,其视觉表达在商业营销、品牌传播与社交互动中占据核心位置。从电商平台的促销海报到品牌的节日KV,从社交平台的祝福配图到线下活动的场景布置,高质量的圣诞视觉图能快速传递节日氛围,激发用户情感共鸣。
飞Link1 天前
论文阅读·人工智能·语言模型·自然语言处理
【论文笔记】A Survey on Data Synthesis and Augmentation for Large Language Models2024大型语言模型(LLM)的成功与否,本质上与用于训练和评估的海量、多样化和高质量数据的可用性息息相关。然而,高质量数据的增长速度明显落后于训练数据集的扩展速度,从而导致迫在眉睫的数据耗尽危机。这突显了提高数据效率和探索新数据来源的迫切需求。在此背景下,合成数据已成为一种有前景的解决方案。目前,数据生成主要包括两种主要方法:数据增强和合成。本文全面回顾并总结了LLM生命周期中的数据生成技术,包括数据准备、预训练、微调、指令调整、偏好对齐和应用。此外,我们还讨论了这些方法目前面临的限制,并探讨了未来发展
汉克老师1 天前
人工智能·语言模型·自然语言处理·小学生0基础学习大语言模型
小学生0基础学大语言模型应用(第0课 课前准备)🎒 适合对象:编程 0 基础的小学生 🎯 本节目标:不学代码,只做一件事: 👉 让电脑准备好,迎接我们的第一行 Python 程序
悟道心1 天前
人工智能·自然语言处理
2.自然语言处理NLP - 文本预处理文本表示的第一步通常是分词和词表构建分词的任务是将原始文本切分为若干具有独立语义的最小单元(token),分词是所有NLP任务的起点。 词表则是由语料库构建出来的、包含着模型可以识别的token的集合。词表中的每个token都分配有唯一的ID,并且支持token与ID之间的双向映射 在后续的训练预测的过程中,模型会首先进行分词,再通过词表将每个token映射为其对应的ID(索引) 。这些ID会被嵌入层转换为低维稠密向量(词向量)。即词向量是根据索引生成的 在文本生成任务中,模型的输出层会针对词表中的每个t
Suahi1 天前
人工智能·自然语言处理
【HuggingFace LLM】经典NLP Tasks数据流转from_pretrained 方法从Hugging Face Hub下载并缓存模型数据。如前所述,检查点名称对应于特定的模型架构和权重,在本例中是具有基本架构(12 层、768 个隐藏大小、12 个注意力头)和大小写输入(意味着大写/小写区分很重要)的 BERT 模型。
natide1 天前
人工智能·pytorch·python·深度学习·自然语言处理
词汇/表达差异-7-Alias覆盖率Alias覆盖率(也常称“别名覆盖率”)是针对实体/术语的别名体系设计的量化指标,核心用于衡量“某一识别/匹配系统对实体所有别名的覆盖程度”,是知识融合、实体链接、信息抽取等领域评估系统能力的重要工具。与之前的距离/相似度指标不同,它属于评估类指标,而非直接的差异度量指标
aitoolhub1 天前
人工智能·深度学习·自然语言处理·aigc·设计语言
生成式AI设计:效率提升与创意平衡之道设计行业的核心矛盾始终是有限时间与无限需求的冲突——电商大促前要输出上百张banner,UI迭代要测试十几种交互方案,品牌升级要适配全渠道物料……这些场景里,设计师往往陷入重复劳动与创意消耗的双重困境。生成式AI的出现,不是简单的工具升级,而是重新定义了设计流程中效率与创意的关系:它把设计师从机械性工作中解放出来,同时为创意提供了更广阔的实验空间。
natide1 天前
大数据·人工智能·深度学习·算法·自然语言处理·nlp·知识图谱
词汇/表达差异-8-Token Overlap(词元重叠度)首先明确**词元(Token)**的概念:词元是文本经过分词/切分后得到的最小语义单元,可分为:Token Overlap的核心思想是:两个文本的相似程度,取决于它们之间共同词元的数量(或占比)。根据计算方式的不同,可分为集合型重叠度和频率型重叠度两类,其中集合型是基础。