自然语言处理

flex88886 小时前
人工智能·语言模型·自然语言处理
输入一个故事主题,使用大语言模型生成故事视频【视频中包含大模型生成的图片、故事内容,以及音频和字幕信息】本项目可以输入一个故事主题,使用大语言模型生成故事视频,视频中包含大模型生成的图片、故事内容,以及音频和字幕信息。
Coovally AI模型快速验证9 小时前
人工智能·yolo·目标跟踪·语言模型·自然语言处理·开源
视觉语言模型(VLM)深度解析:如何用它来处理文档视觉语言模型是一类强大的机器学习模型,能够同时处理视觉(图像)和文本信息。随着最近 Qwen 3 VL 模型的发布,我想带大家深入探讨一下,如何利用这些强大的 VLM 来处理文档。
十三画者13 小时前
人工智能·自然语言处理
【文献分享】利用 GeneTEA 对基因描述进行自然语言处理以进行过表达分析过度表型分析用于识别基因列表中的生物学富集现象。在此,我们介绍了 GeneTEA,这是一个能够接收自由文本基因描述并结合自然语言处理方法来学习稀疏的基因-项嵌入的模型,该嵌入可以被视为一个新的基因集数据库。在与现有过度表型分析工具的基准测试中,只有 GeneTEA 能够正确控制假发现率,同时始终能揭示最相关的生物学信息,并且这样做的冗余度更低。我们表明,同样的方法可以应用于其他生物体的基因组或化合物。此外,我们还提供了训练好的 GeneTEA 模型的交互式应用程序和 API。
跳跳糖炒酸奶13 小时前
人工智能·自然语言处理·大模型·transformer·gpt1
第十章、GPT1:Improving Language Understanding by Generative Pre-Training(代码部分)对于代码部分首先先把代码运行起来,其次逐块来看每部分代码在做什么。论文:https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
汉克老师16 小时前
人工智能·语言模型·自然语言处理·lmcc
CCF--LMCC大语言模型能力认证官方样题(第一赛(青少年组)第二部分 程序题 (21--25))完整修补后代码:
杰克逊的日记18 小时前
人工智能·语言模型·自然语言处理
LLM(大语言模型)LLM(大语言模型)是 AI 时代的核心基础模型,核心作用是理解和生成人类语言,支撑各类自然语言处理(NLP)应用落地。
盼小辉丶19 小时前
人工智能·深度学习·自然语言处理·transformer
Transformer实战(24)——通过数据增强提升Transformer模型性能我们已经使用经典 Tansformer 模型解决了许多任务,但我们可以通过利用特定的技术来进一步提高模型性能。有多种方法可以提升 Transformer 模型的性能,在节中,我们将介绍如何通过数据增强技术将模型性能提升到超越普通训练流程的水平。数据增强广泛应用于提高深度学习模型的准确性,通过增强数据样本,深度学习模型能够更有效地捕捉数据中的潜在模式和关系。
悟乙己20 小时前
人工智能·自然语言处理·知识图谱
LangExtract + 知识图谱 — Google 用于 NLP 任务的新库原文摘要:LangExtract 是 Google 于 2025-07-30 开源的“程序化抽取”工具,面向邮件、报告、病历等非结构化文本,精确抽取所需信息并将每个抽取结果与原文字符偏移(offset)绑定,实现可追溯、可高亮验证的结构化输出。其核心能力包括:对长文档的分块与并行处理、多轮抽取确保召回、直接生成结构化结果以减少传统 RAG 中的切分与向量嵌入开销;可同时兼容云端大模型(如 Gemini)与本地开源模型,并支持自定义提示模板以适配不同领域。本文提供一个以 Streamlit 为界面、Agra
Allen正心正念202520 小时前
人工智能·语言模型·自然语言处理
提升大语言模型性能的关键技术清单(from 网络)提升大语言模型性能的关键技术清单:**• LoRA(低秩适配):**高效微调,节省计算资源 **• 量化(Quantization):**降低模型精度需求,显著减小模型体积 • **剪枝(Pruning):**剔除冗余参数,提升推理速度 **• 蒸馏(Distillation):**通过小模型学习大模型知识,实现轻量化 **• 权重共享(Weight Sharing):**减少参数数量,降低存储需求 **• Flash Attention:**优化注意力计算,提升内存利用与速度 **• KV-Cache
qyresearch_1 天前
人工智能·语言模型·自然语言处理
大语言模型训推一体机:AI算力革命的“新引擎”,2031年市场规模突破123亿的黄金赛道在生成式AI(AIGC)技术爆发式增长的背景下,大语言模型(LLM)的训练与推理需求呈现指数级增长。传统方案中,训练集群与推理服务器分离导致资源闲置、部署复杂等问题日益凸显。大语言模型训推一体机作为集成高性能算力芯片、存储系统、网络互联及软件框架的专用设备,凭借“训练+推理一体化”“高效能低延迟”“即插即用”等特性,正成为AI研发与应用场景的核心基础设施。据QYResearch最新调研,2031年全球大语言模型训推一体机市场销售额预计达123.5亿元,2025-2031年复合增长率(CAGR)为7.2%。
2401_841495641 天前
人工智能·python·gpt·深度学习·语言模型·自然语言处理·transformer
【自然语言处理】生成式语言模型GPT复现详细技术方案目录一、引言:GPT模型复现的背景与意义二、生成式语言模型GPT的理论基础三、GPT模型架构的详细设计
lx7416026982 天前
人工智能·自然语言处理
面试可能的问题(自用)1. Transformers的原理结构和流程。encoder-decoder,论文中是分别六层,实际也可以别的层数。每个encoder由self-attention和feed forward network组成。编码器的输入先流入sa层,它可以让编码器在对特定词进行编码时,使用输入句子时其他词的信息,然后sa层的输出流入ffn。ffn的作用是引入非线性变换。decoder也有sa和ffn,但中间还有个注意力层(encoder-decoder attention),用来帮助解码器关注输入句子的相关部分。
喜欢吃豆2 天前
人工智能·microsoft·自然语言处理·大模型
OpenAI Agent 工具全面开发者指南——从 RAG 到 Computer Use —— 深入解析全新 Responses API工具使用 (Tool Use) 是一个核心范式,标志着大型语言模型(LLM)从被动的文本生成器向主动“代理”(Agent)的转变。 模型不再局限于已训练的知识,而是通过调用外部工具与世界交互,例如:
Scabbards_2 天前
人工智能·语言模型·自然语言处理
KGGEN: 用语言模型从纯文本中提取知识图论文链接:https://arxiv.org/abs/2502.09956代码链接:https://github.com/stair-lab/kg-gen
Wu Liuqi3 天前
人工智能·学习·自然语言处理·大模型·大模型转行
【大模型学习】第一章:自然语言处理(NLP)核心概念自然语言处理(Natural Language Processing, NLP)是人工智能领域(AI)的一个重要分支,目标是使计算机能够理解、解释并生成人类语言,实现自然、无障碍的人机交互。随着信息技术的发展,NLP已成为从海量文本中提取信息、理解语言深层含义的核心工具。本章旨在为您系统地介绍NLP的基础知识,包括其定义、发展脉络、主要任务及关键的文本表示技术。
力江3 天前
人工智能·python·自然语言处理·语音识别·unicode·维吾尔语
攻克维吾尔语识别的技术实践(多语言智能识别系统)在全球化的今天,多语言处理已经成为现代应用的标配。然而,当我将目光投向小语种——特别是维吾尔语时,发现技术资源异常匮乏。这篇文章将深入探讨我如何从零开始构建一个高精度的多语言识别系统,重点解决维吾尔语识别这一技术难题。
一个处女座的程序猿3 天前
人工智能·自然语言处理·小语言模型·slms
LLMs之SLMs:《Small Language Models are the Future of Agentic AI》的翻译与解读LLMs之SLMs:《Small Language Models are the Future of Agentic AI》的翻译与解读
开水好喝4 天前
ai·自然语言处理·ask rovo
Rovo Automation - TestRail Agent设计支持用例编写Atlassian推出Ask Rovo重塑了当前AI使用的工作方式,它专为集成Confluence和Jira等协作工具而设计。它能够自动检索和整合团队在Confluence文档和Jira工单中的知识与数据,帮助成员快速找到所需信息和最佳实践。通过Ask Rovo,团队成员无需手动翻查大量页面或任务,只需提出问题,即可获得精准、实时的答案。
Francek Chen4 天前
人工智能·pytorch·深度学习·自然语言处理·word2vec
【自然语言处理】预训练04:预训练word2vec【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据分析、科学探索等领域都取得了很多成果。本专栏介绍基于PyTorch的深度学习算法实现
2401_841495644 天前
人工智能·python·gpt·深度学习·语言模型·自然语言处理·transformer
【自然语言处理】轻量版生成式语言模型GPT目录一、引言:轻量版GPT的设计目标与整体架构二、全局配置与工具函数的工程实现三、自定义BPE分词器的设计与实现