自然语言处理

啦啦啦_99994 小时前
自然语言处理
RNN案例_seq2seq 英译法案例(对于业务分析:英译法,类似中文翻译,思想都是一样的。在翻译时是逐字翻译的,为什么可以将将文本生成任务 转化为分类问题?: 要翻译成法文,一定要有个法文词典,如当前法文词典有 4000多个词,要预测出每个词分别属于词典中这4000多个词的哪一个即 token classification,可理解为4000多分类,目标是预测4000多个概率值,找到最大概率对应的索引,即为预测出来的法文单词。虽说是文本生成任务,但目标是找词表中的某个单词,其实是一个分类问题,所以要转化为分类问题。) (不是单词之间的直译,每
余俊晖6 小时前
人工智能·自然语言处理·多模态
推理驱动的生成式通用多模态嵌入框架-UME-R1VLM2Vec, MM-Embed等模型均为判别式:直接提取输入最后一个 token 的隐层状态作为嵌入,不生成新 token,无法利用 MLLM 的推理能力。UME-R1 提出生成式多模态嵌入,让模型先推理、再总结、最后生成嵌入,同时保留判别式嵌入能力。
啦啦啦_99999 小时前
自然语言处理
4. 注意力机制介绍_2它需要三个指定的输入Q(query), K(key), V(value),然后通过计算公式得到注意力的结果,这个结果代表 query在 key和 value作用下的注意力表示;当输入的 Q=K=V时,称作自注意力计算规则;当 Q、K、V不相等时称为一般注意力计算规则。
hai31524754310 小时前
数据结构·自然语言处理·硬件工程·动态规划·集成学习
结构化编程:AI工业化编程的探索AI辅助编程并非新鲜事物。GitHub Copilot已在超过两万家企业的代码库中被使用,Amazon CodeWhisperer、Tabnine、Replit Ghostwriter等工具相继涌现。这些工具都聚焦于“代码补全”——根据上下文猜测开发者接下来想写什么,然后生成一行或几行代码建议。
lqqjuly10 小时前
人工智能·语言模型·自然语言处理
语言模型理论与术语(LLM Theory & Terminology)
AI人工智能+11 小时前
深度学习·自然语言处理·ocr·营业执照识别
营业执照识别技术,通过深度学习、图像处理与NLP技术的深度融合,实现了对营业执照信息的快速、精准提取与智能解析在数字化转型的浪潮中,企业注册信息的自动化处理已成为提升商业效率的关键环节。传统的营业执照人工录入方式不仅耗时费力,且极易出现人为错误。随着人工智能技术的飞速发展,基于深度学习技术的高精度OCR识别系统应运而生。该系统深度融合图像处理、模式语言识别与自然语言处理(NLP)技术,实现了对营业执照信息的快速、精准提取与智能解析,彻底改变了企业信息核验的传统模式。
大模型最新论文速读12 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
06-02 · LLM 最新论文速览今日候选池 105 篇,硬过滤 + LLM 打分后通过评估 18 篇,精选 Top-10,另列 8 篇速览。
GIOTTO情13 小时前
人工智能·自然语言处理·自动化
智能舆情处置技术方案:基于NLP语义研判的全链路自动化处置与风控落地技术摘要:传统企业舆情处置普遍存在响应时延高、风险定级主观、处置流程碎片化、问题无法溯源、无法迭代优化等痛点。人工主导的处置模式,无法适配多模态、高实时、广覆盖的网络舆情传播场景。本文基于Infoseek字节探索技术架构,阐述智能化舆情处置的核心技术逻辑、全链路落地体系与企业风控价值,嵌入核心算法代码实现,为企业标准化、自动化舆情处置建设提供可落地技术参考。
承渊政道14 小时前
人工智能·pytorch·python·深度学习·机器学习·语言模型·自然语言处理
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(新时代的曙光之大模型与人工智能)在人工智能快速演进的今天,大语言模型已经从前沿研究逐渐走向真实业务场景,成为智能问答、内容生成、代码辅助、知识库检索等应用的核心能力.然而,对于许多开发者而言,大模型依然像一个"黑箱":我们知道它强大,却不一定清楚它是如何构建、如何训练,又该如何针对具体任务进行高效微调.本文将以"从零开始"为主线,围绕大模型开发与微调的完整流程展开,结合 PyTorch 的灵活深度学习能力与 ChatGLM 的中文大模型实践基础,带你一步步理解大模型背后的关键技术.从模型结构、数据处理、训练流程,到参数高效微调、推理部署
头盔小妹1 天前
人工智能·语言模型·自然语言处理
在本地调用大语言模型将模型下载到本地,方便调用。jinxia千问1.5-0.5B-Chat · 模型库下载好的文件移动到D盘的文件夹里,D:\AI_Model\Qwen1.5-0.5B-Chat。
weixin_446260851 天前
人工智能·语言模型·自然语言处理
分离性身份:语言模型代理缺乏声誉机制的基础论文来源: arXiv:2605.30169v1 提取时间: 2026-05-31Dissociative Identity (解离身份) 论文明确指出,语言模型(LM)代理在本质上是解离的 (Ontologically Dissociative)。由于 LM 代理具备模块化、流体化和可复制的架构,它们破坏了人类风格声誉机制(Reputation Systems)所需的基础假设。
Hali_Botebie1 天前
人工智能·语言模型·自然语言处理
Infinity Instruct:扩展指令选择与综合以增强语言模型:推动开源指令数据集的发展大型语言模型(LLMs)在实际应用中展现出卓越的性能,然而,现有的开源指令数据集往往局限于数学或代码等狭窄领域,这限制了模型的泛化能力,并拉大了其与专有模型之间的差距。为弥合这一差距,我们推出了 Infinity-Instruct,这是一个高质量的指令数据集,旨在通过一个两阶段流程同时提升大语言模型的基础能力和聊天能力。在第一阶段,我们利用混合数据选择技术,从超过1亿条样本中筛选出740万条高质量的基础指令(InfInstruct-F-7.4M)。在第二阶段,我们经过指令选择、进化以及诊断性过滤这两个步骤
GIOTTO情2 天前
人工智能·算法·自然语言处理
智能舆情处置系统技术方案:基于NLP语义算法的全链路风险处置落地传统人工舆情处置存在误判率高、响应时延、分级混乱、无法溯源、无法迭代等行业痛点,无法适配海量、实时、多模态的网络舆论场景。本文基于Infoseek字节探索技术架构,拆解智能化舆情处置的核心技术逻辑、风险分级算法与自动化处置闭环,从技术维度解决传统舆情处置的低效与失准问题。
m沐沐2 天前
人工智能·python·机器学习·自然语言处理·nlp·中文分词·tf-idf
【机器学习】NLP---用 Python+TF-IDF 给《红楼梦》自动提取关键词在信息爆炸的时代,快速从文本中抓取核心信息的能力非常重要。TF-IDF 是 NLP 领域最经典、也最容易上手的关键词提取算法之一。本文将带你从零开始,完成从文本读取、分词、去停用词,到使用 TF-IDF 提取每一回关键词的全过程,代码清晰易懂,有需要可直接运行。
yuanyuan2o22 天前
算法·ai·语言模型·自然语言处理·nlp·深度优先
模型预训练:Hugging Face Transformers 基础0. 环境安装1. Pipeline2. Tokenizer3. Model4. Config5. Datasets
瑶总迷弟2 天前
pytorch·python·华为·语言模型·自然语言处理·cnn·unix
使用 mis-tei 在昇腾310P上部署 bge-m3模型BGE-M3 是 BAAI 推出的开源多语言通用嵌入模型,支持文本嵌入、相似度计算、检索重排等多种任务,凭借优异的多语言适配能力和精度表现,被广泛应用于 RAG 知识库、文本检索、语义匹配等 AI 场景。
Chunyyyen2 天前
人工智能·自然语言处理
【第四十七周】自然语言处理课程作业记录本周主要完成自然语言处理课程作业——基于LLM的多模态视觉 Token 压缩技术研究综述的撰写,同时对项目内容进行调整。
tzc_fly2 天前
人工智能·语言模型·自然语言处理
ELF:连续扩散语言模型这是一篇来自麻省理工学院(MIT)Kaiming He(何恺明)团队等人的最新重量级论文《ELF: Embedded Language Flows》。
啦啦啦_99992 天前
自然语言处理
4. 注意力机制介绍
lzp07912 天前
人工智能·自然语言处理·机器翻译
从机器翻译到智驾:规则派的黄昏与数据革命的终局 (伍)让我们把时间拨回到规则派的鼎盛时期。SysTran的语言学家们手写了十几万条语法规则,连“一石二鸟”这种习语都要单独标注——不能逐字翻译,必须特殊处理。他们以为,只要规则足够多,机器就能理解人类语言。