自然语言处理

大模型任我行21 分钟前
人工智能·语言模型·自然语言处理·论文笔记
腾讯:Agent视觉隐喻迁移📖标题:Beyond Pixels: Visual Metaphor Transfer via Schema-Driven Agentic Reasoning 🌐来源:arXiv, 2602.01335v1
文艺倾年1 小时前
java·开发语言·人工智能·语言模型·自然语言处理·大模型·免训练
【源码精讲+简历包装】LeetcodeRunner—手搓调试器轮子(20W字-下)😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【源码精讲+简历包装】LeetcodeRunner—手搓调试器,期待与你一同探索、学习、进步,一起卷起来叭! 🔔源码地址:https://github.com/xuhuafeifei/leetcode-runner(点点star了) 🔔作者:飞哥不鸽、文艺倾年
阿杰学AI2 小时前
人工智能·ai·语言模型·自然语言处理·aigc·世界模型·世界模型训练师
AI核心知识106—大语言模型之 World Model Trainer(简洁且通俗易懂版)世界模型训练师 (World Model Trainer) 是 AI 领域中一个极具未来感、正在快速崛起的新兴职业。
DisonTangor3 小时前
人工智能·语言模型·自然语言处理·开源·aigc
MiniMax AI 开源 MiniMax-M2.5今天我们推出最新模型 MiniMax-M2.5。该模型在数十万复杂现实场景中通过强化学习进行广泛训练,在编程、智能体工具使用与搜索、办公及一系列高经济价值任务上达到业界顶尖水平,其**SWE-Bench Verified通过率80.2%、Multi-SWE-Bench 51.3%、BrowseComp(含上下文管理)76.3%**的表现尤为亮眼。
陈天伟教授4 小时前
人工智能·神经网络·搜索引擎·语言模型·自然语言处理·机器翻译
人工智能应用- 搜索引擎:01. 互联网时代搜索引擎是互联网时代获取信息的重要工具,广泛应用于我们的日常生活中。一个优秀的搜索引擎需要解决两个关键问题:(1)如何找到与用户搜索意图相匹配的文档;(2)如何对这些文档进行重要性排序。前者依赖“倒排索引”技术,后者则使用排序算法,其中最著名的是Google 的PageRank 算法。本节将介绍这些关键技术,揭开搜索引擎背后的工作机制。
shenxianasi5 小时前
人工智能·机器学习·计算机视觉·语言模型·自然语言处理·vllm·audiolm
【论文精读】Language Is Not All You Need: Aligning Perceptionwith Language Models目录一、前言二、KOSMOS-11.输入表示2.MLLMs为什么MAGNETO在Transformer的每个子层(即MHA和FFN)中都引入一个额外的LayerNorm?为什么这样设计?
DevilSeagull5 小时前
人工智能·语言模型·自然语言处理
大语言模型完全指南AI模型本质上是一个经过训练的"智能处理系统"。想象一个超级工厂,它通过学习海量案例数据,自主归纳出执行特定任务的规则体系。
文艺小码农16 小时前
人工智能·深度学习·语言模型·自然语言处理·集成学习
PEFT 库中文本生成LoRA 教程在本教程中介绍如何使用的 peft 库和 bitsandbytes 来以 8-bits 加载大语言模型,并对其进行高效微调。微调方法使用“低秩适配器”(LoRA)的方法
MaoziShan19 小时前
开发语言·人工智能·机器学习·语言模型·自然语言处理·c#
CMU Subword Modeling | 09 Lexemes, or What Dictionaries Know about Morphology我们平常说的 “word(词)” 在语言学里其实有两个不同层次:通俗理解:Lexeme 就是词的“家族”。一个 lexeme 是一组意义相同但形式不同的 word forms 的集合。例如:
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·大模型全栈工程师·新型职业
AI核心知识104—大语言模型之 LLM Full Stack Engineer(简洁且通俗易懂版)大模型全栈工程师 (LLM Full Stack Engineer) 是 AI 时代诞生的一种“超级个体”或新型技术角色。
量子-Alex1 天前
人工智能·语言模型·自然语言处理
【大模型智能体】作为数字原子与分子的AI智能体:大型语言模型在计算生物物理领域开启新纪元Large Language Models as AI Agents for Digital Atoms and Molecules: Catalyzing a New Era in Computational Biophysics 作为数字原子与分子的AI智能体:大型语言模型在计算生物物理领域开启新纪元
好家伙VCC1 天前
java·python·自然语言处理·分类·bert
# BERT在中文文本分类中的实战优化:从模型微调到部署全流程在自然语言处理(NLtrain_labels = df[‘label’].tolist()from transformers import AutoTokenizer
陈天伟教授1 天前
人工智能·神经网络·游戏·自然语言处理·机器人·机器翻译
人工智能应用- 扫地机器人:02. 机器人 ≠ 人工智能很多人会将“机器人”和“人工智能”画上等号。但实际上,这两个概念既有关联,又不等同。多数机器人仍是预设程序的“执行器”,并不具备真正的“理解”与“思考”能力。
MaoziShan1 天前
人工智能·机器学习·自然语言处理
CMU Subword Modeling | 03 Productivity and GeneralizationProductivity & Generalization(生产力与泛化)这一讲的核心思想是:语言中的形态学规则 / 子词组合规则怎样推广到新词? 也就是说,我们不只是看 一个词怎么表示,我们关心 一个模式能不能“生”出新词。(dmort27.github.io)
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·产品经理·ai产品经理·ai pm
AI核心知识103——大语言模型之 AI PM(简洁且通俗易懂版)AI 产品经理 (AI Product Manager, 简称 AI PM) 是人工智能时代诞生的一种全新职业角色。
MARS_AI_1 天前
大数据·人工智能·自然语言处理·交互·信息与通信
2026年大模型呼叫厂商深度盘点:8家核心玩家及选型指南2026年,大模型呼叫系统市场正在经历根本性转变。根据IDC最新数据,2025年中国智能语音交互市场规模已突破480亿元。
Yaozh、1 天前
人工智能·深度学习·神经网络·自然语言处理·nlp·word2vec
【word2vec模型】两种模型结构CBOW和Skip-gram的具体过程Word Embedding(词嵌入) 是自然语言处理(NLP)中的一项基础技术,它的核心目的是将人类语言中的词语转换成计算机能够理解和计算的数字形式——即向量(Vectors)。
陈天伟教授1 天前
人工智能·神经网络·语言模型·自然语言处理·机器人·机器翻译
人工智能应用- 扫地机器人:01.什么是机器人在人工智能逐渐融入日常生活的今天,有一类低调却极富技术含量的“家电新成员”悄然改变着我们的生活方式——扫地机器人。它不再是传统意义上的家用电器,而是集成了传感、定位、路径规划等多个智能模块的移动机器人。
MaoziShan2 天前
人工智能·自然语言处理
CMU Subword Modeling | 02 Signs, Minimal Signs, and Compositionality在自然语言处理里,我们希望模型真正“理解”语言,而不仅仅是把字符拼凑在一起。为此,我们要理解一个最基础的概念。
量子-Alex2 天前
人工智能·语言模型·自然语言处理
【大模型智能体】基于大语言模型的角色扮演Role play with large language models 基于大语言模型的角色扮演随着对话代理的行为表现日趋拟人化,我们必须建立有效的描述框架,以高层次术语刻画其行为特征,同时避免陷入拟人化陷阱。本文凸显"角色扮演"的核心概念,通过该理论框架阐释对话代理行为,使我们能够借助熟悉的民间心理学术语进行论述,而无需将语言模型实际不具备的人类特性强加于它们。基于此方法,我们重点探讨对话代理行为中两个重要案例:表面性欺骗与表面性自我意识。