语言模型

gorgeous(๑>؂<๑)3 小时前
人工智能·计算机视觉·语言模型·自然语言处理
【ICLR26-Oral Paper-Meta】DepthLM:基于视觉语言模型的度量深度文章:DepthLM: Metric Depth From Vision Language Models
陈天伟教授4 小时前
人工智能·神经网络·搜索引擎·语言模型·自然语言处理
人工智能应用- 搜索引擎:04. 网页重要性评估搜索引擎不仅需要找到包含关键词的网页,还要对这些网页进行排序,以便用户在最短时间内获取到最有价值的信息。
gorgeous(๑>؂<๑)7 小时前
人工智能·算法·语言模型·自然语言处理
【ICLR26-Oral Paper】透过对比的视角:视觉语言模型中的自改进视觉推理文章:THROUGH THE LENS OF CONTRAST: SELF-IMPROVING VISUAL REASONING IN VLMS
量子-Alex7 小时前
人工智能·语言模型·自然语言处理
【大模型思维链】Tree of Thoughts: Deliberate Problem Solving with Large Language Models语言模型正日益广泛地部署于解决各类通用任务,但在推理过程中仍受限于基于词元、从左至右的决策模式。这意味着它们在处理需要探索性、战略性前瞻或初始决策起关键作用的任务时可能存在不足。为克服这些挑战,我们提出了一种新的语言模型推理框架——“思维树”(ToT),该框架推广了当前流行的“思维链”提示方法,允许模型对作为问题解决中间步骤的连贯文本单元(即“思维”)进行系统性探索。ToT使语言模型能够通过考量多种推理路径、对选择进行自我评估以确定后续行动方案,并在必要时通过前瞻或回溯机制做出全局决策,从而实现审慎的决策
MoonOutCloudBack9 小时前
人工智能·机器学习·语言模型·自然语言处理
VeRL 框架 RL 微调大语言模型,algorithm.use_pf_ppo 参数详解在 verl 框架 里,use_pf_ppo(完整路径通常是 algorithm.use_pf_ppo)是一个开关参数,用来控制是否启用 PF‑PPO(Preference Feedback PPO,偏好反馈 PPO) 这套额外的重加权机制。
阿杰学AI9 小时前
人工智能·语言模型·自然语言处理·aigc·生成式ai·generative ai
AI核心知识98——大语言模型之 Generative AI(简洁且通俗易懂版)生成式 AI (Generative AI / GenAI),或者在国内常被称为 AIGC (Artificial Intelligence Generated Content),是人工智能发展史上的分水岭。
阿杰学AI10 小时前
人工智能·ai·语言模型·自然语言处理·aigc·新型职业·ai美学工程师
AI核心知识108—大语言模型之 AI Aesthetics Engineer(简洁且通俗易懂版)AI美学工程师 (AI Aesthetics Engineer) 并不是传统意义上的“程序员”,而是一个横跨技术、艺术与产品的新兴复合型角色。
陈天伟教授10 小时前
神经网络·搜索引擎·语言模型·自然语言处理·机器翻译
人工智能应用- 搜索引擎:06. PageRank 算法搜索引擎是互联网时代不可或缺的工具,它让我们得以在信息的海洋中迅速找到所需要的内容。通过倒排索引技术,搜索引擎能够高效定位与查询词相关的网页,而像PageRank 这样的排序算法则帮助我们对搜索结果进行排序,从而将最有价值的信息优先呈现给用户。这些技术的结合,不仅提升了搜索的准确性,还极大地改善了用户体验。
大模型任我行11 小时前
人工智能·语言模型·自然语言处理·论文笔记
阿里:具身智能模型ABot-M0📖标题:ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning 🌐来源:arXiv, 2602.11236v1
阿杰学AI12 小时前
人工智能·ai·语言模型·自然语言处理·aigc·prompt engineer·提示词工程师
AI核心知识107—大语言模型之 Prompt Engineer(简洁且通俗易懂版)提示词工程师 (Prompt Engineer) 是大语言模型爆发初期诞生,且目前依然非常关键的一个技术角色。
量子-Alex1 天前
人工智能·语言模型·自然语言处理
【大模型思维链】自洽性提升语言模型中的思维链推理能力SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS 自洽性提升语言模型中的思维链推理能力
硅谷秋水1 天前
深度学习·机器学习·计算机视觉·语言模型·机器人
RoboBrain 2.5:视野中的深度,思维中的时间26年1月来自北京智源的论文“RoboBrain 2.5: Depth in Sight, Time in Mind”。
MaoziShan1 天前
人工智能·机器学习·语言模型·自然语言处理
CMU Subword Modeling | 07 Allomorphy在语言学里,我们之前学过 morpheme(词素) 是最小的有意义单位(意义不随单词形式改变)。但有时候:同一个 morpheme 在不同环境里会表现成不同的形式(signifier),而意义(signified)不变。这种现象就叫 Allomorphy(音形变体现象)。通俗地讲:
minhuan1 天前
人工智能·语言模型·自然语言处理·qwen2-vl·轻量化vlm模型
大模型应用:轻量化视觉语言模型(VLM):基于Qwen2-VL多模态模型实践.87随着大模型技术从单一文本交互迈向多模态智能时代,视觉语言模型(VLM)已成为连接图像感知与语言理解的关键载体。传统大参数VLM凭借强大的综合能力,在图文问答、视觉推理等领域展现出惊人效果,但其对算力与存储的极高要求,也让多模态 AI 长期局限于云端服务与高端硬件环境,难以走向更广泛的落地场景。
MaoziShan1 天前
人工智能·机器学习·语言模型·自然语言处理
CMU Subword Modeling | 08 Non-Concatenative Morphological Processes在之前的章节我们看到,大部分词构造是通过 Concatenative morphology(连接形态学) 实现的:词素按顺序串联(prefix、suffix、compounding)组成词。例如:
大模型任我行1 天前
人工智能·语言模型·自然语言处理·论文笔记
百度:动态偏好选择提升LLM对齐稳定性📖标题:Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models 🌐来源:arXiv, 2602.01207v1
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·agent·智能体·多智能体架构师
AI核心知识105—大语言模型之 Multi-Agent Architect(简洁且通俗易懂版)多智能体架构师 (Multi-Agent Architect) 是 2024 年随着 AI Agent 爆发而涌现出的一个顶层技术设计角色。
怀璧其罪1 天前
语言模型
树莓派zero安装openclaw第一段:nodejs安装,由于openclaw官方要求 版本至少22,而树莓派zero是armv6l,node官方版本已经不支持,只能安装非官方编译的版本
大模型任我行1 天前
人工智能·语言模型·自然语言处理·论文笔记
腾讯:Agent视觉隐喻迁移📖标题:Beyond Pixels: Visual Metaphor Transfer via Schema-Driven Agentic Reasoning 🌐来源:arXiv, 2602.01335v1
文艺倾年1 天前
java·开发语言·人工智能·语言模型·自然语言处理·大模型·免训练
【源码精讲+简历包装】LeetcodeRunner—手搓调试器轮子(20W字-下)😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【源码精讲+简历包装】LeetcodeRunner—手搓调试器,期待与你一同探索、学习、进步,一起卷起来叭! 🔔源码地址:https://github.com/xuhuafeifei/leetcode-runner(点点star了) 🔔作者:飞哥不鸽、文艺倾年