技术栈
语言模型
量子-Alex
9 小时前
人工智能
·
语言模型
·
自然语言处理
【大模型思维链】自洽性提升语言模型中的思维链推理能力
SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS 自洽性提升语言模型中的思维链推理能力
硅谷秋水
10 小时前
深度学习
·
机器学习
·
计算机视觉
·
语言模型
·
机器人
RoboBrain 2.5:视野中的深度,思维中的时间
26年1月来自北京智源的论文“RoboBrain 2.5: Depth in Sight, Time in Mind”。
MaoziShan
11 小时前
人工智能
·
机器学习
·
语言模型
·
自然语言处理
CMU Subword Modeling | 07 Allomorphy
在语言学里,我们之前学过 morpheme(词素) 是最小的有意义单位(意义不随单词形式改变)。但有时候:同一个 morpheme 在不同环境里会表现成不同的形式(signifier),而意义(signified)不变。这种现象就叫 Allomorphy(音形变体现象)。通俗地讲:
minhuan
15 小时前
人工智能
·
语言模型
·
自然语言处理
·
qwen2-vl
·
轻量化vlm模型
大模型应用:轻量化视觉语言模型(VLM):基于Qwen2-VL多模态模型实践.87
随着大模型技术从单一文本交互迈向多模态智能时代,视觉语言模型(VLM)已成为连接图像感知与语言理解的关键载体。传统大参数VLM凭借强大的综合能力,在图文问答、视觉推理等领域展现出惊人效果,但其对算力与存储的极高要求,也让多模态 AI 长期局限于云端服务与高端硬件环境,难以走向更广泛的落地场景。
MaoziShan
15 小时前
人工智能
·
机器学习
·
语言模型
·
自然语言处理
CMU Subword Modeling | 08 Non-Concatenative Morphological Processes
在之前的章节我们看到,大部分词构造是通过 Concatenative morphology(连接形态学) 实现的:词素按顺序串联(prefix、suffix、compounding)组成词。例如:
大模型任我行
16 小时前
人工智能
·
语言模型
·
自然语言处理
·
论文笔记
百度:动态偏好选择提升LLM对齐稳定性
📖标题:Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models 🌐来源:arXiv, 2602.01207v1
阿杰学AI
17 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
agent
·
智能体
·
多智能体架构师
AI核心知识105—大语言模型之 Multi-Agent Architect(简洁且通俗易懂版)
多智能体架构师 (Multi-Agent Architect) 是 2024 年随着 AI Agent 爆发而涌现出的一个顶层技术设计角色。
怀璧其罪
17 小时前
语言模型
树莓派zero安装openclaw
第一段:nodejs安装,由于openclaw官方要求 版本至少22,而树莓派zero是armv6l,node官方版本已经不支持,只能安装非官方编译的版本
大模型任我行
18 小时前
人工智能
·
语言模型
·
自然语言处理
·
论文笔记
腾讯:Agent视觉隐喻迁移
📖标题:Beyond Pixels: Visual Metaphor Transfer via Schema-Driven Agentic Reasoning 🌐来源:arXiv, 2602.01335v1
文艺倾年
19 小时前
java
·
开发语言
·
人工智能
·
语言模型
·
自然语言处理
·
大模型
·
免训练
【源码精讲+简历包装】LeetcodeRunner—手搓调试器轮子(20W字-下)
😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【源码精讲+简历包装】LeetcodeRunner—手搓调试器,期待与你一同探索、学习、进步,一起卷起来叭! 🔔源码地址:https://github.com/xuhuafeifei/leetcode-runner(点点star了) 🔔作者:飞哥不鸽、文艺倾年
宇擎智脑科技
20 小时前
人工智能
·
爬虫
·
语言模型
Crawl4AI:面向大语言模型的开源智能网页爬虫框架深度解析
随着大语言模型(LLM)技术的快速发展,如何高效获取高质量的网页数据成为构建 RAG(检索增强生成)系统、AI Agent 和数据管道的关键挑战。Crawl4AI 作为 GitHub 上最受关注的开源网页爬虫项目之一(50K+ Stars),专为 LLM 应用场景设计,提供了从网页内容到 LLM 友好型 Markdown 的完整解决方案。本文将从技术架构、AI 集成能力和实际应用场景三个维度,对 Crawl4AI 进行系统性分析。
阿杰学AI
20 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
世界模型
·
世界模型训练师
AI核心知识106—大语言模型之 World Model Trainer(简洁且通俗易懂版)
世界模型训练师 (World Model Trainer) 是 AI 领域中一个极具未来感、正在快速崛起的新兴职业。
DisonTangor
21 小时前
人工智能
·
语言模型
·
自然语言处理
·
开源
·
aigc
MiniMax AI 开源 MiniMax-M2.5
今天我们推出最新模型 MiniMax-M2.5。该模型在数十万复杂现实场景中通过强化学习进行广泛训练,在编程、智能体工具使用与搜索、办公及一系列高经济价值任务上达到业界顶尖水平,其**SWE-Bench Verified通过率80.2%、Multi-SWE-Bench 51.3%、BrowseComp(含上下文管理)76.3%**的表现尤为亮眼。
陈天伟教授
1 天前
人工智能
·
神经网络
·
搜索引擎
·
语言模型
·
自然语言处理
·
机器翻译
人工智能应用- 搜索引擎:01. 互联网时代
搜索引擎是互联网时代获取信息的重要工具,广泛应用于我们的日常生活中。一个优秀的搜索引擎需要解决两个关键问题:(1)如何找到与用户搜索意图相匹配的文档;(2)如何对这些文档进行重要性排序。前者依赖“倒排索引”技术,后者则使用排序算法,其中最著名的是Google 的PageRank 算法。本节将介绍这些关键技术,揭开搜索引擎背后的工作机制。
shenxianasi
1 天前
人工智能
·
机器学习
·
计算机视觉
·
语言模型
·
自然语言处理
·
vllm
·
audiolm
【论文精读】Language Is Not All You Need: Aligning Perceptionwith Language Models
目录一、前言二、KOSMOS-11.输入表示2.MLLMs为什么MAGNETO在Transformer的每个子层(即MHA和FFN)中都引入一个额外的LayerNorm?为什么这样设计?
DevilSeagull
1 天前
人工智能
·
语言模型
·
自然语言处理
大语言模型完全指南
AI模型本质上是一个经过训练的"智能处理系统"。想象一个超级工厂,它通过学习海量案例数据,自主归纳出执行特定任务的规则体系。
硅谷秋水
1 天前
深度学习
·
机器学习
·
计算机视觉
·
语言模型
·
机器人
用于机器人控制的因果世界建模
26年1月来自蚂蚁Robbyant的论文“Causal World Modeling for Robot Control”。
文艺小码农
1 天前
人工智能
·
深度学习
·
语言模型
·
自然语言处理
·
集成学习
PEFT 库中文本生成LoRA 教程
在本教程中介绍如何使用的 peft 库和 bitsandbytes 来以 8-bits 加载大语言模型,并对其进行高效微调。微调方法使用“低秩适配器”(LoRA)的方法
MaoziShan
2 天前
开发语言
·
人工智能
·
机器学习
·
语言模型
·
自然语言处理
·
c#
CMU Subword Modeling | 09 Lexemes, or What Dictionaries Know about Morphology
我们平常说的 “word(词)” 在语言学里其实有两个不同层次:通俗理解:Lexeme 就是词的“家族”。一个 lexeme 是一组意义相同但形式不同的 word forms 的集合。例如:
SmartBrain
2 天前
人工智能
·
语言模型
·
aigc
经营洞察:三种经营哲学的核心内涵和实践机制
目录一、三种经营哲学的核心内涵与理论基础1.1 稻盛和夫:以 "敬天爱人" 为根基的价值创造哲学1.2 任正非:基于熵减理论的组织进化哲学