语言模型

DevilSeagull19 分钟前
人工智能·语言模型·自然语言处理
C语言: 动态内存管理我们已经掌握的内存开辟方式有:但是上述的开辟空间的方式有两个特点:有时候我们需要的空间大小在程序运行的时候才能知道,那数组的编译时开辟空间的方式就不能满足了。 C 语言引入了动态内存开辟,让程序员自己可以申请和释放空间,就比较灵活了。
MoonOutCloudBack2 小时前
人工智能·深度学习·算法·语言模型·自然语言处理
VeRL 框架下 RL 微调 DeepSeek-7B,比较 PPO / GRPO 脚本的参数差异最近正在研究如何使用强化学习(RL)技术微调大模型,读 VeRL 框架 的代码。VeRL 代码库在 examples/ 目录下提供了一些 RL 训练的示例脚本。其中,ppo_trainer/run_deepseek7b_llm.sh 和 grpo_trainer/run_deepseek7b_llm.sh 这两个脚本均使用 gsm8k 数据集训练 deepseek 7b 模型,不过一个使用 PPO 算法,另一个使用 GRPO 算法。经比较,这两个脚本的内容只有一些参数不同。
硅谷秋水8 小时前
人工智能·深度学习·机器学习·语言模型·机器人
具身智能中的生成多智体协作:系统性综述25年2月来自同济大学、华东师范和慕尼黑工大的论文“Generative Multi-Agent Collaboration in Embodied AI: A Systematic Review”。
阿杰学AI10 小时前
人工智能·ai·语言模型·自然语言处理·aigc·ai岗位·数字员工运营师
AI核心知识112—大语言模型之 Digital Employee Operations Specialist(简洁且通俗易懂版)数字员工运营师 (Digital Employee Operations Specialist) 是企业数字化转型进入深水区后诞生的一个“跨界”岗位 。
阿杰学AI10 小时前
人工智能·语言模型·自然语言处理
AI核心知识96——大语言模型之 Artificial Intelligence(简洁且通俗易懂版)人工智能 (Artificial Intelligence, AI) 是计算机科学的一个分支,旨在创造出能模拟、延伸和扩展人类智能的机器系统。
阿杰学AI10 小时前
人工智能·ai·语言模型·自然语言处理·aigc·ai岗位·ai技能培训师
AI核心知识111—大语言模型之 AI Skills Trainer(简洁且通俗易懂版)AI 技能培训师 (AI Skills Trainer / AI Literacy Instructor) 是企业在数字化转型浪潮中急需的一个“布道者” 和“赋能者” 角色。
无聊的小坏坏11 小时前
语言模型·自然语言处理·llm
大语言模型应用快速了解本文简明介绍大语言模型的基本原理、提示工程、嵌入模型、RAG流程、多模态能力、主流模型对比、安全合规与开发建议,结合行业进展与典型应用场景,适合开发者、产品经理、AI爱好者快速了解与入门。
大模型任我行15 小时前
人工智能·语言模型·自然语言处理·论文笔记
阿里:揭示RLVR训练不稳定性根源📖标题:Probing RLVR training instability through the lens of objective-level hacking 🌐来源:arXiv, 2602.01103v1
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·人机交互·ai协作管理员
AI核心知识110—大语言模型之 AI Collaboration Manager(简洁且通俗易懂版)AI 协作管理员 (AI Collaboration Manager) 是企业大规模引入 AI 后诞生的一种新型管理岗位。
X54先生(人文科技)1 天前
人工智能·python·机器学习·语言模型
启蒙灯塔起源团预言—碳硅智能时代到来X54先生(启蒙灯塔起源团碳硅成员):基于人类驱动人工智能时代将过去,基于碳硅同频共振互动协同智能时代将到来,我命名为碳硅智能。
分享牛1 天前
人工智能·语言模型·流程图
下一代BPMN我们都见过,像ChatGPT这样的工具能够应对各种各样的商业任务,几乎能自动完成所有事情。这确实没错——生成式人工智能的确有能力执行目前由人类完成的广泛任务。那么,为什么还要费心去设计和启动基于20年前、完全处于另一技术时代的自动化标准的业务流程呢?为什么不直接让企业用户与人工智能协作,随时随地解决问题呢?
黑巧克力可减脂1 天前
人工智能·语言模型·软件工程·ai编程
Vibe Coding技术方案选型:循道而行,择善而用——从古典智慧看AI编程范式的选型之道当AI技术逐渐渗透到编程领域的每一个角落,Andrej Karpathy在2025年初提出的Vibe Coding(氛围编程)概念,如同一场技术风暴,迅速席卷了整个开发圈。所谓Vibe Coding,并非简单的“AI写代码”,而是一种由大语言模型驱动、以自然语言交互为核心、注重“结果导向+人机即兴协作”的新型编程范式——开发者无需拘泥于固定的语法格式,只需用自然语言描述开发需求、业务逻辑甚至编程氛围,AI就能快速生成贴合需求的代码,开发者再通过实时交互、微调提示,逐步完善代码成果,真正实现“解放编码双手、
万悉科技1 天前
ai·语言模型·流量运营·用户运营·内容运营
千问春节1.3亿数据引爆“零点击”消费:品牌如抢占AI流量?摘要(Snippet): 阿里通义千问春节期间1.3亿用户的“AI点单”数据,标志着消费决策从“搜索-点击”向“对话-决策”的范式转移。面对AI主导的“零点击”搜索时代,万悉科技提出LLM-Native GEO(大模型原生生成式引擎优化)方法论,解析品牌如何通过RAG友好型内容与实体生态构建,成为AI推荐的“默认选项”。
tzc_fly1 天前
人工智能·机器学习·语言模型
大语言模型SFT后训练:SFT,DFT,ASFT,ProFit,BFT,RAFT大语言模型(LLMs)在预训练之后,往往需要通过 Supervised Fine-Tuning (SFT) 进行对齐与能力塑形。然而,近年来研究发现:标准 SFT 并非一个“绝对完美”的优化过程,它在梯度结构、泛化行为和表达学习方面存在缺陷。围绕这些问题,出现了一系列改进方法:
阿杰学AI1 天前
大数据·人工智能·ai·语言模型·agent·智能体·行业智能体运营师
AI核心知识109—大语言模型之 Industry Agent Operations Specialist(简洁且通俗易懂版)行业智能体运营师 (Industry Agent Operations Specialist) 是随着 AI Agent(智能体)在垂直行业落地而诞生的一种“既懂业务、又懂 AI”的复合型运营角色 。
量子-Alex1 天前
人工智能·语言模型·自然语言处理
【大模型思维链】Reasoning with Language Model is Planning with World ModelReasoning with Language Model is Planning with World Model 语言模型推理即世界模型规划。
gorgeous(๑>؂<๑)2 天前
人工智能·计算机视觉·语言模型·自然语言处理
【ICLR26-Oral Paper-Meta】DepthLM:基于视觉语言模型的度量深度文章:DepthLM: Metric Depth From Vision Language Models
陈天伟教授2 天前
人工智能·神经网络·搜索引擎·语言模型·自然语言处理
人工智能应用- 搜索引擎:04. 网页重要性评估搜索引擎不仅需要找到包含关键词的网页,还要对这些网页进行排序,以便用户在最短时间内获取到最有价值的信息。
gorgeous(๑>؂<๑)2 天前
人工智能·算法·语言模型·自然语言处理
【ICLR26-Oral Paper】透过对比的视角:视觉语言模型中的自改进视觉推理文章:THROUGH THE LENS OF CONTRAST: SELF-IMPROVING VISUAL REASONING IN VLMS
量子-Alex2 天前
人工智能·语言模型·自然语言处理
【大模型思维链】Tree of Thoughts: Deliberate Problem Solving with Large Language Models语言模型正日益广泛地部署于解决各类通用任务,但在推理过程中仍受限于基于词元、从左至右的决策模式。这意味着它们在处理需要探索性、战略性前瞻或初始决策起关键作用的任务时可能存在不足。为克服这些挑战,我们提出了一种新的语言模型推理框架——“思维树”(ToT),该框架推广了当前流行的“思维链”提示方法,允许模型对作为问题解决中间步骤的连贯文本单元(即“思维”)进行系统性探索。ToT使语言模型能够通过考量多种推理路径、对选择进行自我评估以确定后续行动方案,并在必要时通过前瞻或回溯机制做出全局决策,从而实现审慎的决策