语言模型

阿拉雷️10 小时前
人工智能·语言模型·prompt
AI Agent 入门与实战:从对话到干活,理解下一代AI工作方式一、背景 2026年上半年,AI行业最重要的一次范式转移已经发生。从ChatGPT到Claude,从豆包到DeepSeek,我们熟悉的大语言模型正在从"对话工具"演变为"执行者"。这种新的AI形态被称为Agent——AI智能体。
硅谷秋水6 小时前
人工智能·深度学习·语言模型·机器人
FATE:面向物理落地机器人课程学习具备主动修复功能且考虑可行性-觉察的闭环任务生成方法26年3月来自清华和BIGAI的论文“FATE: Closed-Loop Feasibility-Aware Task Generation with Active Repair for Physically Grounded Robotic Curricula”。
A.说学逗唱的Coke7 小时前
人工智能·语言模型
【大模型专题】Qoder 实战指南:从安装到 Agents 自主开发全流程阿里云 Qoder CN —— 下一代 Agentic 编程平台深度实战手册2026 年,AI 编程工具的战场已经从「谁的补全更准」转向了「谁能自主交付完整功能」。当你还在手动 Tab 补全代码时,别人已经把整个功能需求扔给 AI,下班前验收结果了。
MartinYeung510 小时前
人工智能·学习·语言模型
[论文学习]BackdoorLLM:大语言模型后门攻击与防御的综合性基准——深度解析大语言模型(LLM)在各类任务中取得了卓越表现,但其安全性面临一个严峻挑战——后门攻击:攻击者通过在输入中植入特定触发器,即可操控模型产生预设的恶意输出。然而,现有后门研究主要聚焦于视觉模型和文本分类任务,生成式LLM的后门威胁长期处于研究空白。
大模型任我行11 小时前
人工智能·语言模型·自然语言处理·论文笔记
百度:渐进多令牌预测加速文档解析📖标题:P-MTP: Efficient Document Parsing via Multi-Token Prediction with Progressive Depth Scaling 🌐来源:arXiv, 2606.24447v1
枫叶林FYL1 天前
人工智能·计算机视觉·语言模型
ReMoT:运动对比三元组强化学习——解决视觉语言模型的时空一致性缺陷来源: CVPR 2026 (IEEE/CVF Conference on Computer Vision and Pattern Recognition) arXiv: 2603.00461 作者: Cong Wan, Zeyu Guo, Jiangyang Li, Songlin Dong, Yifan Bai, Lin Peng, Zhiheng Ma, Yihong Gong 机构: 西安交通大学、深圳理工大学、阿里巴巴达摩院 基座模型: Qwen3-VL-4B-Thinking 数据集: ReM
owCode1 天前
语言模型·chatgpt·github·llama·gpu算力
Windows RX6500XT(gfx1034) Ollama AMD ROCm 完整安装教程我的显卡:RX 6500XT = gfx1034,官方Ollama不原生支持,需使用社区魔改ollama-for-amd + 对应gfx1034 ROCmLibs + HIP SDK 5.7系列,全程严格保证版本三统一:
阿拉雷️1 天前
人工智能·语言模型·prompt
Prompt工程设计实践:从基础模板到场景化策略本文基于2026年6月实践整理。Prompt工程的关键不是收集模板,是理解不同场景下的设计策略。梳理6个核心策略及对应模板。
Zzj_tju1 天前
人工智能·学习·语言模型
Test-Time Scaling 与推理时计算:搜索、验证器、反思和自一致性系列:AI 论文盘点 / 技术趋势第二轮:2026 AI 系统与 Agent 基础设施专题 日期:2026-07-03 适合读者:研究生、LLM/Agent 研究者、模型应用与推理系统工程师 检索日期:2026-07-03
江华森1 天前
人工智能·语言模型·自然语言处理
人工智能 AI 大语言模型 多模态 — 从 API 调用到 Agent 实战服务器: 华为云 FlexusX ecs-d2c2-0001 (8vCPU/16GiB, Ubuntu 24.04) Python: 3.12.3 | Flask: 3.1.3 | Markdown: 3.10.2 实验总数: 26 个 | 实战环境: 真实服务器上机执行
水上冰石1 天前
语言模型
什么是 Hermes 大模型?Hermes 不是从头训练的基础模型,而是基于现有的强大基础模型(如 Meta 的 Llama 2、Mistral 等),通过指令微调 得到的一系列对话模型。你可以把它理解成:
小小工匠18 天前
人工智能·语言模型·自然语言处理
拆解大语言模型:从词向量到注意力机制的内部运行原理当你向 ChatGPT 输入一句话,它在零点几秒内就能续写出流畅、连贯甚至富有洞察力的文字。这背后没有任何人类工程师编写的「逐步指令」,只有一张由数千亿参数构成的神经网络。本文尝试用尽量少的数学,把这张网络内部真正发生的事情讲清楚。
大鱼>18 天前
物联网·struts·语言模型·多模态·aiot
大语言模型+物联网:LLM理解物理世界当LLM学会了"看"传感器数据、"听"设备告警、“说"控制指令,物联网就从"自动化"进化到了"智能化”。这不是科幻,而是正在发生的技术融合。
AndrewHZ18 天前
人工智能·语言模型·大模型·llm·cot·思维链·icl
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)摘要:本文是《LLM技术全景:从Token到部署》系列第七篇。为什么大模型"看几个例子就能举一反三",而无需任何参数更新?为什么只是加上"Let’s think step by step",数学推理准确率就能翻倍?本文深度解析两大神秘能力——In-Context Learning(上下文学习)与Chain-of-Thought(思维链),拆解其工作机制,探讨涌现现象背后的规律,并给出实用的Prompt工程指南。
生成论实验室18 天前
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
机器人:一个自主运动的系统我们先不谈AI,不谈传感器,不谈运动控制算法。先谈一个更根本的问题:机器人是什么?传统定义告诉我们:机器人是一种能够自动执行任务的机器装置。它由传感器、控制器和执行器组成,按照预设程序或AI指令运行。
Data-Miner18 天前
人工智能·microsoft·语言模型
大语言模型+智能体AI,122页PPT详解落地应用培训!本课件是面向人工智能通识教育的培训材料,系统讲解智能体(Agent)与智能体AI(Agentic AI)的核心概念、技术原理与应用场景,帮助学习者建立从传统AI到智能体AI时代的完整认知框架。
枫叶林FYL18 天前
人工智能·语言模型
BRIDGE:多模态查询的强化学习对齐与文本检索重构本系列基于 Mounis et al. (2026), BRIDGE: Multimodal-to-Text Retrieval via Reinforcement-Learned Query Alignment (arXiv:2604.07201)。所有实验数据、架构设计与消融结论均引用自该工作,叙述方式按工程直觉范式重新编排。
暮云星影18 天前
arm开发·人工智能·语言模型·自然语言处理
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)在 RK3588开发板上,利用 Rockchip NPU 运行大语言模型(LLM),测试模型包括:设备
生成论实验室18 天前
人工智能·算法·机器学习·语言模型·机器人·自动驾驶·安全架构
自动驾驶:一个自主运动的系统我们先不谈传感器,不谈算法,不谈算力。先谈一个更根本的问题:自动驾驶汽车是什么?传统定义告诉我们:自动驾驶汽车是一种能够感知环境、规划路径并自动控制行驶的智能车辆。它由摄像头、激光雷达、毫米波雷达、高精地图、域控制器和执行器组成,按照预设规则或AI模型运行。
searchforAI19 天前
人工智能·科技·深度学习·ai·语言模型·知识图谱·agent
啥是LLM?大语言模型从原理到选型的完整科普本文整理自B站「AI专业知识科普:啥是LLM(大语言模型)」,通过AI音视频总结工具 Ai好记 转文字+截取PPT整理,以下为精炼整理后的内容。