语言模型

人工智能培训17 分钟前
语言模型·llm·数据采集·模型量化·多模态学习·具身智能·环境感知
具身智能如何在保证安全的前提下高效探索学习?具身智能的核心的是通过物理实体与环境的交互获取认知、优化行为,其探索学习本质是“试错—反馈—迭代”的循环。但物理交互的不可逆性(如机器人碰撞损坏、误触危险设备),使得“安全”与“高效”成为核心矛盾——过度强调安全会导致探索保守、学习低效,盲目追求高效则可能引发安全事故。结合当前技术研究成果,需从安全边界构建、学习范式优化、技术协同支撑三个层面系统设计,实现二者动态平衡,让具身智能既能“大胆探索”,也能“守住底线”。
阿杰学AI25 分钟前
人工智能·ai·语言模型·自然语言处理·aigc·机械学习·ai价值观对齐
AI核心知识82——大语言模型之AI Value Alignment(简洁且通俗易懂版)AI 价值观对齐 (AI Value Alignment) 是大语言模型领域最重要、最严肃的安全课题。
学而要时习41 分钟前
人工智能·语言模型·dnn
深度神经网络到AI大语言模型:一场被“误认为突然发生”的技术演进摘要:近年来,大语言模型(LLM)展现的跨领域泛化能力常被公众认知为"人工智能的突变式爆发"。本文从计算学习理论、网络架构机制、优化目标演进与系统工程约束四个维度,论证现代AI大模型并非技术代际的断裂,而是深度神经网络(Deep Neural Networks, DNN)在规模扩展律(Scaling Laws)与自监督学习范式驱动下的必然连续形态。所谓"智能跃迁",本质上是高维统计学习系统在数据量、参数量与计算量跨越临界规模阈值(Critical Threshold)后产生的相变现象(Phase Tran
阿杰学AI2 小时前
人工智能·ai·语言模型·自然语言处理·aigc·maas·模型即服务
AI核心知识81——大语言模型之MaaS(简洁且通俗易懂版)MaaS 是 Model as a Service(模型即服务)的缩写。在大语言模型(LLM)的语境下,它代表了一种全新的商业模式和技术分发方式。
m0_603888713 小时前
人工智能·ai·语言模型·自然语言处理·论文速览
VEQ Modality-Adaptive Quantization for MoE Vision-Language ModelsAuthors: Guangshuo Qin, Zhiteng Li, Zheng Chen, Weihang Zhang, Linghe Kong, Yulun Zhang
zhangfeng11333 小时前
人工智能·pytorch·深度学习·语言模型
大语言模型llm 量化模型 跑在 边缘设备小显存显卡 GGUF GGML PyTorch (.pth, .bin, SafeTensors)GGUF(GPT-Generated Unified Format)是 一种为机器学习模型设计的二进制文件格式,特别优化用于高效加载和运行模型,尤其是在资源受限的环境(如个人电脑、手机、边缘设备)上。
kebijuelun3 小时前
人工智能·gpt·深度学习·语言模型
Towards Automated Kernel Generation in the Era of LLMs:LLM 时代的自动化 Kernel 生成全景图现代 AI 系统的性能很大程度取决于 Kernel 的质量。Kernel 把高层算法语义翻译成硬件层的并行执行指令,但要做到接近硬件峰值性能,需要对 GPU 架构、内存层级、并行编程模型有深度理解。问题在于:
汉克老师3 小时前
人工智能·深度学习·机器学习·语言模型·prompt·提示词
小学生0基础学大语言模型应用(第 19 课《字符串提示词训练(Prompt Thinking)》)适用对象:已学过字符串、print、input信息学 / AI 素养启蒙想象一下,你面前有一个非常聪明的机器人 🤖
狮子座明仔3 小时前
人工智能·深度学习·语言模型·自然语言处理
AgentScope 深度解读:多智能体开发框架的工程化实践一句话总结:AgentScope 把多智能体开发从"每次都要造轮子"变成"拼积木"——消息驱动的通信、内置的容错机制、本地和分布式代码零差异,这三板斧砍下来,工业级多 Agent 应用的开发门槛直接降了一个量级。
庵中十三居士3 小时前
语言模型
智谱清言智能体的设定(系统提示词)新建智能体试了一下,把智谱清言的智能体提示词背后的格式测了出来。内容是:以下是具体的调试过程:
源代码杀手3 小时前
人工智能·语言模型·自然语言处理
大型语言模型的主体推理(一项综述):2026 最新!Agentic Reasoning 终极指南——最全 LLM 智能体推理论文合集 + 核心架构解析本文围绕《Agentic Reasoning for Large Language Models》综述及配套开源仓库 Awesome-Agentic-Reasoning 展开,解读了 LLM 智能体推理(Agentic Reasoning)这一核心技术。文章首先界定了智能体推理的本质 —— 构建 “思考 - 行动 - 反馈 - 进化” 闭环,具备目标导向、环境交互和自我进化能力;随后详解其三层架构(基础推理层:规划、工具使用、智能搜索;自我进化层:反馈机制、记忆管理、能力进化;集体协作层:角色分工、协同合
hjs_deeplearning5 小时前
人工智能·语言模型·自动驾驶
文献阅读篇#16:自动驾驶中的视觉语言模型:综述与展望(翻译)自动驾驶中的视觉语言模型:综述与展望文章发表于一区Top期刊IEEE Transactions on Intelligent Vehicles,DOI 10.1109/TIV.2024.3402136
破烂pan17 小时前
语言模型·模型评测
大语言模型核心评测基准详解:从认知到实践——研究测试专家学习总结文档(2026年更新版)大模型能力如“冰山”——表面流畅,水下能力需专业探针。单一指标(如BLEU)已失效,多维度、场景化、抗欺骗性的基准组合成为行业共识。本文精选9个经工业界/学术界验证的核心基准,按“定义→价值→实操→升华”四层逻辑拆解,助你: ✅ 精准定位模型能力短板 ✅ 避免评测陷阱与误读 ✅ 设计专业、可信的评测方案
司沐_Simuoss19 小时前
数据库·人工智能·sql·语言模型·系统架构
Text to SQL系统的千层套路~引言你好,我是司沐。在上个月月初,有个朋友说,他们团队正在做Text2SQL系统,想问问我有没有什么技巧。
阿杰学AI20 小时前
人工智能·ai·语言模型·自然语言处理·aigc·慢思考·深度推理
AI核心知识80——大语言模型之Slow Thinking和Deep Reasoning(简洁且通俗易懂版)慢思考 (Slow Thinking) 和 深度推理 (Deep Reasoning) 是 2024 年以 OpenAI o1 和 DeepSeek-R1 为代表的新一代大模型所引入的核心概念。
SmartBrain21 小时前
人工智能·算法·语言模型·架构·aigc·ocr
OCR 模型在医疗场景的选型研究随着医疗信息化进程的深入推进,电子病历识别和医学影像报告分析等 OCR 应用需求日益增长。然而,医疗数据的隐私敏感性和合规要求使得本地化部署成为必然选择。本研究聚焦 Qwen3-VL、DeepSeek OCR 等主流大厂模型在医疗场景下的准确率表现,为医疗机构的技术选型提供决策依据。
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·rag·知识冲突
AI核心知识79——大语言模型之Knowledge Conflict(简洁且通俗易懂版)知识冲突 (Knowledge Conflict) 是大语言模型在处理 RAG (检索增强生成) 任务时最头疼、也是最常见的现象。
vlln1 天前
人工智能·语言模型·自然语言处理·ai agent
【论文速读】MUSE: 层次记忆和自我反思提升的 Agent论文标题: Learning on the Job: An Experience-Driven, Self-Evolving Agent for Long-Horizon Tasks 作者: Cheng Yang 1 , 2 † ^{1,2†} 1,2†, Xuemeng Yang 2 † ^{2†} 2†, Licheng Wen 2 , 4 † ^{2,4†} 2,4†, Daocheng Fu 3 , 2 ^{3,2} 3,2, Jianbiao Mei 5 , 2 ^{5,2} 5,2, Rong
翱翔的苍鹰1 天前
人工智能·深度学习·语言模型·自然语言处理
一个简单的法律问答机器人实现思路法律问答机器人是当前 AI 落地最成熟、需求最明确的垂直场景之一。结合你“想做法律问答机器人”的目标,我将从 **模型选型 → 知识增强 → 部署方案 → 安全合规** 四个维度,为你提供一套**务实、高效、可落地**的技术路径,并附上一份更聚焦“法律 AI”的知识总结。
SmartBrain1 天前
人工智能·算法·语言模型·架构·aigc
AI算法工程师面试:大模型和智能体知识(含答案)目录一、中级算法工程师知识(原理题)题目1:Transformer 核心架构的原理和工作流程题目 2:多头注意力机制的设计动机