语言模型

码上掘金3 小时前
人工智能·yolo·语言模型
基于YOLO和大语言模型的PCB智能缺陷检测系统PCB Intelligent Defect Detection System based on YOLO & LLM 基于 YOLOv8 + LLaVA 的PCB智能缺陷检测系统
dog2506 小时前
人工智能·语言模型·自然语言处理·高尔顿板
LLM(大语言模型)和高尔顿板先了解一下 高尔顿板,这是个展示中心极限定理的物理装置,这装置比代码更直观。我将大数定律和中心极限定理视作宇宙的根本规则,不禁用它们解释一切。
乐鑫科技 Espressif7 小时前
ai·语言模型·iot·乐鑫科技
乐鑫私有化智能体平台介绍与应用乐鑫正式推出乐鑫私有化智能体平台 (Private AI Agents Platform),这是一个专为 IoT 设备厂商打造的自托管智能体平台,支持厂商在其自有 AWS 账户中部署和管理。该平台经过专门优化,用于构建和管理可集成到连接设备、配套移动应用及 Web 控制台中的 AI 智能体。在本文中,我们将对这一平台进行详细介绍。
硅谷秋水7 小时前
人工智能·深度学习·机器学习·语言模型
LLM的测试-时规模化:基于子问题结构视角的综述25年来自Penn State和南洋理工(新加坡)的论文“Test-time Scaling of LLMs: A Survey from A Subproblem Structure Perspective”。
阿杰学AI8 小时前
人工智能·ai·语言模型·自然语言处理·aigc·模型量化·ai-native
AI核心知识52——大语言模型之Model Quantization(简洁且通俗易懂版)模型量化 (Model Quantization) 是大语言模型落地应用中最实用、最接地气的技术。如果说预训练和微调是在打造一个“天才大脑”,那么量化就是给这个大脑做“瘦身手术”。
阿杰学AI8 小时前
人工智能·ai·语言模型·aigc·模型推理·大语言模型推理·llm inference
AI核心知识51——大语言模型之LLM Inference(简洁且通俗易懂版)大语言模型推理 (LLM Inference),简单来说,就是使用大模型的过程。如果说 “训练” (Training) 是模型在“上学读书”,那么 “推理” (Inference) 就是模型毕业后“参加工作”或“上考场答题”。
阿正的梦工坊9 小时前
人工智能·深度学习·语言模型
RLVE:通过自适应可验证环境扩展语言模型的强化学习这篇论文《RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments》提出了一种创新的RL框架,针对语言模型(LM)强化学习中数据饱和和难度不匹配的痛点。传统RL训练依赖静态数据集,导致简单问题无学习信号、难题奖励稀疏,训练易卡住。论文的创新在于引入自适应可验证环境(Adaptive Verifiable Environments),这些环境能无限生成问题,并动态调整难度
semantist@语校10 小时前
大数据·linux·服务器·人工智能·百度·语言模型·prompt
第五十四篇|从事实字段到推理边界:名古屋国际外语学院Prompt生成中的过度推断防御设计系列延续:500 所日本语言学校结构数据工程 关键词:名古屋国际外语学院、Prompt设计、结构化数据、过度推断、语校网
努力毕业的小土博^_^12 小时前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
【AI课程领学】基于SmolVLM2与Qwen3的多模态模型拼接实践:从零构建视觉语言模型(一)【AI课程领学】基于SmolVLM2与Qwen3的多模态模型拼接实践:从零构建视觉语言模型(一)欢迎铁子们点赞、关注、收藏! 祝大家逢考必过!逢投必中!上岸上岸上岸!upupup
Elastic 中国社区官方博客13 小时前
大数据·人工智能·elasticsearch·搜索引擎·ai·语言模型·全文检索
在 Google MCP Toolbox for Databases 中引入 Elasticsearch 支持作者:来自 Elastic Enrico Zimuel 及 Laurent Saint-Félix探索 Elasticsearch 支持现已在 Google MCP Toolbox for Databases 中可用,并利用 ES|QL 工具安全地将你的索引与任何 MCP 客户端集成。
fishfuck13 小时前
人工智能·语言模型·自然语言处理
MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct多模态指令数据进化框架。该框架通过对精细化感知、认知推理和交互进化的有机结合进行迭代优化,从而生成更加复杂、多样的图文指令数据集,并显著提升 MLLM 的能力。
阿正的梦工坊1 天前
人工智能·语言模型·自然语言处理
ProRL:延长强化学习训练,扩展大语言模型推理边界——NeurIPS 2025论文解读一段话总结: 这篇论文来自NVIDIA团队,标题是《ProRL:延长强化学习扩展大语言模型的推理边界》,发表于NeurIPS 2025。它直击当前AI热点:强化学习(RL)在提升语言模型推理能力时,到底是真正“解锁”新策略,还是只是优化了基础模型中已有的高奖励输出?作者挑战了后者的观点,认为过去研究训练太短、任务太窄。通过“ProRL”方法,他们证明了延长RL训练能让模型发现基础模型采样中完全缺失的新推理路径,甚至在某些任务上从0%成功率飙升到100%。他们开源了1.5B参数的Nemotron-Resea
LiYingL1 天前
人工智能·机器学习·语言模型
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性LLM 4 位量化是在设备上部署的一项重要技术,因为它可以大大减少推理过程中的内存使用量。然而,众所周知,训练过程中出现的 “异常值”(极端激活值)会大大降低量化的性能。传统的方法是在训练后处理这个问题,例如通过训练后量化(PTQ),但这些方法并没有从根本上解决这个问题,而是将异常值视为不可避免的。
AI浩1 天前
目标检测·目标跟踪·语言模型
ROD-MLLM:迈向多模态大语言模型中更可靠的目标检测https://openaccess.thecvf.com/content/CVPR2025/papers/Yin_ROD-MLLM_Towards_More_Reliable_Object_Detection_in_Multimodal_Large_Language_CVPR_2025_paper.pdf 多模态大语言模型(MLLMs)已展现出强大的语言理解和生成能力,在指代(referring)和定位(grounding)等视觉任务上表现卓越。然而,由于任务类型限制和数据集稀缺,现有的 MLLMs 仅
音元系统1 天前
语言模型·语音识别·语音合成·输入法·语音分析
已有析音法析音法是分析语音的方法。分析语音,就是对语音作分析,被简称为析音。因此,分析语音的方法被简称为析音法。在汉语中,在学术上,析音法过去通常被称呼为语音分析法或音节分析法。
何小少1 天前
人工智能·语言模型·copilot
从 Copilot 到 “Lab-pilot“:大语言模型在科学研究领域的应用现状与未来展望2021年,GitHub Copilot的问世,让全球开发者第一次真切地感受到了大语言模型(LLM)的颠覆性力量。它如同一位不知疲倦的“副驾驶”,能实时补全代码、生成函数甚至整个测试用例。然而,当我们把目光从屏幕上的代码移向更广阔的科学研究领域时,一个更宏大的叙事正在展开:LLM及其衍生技术正从一个“编程副驾”(Copilot),进化为整个实验室的“科研助理”(Lab-pilot)。
我命由我123451 天前
开发语言·人工智能·后端·python·阿里云·ai·语言模型
Python 开发 - OpenAI 兼容阿里云百炼平台 API配置阿里云百炼平台的 API 密钥:https://bailian.console.aliyun.com/?tab=api#/api
你那是什么调调2 天前
人工智能·语言模型·chatgpt
大语言模型如何“思考”与“创作”:以生成一篇杭州游记为例想象一下,你让ChatGPT“帮我写一篇关于杭州的文章”,几秒钟后,一篇文笔优美、内容充实的文章就展现在眼前。这看似简单的交互背后,隐藏着怎样复杂的计算过程?大语言模型真的是在“理解”后“创作”文章吗?
DashVector2 天前
人工智能·阿里云·ai·语言模型
通义 DeepResearch:开源 AI 智能体的新纪元githubHUGGINGFACEMODELSCOPESHOWCASEgithub通义DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
java1234_小锋2 天前
深度学习·语言模型·transformer
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 层归一化(Layer Normalization)详解以及算法实现锋哥原创的Transformer 大语言模型(LLM)基石视频教程:https://www.bilibili.com/video/BV1X92pBqEhV