文章目录
- 一、碎碎念
- 二、如何使用小米AI模型
-
- [1. 网站访问](#1. 网站访问)
- [2. 官方API服务(开发者首选)](#2. 官方API服务(开发者首选))
- 三、小米新发布AI模型详解
-
- [1. Xiaomi MiMo-V2-Pro:旗舰基座模型](#1. Xiaomi MiMo-V2-Pro:旗舰基座模型)
- [2. Xiaomi MiMo-V2-Omni:全模态感知模型](#2. Xiaomi MiMo-V2-Omni:全模态感知模型)
- [3. Xiaomi MiMo-V2-TTS:语音合成模型](#3. Xiaomi MiMo-V2-TTS:语音合成模型)
- 四、小米AI模型的技术特点
-
- [1. 轻量化与本地部署的持续演进](#1. 轻量化与本地部署的持续演进)
- [2. 数据与训练策略优势](#2. 数据与训练策略优势)
- [3. 端云结合的生态协同](#3. 端云结合的生态协同)
一、碎碎念
2026 年初,两个匿名的AI模型悄然上线知名聚合平台 OpenRouter,代号分别为Hunter Alpha 和 Healer Alpha。凭借其惊艳的性能表现,Hunter Alpha迅速登顶日榜,累计调用量突破 1T tokens。在当时 DeepSeek V4 即将发布的传闻背景下,外界纷纷猜测这可能是其内测版本。然而,最终的真相出人意料------这两个模型均出自小米之手。
不禁感叹小米确实不鸣则已,一鸣惊人,雷总确实很好地践行了"咱得悄悄地干,输了呢,就当没干过"这句话。这并非偶然。小米早已为AI领域的爆发埋下伏笔:从2016年成立AI实验室,到2023年组建大模型团队,更为小米注入了关键的技术基因。如今,随着MiMo-V2系列三款模型的正式发布,小米终于揭开了其AI版图的神秘面纱。
二、如何使用小米AI模型
1. 网站访问
网站目前比较简陋,和 DeepSeek 差不多,对话界面可以选择模型,可以上传文件(仅识别文字),但上传文件后无法使用联网搜索能力。网址如下
2. 官方API服务(开发者首选)
小米已正式开放这些模型的 AI 服务,访问下面的网址即可,有官方使用教程。
三、小米新发布AI模型详解
2026年3月19日,小米集团正式发布了三款自研大模型,标志着小米AI能力进入新阶段。
1. Xiaomi MiMo-V2-Pro:旗舰基座模型
- 参数规模:总参数量超过1万亿(1T),其中激活参数为42B
- 核心能力:支持100万(1M)超长上下文理解,采用创新的混合注意力架构
- 开放服务:已开放API服务,为开发者提供强大的基座能力
2. Xiaomi MiMo-V2-Omni:全模态感知模型
- 多模态支持:能够理解图像、视频、音频与文本的跨模态信息
- 应用场景:适用于需要多感官交互的复杂场景,如智能助手、内容创作等
- API开放:与MiMo-V2-Pro一同开放API,方便集成到各类应用中
3. Xiaomi MiMo-V2-TTS:语音合成模型
- 技术亮点:基于小米自研的Audio Tokenizer技术实现
- 语音能力:支持多风格、高表现力的语音合成,可应用于语音助手、内容朗读等场景
- 历史基础:延续了小米在语音技术上的积累,早期小爱同学的翻译能力已有显著提升
小米创始人雷军表示,公司今年在AI领域的研发和资本投入将超过160亿元人民币。这一投入规模反映了小米对AI战略的重视程度。
四、小米AI模型的技术特点
1. 轻量化与本地部署的持续演进
小米早期就确立了"轻量化、本地部署"的方向。2023年时,小米自研的13亿参数端侧模型已在手机端跑通,部分场景效果媲美60亿模型在云端的运算结果。如今的MiMo-V2系列虽然参数规模更大,但依然注重与硬件的适配,特别是与高通、联发科等芯片厂商合作,将端侧AI底层能力整合进SoC芯片。
2. 数据与训练策略优势
小米在数据训练上具有独特优势:自研模型的训练数据中,小米自有的产品和业务数据占比达80%,数据量达到3TB。这使得模型对小米的产品和业务有更深入的理解。
在训练策略上,小米采用了自研的ScaledAdam优化器和Eden学习率调度器,显著提升收敛速度的同时减少显存浪费。
3. 端云结合的生态协同
小米的大模型并非孤立存在,而是与整个生态深度融合。早期小爱同学的大模型版本就采用了第三方和自研的混合方案。现在的新模型进一步扩展了应用场景,包括手机、智能家居、汽车。例如,小爱同学日活已超1.2亿,支持跨设备指令联动。