小米大模型mimo-v2-flash简单接触

小米大模型mimo-v2-flash简单接触

调用:Xiaomi MiMo 开放平台

首次调用:Xiaomi MiMo 开放平台

模型详细信息

模型名称 mimo-v2-flash
上下文长度 256 K
最大输出长度 128 K
模型能力 深度思考、流式输出、函数调用、结构化输出
价格 输入、输出限时免费
流控 RPM: 100 TPM: 暂无限制

OpenAI API 兼容

请求地址

复制代码
https://api.xiaomimimo.com/v1/chat/completions

请求头

接口支持以下两种认证方式,请选择其中一种添加到请求头中:

  1. 方式一:api-key 字段认证,格式:

    复制代码
    api-key: $MIMO_API_KEY
    Content-Type: application/json
  2. 方式二:Authorization: Bearer 认证,格式:

    复制代码
    Authorization: Bearer $MIMO_API_KEY
    Content-Type: application/json

API调用信息:

api-key:xxxx

base_url: https://api.xiaomimimo.com/v1

模型:mimo-v2-flash

复制代码
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("MIMO_API_KEY"),
    base_url="https://api.xiaomimimo.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2-flash",
    messages=[
        {
            "role": "system",
            "content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
        },
        {
            "role": "user",
            "content": "please introduce yourself"
        }
    ],
    max_completion_tokens=1024,
    temperature=0.3,
    top_p=0.95,
    stream=False,
    stop=None,
    frequency_penalty=0,
    presence_penalty=0,
    extra_body={
        "thinking": {"type": "disabled"}
    }
)

print(completion.model_dump_json())
相关推荐
神的泪水3 小时前
CANN 生态实战:`msprof-performance-analyzer` 如何精准定位 AI 应用性能瓶颈
人工智能
芷栀夏3 小时前
深度解析 CANN 异构计算架构:基于 ACL API 的算子调用实战
运维·人工智能·开源·cann
威迪斯特3 小时前
项目解决方案:医药生产车间AI识别建设解决方案
人工智能·ai实时识别·视频实时识别·识别盒子·识别数据分析·项目解决方案
笔画人生3 小时前
# 探索 CANN 生态:深入解析 `ops-transformer` 项目
人工智能·深度学习·transformer
feasibility.3 小时前
AI 编程助手进阶指南:从 Claude Code 到 OpenCode 的工程化经验总结
人工智能·经验分享·设计模式·自动化·agi·skills·opencode
程序猿追3 小时前
深度剖析 CANN ops-nn 算子库:架构设计、演进与代码实现逻辑
人工智能·架构
灰灰勇闯IT3 小时前
领域制胜——CANN 领域加速库(ascend-transformer-boost)的场景化优化
人工智能·深度学习·transformer
灰灰勇闯IT3 小时前
从零到一——CANN 社区与 cann-recipes-infer 实践样例的启示
人工智能
小白狮ww3 小时前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能·深度学习·机器学习·ocr·cpu·gpu·deepseek
lili-felicity3 小时前
CANN优化LLaMA大语言模型推理:KV-Cache与FlashAttention深度实践
人工智能·语言模型·llama