深入了解AI

模型

模型命名

模型命名:Reasoning推理强,Version通用版,Pro专业Max强,Mini便宜,Turbo快

术语 全称/含义 解释 例子
R1 Reasoning 1 推理专用模型(DeepSeek命名) DeepSeek-R1:专门解决数学/逻辑问题
o1/o3 O mni/OpenAI OpenAI的推理系列(o=Omni全能) o1-preview:会"思考"再回答
V3 Version 3 通用基础模型(DeepSeek-V3) 对比:V3是通才,R1是专才
K2/K2.5 Kimi 第2代 月之暗面的版本号 Kimi-K2:长文本+Agent能力
K2.5 Thinking 带思考模式的K2.5 切换为推理模式(类似R1) Kimi-K2.5-32K/26K/64K:不同上下文版本
Pro/Max/Mini 专业版/最大版/迷你版 能力梯次:Max>Pro>Mini GPT-4o Mini:便宜小模型,GPT-4o Max:顶配
Turbo 涡轮加速版 速度与成本优化版,性能略降但更快更便宜 GPT-4 Turbo:比GPT-4快3倍,价格低1/3
Ultra 极致版 该系列最强版本 Gemini Ultra:谷歌最强模型
Nano 纳米版 端侧运行(手机本地) Gemini Nano:能在Pixel手机离线运行

模型分类

  1. LLM(Large Language Model,大语言模型)

    ├── 按规模:SLM(小)/ LLM(大)

    ├── 按模态:纯文本 LLM / 多模态 LMM(或VLM)

    ├── 按功能:基座模型 / 推理模型 / 代码模型

    └── 按架构:Dense / MoE

  2. LMM(Large Multimodal Model,大多模态模型)

    └── 特指:Gemini 2.0、GPT-4o、Qwen-VL、Claude 3(支持图像的版本)

  3. SLM(Small Language Model,小语言模型)

    └── 特指:Phi-3-mini、Qwen2.5-0.5B、Gemma 2B、Apple OpenELM

国外AI领域的核心巨头

公司 核心产品/优势 最新动态
OpenAI ChatGPT、GPT-4o、Sora 2025年3月完成400亿美元 融资,估值达3000亿美元,稳居全球榜首
Google (DeepMind) Gemini 系列模型 全球排名仅次于ChatGPT,约12%市场份额,押注多模态与科学AI
Meta Llama 开源模型系列 2025年AI投资640-720亿美元,收购Scale AI,通过Llama生态与OpenAI抗衡
Anthropic Claude 系列模型 Amazon和Google重点投资,专注AI安全与企业服务
xAI Grok 模型 马斯克旗下,快速崛起为ChatGPT主要竞争对手
Microsoft Copilot、Azure OpenAI 与OpenAI深度绑定,但在独立研发上也在加速

大众流量 vs 专业渗透

Claude Code 在AI编程工具(专业领域)中占 54% 份额 ;

Claude Code 并不追求成为"人人都用的AI",而是专注 "最难的编程问题";

编程领域的AI工具

  • AI编程助手:
    • Gemini Code Assist
    • GitHub Copilot
  • Cursor:它不是插件,而是替代VS Code的独立AI编辑器;
  • Claude Code:像一个能写代码的 工程师,而非工具;需要CLI操作经验,适合复杂任务而非简单补全;

总结:

Gemini = 免费且强大的智能补全;

Cursor = AI帮你更快地写代码;

Claude Code = 雇佣一个AI工程师帮你独立完成整个任务;

付费情况:

工具 付费模式 关键信息
Gemini Code Assist 免费额度+订阅 免费版:18万次补全/月;标准版 19/月;企业版 45/用户/月
GitHub Copilot 订阅制 免费版仅2千次/月;**Pro版 10/月**(个人);企业版 19-39/用户/月
Cursor 订阅制 Hobby版免费(有限额度);**Pro版 20/月**(按年付16/月);商业版 $40/用户/月
Claude Code 按需付费 基于API调用量计费(输入/输出tokens);无固定月费,用多少付多少;企业级用量需联系销售
相关推荐
马丁聊GEO6 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker6 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.6 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑6 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金6 小时前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移6 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower6 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
GitCode官方6 小时前
基于昇腾 MindSpeed LLM 玩转 DeepSeekV4-Flash 模型的预训练复现部署
人工智能·开源·atomgit
大刘讲IT7 小时前
AI重塑企业信息价值标准:从“系统供给”到“用户定义”的企业数字化新范式
人工智能·经验分享·ai·制造
流年似水~7 小时前
MCP协议实战:从零搭建一个让Claude能“看见“数据库的工具服务
数据库·人工智能·程序人生·ai·ai编程