第八篇（终篇）：选型指南——开源 vs 闭源、国内 vs 国外

对比项	开源模型	闭源模型
定义	模型权重公开，可下载本地运行	模型权重不公开，只能 API 调用
代表	Llama、Qwen、DeepSeek、Yi	GPT-4、Claude、Gemini
成本	免费（但需要硬件）	按量付费
隐私	数据完全本地	数据要传到云端
定制	可以微调、修改	不能修改
能力	中上水平	顶级水平
稳定性	自己维护	服务商保障

选择建议

你的情况	推荐	理由
学习研究	开源	免费，可以随便折腾
隐私敏感	开源	数据不出本地
企业生产	闭源	稳定性、SLA 保障
追求最强	闭源	GPT-4/Claude 仍是顶级
预算有限	开源	硬件一次投入，之后免费

二、开源模型全家福

主流开源模型对比

模型	公司	参数量	中文能力	代码能力	推荐度
Llama 3	Meta	8B/70B	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
Qwen2	阿里	7B/72B	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
DeepSeek-V2	深度求索	16B/236B	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
Yi-1.5	零一万物	6B/34B	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐
Gemma 2	Google	9B/27B	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
Phi-3	Microsoft	3.8B/14B	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐

各模型特点

Llama 3（Meta）

优点： 综合能力强、生态最完善、社区支持好
缺点： 中文不如专门优化的模型
适合： 通用场景、英文任务、研究学习

Qwen2（阿里）

优点： 中文能力顶级、开源彻底（可商用）、多语言支持好
缺点： 国际知名度不如 Llama
适合： 中文场景、企业应用、多语言

DeepSeek-V2（深度求索）

优点： 代码能力顶级、MoE 架构效率高、完全免费开源
缺点： 相对较新，生态待完善
适合： 代码生成、中文任务、性价比优先

Phi-3（Microsoft）

优点： 体积小速度快、低配电脑能跑、完全免费
缺点： 复杂任务能力有限
适合： 低配设备、边缘部署、简单任务

开源模型选型建议

你的需求	推荐模型
综合最强	Llama 3 70B 或 Qwen2 72B
中文最好	Qwen2 72B
代码最强	DeepSeek-Coder-V2
体积最小	Phi-3-mini（3.8B）
平衡选择	Llama 3 8B 或 Qwen2 7B
低配电脑	Phi-3-mini 或 Gemma 2 9B

三、闭源模型对比

主流闭源模型

模型	公司	能力等级	价格	中文能力	推荐度
GPT-4o	OpenAI	⭐⭐⭐⭐⭐	高	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
Claude 3.5	Anthropic	⭐⭐⭐⭐⭐	高	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
Gemini 1.5	Google	⭐⭐⭐⭐	中	⭐⭐⭐	⭐⭐⭐⭐
GPT-4o-mini	OpenAI	⭐⭐⭐⭐	低	⭐⭐⭐⭐	⭐⭐⭐⭐⭐

各模型特点

GPT-4o（OpenAI）

优点： 综合能力最强、生态最完善、多模态能力强
缺点： 价格较高、国内访问不稳定、需要外币支付
适合： 追求最强能力、复杂任务、多模态
价格： 输入 $5/100 万 token，输出$ 15/100 万 token

Claude 3.5（Anthropic）

优点： 长文本处理最强（200K）、安全性高、代码能力强
缺点： 价格高、国内访问困难
适合： 长文档分析、代码生成、安全敏感
价格： 输入 $3/100 万 token，输出$ 15/100 万 token

GPT-4o-mini（OpenAI）

优点： 性价比之王、速度超快、价格极低
缺点： 复杂任务不如 GPT-4
适合： 高频任务、简单问答、成本敏感
价格： 输入 $0.15/100 万 token，输出$ 0.6/100 万 token

闭源模型选型建议

你的需求	推荐模型
追求最强	GPT-4o 或 Claude 3.5
性价比	GPT-4o-mini
长文档	Claude 3.5（200K 上下文）
多模态	GPT-4o 或 Gemini 1.5
代码生成	Claude 3.5 或 GPT-4o
高频调用	GPT-4o-mini

四、国内模型特色

主流国内模型

模型	公司	特点	价格	推荐度
通义千问	阿里	中文优化好，生态全	低	⭐⭐⭐⭐⭐
文心一言	百度	搜索整合，中文强	中	⭐⭐⭐⭐
讯飞星火	科大讯飞	语音能力强	中	⭐⭐⭐⭐
智谱 GLM	智谱 AI	学术背景，中文好	低	⭐⭐⭐⭐⭐
Kimi	月之暗面	长文本突出	免费	⭐⭐⭐⭐⭐
DeepSeek	深度求索	代码强，免费	免费	⭐⭐⭐⭐⭐

国内模型优势

优势	说明
中文优化	针对中文场景专门训练
访问稳定	国内服务器，速度快
支付方便	人民币支付，不用外币
合规安全	符合国内法规
免费额度	大多有 generous 免费额度
客服支持	中文客服，沟通方便

国内模型选型建议

你的需求	推荐模型
综合最佳	通义千问 Qwen-Max
长文本	Kimi（200 万上下文）
代码生成	DeepSeek-Coder
免费优先	Kimi、DeepSeek
语音相关	讯飞星火
搜索整合	文心一言

五、场景推荐表

按任务类型

任务类型	首选	备选	理由
中文写作	通义千问	Kimi	中文优化好
英文写作	GPT-4o	Claude 3.5	英文能力更强
代码生成	DeepSeek-Coder	GPT-4o	代码专项训练
长文档分析	Claude 3.5	Kimi	上下文窗口大
多模态	GPT-4o	Gemini 1.5	图像理解强
数学推理	GPT-4o	DeepSeek	推理能力强
对话聊天	GPT-4o-mini	通义千问	成本低、响应快

按用户类型

用户类型	推荐方案	预算估算
学生/个人学习	Kimi/DeepSeek（免费）	¥0
个人开发者	GPT-4o-mini + 本地模型	¥50-100/月
初创公司	通义千问 + RAG	¥500-2000/月
中型企业	GPT-4/Claude + 私有化	¥5000-20000/月
大型企业	混合方案（闭源 + 开源微调）	¥20000+/月

按行业

行业	推荐	理由
互联网/科技	GPT-4o + DeepSeek	代码能力强
金融	通义千问（私有化）	合规、中文好
医疗	RAG+ 审核	需要准确、可追溯
法律	RAG+ 审核	需要准确、可追溯
教育	Kimi/通义	免费额度多、中文好
电商	通义千问	客服场景优化
媒体/内容	Claude 3.5	写作质量高

六、小攀哥的私藏推荐清单

新手入门（零成本）

复制代码

1. Kimi（月之暗面）- 免费，长文本强
2. DeepSeek - 免费，代码强
3. 通义千问 - 免费额度多，中文好

个人开发者（性价比）

复制代码

1. GPT-4o-mini - 便宜好用
2. 本地 Llama 3 8B - 免费，隐私好
3. 通义千问 - 中文场景备用

企业生产（稳定可靠）

复制代码

1. GPT-4o/Claude 3.5 - 核心业务
2. 通义千问私有化 - 合规场景
3. 自研微调模型 - 特定场景

特殊需求

复制代码

长文本：Claude 3.5 或 Kimi
代码：DeepSeek-Coder 或 GPT-4o
多模态：GPT-4o 或 Gemini 1.5
隐私：本地部署 Llama 3/Qwen2
成本：GPT-4o-mini 或 Phi-3

七、系列总结

八篇回顾

篇目	核心内容	关键收获
第一篇	大模型是什么	理解概念、能力边界
第二篇	Transformer 原理	理解技术基础
第三篇	本地部署	免费跑起来
第四篇	API 调用	各大平台实战
第五篇	提示词工程	写好 Prompt
第六篇	微调入门	让模型更专业
第七篇	应用架构	RAG/Agent/Function Calling
第八篇	选型指南	知道该选哪个

学完这个系列，你应该能：

✅ 理解大模型是什么、怎么工作的
✅ 本地部署或调用 API 实际使用
✅ 写出高质量的 Prompt
✅ 知道什么时候该微调、什么时候用 RAG
✅ 设计大模型应用架构
✅ 根据场景选对模型

结语：大模型时代，做会用 AI 的人

八篇连载到此结束！感谢一路相伴！🎉

小攀哥的最后叮嘱：

大模型是工具，不是魔法 --- 用它提升效率，但别完全依赖
持续学习 --- 这个领域变化太快，保持关注
动手实践 --- 光看不练没用，赶紧动手试试
注意安全 --- 别输入隐私数据，别用于高风险决策
保持批判 --- AI 会犯错，保持独立判断

最后送大家一句话：

"不会被 AI 取代的，是会用 AI 的人。"