阿里云上线 DeepSeek,AI 领域再掀波澜

大家好,我是小悟。

在人工智能蓬勃发展的当下,模型技术的每一次突破都备受瞩目。阿里云百炼平台全面上线 DeepSeek-V3、DeepSeek-R1 及其蒸馏版本等六款全尺寸模型。

短短半个月时间,DeepSeek 热潮席卷全球。阿里云、华为云、腾讯云、百度智能云等国内云巨头已相继接入。

OPPO、荣耀也宣布与 DeepSeek 达成合作,方便用户在手机中直接唤醒使用其 AI 功能,十余家车企更是加速让 AI 大模型上车,抢跑汽车行业智能化下半场。

为何 DeepSeek 能引发如此大规模的行业接入潮?答案就在于它在技术上的突破和成本的优化。

此次阿里云上线的 DeepSeek-V3 和 DeepSeek-R1 满血版各自提供了高达 100 万免费 tokens 的使用额度,蒸馏版本则极具性价比,仅需 1 元即可享受最高 200 万 tokens 的服务。

DeepSeek-R1 模型包含 671B 参数,激活 37B ,在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,尤其在数学、代码、自然语言推理等任务上表现出色。

DeepSeek-V3 为 DeepSeek 自研的 MoE 模型,同样拥有 671B 参数,激活 37B ,在 14.8T Token 上进行了预训练,在长文本、代码、数学、百科、中文能力上表现优秀。

阿里云 PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 ,用户可以零代码实现从训练到部署再到推理的全过程,极大地简化了模型开发流程。

即使是没有编程经验的用户,也能通过可视化的界面,轻松完成对 DeepSeek 系列模型的部署,让 AI 技术不再高不可攀。

比如在智能客服领域,企业可以快速部署 DeepSeek 模型,优化客服问答系统,提升客户服务效率。

阿里云百炼提供了 DeepSeek 模型调用的 API。使用前,需先获取 API Key 并完成配置 API Key 到环境变量 ,若通过 SDK 调用,还得安装 OpenAI SDK 。以 DeepSeek-R1 模型为例,示例代码如下:

python 复制代码
import os
from openai import OpenAI
client = OpenAI(
 # 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx",
 api_key=os.getenv("DASHSCOPE_API_KEY"), # 如何获取API Key:https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
 base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
 model="deepseek-r1", # 此处以 deepseek-r1 为例,可按需更换模型名称。
 messages=(
 {
 'role': 'user', 'content': '9.9和9.11谁大'}
 )
)
# 通过reasoning_content字段打印思考过程
print("思考过程:")
print(completion.choices(0).message.reasoning_content)
# 通过content字段打印最终答案
print("最终答案:")
print(completion.choices(0).message.content)

通过这段代码,就能轻松获取 DeepSeek-R1 模型的思考过程和最终答案 ,让开发者能更好地利用模型进行各种任务。

阿里云上线 DeepSeek 模型,为开发者提供了更强大的工具。以往受限于模型能力和成本,一些开发项目进展缓慢。

如今有了 DeepSeek,开发者可以更高效地进行代码生成、算法优化等工作,加速项目迭代,降低开发成本。

比如在开发一款智能图像识别应用时,借助 DeepSeek 强大的模型能力,开发者能更快地训练出精准的识别模型。

企业可以利用 DeepSeek 模型进行数字化转型,提升业务效率。在金融行业,可用于风险评估、智能投顾。在制造业,能优化生产流程、进行质量检测。

以证券行业为例,国泰君安、国金证券等多家券商已宣布完成 DeepSeek 本地化部署,计划将其应用于信息检索、文档处理、行业研究及市场研判等多个场景。

云厂商纷纷接入 DeepSeek,有望推动云服务商算力租赁及 AI 服务收入快速增长 ,同时加速应用侧的繁荣,云计算算力需求将进一步上升。

模型平权也将加速 AI 应用侧的发展,让更多领域能够享受到 AI 技术带来的变革。

阿里云上线 DeepSeek 模型,是 AI 领域的一次重大突破,为用户带来了更强大、更经济的 AI 解决方案。

相信在未来,随着 DeepSeek 模型在阿里云平台上的广泛应用,将会催生出更多创新的 AI 应用和业务模式,推动整个行业迈向新的高度。

您的一键三连,是我更新的最大动力,谢谢

山水有相逢,来日皆可期,谢谢阅读,我们再会

我手中的金箍棒,上能通天,下能探海

相关推荐
逆旅行天涯30 分钟前
【DeepSeek】本地部署,保姆级教程
deepseek
涛涛讲AI1 小时前
文心一言大模型的“三级跳”:从收费到免费再到开源,一场AI生态的重构实验
人工智能·百度·大模型·deepseek
渔舟唱晚@2 小时前
使用 DeepSeek 生成流程图、甘特图与思维导图:结合 Typora 和 XMind 的高效工作流
流程图·甘特图·xmind·mermaid·deepseek
呱牛do it3 小时前
离线部署大模型:ollama+deepseek+open-webui
人工智能·ollama·deepseek
大龄码农有梦想4 小时前
Spring AI如何调用Function Calling
人工智能·function call·function·spring ai·deepseek·qwen模型
Crazy Struggle4 小时前
.NET 使用 DeepSeek R1 开发智能 AI 客户端
人工智能·ai·.net·deepseek
facaixxx20246 小时前
阿里云SLB负载均衡的ALB和NLB有啥区别?一个是7层一个是4层
阿里云·云计算·负载均衡
avi91117 小时前
[AI相关]生成视频-第一个项目,20k星开源MoneyPrinterTurbo
人工智能·音视频·生成视频·自动生成·deepseek
大鱼>8 小时前
Ubuntu 服务器Llama Factory 搭建DeepSeek-R1微调训练环境
llama·大模型微调·deepseek