PPIO私有化部署模板上新!10分钟拥有专属最新DeepSeek模型

这两天,DeepSeek接连发布了升级版R1模型DeepSeek-R1-0528及蒸馏模型DeepSeek-R1-0528-Qwen3-8B,模型性能相较于此前R1模型大幅升级。DeepSeek-R1-0528性能自是不必多言,值得注意的是,根据升级版R1模型思维链提取出来蒸馏模型性能依旧强大,在数学测试中表现与 Qwen3-235B 相当,可以说是"小参数大性能"。

此前,不少企业和个人尝试将模型进行私有化部署,但是,如果将DeepSeek-R1(671B)进行私有化部署,至少需要1.5TB显存,按官方推荐配置需要将近20张NVIDIA H100 80GB显卡,门槛较高。

而小参数的DeepSeek-R1-0528-Qwen3-8B,则可以完美匹配这一需求。该模型在保持较高推理能力的同时大幅降低了运行资源需求,适合个人及中小企业部署。现在PPIO派欧云上线了该模型私有化部署模板,用户可一键将DeepSeek-R1-0528-Qwen3-8B部署在云服务器上,10分钟就能拥有专属模型。

模型私有化部署教程

选择模板与配置

打开PPIO派欧云算力市场,选择 deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 模版,选择卡型 4090 点击部署。

算力市场地址:ppio.cn/gpu-instanc...

确认部署参数

检查部署参数确认页面。确认无误后,点击 下一步

启动部署

  1. 在最终确认页面,点击 部署 按钮启动实例创建。 此过程可能需要几分钟,请耐心等待。

查看部署进度

点击实例管理,进入控制台查看部署进度

点击实例,查看镜像拉取进度

等待实例变为运行中,点击日志 ---> 实例日志查看模型拉取进度,等待模型拉取完成

日志出现 "Application startup complete." 即为部署完成!

获取模型访问地址

点击实例连接,拷贝端口 8000 的 HTTP 映射,即模型访问

访问您的私有模型

注意请将 下文中的 " c9f957427e53e9ba-8000.cn-northwest-2.gpu-instance.ppinfra.com " 替换为您真正的访问地址,复制以下代码,访问您的私有模型!

swift 复制代码
# Call the server using curl:
curl -X POST "https://c9f957427e53e9ba-8000.cn-northwest-2.gpu-instance.ppinfra.com/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-d9e5f06123944037a8105d638d902f06","object":"chat.completion","created":1748594949,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":"<think>\nOkay, the user is asking for the capital of France. This seems like a straightforward factual question, probably aimed at getting a quick answer. \n\nThe user might be a student doing homework, someone preparing for a quiz, or just an individual curious about geography. The question's simplicity suggests they don't necessarily need extra context, just the direct answer. \n\nI recall that Paris is indeed France's capital, with a long history dating back centuries. There's no ambiguity here---it's a well-established fact. The response should be concise to match the query's straightforward nature.\n\nConsidering possible follow-up questions, I might mentally prepare to elaborate if the user asks about Paris's history or significance, but since the query is direct, there's no need to overload with information right now. \n\nThe answer "Paris" is correct and unambiguous. No need to complicate things unless the user indicates further interest.\n</think>\nThe capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":204,"completion_tokens":194,"prompt_tokens_details":null},"prompt_logprobs":null}

将 API 地址配置到您的 chatbox 等应用,就可以拥有专属模型及聊天助手!

目前,PPIO算力市场已上线18个私有化部署模板,除了DeepSeek-R1-0528-Qwen3-8B,用户也可以将llama3-8b:v0.5.0 、StableDiffusion:v1.8.0等模型快速进行私有化部署,帮助企业及个人降低模型部署成本,实现高效、安全调用。

相关推荐
那个村的李富贵16 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
蛇皮划水怪18 小时前
深入浅出LangChain4J
java·langchain·llm
墨风如雪18 小时前
16个AI两周手搓编译器:Claude Opus 4.6 正在改写代码规则
aigc
心疼你的一切20 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
种时光的人20 小时前
CANN仓库核心解读:catlass夯实AIGC大模型矩阵计算的算力基石
线性代数·矩阵·aigc
哈哈你是真的厉害20 小时前
当 Triton 遇上 Ascend:深度解析 GE Backend 如何打通 NPU 推理“最后一公里”
aigc·cann
那个村的李富贵20 小时前
CANN加速下的AIGC“即时翻译”:AI语音克隆与实时变声实战
人工智能·算法·aigc·cann
禁默21 小时前
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理
深度学习·重构·aigc·transformer·cann
未来可期叶21 小时前
CANN图编译基础——AIGC模型计算图优化的核心逻辑
aigc