PPIO私有化部署模板上新!10分钟拥有专属最新DeepSeek模型

这两天,DeepSeek接连发布了升级版R1模型DeepSeek-R1-0528及蒸馏模型DeepSeek-R1-0528-Qwen3-8B,模型性能相较于此前R1模型大幅升级。DeepSeek-R1-0528性能自是不必多言,值得注意的是,根据升级版R1模型思维链提取出来蒸馏模型性能依旧强大,在数学测试中表现与 Qwen3-235B 相当,可以说是"小参数大性能"。

此前,不少企业和个人尝试将模型进行私有化部署,但是,如果将DeepSeek-R1(671B)进行私有化部署,至少需要1.5TB显存,按官方推荐配置需要将近20张NVIDIA H100 80GB显卡,门槛较高。

而小参数的DeepSeek-R1-0528-Qwen3-8B,则可以完美匹配这一需求。该模型在保持较高推理能力的同时大幅降低了运行资源需求,适合个人及中小企业部署。现在PPIO派欧云上线了该模型私有化部署模板,用户可一键将DeepSeek-R1-0528-Qwen3-8B部署在云服务器上,10分钟就能拥有专属模型。

模型私有化部署教程

选择模板与配置

打开PPIO派欧云算力市场,选择 deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 模版,选择卡型 4090 点击部署。

算力市场地址:ppio.cn/gpu-instanc...

确认部署参数

检查部署参数确认页面。确认无误后,点击 下一步

启动部署

  1. 在最终确认页面,点击 部署 按钮启动实例创建。 此过程可能需要几分钟,请耐心等待。

查看部署进度

点击实例管理,进入控制台查看部署进度

点击实例,查看镜像拉取进度

等待实例变为运行中,点击日志 ---> 实例日志查看模型拉取进度,等待模型拉取完成

日志出现 "Application startup complete." 即为部署完成!

获取模型访问地址

点击实例连接,拷贝端口 8000 的 HTTP 映射,即模型访问

访问您的私有模型

注意请将 下文中的 " c9f957427e53e9ba-8000.cn-northwest-2.gpu-instance.ppinfra.com " 替换为您真正的访问地址,复制以下代码,访问您的私有模型!

swift 复制代码
# Call the server using curl:
curl -X POST "https://c9f957427e53e9ba-8000.cn-northwest-2.gpu-instance.ppinfra.com/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-d9e5f06123944037a8105d638d902f06","object":"chat.completion","created":1748594949,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":"<think>\nOkay, the user is asking for the capital of France. This seems like a straightforward factual question, probably aimed at getting a quick answer. \n\nThe user might be a student doing homework, someone preparing for a quiz, or just an individual curious about geography. The question's simplicity suggests they don't necessarily need extra context, just the direct answer. \n\nI recall that Paris is indeed France's capital, with a long history dating back centuries. There's no ambiguity here---it's a well-established fact. The response should be concise to match the query's straightforward nature.\n\nConsidering possible follow-up questions, I might mentally prepare to elaborate if the user asks about Paris's history or significance, but since the query is direct, there's no need to overload with information right now. \n\nThe answer "Paris" is correct and unambiguous. No need to complicate things unless the user indicates further interest.\n</think>\nThe capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":204,"completion_tokens":194,"prompt_tokens_details":null},"prompt_logprobs":null}

将 API 地址配置到您的 chatbox 等应用,就可以拥有专属模型及聊天助手!

目前,PPIO算力市场已上线18个私有化部署模板,除了DeepSeek-R1-0528-Qwen3-8B,用户也可以将llama3-8b:v0.5.0 、StableDiffusion:v1.8.0等模型快速进行私有化部署,帮助企业及个人降低模型部署成本,实现高效、安全调用。

相关推荐
程序员X小鹿4 小时前
这5个AI文本可视化工具太强了!一键把文本转信息图、流程图等多种可视化形式!PPT秒变高级!(建议收藏)
aigc
墨风如雪5 小时前
智谱GLM-4.6V开源:不仅仅是“看懂”,它终于长出了“双手”
aigc
leo03085 小时前
【LLM微调】拒绝“假装聪明”:SFTTrainer 中 completion_only_loss 新旧版本用法详解
llm·sft·huggingface·trl
ariesjzj5 小时前
DeepSeek时代的Large-scale LLM推理
大模型·llm·deepseek·推理优化·大规模ep
阿杰学AI6 小时前
AI核心知识39——大语言模型之World Model(简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·世界模型·world model·sara
智泊AI6 小时前
长上下文、Agent记忆、Text2SQL中,谁会取代RAG?
llm
realhuizhu8 小时前
屏幕上那一行刺眼的红色 `Time Limit Exceeded`,是不是你我再熟悉不过的场景?
aigc·算法优化·性能调优·ai提示词·程序员生产力
天远数科9 小时前
Golang并发实战:高效对接天远API实现海量用户画像构建
大数据·api
韭菜炒大葱10 小时前
别等了!用 Vue 3 让 AI 边想边说,字字蹦到你脸上
前端·vue.js·aigc
清水寺小和尚10 小时前
RAG (检索增强生成) 深度实战知识库
aigc