在星河社区部署大模型unsloth/Llama-3.3-70B-Instruct-GGUF

skywalk81632025-11-08 17:35

unsloth/Llama-3.3-70B-Instruct-GGUF在hf的网址：https://huggingface.co/unsloth/Llama-3.3-70B-Instruct-GGUF

在hf-mirror镜像的网址：https://hf-mirror.com/unsloth/Llama-3.3-70B-Instruct-GGUF

先上结论，速度慢，基本上1秒一个token的往外出，基本没法使用

部署unsloth/Llama-3.3-70B-Instruct-GGUF

部署很简单，进入星河社区部署页面：飞桨AI Studio星河社区-人工智能学习与实训社区

点击：新建部署，选外部资源库，输入模型url，比如

复制代码

https://huggingface.co/unsloth/Llama-3.3-70B-Instruct-GGUF

然后点击：一键部署，后面一会儿就部署好了。

使用外部库部署要比内部（也就是热门模型库）要慢很多。而且文本输出速度也很慢，只能说聊胜于无吧。

估计也就是7b、8b模型的速度还可以一用。另外文心自己的21b模型，速度也还将就，至少咱也有免费的大模型用，还要啥自行车！

上一篇：下载CUDA Toolkit和VS后，配置vscode

下一篇：尝试Auto-coder.chat使用星河社区AIStudio部署的几个大模型：文心4.5-21b、Deepseek r1 70b、llama 3.1 8b

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 04Linux下V2Ray安装配置指南 05BongoCat - 跨平台键盘猫动画工具 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07npm使用国内淘宝镜像的方法 08jdk21下载、安装（Windows、Linux、macOS）09《大数据技术原理与应用》实验报告三熟悉HBase常用操作 10PyCharm 社区版全平台安装指南