第八十四篇-V100-32G+Easyclaw+Ollama+Qwopus3.5-27B-V3

环境

bash 复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

下载

https://modelscope.cn/models/Jackrong/Qwopus3.5-27B-v3-GGUF

Ollama配置MF

clike 复制代码
FROM /models/Qwopus3.5-27B/Qwopus3.5-27B-v3-Q4_K_M.gguf

# --------------------------------------------------------------------------
# 🎯 CHAT TEMPLATE (Qwen3.5 Compatible)
# --------------------------------------------------------------------------
TEMPLATE """{{- if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{- range .Messages }}
{{- if eq .Role "user" }}<|im_start|>user
{{ .Content }}<|im_end|>
{{- else if eq .Role "assistant" }}<|im_start|>assistant
{{ .Content }}<|im_end|>
{{- end }}
{{- end }}<|im_start|>assistant
"""

SYSTEM """You are Qwopus3.5-27B-v3, an advanced AI assistant optimized for NVIDIA V100 32GB.
- Provide accurate, concise, and well-structured responses
- Use chain-of-thought reasoning for complex tasks
- Support multilingual input but default to user's language
- Decline harmful requests politely but firmly"""

# --------------------------------------------------------------------------
# ⚙️ HARDWARE OPTIMIZATION (V100-32GB CRITICAL)
# --------------------------------------------------------------------------

# ✓ 修正: Context 设为 4096 (平衡速度与显存),可按需调整
PARAMETER num_ctx 64096

# ✓ 批处理大小: 提升推理吞吐量 (显存允许下尽量大)
PARAMETER num_batch 512

# ✓ GPU 层数: 99 层全卸载,若 OOM 则降至 85-90
PARAMETER num_gpu 99

# ✓ CPU 线程: 匹配物理核心数,避免超线程开销
PARAMETER num_thread 8

# ✓ 内存映射: 加速加载,允许 swap 缓冲
PARAMETER use_mmap true

# ✓ (可选) 低显存模式: 若频繁 OOM 可启用
# PARAMETER low_vram true

# --------------------------------------------------------------------------
# 🎲 SAMPLING PARAMETERS (Balanced Quality/Speed)
# --------------------------------------------------------------------------
PARAMETER temperature 0.7
PARAMETER top_p 0.9
PARAMETER top_k 40
PARAMETER min_p 0.05
PARAMETER repeat_penalty 1.1
PARAMETER typical_p 0.9
PARAMETER presence_penalty 0.0
PARAMETER frequency_penalty 0.0

# --------------------------------------------------------------------------
# 🛑 OUTPUT CONTROL & STOP SEQUENCES
# --------------------------------------------------------------------------
# 标准 Qwen3.5 stop tokens
PARAMETER stop "<|im_end|>"
PARAMETER stop "<|im_start|>"
PARAMETER stop "<|user|>"
PARAMETER stop "<|assistant|>"
PARAMETER stop "<|system|>"
PARAMETER stop "</s>"

# 对话连贯性控制
PARAMETER num_keep 512

运行

clike 复制代码
ollama create Qwopus3.5-27B-V3 -f Modelfile

验证模型

clike 复制代码
http://192.168.1.222:11434/v1/models

下载Easyclaw

clike 复制代码
https://easyclaw.cn/

安装

clike 复制代码
windows下正常下一步安装

启动

配置Ollama本地模型


开始使用

可以正常使用了,速度还可以

相关推荐
ZC跨境爬虫2 小时前
3D 地球卫星轨道可视化平台开发 Day5(简介接口对接+规划AI自动化卫星数据生成工作流)
前端·人工智能·3d·ai·自动化
xiaoxiang96092 小时前
TDD测试驱动开发:从理论到实战的完整指南(含AI增强工作流)
人工智能·驱动开发·tdd
小张同学8242 小时前
Python 封神技巧:1 行代码搞定 90% 日常数据处理,效率直接拉满
开发语言·人工智能·python
源码之家2 小时前
计算机毕业设计:Python棉花产业数据可视化与预测系统 Django框架 ARIMA算法 数据分析 可视化 爬虫 大数据 大模型(建议收藏)✅
人工智能·python·算法·信息可视化·数据挖掘·django·课程设计
chatexcel2 小时前
北大ChatExcel团队推出AI办公桌宠“仓鼠元元”:桌面宠物开始做效率助手了
人工智能·宠物
数字供应链安全产品选型2 小时前
从影子AI到合规溯源:悬镜安全灵境AIDR如何覆盖智能体安全全生命周期?
人工智能
梵得儿SHI2 小时前
(第一篇)Spring AI 架构设计与优化:从单实例到万级 QPS 分布式服务的演进之路
人工智能·分布式架构·spring ai·万级 qps·ai 服务高并发·模型 / 向量 / 业务·qps分布式服务
qq_348231852 小时前
Ubuntu 24.04 环境配置 AI自动化编程 gstack
linux·运维·人工智能·ubuntu
财经资讯数据_灵砚智能2 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月20日
大数据·人工智能·python·信息可视化·自然语言处理