彻底解决openclaw的tokens焦虑

彻底解决openclaw的tokens焦虑

缘起

比较所谓永久免费、不限tokens的服务却限制request频率的服务,真正能做到解决openclaw的tokens焦虑的,只有一种办法,就是接入本地大模型。

其实在各种openclaw的网友群里,还是有不好同学不知道如何接入本地大模型,今天想试试。

就以最流行的ollama来实现。

工具简介

这是本文使用的软件版本:

debian: 12

ollama: 0.16.1

openclaw: 2026.2.14

model: glm-4.7-flash

如下:

开始ollama

  1. 安装必要软件
bash 复制代码
# 系统必要工具
apt update -y
apt install zstd git curl jq

# 安装ollama
curl -fsSL https://ollama.com/install.sh | sh
  1. 启动和测试ollama
bash 复制代码
# 启动ollama
export OLLAMA_HOST=0.0.0.0
nohup ollama serve >/dev/null 2>&1 &

#检查服务
ollama list

应该输出:

测试一下模型:

bash 复制代码
ollama run glm-4.7-flash:latest

打个招呼:

接入openclaw

接入openclaw的配置方式有三种:

  1. 最初只能直接编辑配置文件: openclaw.json

  2. openclaw支持引导式配置: openclaw config

    注意:由于ollama目前在引导配置里面,没有提供商,所以第一步选供应商的时候,选所有,然后第一页选择模型的是,可以看到ollama

  3. ollama支持引导式配置

目前版本中,直接使用ollama的引导式配置是最简单的,下面用这个方式:

执行命令:

bash 复制代码
ollama launch openclaw --config

然后返回就会看到推荐的列表(不要选,需要下载模型,超大)和本地已经有的列表,选择本地的模型,回车。

然后可以启动或者略过,使用openclaw gateway来启动。

最后,来试试效果:

万事大吉!

最后给一下配置文件关键部分,希望直接修改配置文件的可以参考:

openclaw.json

json 复制代码
{
  "agents": {
    "defaults": {
      "compaction": {
        "mode": "safeguard"
      },
      "maxConcurrent": 4,
      "model": {
        "primary": "ollama/glm-4.7-flash:latest"
      },
      "subagents": {
        "maxConcurrent": 8
      }
    }
  },
...
  "models": {
    "providers": {
      "ollama": {
        "api": "openai-completions",
        "apiKey": "ollama-local",
        "baseUrl": "http://127.0.0.1:11434/v1",
        "models": [
          {
            "contextWindow": 131072,
            "cost": {
              "cacheRead": 0,
              "cacheWrite": 0,
              "input": 0,
              "output": 0
            },
            "id": "glm-4.7-flash:latest",
            "input": [
              "text"
            ],
            "maxTokens": 16384,
            "name": "glm-4.7-flash:latest",
            "reasoning": false
          }
        ]
      }
    }
  },
...
}

小结

使用本地大模型,也许是很多企业用户的最终之路吧。

在这个数据就是金钱的时代,越来越多的用户和企业重视自己的数据,部署本地模型既能保护数据,又能解决tokens的顾虑。

欢迎关注:彻底解决openclaw的tokens焦虑

如果你还没有入坑openclaw,推荐阅读:

用docker来安装openclaw

自研第一个SKILL-openclaw入门

来了!老黄NVIDIA免费为clawdbot续命

相关推荐
小小测试开发12 小时前
安装 Python 3.10+
开发语言·人工智能·python
KaMeidebaby12 小时前
卡梅德生物技术快报|PD1 单克隆抗体定制配套 N 糖全谱质控开发
前端·人工智能·算法·数据挖掘·数据分析
我叫唧唧波13 小时前
Python+AI 全栈学习笔记
人工智能·python·学习
lipengxs13 小时前
写 README/技术方案时被 Ai 生成的 PlantUml/Mermaid 折腾烦了,做了个 预览小工具
ai·预览·plantuml·设计图
审判长烧鸡13 小时前
【AI问答/Docker】Docker全命令对照表:命令+中文+示例+示例说明
docker·ai
哈哈,柳暗花明13 小时前
人工智能专业术语详解(E)
人工智能·专业术语
AI极客菌14 小时前
AI绘画工具中,为什么专业玩家爱用Stable Diffusion,普通玩家却喜欢Midjourney?
大数据·人工智能·ai·ai作画·stable diffusion·aigc·midjourney
人工智能AI技术14 小时前
FLUX.2[klein]开源!小香蕉平替,本地部署AI绘画的极简方案
人工智能·ai作画·aigc
腾视科技AI14 小时前
腾视科技大模型一体机解决方案:低成本私有化落地,重塑行业智能应用新格局
大数据·人工智能·科技·ai·边缘计算·算力·ai算力
pusheng202514 小时前
IFSJ全英文专访:中国创新力量重塑先进气体感知技术,赋能全球关键基础设施安全
前端·网络·人工智能·物联网·安全