【DeepSeek】离线计算token用量实践总结【Windows】

引言

DeepSeek官方提供一个离线版的token用量计算的代码示例,本文我们将按照代码示例进行一下实践。

准备工作

Anaconda安装,提供Python代码运行所需的虚拟环境。

PyCharm安装,代码编写和运行工具,方便。

开始实践

第一步:安装Anaconda工具。

第二步:在Anaconda中创建一个新的虚拟环境,示例如下:

首先打开AnacondaPowershell窗口:

输入以下命令,创建虚拟环境:

lua 复制代码
conda create -n deepseek_token

输入以下命令,切换到新创建的虚拟环境中:

复制代码
conda activate deepseek_token

输入以下命令,安装python3.8python版本要求不低于3.8

ini 复制代码
conda install python=3.8

输入以下命令,安装transformers

arduino 复制代码
pip install transformers -i https://pypi.tuna.tsinghua.edu.cn/simple

下载DeepSeek离线计算token用量示例代码:地址:Token 用量计算 | DeepSeek API Docs

下载后得到一个名为deepseek_v3_tokenizer.zip的压缩包,内容如下图所示:

在本地代码存放目录新建一个文件夹,将上图中最后一个红框内的三个文件拷贝到自己的文件夹内,如下图所示:

使用PyCharm打开新建的项目工程目录,如下图所示:

打开后,发现示例代码中的transformers有报错,右下角发现运行环境错误,不是我们之前创建好的虚拟环境,需要手动切换到刚刚新建的虚拟环境中:

点击右下角的Python 3.7,进行运行环境切换,如下图所示:

选择刚刚创建好的虚拟环境,如下图所示:

切换成功后,如下图所示,transformers下方红线会消失,如果不消失可以重新打开一下PyCharm就会消失了,右下角切换环境的位置会显示刚刚创建的虚拟环境名称:

在文件空白位置鼠标右键,选择run就可以运行代码了,如下图所示:

运行成功后,如下图所示,控制台输出的是字符串的编码:

并没有按照我预想的直接返回一个数字,而是返回的集合,还需要我们自己转换一下,输出一下集合的长度,如下图所示:

这样看起来就清晰多了,至此在Windows系统下DeepSeek离线计算token用量实践到此结束,如有问题或建议欢迎大家评论区交流,最后还是要passion

问题及解决办法

一、运行长文本内容时出现以下错误:

csharp 复制代码
SyntaxError: Non-UTF-8 code starting with '\xe5' in file D:\ConnorProjects\deepseek_token\deepseek_tokenizer.py on line 11, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

报错内容分析应该是编码格式问题,查阅资料后使用以下方案成功解决:

在文件第一行新增以下代码,如下图所示:

markdown 复制代码
# -*- coding: utf-8 -*-
相关推荐
大模型真好玩5 天前
大模型训练全流程实战指南工具篇(七)——EasyDataset文档处理流程
人工智能·langchain·deepseek
Rockbean5 天前
用40行代码搭建自己的无服务器OCR
服务器·python·deepseek
爱吃的小肥羊6 天前
DeepSeek V4 细节曝光:100 万上下文 + 原生多模态
人工智能·aigc·deepseek
AC赳赳老秦6 天前
云原生AI故障排查新趋势:利用DeepSeek实现高效定位部署报错与性能瓶颈
ide·人工智能·python·云原生·prometheus·ai-native·deepseek
AI大模型..7 天前
Dify 本地部署安装教程(Windows + Docker),大模型入门到精通,收藏这篇就足够了!
人工智能·程序员·开源·llm·github·deepseek·本地化部署
AC赳赳老秦7 天前
预见2026:DeepSeek与云平台联动的自动化流程——云原生AI工具演进的核心引擎
人工智能·安全·云原生·架构·自动化·prometheus·deepseek
AC赳赳老秦7 天前
DeepSeek助力云原生AI降本:容器化部署资源优化与算力利用率提升技巧
网络·python·django·prompt·tornado·ai-native·deepseek
AC赳赳老秦8 天前
多模态 AI 驱动办公智能化变革:DeepSeek 赋能图文转写与视频摘要的高效实践
java·ide·人工智能·python·prometheus·ai-native·deepseek
AC赳赳老秦8 天前
2026云原生AI规模化趋势预测:DeepSeek在K8s集群中的部署与运维实战
运维·人工智能·云原生·架构·kubernetes·prometheus·deepseek
码农小韩9 天前
AIAgent应用开发——大模型理论基础与应用(六)
人工智能·python·提示词工程·aiagent·deepseek