0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词

本篇文章,我们将用仅0.08B参数 的轻量级模型**Xiaothink-T6-0.08B-Poem(清韵千言2)**生成效果接近GPT-4o的古诗。

根据官方介绍,这个模型从0全程在单颗Intel Core i7上完成预训练、指令微调和领域微调。

🎯 模型特点

  • 参数仅8000万:比主流模型小100倍
  • 150MB专项训练:仅用半本电子书的诗歌数据
  • 全CPU训练:在Intel Core i7上完成30小时微调
  • 超越ChatGLM-6B:在GPT-4o盲测中表现优异

🚀 三步开启诗词创作

步骤1:安装专用库
bash 复制代码
pip install xiaothink
步骤2:下载模型文件

从ModelSpace获取模型文件:

  1. 访问模型主页
  2. 下载checkpointvocab.txt文件
步骤3:创作你的第一首诗
python 复制代码
import xiaothink as xt

# 配置模型路径(替换为你的实际路径)
model = xt.llm.inference.test_formal.QianyanModel(
    ckpt_dir='path/to/checkpoint',
    MT='t6_beta_dense',
    vocab='path/to/vocab.txt'
)

# 生成七言绝句(李白风格)
response = model.chat_SingleTurn(
    "请你以王维的风格生成古诗,起始为空山新雨后",
    temp=0.56  # 控制创意度
)

print(f"【AI诗人】:\n{response}")

🌸 创作示例(实际生成效果)

text 复制代码
【用户指令】:请你以王维的风格生成古诗,起始为空山新雨后

【AI生成】:
空山新雨后,野色暮寒青。
水落山光澹,烟深鸟语清。
风吹花木尽,人入酒杯倾。
欲寄仙家去,归来定不能。 

📝 推荐Prompt格式

为获得最佳诗歌生成效果,建议使用以下prompt格式:

风格仿写

请你以{风格}的风格生成一些古诗

仿照{风格}写古诗

指定开头/题目

请你以{风格}的风格生成古诗,起始为{起始句}

用{风格}的风格写古诗(开头:{起始句})

诗句续写

续写"{起始句}"生成一些古诗

写诗 用{起始句}为第一句

作者猜测

给出古诗 {诗句} 请你猜猜这是谁写的

根据这段古诗推测一下作者:{诗句}

🎚️ 温度参数调

优指南

通过temp参数控制创作风格:

  • 0.44:严谨工整(适合应试创作)
  • 0.56:平衡模式(推荐日常使用)
  • 0.64:奔放创意(可能突破格律)

🌟 为什么选择清韵千言2?

  1. 硬件零门槛:支持量化,在树莓派上也能流畅运行
  2. 创作可控性:精准控制诗歌风格和主题
  3. 文化传承:严格遵循古诗词格律规范
  4. 即开即用:无需联网,保护创作隐私

结语

清韵千言2证明了:诗意不在参数大小,而在算法匠心。这款能在普通笔记本电脑上运行的AI诗人,不仅打开了传统文化数字化的新可能,更为边缘计算设备上的AI创作树立了标杆。无论您是教育工作者、文学爱好者还是AI开发者,都可以立即体验这份"小而美"的诗意:

bash 复制代码
pip install xiaothink

模型主页:https://www.modelscope.cn/models/ericsjq/Xiaothink-T6-0.08B-Poem

致谢:特别鸣谢Qwen团队和Minimind项目的高质量预训练数据支持

相关推荐
光泽雨24 分钟前
检测阈值 匹配阈值分析 金字塔
图像处理·人工智能·计算机视觉·机器视觉·smart3
Σίσυφος190033 分钟前
PCL 法向量估计-PCA邻域点(经典 kNN 协方差)的协方差矩阵
人工智能·线性代数·矩阵
小鸡吃米…1 小时前
机器学习的商业化变现
人工智能·机器学习
sali-tec1 小时前
C# 基于OpenCv的视觉工作流-章22-Harris角点
图像处理·人工智能·opencv·算法·计算机视觉
2的n次方_1 小时前
ops-math 极限精度优化:INT8/INT4 基础运算的底层指令集映射与核函数复用
人工智能
AI袋鼠帝1 小时前
Claude4.5+Gemini3 接管电脑桌面,这回是真无敌了..
人工智能·windows·aigc
Lun3866buzha1 小时前
农业害虫检测_YOLO11-C3k2-EMSC模型实现与分类识别_1
人工智能·分类·数据挖掘
方见华Richard1 小时前
世毫九量子原住民教育理念全书
人工智能·经验分享·交互·原型模式·空间计算
忆~遂愿1 小时前
GE 引擎进阶:依赖图的原子性管理与异构算子协作调度
java·开发语言·人工智能
凯子坚持 c1 小时前
CANN-LLM:基于昇腾 CANN 的高性能、全功能 LLM 推理引擎
人工智能·安全