0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词

本篇文章,我们将用仅0.08B参数 的轻量级模型**Xiaothink-T6-0.08B-Poem(清韵千言2)**生成效果接近GPT-4o的古诗。

根据官方介绍,这个模型从0全程在单颗Intel Core i7上完成预训练、指令微调和领域微调。

🎯 模型特点

  • 参数仅8000万:比主流模型小100倍
  • 150MB专项训练:仅用半本电子书的诗歌数据
  • 全CPU训练:在Intel Core i7上完成30小时微调
  • 超越ChatGLM-6B:在GPT-4o盲测中表现优异

🚀 三步开启诗词创作

步骤1:安装专用库
bash 复制代码
pip install xiaothink
步骤2:下载模型文件

从ModelSpace获取模型文件:

  1. 访问模型主页
  2. 下载checkpointvocab.txt文件
步骤3:创作你的第一首诗
python 复制代码
import xiaothink as xt

# 配置模型路径(替换为你的实际路径)
model = xt.llm.inference.test_formal.QianyanModel(
    ckpt_dir='path/to/checkpoint',
    MT='t6_beta_dense',
    vocab='path/to/vocab.txt'
)

# 生成七言绝句(李白风格)
response = model.chat_SingleTurn(
    "请你以王维的风格生成古诗,起始为空山新雨后",
    temp=0.56  # 控制创意度
)

print(f"【AI诗人】:\n{response}")

🌸 创作示例(实际生成效果)

text 复制代码
【用户指令】:请你以王维的风格生成古诗,起始为空山新雨后

【AI生成】:
空山新雨后,野色暮寒青。
水落山光澹,烟深鸟语清。
风吹花木尽,人入酒杯倾。
欲寄仙家去,归来定不能。 

📝 推荐Prompt格式

为获得最佳诗歌生成效果,建议使用以下prompt格式:

风格仿写

请你以{风格}的风格生成一些古诗

仿照{风格}写古诗

指定开头/题目

请你以{风格}的风格生成古诗,起始为{起始句}

用{风格}的风格写古诗(开头:{起始句})

诗句续写

续写"{起始句}"生成一些古诗

写诗 用{起始句}为第一句

作者猜测

给出古诗 {诗句} 请你猜猜这是谁写的

根据这段古诗推测一下作者:{诗句}

🎚️ 温度参数调

优指南

通过temp参数控制创作风格:

  • 0.44:严谨工整(适合应试创作)
  • 0.56:平衡模式(推荐日常使用)
  • 0.64:奔放创意(可能突破格律)

🌟 为什么选择清韵千言2?

  1. 硬件零门槛:支持量化,在树莓派上也能流畅运行
  2. 创作可控性:精准控制诗歌风格和主题
  3. 文化传承:严格遵循古诗词格律规范
  4. 即开即用:无需联网,保护创作隐私

结语

清韵千言2证明了:诗意不在参数大小,而在算法匠心。这款能在普通笔记本电脑上运行的AI诗人,不仅打开了传统文化数字化的新可能,更为边缘计算设备上的AI创作树立了标杆。无论您是教育工作者、文学爱好者还是AI开发者,都可以立即体验这份"小而美"的诗意:

bash 复制代码
pip install xiaothink

模型主页:https://www.modelscope.cn/models/ericsjq/Xiaothink-T6-0.08B-Poem

致谢:特别鸣谢Qwen团队和Minimind项目的高质量预训练数据支持

相关推荐
island13141 分钟前
CANN ops-nn 算子库深度解析:神经网络计算引擎的底层架构、硬件映射与融合优化机制
人工智能·神经网络·架构
小白|5 分钟前
CANN与实时音视频AI:构建低延迟智能通信系统的全栈实践
人工智能·实时音视频
Kiyra5 分钟前
作为后端开发你不得不知的 AI 知识——Prompt(提示词)
人工智能·prompt
艾莉丝努力练剑8 分钟前
实时视频流处理:利用ops-cv构建高性能CV应用
人工智能·cann
程序猿追9 分钟前
深度解析CANN ops-nn仓库 神经网络算子的性能优化与实践
人工智能·神经网络·性能优化
User_芊芊君子12 分钟前
CANN_PTO_ISA虚拟指令集全解析打造跨平台高性能计算的抽象层
人工智能·深度学习·神经网络
初恋叫萱萱15 分钟前
CANN 生态安全加固指南:构建可信、鲁棒、可审计的边缘 AI 系统
人工智能·安全
机器视觉的发动机21 分钟前
AI算力中心的能耗挑战与未来破局之路
开发语言·人工智能·自动化·视觉检测·机器视觉
铁蛋AI编程实战24 分钟前
通义千问 3.5 Turbo GGUF 量化版本地部署教程:4G 显存即可运行,数据永不泄露
java·人工智能·python
HyperAI超神经28 分钟前
在线教程|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁
开发语言·人工智能·深度学习·神经网络·机器学习·ocr·创业创新