0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词

本篇文章,我们将用仅0.08B参数 的轻量级模型**Xiaothink-T6-0.08B-Poem(清韵千言2)**生成效果接近GPT-4o的古诗。

根据官方介绍,这个模型从0全程在单颗Intel Core i7上完成预训练、指令微调和领域微调。

🎯 模型特点

  • 参数仅8000万:比主流模型小100倍
  • 150MB专项训练:仅用半本电子书的诗歌数据
  • 全CPU训练:在Intel Core i7上完成30小时微调
  • 超越ChatGLM-6B:在GPT-4o盲测中表现优异

🚀 三步开启诗词创作

步骤1:安装专用库
bash 复制代码
pip install xiaothink
步骤2:下载模型文件

从ModelSpace获取模型文件:

  1. 访问模型主页
  2. 下载checkpointvocab.txt文件
步骤3:创作你的第一首诗
python 复制代码
import xiaothink as xt

# 配置模型路径(替换为你的实际路径)
model = xt.llm.inference.test_formal.QianyanModel(
    ckpt_dir='path/to/checkpoint',
    MT='t6_beta_dense',
    vocab='path/to/vocab.txt'
)

# 生成七言绝句(李白风格)
response = model.chat_SingleTurn(
    "请你以王维的风格生成古诗,起始为空山新雨后",
    temp=0.56  # 控制创意度
)

print(f"【AI诗人】:\n{response}")

🌸 创作示例(实际生成效果)

text 复制代码
【用户指令】:请你以王维的风格生成古诗,起始为空山新雨后

【AI生成】:
空山新雨后,野色暮寒青。
水落山光澹,烟深鸟语清。
风吹花木尽,人入酒杯倾。
欲寄仙家去,归来定不能。 

📝 推荐Prompt格式

为获得最佳诗歌生成效果,建议使用以下prompt格式:

风格仿写

请你以{风格}的风格生成一些古诗

仿照{风格}写古诗

指定开头/题目

请你以{风格}的风格生成古诗,起始为{起始句}

用{风格}的风格写古诗(开头:{起始句})

诗句续写

续写"{起始句}"生成一些古诗

写诗 用{起始句}为第一句

作者猜测

给出古诗 {诗句} 请你猜猜这是谁写的

根据这段古诗推测一下作者:{诗句}

🎚️ 温度参数调

优指南

通过temp参数控制创作风格:

  • 0.44:严谨工整(适合应试创作)
  • 0.56:平衡模式(推荐日常使用)
  • 0.64:奔放创意(可能突破格律)

🌟 为什么选择清韵千言2?

  1. 硬件零门槛:支持量化,在树莓派上也能流畅运行
  2. 创作可控性:精准控制诗歌风格和主题
  3. 文化传承:严格遵循古诗词格律规范
  4. 即开即用:无需联网,保护创作隐私

结语

清韵千言2证明了:诗意不在参数大小,而在算法匠心。这款能在普通笔记本电脑上运行的AI诗人,不仅打开了传统文化数字化的新可能,更为边缘计算设备上的AI创作树立了标杆。无论您是教育工作者、文学爱好者还是AI开发者,都可以立即体验这份"小而美"的诗意:

bash 复制代码
pip install xiaothink

模型主页:https://www.modelscope.cn/models/ericsjq/Xiaothink-T6-0.08B-Poem

致谢:特别鸣谢Qwen团队和Minimind项目的高质量预训练数据支持

相关推荐
一念&21 分钟前
今日科技热点 | AI创新、量子计算突破与5G应用加速:引领未来的技术浪潮
人工智能·科技·量子计算
亚马逊云开发者28 分钟前
快时尚电商行业智能体设计思路与应用实践(三)借助 Transcribe/Polly 打造新一代智能语音客服,实现媲美人工客服的对话体验
人工智能
岛屿旅人41 分钟前
欧盟《人工智能法案》生效一年主要实施进展概览(二)
网络·人工智能·安全·web安全·架构
阿Paul果奶ooo1 小时前
数据分析与数据挖掘
人工智能·数据挖掘·数据分析
茫茫人海一粒沙1 小时前
LoRA 微调后幻觉排查 Checklist
人工智能
万邦科技Lafite1 小时前
京东API分类接口实战指南:获取各类商品信息
数据库·人工智能·api接口·开放api·电商开放平台
nnerddboy1 小时前
预测模型及超参数:2.传统机器学习:PLS及其改进
人工智能·机器学习
IT_陈寒1 小时前
Python数据处理太慢?这5个Pandas优化技巧让速度提升300%!
前端·人工智能·后端
大模型真好玩1 小时前
深入浅出LangGraph AI Agent智能体开发教程(一)—全面认识LangGraph
人工智能·python·mcp
钢铁男儿1 小时前
PyTorch 机器学习基础(机器学习一般流程)
人工智能·pytorch·机器学习