0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词

本篇文章,我们将用仅0.08B参数 的轻量级模型**Xiaothink-T6-0.08B-Poem(清韵千言2)**生成效果接近GPT-4o的古诗。

根据官方介绍,这个模型从0全程在单颗Intel Core i7上完成预训练、指令微调和领域微调。

🎯 模型特点

  • 参数仅8000万:比主流模型小100倍
  • 150MB专项训练:仅用半本电子书的诗歌数据
  • 全CPU训练:在Intel Core i7上完成30小时微调
  • 超越ChatGLM-6B:在GPT-4o盲测中表现优异

🚀 三步开启诗词创作

步骤1:安装专用库
bash 复制代码
pip install xiaothink
步骤2:下载模型文件

从ModelSpace获取模型文件:

  1. 访问模型主页
  2. 下载checkpointvocab.txt文件
步骤3:创作你的第一首诗
python 复制代码
import xiaothink as xt

# 配置模型路径(替换为你的实际路径)
model = xt.llm.inference.test_formal.QianyanModel(
    ckpt_dir='path/to/checkpoint',
    MT='t6_beta_dense',
    vocab='path/to/vocab.txt'
)

# 生成七言绝句(李白风格)
response = model.chat_SingleTurn(
    "请你以王维的风格生成古诗,起始为空山新雨后",
    temp=0.56  # 控制创意度
)

print(f"【AI诗人】:\n{response}")

🌸 创作示例(实际生成效果)

text 复制代码
【用户指令】:请你以王维的风格生成古诗,起始为空山新雨后

【AI生成】:
空山新雨后,野色暮寒青。
水落山光澹,烟深鸟语清。
风吹花木尽,人入酒杯倾。
欲寄仙家去,归来定不能。 

📝 推荐Prompt格式

为获得最佳诗歌生成效果,建议使用以下prompt格式:

风格仿写

请你以{风格}的风格生成一些古诗

仿照{风格}写古诗

指定开头/题目

请你以{风格}的风格生成古诗,起始为{起始句}

用{风格}的风格写古诗(开头:{起始句})

诗句续写

续写"{起始句}"生成一些古诗

写诗 用{起始句}为第一句

作者猜测

给出古诗 {诗句} 请你猜猜这是谁写的

根据这段古诗推测一下作者:{诗句}

🎚️ 温度参数调

优指南

通过temp参数控制创作风格:

  • 0.44:严谨工整(适合应试创作)
  • 0.56:平衡模式(推荐日常使用)
  • 0.64:奔放创意(可能突破格律)

🌟 为什么选择清韵千言2?

  1. 硬件零门槛:支持量化,在树莓派上也能流畅运行
  2. 创作可控性:精准控制诗歌风格和主题
  3. 文化传承:严格遵循古诗词格律规范
  4. 即开即用:无需联网,保护创作隐私

结语

清韵千言2证明了:诗意不在参数大小,而在算法匠心。这款能在普通笔记本电脑上运行的AI诗人,不仅打开了传统文化数字化的新可能,更为边缘计算设备上的AI创作树立了标杆。无论您是教育工作者、文学爱好者还是AI开发者,都可以立即体验这份"小而美"的诗意:

bash 复制代码
pip install xiaothink

模型主页:https://www.modelscope.cn/models/ericsjq/Xiaothink-T6-0.08B-Poem

致谢:特别鸣谢Qwen团队和Minimind项目的高质量预训练数据支持

相关推荐
9呀2 分钟前
【人工智能99问】什么是Post-Training,包含哪些内容?(19/99)
人工智能
小拇指~5 分钟前
神经网络的基础
人工智能·深度学习·神经网络
wenzhangli76 分钟前
AI 重塑软件产业:从技术革命到生态重构
人工智能·驱动开发·重构
安冬的码畜日常14 分钟前
【AI 加持下的 Python 编程实战 2_13】第九章:繁琐任务的自动化(中)——自动批量合并 PDF 文档
人工智能·python·自动化·ai编程·ai辅助编程
Bar_artist39 分钟前
RockAI 的破壁之战:Yan 架构如何啃下“端侧炼丹”硬骨头?
人工智能
爱编码的程序员42 分钟前
python 处理json、excel、然后将内容转化为DSL语句,适用于数据处理(实用版)
人工智能·python·ai·json·excel·数据处理·dsl
哔哩哔哩技术1 小时前
B站是如何实现原声视频翻译的
人工智能
陈敬雷-充电了么-CEO兼CTO1 小时前
OpenAI ChatGPT Agent横空出世:全能工具+实时交互,重新定义AI智能体的终极形态
人工智能·gpt·ai·chatgpt·大模型
新智元1 小时前
ChatGPT血洗美国50万科技岗位!25年美国GDP增长,不靠人类靠AI?
人工智能·openai
TMT星球1 小时前
官宣朱珠成为集团品牌代言人,转转推动二手消费新风尚
大数据·人工智能