0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词

本篇文章,我们将用仅0.08B参数 的轻量级模型**Xiaothink-T6-0.08B-Poem(清韵千言2)**生成效果接近GPT-4o的古诗。

根据官方介绍,这个模型从0全程在单颗Intel Core i7上完成预训练、指令微调和领域微调。

🎯 模型特点

  • 参数仅8000万:比主流模型小100倍
  • 150MB专项训练:仅用半本电子书的诗歌数据
  • 全CPU训练:在Intel Core i7上完成30小时微调
  • 超越ChatGLM-6B:在GPT-4o盲测中表现优异

🚀 三步开启诗词创作

步骤1:安装专用库
bash 复制代码
pip install xiaothink
步骤2:下载模型文件

从ModelSpace获取模型文件:

  1. 访问模型主页
  2. 下载checkpointvocab.txt文件
步骤3:创作你的第一首诗
python 复制代码
import xiaothink as xt

# 配置模型路径(替换为你的实际路径)
model = xt.llm.inference.test_formal.QianyanModel(
    ckpt_dir='path/to/checkpoint',
    MT='t6_beta_dense',
    vocab='path/to/vocab.txt'
)

# 生成七言绝句(李白风格)
response = model.chat_SingleTurn(
    "请你以王维的风格生成古诗,起始为空山新雨后",
    temp=0.56  # 控制创意度
)

print(f"【AI诗人】:\n{response}")

🌸 创作示例(实际生成效果)

text 复制代码
【用户指令】:请你以王维的风格生成古诗,起始为空山新雨后

【AI生成】:
空山新雨后,野色暮寒青。
水落山光澹,烟深鸟语清。
风吹花木尽,人入酒杯倾。
欲寄仙家去,归来定不能。 

📝 推荐Prompt格式

为获得最佳诗歌生成效果,建议使用以下prompt格式:

风格仿写

请你以{风格}的风格生成一些古诗

仿照{风格}写古诗

指定开头/题目

请你以{风格}的风格生成古诗,起始为{起始句}

用{风格}的风格写古诗(开头:{起始句})

诗句续写

续写"{起始句}"生成一些古诗

写诗 用{起始句}为第一句

作者猜测

给出古诗 {诗句} 请你猜猜这是谁写的

根据这段古诗推测一下作者:{诗句}

🎚️ 温度参数调

优指南

通过temp参数控制创作风格:

  • 0.44:严谨工整(适合应试创作)
  • 0.56:平衡模式(推荐日常使用)
  • 0.64:奔放创意(可能突破格律)

🌟 为什么选择清韵千言2?

  1. 硬件零门槛:支持量化,在树莓派上也能流畅运行
  2. 创作可控性:精准控制诗歌风格和主题
  3. 文化传承:严格遵循古诗词格律规范
  4. 即开即用:无需联网,保护创作隐私

结语

清韵千言2证明了:诗意不在参数大小,而在算法匠心。这款能在普通笔记本电脑上运行的AI诗人,不仅打开了传统文化数字化的新可能,更为边缘计算设备上的AI创作树立了标杆。无论您是教育工作者、文学爱好者还是AI开发者,都可以立即体验这份"小而美"的诗意:

bash 复制代码
pip install xiaothink

模型主页:https://www.modelscope.cn/models/ericsjq/Xiaothink-T6-0.08B-Poem

致谢:特别鸣谢Qwen团队和Minimind项目的高质量预训练数据支持

相关推荐
古城小栈9 小时前
雾计算架构:边缘-云端协同的分布式 AI 推理
人工智能·分布式·架构
JoannaJuanCV9 小时前
自动驾驶—CARLA仿真(7)vehicle_physics demo
人工智能·机器学习·自动驾驶
Allen正心正念202510 小时前
AWS专家Greg Coquillo提出的 6种LLM ORCHESTRATION PATTERNS解析
人工智能·架构
每日学点SEO10 小时前
「网站新页面冲进前10名成功率下降69%」:2025 年SEO竞争格局分析
大数据·数据库·人工智能·搜索引擎·chatgpt
HalvmånEver10 小时前
AI 工具实战测评:从技术性能到场景落地的全方位解析
人工智能·ai
碧海银沙音频科技研究院10 小时前
论文写作word插入公式显示灰色解决办法
人工智能·深度学习·算法
O561 6O623O7 安徽正华露10 小时前
露,AI人工智能Barnes迷宫 AI人工智能自动记录水迷宫
人工智能
十铭忘10 小时前
SAM2跟踪的理解6——mask decoder
人工智能·计算机视觉
不会计算机的g_c__b10 小时前
AI Agent 三大核心组件解析:规划、记忆与工具使用,构建真正智能体
人工智能
听风吹等浪起10 小时前
机器学习算法:随机梯度下降算法
人工智能·深度学习·算法·机器学习