随着大语言模型(LLM)在文本生成领域的能力不断增强,越来越多的应用场景开始提出更高要求:
不仅要"能写",还要"像某个人写",并且能写通知、演讲稿、报告等不同文体。
本文将系统性地介绍一套可工程化落地的方法,帮助大模型实现:
- ✅ 文章生成的风格个性化(符合某个人的长期写作特点)
- ✅ 多文体写作能力(通知、演讲稿、汇报材料等)
- ✅ 在 Prompt 工程、模板化、轻量微调之间合理取舍
一、核心问题拆解:风格 ≠ 文体
在实际项目中,一个非常常见但致命的误区是:
把"写作风格"和"文章文体"混为一谈。
事实上,这两者是正交的两个维度:
-
写作风格(Style):
某个人"怎么写"
包括语气、句式、用词习惯、逻辑方式等
-
文章文体(Genre):
文章"写成什么形式"
比如通知、演讲稿、总结、汇报材料
一个人可以:
- 用同样的风格
- 写出完全不同文体的文章
因此,一个合理的建模方式是:
输出文本 = 人物写作风格 × 文体结构 × 具体内容
二、如何建模"某个人的写作风格"
1. 写作风格不是玄学,而是可拆解的特征集合
在工程上,不建议直接说"模仿某某的风格",而是将其拆解为可描述、可约束的维度。
常见的风格维度包括:
| 维度 | 示例 |
|---|---|
| 语气 | 正式 / 克制 / 激昂 |
| 人称 | 多用"我们""我认为" |
| 句式 | 中短句 / 长复合句 |
| 逻辑结构 | 总分总 / 条列式 |
| 常用词 | "进一步""高度重视""切实做好" |
| 情绪表达 | 偏理性 / 偏鼓动 |
| 修辞 | 少修辞 / 排比较多 |
这些特征可以通过两种方式获得:
- 人工总结(专家或熟悉该作者的人)
- LLM 辅助分析(对历史文章做风格归纳)
2. 基于 Prompt 的风格注入(最实用)
在不微调模型的前提下,最成熟、成本最低的方法是:
用结构化 Prompt 明确约束风格。
示例:
text
你是一位写作风格具有如下特点的作者:
- 语言正式、克制,不使用夸张修辞
- 多使用"我们"作为主体
- 逻辑清晰,偏好总分总结构
- 句式以中短句为主
- 强调执行与落实
这类 Prompt 本质上是一个**"风格接口"**,可以在不同任务中反复复用。
3. Few-shot 示例对齐(增强一致性)
如果对风格一致性要求更高,可以引入示例对齐:
text
以下是该作者过往文章示例:
【示例1】......
【示例2】......
请严格模仿上述语言风格完成写作任务。
实践经验表明:
- 3--5 篇高质量示例即可明显改善效果
- 示例与目标任务文体相近时效果最好
4. 轻量微调(LoRA / PEFT)
当某个人的风格需要长期、稳定、高一致性复现时,可以考虑微调。
推荐做法:
- 只用该人物的文章
- 数据中显式区分文体
示例数据结构:
json
{
"style": "leader_A",
"genre": "speech",
"input": "主题与背景",
"output": "完整演讲稿"
}
这样模型学到的是:
在不同文体下,这个人通常会如何表达。
三、多文体写作:用结构而不是"感觉"
与风格不同,文体是强结构化的,非常适合模板化处理。
1. 为每种文体建立"结构骨架"
通知类示例:
标题
关于......的通知
正文:
1. 事项背景
2. 具体安排
3. 工作要求
4. 截止时间 / 联系方式
演讲稿示例:
1. 开场(背景 + 听众情绪)
2. 核心观点(2--3 点)
3. 行动号召 / 总结
这一步的本质是:
把"文体能力"从模型中剥离,前移到工程侧。
2. 文体 Prompt 约束
在生成时,用 Prompt 明确文体要求:
text
请以【演讲稿】形式撰写,要求:
- 面向内部员工
- 语言正式但有号召力
- 结构清晰,适合口头表达
这与"人物风格 Prompt"是并列关系。
四、风格 × 文体 的组合生成
实践中效果最稳定的方式,是将两者显式组合:
text
你是一位具有如下写作风格的作者:
(人物风格描述)
请以【通知】形式撰写文章,结构要求:
1. 背景说明
2. 工作安排
3. 执行要求
主题是:......
篇幅约:800 字
这种方式的优点是:
- 风格稳定
- 文体不混乱
- 可扩展性强(新增人 / 新增文体都很容易)
五、推荐的工程架构方案
方案一:Prompt 组合(快速验证)
人物风格 Prompt
+ 文体结构 Prompt
+ 任务 Prompt
适合:
- MVP
- 多风格、低频使用
方案二:风格参数化 + 文体模板库(推荐)
json
{
"style_profile": "leader_A",
"genre": "notice",
"topic": "年度重点工作安排",
"constraints": {
"length": 1000,
"tone": "正式"
}
}
系统内部:
style_profile→ 风格描述 Promptgenre→ 固定结构模板- 自动拼接 Prompt 调用模型
这是目前企业应用中最常见、性价比最高的方案。
方案三:微调模型 + Prompt(成熟阶段)
- 微调负责"像谁写"
- Prompt 负责"写成什么形式、完成什么任务"
适合高频、强一致性场景。
六、常见误区总结
- ❌ 试图一个 Prompt 同时解决风格和文体
- ❌ 用模糊形容词描述风格(如"更大气一点")
- ❌ 不做结构约束,完全依赖模型自由生成
- ❌ 为每个文体单独微调模型(成本极高)
七、结语
大模型写作从"能用"走向"好用",关键不在模型参数大小,而在于:
- 是否正确拆解了问题
- 是否把结构性交给工程,把表达性交给模型
通过风格画像 + 文体模板 + 组合生成,可以在不追求重模型训练的前提下,实现高度可控、可扩展的个性化写作系统。