gpt-2模型训练后应用

一、生成的文件集:

根据上篇文章训练后的数据进行训练后,使用训练好的数据集:

二、代码样例实现:

复制代码
from transformers import GPT2Tokenizer, GPT2LMHeadModel


tokenizer = GPT2Tokenizer.from_pretrained('./gpt2-model')
model = GPT2LMHeadModel.from_pretrained('./gpt2-model')

tokenizer.save_pretrained('./results/tokenizer')
model.save_pretrained('./results/model')

# 加载训练好的模型和tokenizer
tokenizer = GPT2Tokenizer.from_pretrained('./results/tokenizer')
model = GPT2LMHeadModel.from_pretrained('./results/model')

# 生成回答示例
question = "什么是高血压的最佳治疗方法?"
input_text = f"提问: {question}\n回答:"
input_ids = tokenizer.encode(input_text, return_tensors='pt')

output = model.generate(input_ids, max_length=100, top_k=50, top_p=0.95, temperature=0.7, do_sample=True)
answer = tokenizer.decode(output[0], skip_special_tokens=True).split("回答:")[1].strip()

print("问题:", question)
print("回答:", answer)
相关推荐
storyseek2 分钟前
RAG的四种的检索方式
python
一只大侠的侠8 分钟前
用PyTorch Lightning快速搭建可复现实验 pipeline
人工智能·pytorch·python
偷星星的贼118 分钟前
Python虚拟环境(venv)完全指南:隔离项目依赖
jvm·数据库·python
一株月见草哇10 分钟前
[python/uv]现代化python工具[先占坑]
python·uv
Leinwin10 分钟前
Azure 存储重磅发布系列创新 以 AI 与云原生能力解锁数据未来
后端·python·flask
无心水17 分钟前
4、Go语言程序实体详解:变量声明与常量应用【初学者指南】
java·服务器·开发语言·人工智能·python·golang·go
充值修改昵称18 分钟前
数据结构基础:B*树B+树的极致优化
数据结构·b树·python·算法
one____dream19 分钟前
【算法】相同的树与对称二叉树
b树·python·算法·递归
蓝净云22 分钟前
如何从pdf中提取带层级的标题结构
python·pdf
飞Link24 分钟前
后端架构选型:Django、Flask 与 Spring Boot 的三剑客之争
spring boot·python·django·flask