gpt-2模型训练后应用

一、生成的文件集:

根据上篇文章训练后的数据进行训练后,使用训练好的数据集:

二、代码样例实现:

复制代码
from transformers import GPT2Tokenizer, GPT2LMHeadModel


tokenizer = GPT2Tokenizer.from_pretrained('./gpt2-model')
model = GPT2LMHeadModel.from_pretrained('./gpt2-model')

tokenizer.save_pretrained('./results/tokenizer')
model.save_pretrained('./results/model')

# 加载训练好的模型和tokenizer
tokenizer = GPT2Tokenizer.from_pretrained('./results/tokenizer')
model = GPT2LMHeadModel.from_pretrained('./results/model')

# 生成回答示例
question = "什么是高血压的最佳治疗方法?"
input_text = f"提问: {question}\n回答:"
input_ids = tokenizer.encode(input_text, return_tensors='pt')

output = model.generate(input_ids, max_length=100, top_k=50, top_p=0.95, temperature=0.7, do_sample=True)
answer = tokenizer.decode(output[0], skip_special_tokens=True).split("回答:")[1].strip()

print("问题:", question)
print("回答:", answer)
相关推荐
威联通安全存储4 分钟前
某大型电力装备制造企业:基于威联通NAS的核心图纸保护与数据治理实践
python
Kang.Charles29 分钟前
python读取环境变量
python
Birdy_x29 分钟前
Python进阶(1)- logging
python
飞翔的烤鸡翅33 分钟前
Kilo Code在PyCharm上的一些实践
ide·python·pycharm·ai编程·kilo code
Roselind_Yi39 分钟前
从线性回归实战到Python依赖安装踩坑:我的机器学习入门排雷记
笔记·python·算法·机器学习·回归·线性回归·学习方法
干啥啥不行,秃头第一名1 小时前
Python深度学习入门:TensorFlow 2.0/Keras实战
jvm·数据库·python
二闹1 小时前
一文了解Python里的函数名和函数参数到底啥关系?
后端·python
sin°θ_陈1 小时前
前馈式3D Gaussian Splatting 研究地图(路线一):像素对齐高斯的起点——pixelSplat 与 latentSplat 在解决什么
python·深度学习·3d·aigc·webgl·3dgs·空间智能
Bert.Cai1 小时前
Python标识符详解
开发语言·python