技术栈
gpt-2
逐梦苍穹
2 个月前
论文阅读
·
人工智能
·
gpt
·
语言模型
·
论文笔记
·
gpt-2
速通GPT-2:Language Models are Unsupervised Multitask Learners全文解读
🍃作者介绍:双非本科大四网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发,目前开始人工智能领域相关知识的学习 🦅个人主页:@逐梦苍穹 📕所属专栏:人工智能 🌻gitee地址:xzl的人工智能代码仓库 ✈ 您的一键三连,是我创作的最大动力🌹 在正式开始本篇文章之前,先介绍一下这篇文章总体结构。
MachineLP
8 个月前
gpt
·
chatgpt
·
gpt-3
·
gpt-4
·
gpt-2
GPT-1, GPT-2, GPT-3, InstructGPT / ChatGPT and GPT-4 总结
在 GPT-1 之前,NLP 通常是一种监督模型。 对于每个任务,都有一些标记数据,然后根据这些标记数据开发监督模型。 这种方法存在几个问题:首先,需要标记数据。 但 NLP 不像 CV,它有一个标记良好的数据imagenet。 其次,这些不同任务训练的模型并不是很通用。 例如,翻译训练出来的模型很难直接用于分类。