机器学习:提取问题答案

模型BERT

任务:提取问题和答案

问题的起始位置和结束位置。

数据集

数据集 DRCD+ODSQA

先分词,然后tokenize

文章长度是不同的,bert的token的长度有限制,一般是512, self-attention的计算量是 O ( n 2 ) O(n^2) O(n2),所以无法将长的整篇文章送进去处理。

Train

以正确答案为中心,以固定长度的windows去找问题。关键字,答案一般在关键字附近,在答案的附近画一个window,越大越好。然后将这些片段进行tokenizer,再去训练。

Hints


  • Linear Learning rate decay

overlapping window, 因为分割可能会看不到,重叠一些部分。 修改doc stride参数。

正确答案不一定是在窗户正中心。

不同的预训练模型,建议使用中文预训练模型。



自动混合精度,有的时候不需要那么高的精度Float32,仅部分卡支持,以加速训练。

如果GPU内存不够的话,可以使用Gradient accumulation,累计参数一次更新。

Kaggle项目

套件:pip install transformers

相关推荐
Mr数据杨7 分钟前
未知交互环境智能体助力机器人自主适应
机器学习·数据分析·机器人·kaggle
逻辑君14 分钟前
认知神经科学研究报告【20260015】
人工智能·神经网络·机器学习
萌新小码农‍15 分钟前
神经系统与深度学习介绍 学习笔记day1
人工智能·深度学习·神经网络·机器学习·语言模型
LDG_AGI36 分钟前
【搜索引擎】Elasticsearch(六):向量搜索深度解析:从参数原理到混合查询实战
人工智能·深度学习·算法·elasticsearch·机器学习·搜索引擎
wusp19941 小时前
DeepSeek V4 Flash + DMXAPI:文生图提示词智能优化
大数据·人工智能·机器学习
2601_950760792 小时前
TNF-α信号通路与自身免疫性疾病研究进展
人工智能·机器学习·蛋白
znhb992 小时前
技术详解 | 脱硫脱硝氨逃逸AI精准控制系统的核心运行逻辑
人工智能·机器学习
人工智能培训2 小时前
AI模型部署进阶:Docker容器化部署AI项目
人工智能·深度学习·机器学习·docker·容器·transformer·知识图谱
天堂12232 小时前
机器学习基本概念
人工智能·机器学习
X journey3 小时前
机器学习进阶(24):主成分分析PCA
人工智能·算法·机器学习