机器学习:提取问题答案

模型BERT

任务:提取问题和答案

问题的起始位置和结束位置。

数据集

数据集 DRCD+ODSQA

先分词,然后tokenize

文章长度是不同的,bert的token的长度有限制,一般是512, self-attention的计算量是 O ( n 2 ) O(n^2) O(n2),所以无法将长的整篇文章送进去处理。

Train

以正确答案为中心,以固定长度的windows去找问题。关键字,答案一般在关键字附近,在答案的附近画一个window,越大越好。然后将这些片段进行tokenizer,再去训练。

Hints


  • Linear Learning rate decay

overlapping window, 因为分割可能会看不到,重叠一些部分。 修改doc stride参数。

正确答案不一定是在窗户正中心。

不同的预训练模型,建议使用中文预训练模型。



自动混合精度,有的时候不需要那么高的精度Float32,仅部分卡支持,以加速训练。

如果GPU内存不够的话,可以使用Gradient accumulation,累计参数一次更新。

Kaggle项目

套件:pip install transformers

相关推荐
初学小刘3 小时前
决策树:机器学习中的强大工具
算法·决策树·机器学习
小五1273 小时前
机器学习(决策树)
人工智能·决策树·机器学习
Wah-Aug3 小时前
从决策树基础到熵与信息增益
决策树·机器学习·分类
没有不重的名么3 小时前
Tmux Xftp及Xshell的服务器使用方法
服务器·人工智能·深度学习·机器学习·ssh
拾零吖5 小时前
吴恩达 Machine Learning(Class 1)
人工智能·机器学习
wydaicls6 小时前
用函数实现方程函数解题
人工智能·算法·机器学习
努力当一个优秀的程序员7 小时前
3.逻辑回归:从分类到正则化
人工智能·机器学习
cwn_8 小时前
牛津大学xDeepMind 自然语言处理(1)
人工智能·深度学习·机器学习·自然语言处理
小五12710 小时前
机器学习实例应用
人工智能·机器学习
WBluuue18 小时前
数学建模:智能优化算法
python·机器学习·数学建模·爬山算法·启发式算法·聚类·模拟退火算法