Datawhale AI夏令营——列车信息智能问答——科大讯飞AI大赛(基于结构化数据的用户意图理解和知识问答挑战赛)

前言

坐火车的你,遇到过这样的场景吗?

  • 一次又一次查车次信息
  • 赶火车狂奔,找检票口找到怀疑人生...
  • 想查"最早到北京的车"?时刻表翻到眼瞎
  • 列车晚点?新出发时间算到脑壳疼!

我们这次将一起来探索------如何让AI"看懂"列车时刻表!

你随口一问(比如"K123在哪检票?"),AI秒回精准答案! 告别抓狂!

于是Datawhale 联合 科大讯飞,创办了此次AI夏令营------主题为《列车信息智能问答》的比赛任务!

如果你感兴趣,那就一起来看看吧!


先看下赛题说明

一句话介绍比赛任务

  1. 根据列车信息表

  2. 构建QA问答对 ,比如

    复制代码
    Q:D218终点站是哪?
    A:上海
  3. 进行模型微调

  4. 达到做智能问答的效果。


理解任务之后,我们根据 学习手册 来学习

下面我们开始微调学习

Task 1:跑通赛事

第1天,如果你不知道啥是 微调

只知道AI时代 你需要了解------啥是 微调

那就啥也别问,跟教程走就行了,走通了就知道有什么问题了!

别不纠结原理,先感受 我能微调一个了解列车信息表的大模型 的爽感!

Task 1 学习手册链接https://www.datawhale.cn/activity/351/learn/198/4421

  1. 报名
  2. 下载数据
  3. 微调(对应下面三张图:1.创建模型 2.数据配置 3.提交微调任务)


数据配置中要创建数据集,把刚才下载数据集拖进来

其他参数都不用改?

当然要改,但不是现在改 ~

先摆烂 ~

我们到 Task2再来考虑这些问题~

Task 2:理解任务、理解重难点(待更新)

Task 3:动手、进阶上分(待更新)

相关推荐
乔江seven1 天前
【李沐 | 动手学深度学习】 21 计算机视觉:微调
人工智能·深度学习·计算机视觉·微调
kylin-运维2 天前
Unsloth Studio 使用问题记录
微调·训练·unsloth studio·离线环境
x_lrong3 天前
昇腾Ascend环境微调部署Qwen3(LlamaFactory+vLLM-Ascend)
微调·部署·昇腾·ascend·llamafactory·qwen3·vllm-ascend
ACCELERATOR_LLC9 天前
【DataWhale组队学习】DIY-LLM Task1分词器
人工智能·大模型·datawhale
墨心@10 天前
多Agent系统的编排
人工智能·语言模型·自然语言处理·agent·datawhale·agent设计模式·组队学习
墨心@10 天前
pytorch 与资源核算
pytorch·语言模型·大语言模型·datawhale·组队学习
念谨12 天前
【Diy-LLM】Task 1 分词器笔记
语言模型·datawhale·组队学习·cs336 中文课程
AI、少年郎13 天前
MiniMind 第 4 篇:《数据工程|Tokenizer 训练 + 预训练 / SFT/DPO 全数据集处理》
人工智能·python·ai·大模型·微调·大模型训练·minimind
墨心@13 天前
Byte-Pair Encoding (BPE) Tokenizer
人工智能·自然语言处理·nlp·datawhale·cs336·组队学习
博士僧小星15 天前
人工智能|大模型——训练——大模型微调全栈指南:从Transformer架构、10+种PEFT原理、流程与实战(全网最详细)
人工智能·lora·大模型·微调·peft·qlora·prefix tuning