自然语言处理-文本对分类或回归

我们研究了自然语言推断。它属于文本对分类,这是一种对文本进行分类的应用类型。

以一对文本作为输入但输出连续值,语义文本相似度是一个流行的"文本对回归"任务。 这项任务评估句子的语义相似度。例如,在语义文本相似度基准数据集(Semantic Textual Similarity Benchmark)中,句子对的相似度得分是从0(无语义重叠)到5(语义等价)的分数区间。我们的目标是预测这些分数。来自语义文本相似性基准数据集的样本包括(句子1,句子2,相似性得分):

  • "A plane is taking off."("一架飞机正在起飞。"),"An air plane is taking off."("一架飞机正在起飞。"),5.000分;

  • "A woman is eating something."("一个女人在吃东西。"),"A woman is eating meat."("一个女人在吃肉。"),3.000分;

  • "A woman is dancing."(一个女人在跳舞。),"A man is talking."("一个人在说话。"),0.000分。

文本对分类或回归应用的BERT微调,如自然语言推断和语义文本相似性(假设输入文本对分别有两个词元和三个词元)

与单文本分类相比,上图中的文本对分类的BERT微调在输入表示上有所不同。对于文本对回归任务(如语义文本相似性),可以应用细微的更改,例如输出连续的标签值和使用均方损失:它们在回归中很常见。

相关推荐
啊阿狸不会拉杆2 分钟前
《数字图像处理》第 10 章 - 图像分割
图像处理·人工智能·深度学习·算法·计算机视觉·数字图像处理
Dev7z3 分钟前
基于深度学习的车辆品牌与类型智能识别系统设计与实现
人工智能·深度学习
国科安芯4 分钟前
强辐射环境无人机视频系统MCU可靠性分析
人工智能·单片机·嵌入式硬件·音视频·无人机·边缘计算·安全性测试
华奥系科技4 分钟前
社区治理创新模式:智慧社区如何通过数字化工具激活邻里活力
大数据·人工智能
AI_56784 分钟前
Airflow“3分钟上手”教程:用Python定义定时数据清洗任务
开发语言·人工智能·python
蓝海星梦4 分钟前
【强化学习】深度解析 DAPO:从 GRPO 到 Decoupled Clip & Dynamic Sampling
人工智能·深度学习·自然语言处理·强化学习
人工智能AI技术9 分钟前
Agent核心模块进阶:让每个组件更智能、更实用
人工智能
羑悻的小杀马特10 分钟前
不做“孤岛”做“中枢”:拆解金仓时序库,看国产基础软件如何玩转“多模融合”
数据库·人工智能
weixin_4624462310 分钟前
从零搭建AI关系图生成助手:Chainlit 结合LangChain、LangGraph和可视化技术
人工智能·langchain·langgraph·chainlit
桂花饼11 分钟前
Python 实战 Sora-2 视频生成:基于小镜 AI 的低成本与角色一致性解决方案
人工智能·sora2·gemini 3·gpt-5.2·codex-max