transformers in tabular tiny survey 2024.4.8

推荐阅读

TabLLM

pmlr2023,

Few-shot Classification of Tabular Data with Large Language Models

方法

使用把tabular数据序列化成文字的方法进行classification。
使用的序列化方法有几个,有人工也有AI生成。

效果

做few shot learning的效果
看上去一般。

TransTab

Learning Transferable Tabular Transformers Across Tables

方法

属于transfer learning的方法。对category、binary和numeric值进行embedding后再进行transformers最后进行classification。

使用场景

原文:

  • S(1) Transfer learning . We collect data tables from multiple cancer trials for testing the efficacy

of the same drug on different patients. These tables were designed independently with overlapping

columns. How do we learn ML models for one trial by leveraging tables from all trials?

  • S(2) Incremental learning . Additional columns might be added over time. For example, additional

features are collected across different trial phases. How do we update the ML models using tables

from all trial phases?

  • S(3) Pretraining+Finetuning . The trial outcome label (e.g., mortality) might not be always available

from all table sources. Can we benefit pretraining on those tables without labels? How do we finetune

the model on the target table with labels?

  • S(4) Zero-shot inference . We model the drug efficacy based on our trial records. The next step is to

conduct inference with the model to find patients that can benefit from the drug. However, patient

tables do not share the same columns as trial tables so direct inference is not possible.

效果

具体看原文吧,与当时的baseline比有提升。

MET

Masked Encoding for Tabular Data

tabtransformer

2020年,arxiv,TabTransformer: Tabular Data Modeling Using Contextual Embeddings

方法

transformer无监督训练,mlp监督训练。

原文

we introduce a pre-training procedure to train the Transformer layers using unlabeled data . This is followed by fine-tuning of the pre-trained Transformer layers along with the top MLP layer using the labeled data

效果

跟mlp

跟其他模型

tabnet

2020, arxiv,Google Cloud AI,Attentive Interpretable Tabular Learning, 封装的非常好,都可以当工具包使用了。

方法

跟transformer没关系的。
feature selection用的是17年的某个选择模型,最后agg一下做predict。

相关推荐
captain_AIouo4 分钟前
全方位降本增效,Captain AI重构OZON运营成本结构
大数据·人工智能·经验分享·重构·aigc
财迅通Ai5 分钟前
双轮驱动弱化周期,向上跃迁重构逻辑:海阳科技如何穿越行业迷雾实现战略进化?
人工智能·科技·重构·海阳科技
白羊by8 分钟前
YOLOv8 官方损失函数详解(按任务分类)
人工智能·深度学习·算法·yolo·分类
老王谈企服8 分钟前
【2026深度洞察】制造业供应链全链路可视化,未来有哪些技术发展方向? | 实在Agent企业级解决方案
人工智能·ai
Agent产品评测局8 分钟前
国产vs海外AI Agent方案,制造业场景适配性横评:2026年企业级自动化选型全景观察
运维·人工智能·ai·chatgpt·自动化
创意岛8 分钟前
大湾区企业如何破解“品牌失语”,在AI时代夺回定义权?
人工智能·python
沪漂阿龙9 分钟前
面试题:逻辑回归是什么?为什么用 Sigmoid、对数损失、最大似然、Softmax、多分类、类别不平衡一文讲透
人工智能·算法·机器学习·分类·逻辑回归
丷丩10 分钟前
我正用AI Agent重构传统GIS 核心功能,说大白话做空间分析
人工智能·gis·geoai
xiaozhazha_10 分钟前
从“看”到“干”的跨越:快鹭AI如何重构企业业务流程的技术实践
人工智能·重构
波动几何11 分钟前
内发与共鸣:基于“仁-感”本体的关怀生成论——对吉利根关怀伦理的哲学重构
人工智能