Re53：读论文 How Can We Know What Language Models Know?

论文名称：How Can We Know What Language Models Know?

官方GitHub项目（prompt之类的都有）：https://github.com/jzbjyb/LPAQA

本文是2020年TACL论文，作者来自卡耐基梅隆大学和博世北美研究所。

本文关注探索LM中蕴含的知识。以前已经有工作用完形填空的方式来探查知识（Obama is a __ by profession），但是这些填空模版（prompt）都是手工做的，因此可能是sub-optimal的（在上一篇论文最后也提及了），不能充分发挥LM的能力。

本文的解决方案是自动挖掘prompt（远程监督、回译、集成）

这篇工作的实验真的多，这也太能做了。

1. 探查知识的方案

从数据库中获取知识是deterministic的，但从LM中获取知识（完形填空）是不可靠的。

本文用的都是双向LM，做填空题的那种。

mining-based methods：远程监督：从维基百科中找三元组出现的句子。
1. 方法一：Middle-word Prompts（subject prompt object）
2. 方法二：Dependency-based Prompts（句法分析→subject和object之间的依存路径）
  
  （句法分析这块我也不懂总之大概是这么个意思吧）
paraphrasing-based methods：对人工或挖掘得到的种子prompt进行回译
挑选和集成prompt
1. Top-1 Prompt Selection：选择在训练集上准确率最高的prompt（这个准确率的公式定义比较复杂，但是反正就这个prompt对应的关系里object预测正确的占所有样本的比例）
2. Rank-based Ensemble：top-K概率求和
3. Optimized Ensemble：大意是说对每个关系的T个prompt分别训练权重