1.6自然语言的分布式表示-word2vec补充说明目的是从概率视角了解CBOW模型的训练目标;CBOW模型是在给定某个上下文时,输出目标词的概率;对于包含 w 1 , w 2 , . . . , w T w_1,w_2,...,w_T w1,w2,...,wT的语料库,CBOW模型就是在给定上下文的情况下(假设上下文窗口为1)预测目标词发生的概率,因此可以用条件概率建模: P ( w t ∣ w t − 1 , w t + 1 ) P(w_t|w_{t-1},w_{t+1}) P(wt∣wt−1,wt+1) 即在 w t − 1 w_{t-1} wt−1