三、AI知识(自然语言处理)
1.常用算法
1.TF-IDF
2.主题模型(LDA,PLSA)
3.词嵌入(Word2Vec、GloVe)
4.基于Transformer框架(如BERT系列、GPT系列)
5.分层结构
6.序列到序列模型(Seq2Seq)
2.大语言模型构建方法
1.数据清洗
2.分词技术
3.位置编码
4.模型预训练
5.微调技术
6.对齐方法
7.解码策略
8.增强方法
1.TF-IDF
2.主题模型(LDA,PLSA)
3.词嵌入(Word2Vec、GloVe)
4.基于Transformer框架(如BERT系列、GPT系列)
5.分层结构
6.序列到序列模型(Seq2Seq)
1.数据清洗
2.分词技术
3.位置编码
4.模型预训练
5.微调技术
6.对齐方法
7.解码策略
8.增强方法