听课笔记-nlp

典型的深度网络模型 resNet

mask R-CNN

大模型为核心的AI

原始的问题就是语言模型

词嵌入

word Embedding

如何将字符串转化为浮点数组,也就是再高维空间中的店,这种空间嵌入,是NLP的关键

含义相近的词汇,应当嵌入到距离相近的点上

词组与搭配关系,乃至于句法和语法,都和词汇之间的亲密度,密切相关,嵌入时,不能只考虑词汇本身的含义

考虑语境和上下文

连带上下文一同嵌入

早期语言模型架构,主要基于RNN,以LSTM作为基本单元,并且引入两列注意力元素 CoVe

若干个CNN,平行的放置,首尾链接,ELMo,处理的是一个顺序对象,基本特征为顺序,人读东西是非线性的

信息越处理噪声越多,越处理信息越少

正着跑一遍,倒着跑一遍

2017年,Transformer的引入是NLP领域的革命性事件

引入注意力机制,假定事先不知道,事先准备了很多的注意力头,提取出来的信息,反复相关

两大特点:非线性,大量的计算

Transfoemer 内部参数众多,可以存储大量信息

ENCODER --> DECODER

预训练pre-train (没有明确目标,没有明显指向任务,是为了今后的精调做准备的,用大量的语料做准备,上千亿种)+ Fine-Tuning 是AI训练方法的革命性创新

人的语义不达,可能是训练的不够,肯定没有上千亿种,

从图片中准确的找到,提取出二维的姿态,模型要放的稳

解决问题才是最重要的

要出深度只有两个途径,一个是一个角度拍一张,两张不同角度的图,三角化,另外一种,立体相机,双目

直接输出图片中关注的三维姿态,一张图片,不但知道有摩托车,还知道位置,还知道姿态,modelTarget,端对端

相关推荐
YF云飞20 分钟前
数据仓库进化:Agent驱动数智化新范式
数据仓库·人工智能·ai
ningmengjing_36 分钟前
理解损失函数:机器学习的指南针与裁判
人工智能·深度学习·机器学习
四谎真好看41 分钟前
Java 学习笔记(进阶篇2)
java·笔记·学习
程序猿炎义1 小时前
【NVIDIA AIQ】自定义函数实践
人工智能·python·学习
小陈phd1 小时前
高级RAG策略学习(四)——上下文窗口增强检索RAG
人工智能·学习·langchain
居然JuRan1 小时前
阿里云多模态大模型岗三面面经
人工智能
THMAIL1 小时前
深度学习从入门到精通 - BERT与预训练模型:NLP领域的核弹级技术详解
人工智能·python·深度学习·自然语言处理·性能优化·bert
nju_spy1 小时前
Kaggle - LLM Science Exam 大模型做科学选择题
人工智能·机器学习·大模型·rag·南京大学·gpu分布计算·wikipedia 维基百科
中國龍在廣州2 小时前
GPT-5冷酷操盘,游戏狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默
人工智能·gpt·深度学习·机器学习·计算机视觉·机器人
东哥说-MES|从入门到精通2 小时前
Mazak MTF 2025制造未来参观总结
大数据·网络·人工智能·制造·智能制造·数字化