技术栈
vla
铮铭
2 天前
python
·
深度学习
·
机器学习
·
具身智能
·
vla
DINOv2+Qwen2.5-VL-2B+LoRA实现image caption的微调
本文的打算是一步步的实现Diffusion VLA的论文思路,之前用ResNet50提取图像特征,现在换成了DINOv2。
heroacool
1 年前
llm+robot
·
vla
Robot Learning
这个讲得不错 https://www.cs.cornell.edu/courses/cs4756/2023sp/ 特别是 https://www.cs.cornell.edu/courses/cs4756/2023sp/assets/slides_notes/lec26_slides.pdf 不得不说老外的课,紧跟前沿。