基于Transformer的人工智能模型搭建与fine-tuning

  • Transformer 模型的本质理解
  • 模型搭建的核心流程
  • 微调(Fine-tuning)的关键策略

相关推荐
大模型任我行1 分钟前
英伟达:物理感知的多模态评判模型
人工智能·语言模型·自然语言处理·论文笔记
laplace01231 分钟前
IcePop技术
人工智能·大模型·agent·claude·rag·skills·icepop
l1t11 分钟前
DeepSeek总结的Nanbeige4.1-3B:一个具备推理、对齐与行动能力的小型通用模型
人工智能
一只理智恩24 分钟前
AI 实战应用:从“搜索式问答“到“理解式助教“
人工智能·python·语言模型·golang
DeepModel1 小时前
第15章 多模态学习
深度学习·学习·机器学习
nudt_qxx1 小时前
讲透Transformer(三):Transformer 注意力机制详解与Qwen/DeepSeek近期改进
人工智能·深度学习·transformer
绒绒毛毛雨1 小时前
多目标强化学习-英伟达:GDPO
人工智能·深度学习·机器学习
systeminof1 小时前
亚马逊转向自研路线,AI生态控制权之争升温
人工智能
Ray Liang1 小时前
EvoMap 硬刚 OpenClaw!从基因胶囊到仿生大脑,AI 的尽头果然是生物学
人工智能·ai助手·openclaw·mindx