视觉大模型专栏导航

关于视觉大模型专栏,暂时还没有比较明确的更新计划,最近会在本专栏上更新关于Sam模型的基本原理,包括Image Encoder、Prompt Encoder及Mask Decoder等模块的实现;还有记录下如何利用Sam代码跑通一个demo。

后期接触了其他视觉大模型也会在本专栏上进行更新,到时候在本博客上会汇总所有文章链接。

未完待续。。。再拿我柴来占一下坑

相关推荐
尽兴-13 小时前
【10 分钟!M4 Mac mini 离线部署「私有 ChatGPT」完整实录】
macos·ai·chatgpt·大模型·ollama·私有化
桃子叔叔14 小时前
从0到1讲解大模型中的关键步骤(一)分词、词性标注、命名实体识别
人工智能·大模型·多模态
AndrewHZ1 天前
【图像处理基石】遥感图像高度信息提取:Python实战全流程+常用库汇总
图像处理·人工智能·python·计算机视觉·cv·遥感图像·高程信息
搞科研的小刘选手1 天前
【大会邀请】2025年AI驱动下:业务转型和数据科学创新国际学术会议(ICBTDS 2025)
人工智能·物联网·大模型·智慧城市·数据科学·ai驱动·计算科学
sight-ai2 天前
超越基础:SightAI 智能路由与多模型选择实战
人工智能·开源·大模型·api
喜欢吃豆2 天前
一份关于语言模型对齐的技术论述:从基于PPO的RLHF到直接偏好优化
人工智能·语言模型·自然语言处理·大模型·强化学习
CoderJia程序员甲2 天前
GitHub 热榜项目 - 日榜(2025-10-15)
ai·开源·大模型·github·ai教程
nueroamazing3 天前
PPT-EA:PPT自动生成器
vue.js·python·语言模型·flask·大模型·项目·ppt
CoderJia程序员甲3 天前
GitHub 热榜项目 - 日榜(2025-10-14)
ai·开源·大模型·github·ai教程
王者鳜錸3 天前
科大讯飞【免费】的开源模型实现录音转写与角色判定
开源·大模型·录音文件转文字·角色自动定位