mllm

SpikeKing1 个月前
人工智能·swift·modelscope·多模态大模型·推理·mllm·微调框架
LLM - 配置 ModelScope SWIFT 测试 Qwen2-VL 模型推理(Infer) 教程 (1)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142827217
SpikeKing2 个月前
人工智能·语言模型·自然语言处理·finetune·mllm·多模态大语言模型·指令微调
LLM - 使用 XTuner 指令微调 多模态大语言模型(InternVL2) 教程欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142528967
SpikeKing2 个月前
人工智能·语言模型·预训练·mllm·多模态大语言模型·qwen-vl·laion
LLM - 理解 多模态大语言模型 (MLLM) 的预训练与相关技术 (三)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142063880
SpikeKing2 个月前
人工智能·语言模型·clip·mllm·多模态大语言模型·openclip·cogvlm
LLM - 理解 多模态大语言模型 (MLLM) 的架构与相关技术 (二)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142063880
m0_603888712 个月前
人工智能·mllm
MiniCPM-V: A GPT-4V Level MLLM on Your Phone现有的MLLM通常需要大量的参数和计算资源,限制了其在实际应用中的范围。大部分MLLM需要部署在高性能云服务器上,这种高成本和高能耗的特点,阻碍了其在移动设备、离线和隐私保护场景中的应用。
同屿Firmirin3 个月前
目标检测·计算机视觉·aigc·多模态大模型·shikra·mllm·grounding
目标检测多模态大模型实践:貌似是全网唯一Shikra的部署和测试教程,内含各种踩坑以及demo代码原文: Shikra: Unleashing Multimodal LLM’s Referential Dialogue Magic 代码: https://github.com/shikras/shikra 模型: https://huggingface.co/shikras/shikra-7b-delta-v1 https://huggingface.co/shikras/shikra7b-delta-v1-0708 第一个是论文用的,第二个会有迭代。