llava

万里鹏程转瞬至1 个月前
论文阅读·多模态·llava
论文阅读:LLaVA-OneVision: Easy Visual Task Transfer论文地址:https://arxiv.org/pdf/2408.03326 公开时间:2024年9月14日 项目地址:https://llava-vl.github.io/blog/llava-onevision LLaVA-OneVision是一个开放的大型多模态模型(LMMs),它是通过整合在LLaVA-NeXT博客系列中的数据、模型和可视化表示的见解而开发的。实验结果表明,LLaVA-OneVision是第一个能够在三个重要的计算机视觉场景:单图像、多图像和视频场景的单一模型。重要的是,LLaVAO
William.csj2 个月前
llama·llava
大模型——LLaVA和LLaMA的介绍和区别LLaVA和LLaMA是两个不同的模型架构,它们的设计目的和应用领域有所不同:
alxe_made5 个月前
llm·vllm·llava
VLM系列文章1-LLaVA作为VLM系列的第一篇文章,打算以LLaVA入手,毕竟是VLM领域较为经典的工作。核心思想就是将视觉特征嵌入到LLM中,作为LLM的prefix(前缀),LLM作为建模的主体。
自律版光追6 个月前
笔记·学习·微调·internlm·llava·书生·浦语·xtuner
【书生·浦语大模型实战营第二期】XTuner微调LLM:1.8B、多模态、Agent——学习笔记4Xtuner工具的运行原理: 总结来说模型微调基础步骤使用数据为openai格式的数据tips代码关于配置文件
代码讲故事9 个月前
chatgpt·aigc·gpt4·llama·模型·gpt-4v·llava
LLaVA:GPT-4V(ision) 的新开源替代品LLaVA:GPT-4V(ision) 的新开源替代品。LLaVA (https://llava-vl.github.io/,是 Large Language 和Visual A ssistant的缩写)。它是一种很有前景的开源生成式 AI 模型,它复制了 OpenAI GPT-4 在与图像对话方面的一些功能。