分享一些实用性的大语言模型(GitHub篇)

1.多模态大模型

GitHub网址:haotian-liu/LLaVA:[NeurIPS'23 Oral] 视觉指令调优 (LLaVA) 构建,旨在实现 GPT-4V 级别及以上的能力。 (github.com)

下面是LLaVA模型的介绍,作者都有一直维护和更新,主张让大家都能体验部分gpt4的功能,目前1月底已出到1.6版本

LLaVA-NeXT:改进的推理、OCR 和世界知识 |LLaVA(拉瓦) (llava-vl.github.io)

部署网站,可直接使用

LLaVA

2.图像字幕

GitHub网址:

GitHub - rmokady/CLIP_prefix_caption: Simple image captioning model

该模型主要预训练CLIP模型来对图像内容进行说明,也可称为图像翻译

部署网站,可直接使用(有点慢)

rmokady/clip_prefix_caption -- 在复制时使用 API 运行 (replicate.com)

3.通义千问大模型

GitHub地址:

GitHub - QwenLM/Qwen-VL: The official repo of Qwen-VL (通义千问-VL) chat & pretrained large vision language model proposed by Alibaba Cloud.

这是阿里云公布的一个大模型,在跑分上超过gpt4的结果,并且对比上面第一个大模型还多了文档输入的功能,试用过,总结得还行

部署网站,可直接使用

通义千问 (aliyun.com)

4.中医大语言模型

GitHub地址:

pariskang/CMLM-ZhongJing: 首个中医大语言模型------"仲景"。受古代中医学巨匠张仲景深邃智慧启迪,专为传统中医领域打造的预训练大语言模型。 The first-ever Traditional Chinese Medicine large language model - "CMLM-ZhongJing". Inspired by the profound wisdom of the ancient Chinese medical master Zhang Zhongjing, it is a pre-trained large language model designed specifically for the field of Traditional Chinese Medicine. (github.com)

这是针对中医药而训练的大模型,是上海的两所大学联合训练的,因为中医药方向涉及的领域比较难,而且非常耗成本,所以这个模型具有很好的参考价值,可以作为以后中医药领域的预训练模型

模型地址:

Suprit/Zhongjing-LLaMA-base at main (huggingface.co)

目前没有部署网站,但作者在google colab上部署了,可以直接登录使用

上面介绍的模型分享都希望让大家能多多了解AI和使用AI,最重要是大佬们的开源意识,可以根据自己的情况进行预训练和部署, 也可以直接通过GitHub上进行论文的学习和源码查看,由于小弟我功力不够,模型和原理上就没有给大家做过多介绍了,如果有遇到其他好的模型会持续分享

希望这篇博文对你有帮助!!!!

相关推荐
飞睿科技18 分钟前
乐鑫代理商飞睿科技,2025年AI智能语音助手市场发展趋势与乐鑫芯片解决方案分析
人工智能
许泽宇的技术分享20 分钟前
从新闻到知识图谱:用大模型和知识工程“八步成诗”打造科技并购大脑
人工智能·科技·知识图谱
坤坤爱学习2.034 分钟前
求医十年,病因不明,ChatGPT:你看起来有基因突变
人工智能·ai·chatgpt·程序员·大模型·ai编程·大模型学
蹦蹦跳跳真可爱5891 小时前
Python----循环神经网络(Transformer ----注意力机制)
人工智能·深度学习·nlp·transformer·循环神经网络
空中湖3 小时前
tensorflow武林志第二卷第九章:玄功九转
人工智能·python·tensorflow
lishaoan773 小时前
使用tensorflow的线性回归的例子(七)
人工智能·tensorflow·线性回归
千宇宙航6 小时前
闲庭信步使用SV搭建图像测试平台:第三十一课——基于神经网络的手写数字识别
图像处理·人工智能·深度学习·神经网络·计算机视觉·fpga开发
onceco7 小时前
领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)
人工智能·python·深度学习·语言模型·自然语言处理·自动化
jndingxin9 小时前
OpenCV CUDA模块设备层-----高效地计算两个 uint 类型值的带权重平均值
人工智能·opencv·计算机视觉
Sweet锦10 小时前
零基础保姆级本地化部署文心大模型4.5开源系列
人工智能·语言模型·文心一言