llm

机器之心2 小时前
llm
开发者狂喜!Meta最新发布的LLM Compiler,实现77%自动调优效率Meta搞了个很牛的LLM Compiler,帮助程序员更高效地写代码。昨天,三大 AI 巨头 OpenAI、Google、Meta 组团发布自家大模型最新研究成果 ——
AI小白龙*2 小时前
阿里云·大模型·llm·prompt·embedding·ai大模型·大模型部署
LLM大模型实战 —— DB-GPT阿里云部署指南简介: DB-GPT 是一个实验性的开源应用,它基于FastChat,并使用vicuna-13b作为基础模型, 模型与数据全部本地化部署, 绝对保障数据的隐私安全。 同时此GPT项目可以直接本地部署连接到私有数据库, 进行私有数据处理, 目前已支持SQL生成、SQL诊断、数据库知识问答、数据处理等一系列的工作。
知来者逆1 天前
人工智能·自然语言处理·chatgpt·llm
探索人工智能和LLM对未来就业的影响近年来,人工智能(AI)迅猛发展,引发了人们的兴奋,同时也引发了人们对就业未来的担忧。大型语言模型(LLM)就是最新的例子。这些强大的人工智能子集经过大量文本数据的训练,以理解和生成类人语言。
营赢盈英2 天前
开发语言·后端·llm·ruby·langchainrb
Ruby langchainrb gem and custom configuration for the model setup题意:Ruby 的 langchainrb gem 以及针对模型设置的自定义配置I am working in a prototype using the gem langchainrb. I am using the module assistant module to implemente a basic RAG architecture.
SunStriKE3 天前
机器学习·llm
LLM并行训练4-megascale论文学习乍一看确实不是等价的, attention那块的后置mlp去哪了..这个其实没有理论证明, Palm论文里提到把mlp融合到attention里实验62B模型上性能没有下降. 主要对应的是下图网络结构的并行化改造.
代码讲故事3 天前
人工智能·机器学习·llm·短视频·翻译·音乐·chatmof
AI 音乐生成器 MusicGPT,同声传译StreamSpeech!Web短视频平台SharineAI 音乐生成器 MusicGPT,同声传译StreamSpeech!Web短视频平台Sharine。
yumuing3 天前
人工智能·llm
ExVideo: 提升5倍性能-用于视频合成模型的新型后调谐方法该研究的核心在于开发了一种创新的后调优方法——ExVideo,它致力于克服当前视频扩散模型在生成长时间视频方面的限制。ExVideo的设计目标是增强现有模型的功能,使之在不大幅增加训练成本的前提下,能够输出更长的视频序列。
中杯可乐多加冰4 天前
人工智能·gpt·llm·文本生成图像·论文检索·老照片修复·文本生成视频
【AI落地应用实战】如何高效检索与阅读论文——302.AI学术论文工具评测作为一名学术领域的探索者,我们都知道,检索和阅读论文是我们获取知识、启发思考、验证假设的基石,也是日常学习中必不可少的基本功之一。然而在浩瀚的学术海洋中,如何快速、准确地找到我们需要的论文,就像是航海家如何在茫茫大海中找到正确的航线。海量的学术资源、复杂的检索系统、不断更新的研究热点,都为我们设置了重重障碍。最近,我就收到了不少同学私信说他们检索并阅读完一篇论文所花费的时间,甚至比追完一季电视剧还要长,那么:
EEE1even4 天前
前端·语言模型·llm·qwen
Qwen2本地web Demo千问2前段时间发布了,个人觉得千问系列是我用过最好的中文开源大模型,所以这里基于streamlit进行一个千问2的web搭建,来进行模型的测试
AI小白龙*4 天前
人工智能·langchain·大模型·llm·产品经理·ai大模型·动手学大模型
上海交通大学出品《动手学大模型》LLM 实战课,从0入门到精通,附课件+实战教程来了来了!上海交通大学的大模型超超超级牛掰的大模型编程实战课公开了,课件+教程,本套实战教程旨在提供大模型相关的入门编程参考。通过简单实践,帮助同学快速入门大模型,更好地开展课程设计或学术研究。
冻感糕人~5 天前
人工智能·自然语言处理·llm·大语言模型·agi·ai大模型·大模型应用
现身说法,AI小白的大模型学习过程导读写这篇文章的初衷:作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。
不正经写文章的我5 天前
macos·ai·llm·dify
Mac 本地启动 Dify安装 poetry配置创建环境 python3.10 并安装依赖迁移初始化数据库启动后端官方文档:https://github.com/langgenius/dify/blob/main/api/README.md
机器之心5 天前
llm
寒武纪1号诞生:谢赛宁Yann LeCun团队发布最强开源多模态LLM就像动物有了眼睛,谢赛宁 Yann LeCun 团队的 Cambrian-1 能让 AI 获得强大的视觉表征学习能力。
alxe_made5 天前
llm·vllm·llava
VLM系列文章1-LLaVA作为VLM系列的第一篇文章,打算以LLaVA入手,毕竟是VLM领域较为经典的工作。核心思想就是将视觉特征嵌入到LLM中,作为LLM的prefix(前缀),LLM作为建模的主体。
OneFlow一流科技5 天前
人工智能·开源·llm
最强开源大模型面世:阿里发布Qwen26月17日凌晨,阿里巴巴通义千问团队发布了Qwen2系列开源模型。该系列模型包括5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。
HuggingFace5 天前
llm·leaderboard
更难、更好、更快、更强:LLM Leaderboard v2 现已发布评估和比较大语言模型 (LLMs) 是一项艰巨的任务。我们 RLHF 团队在一年前就意识到了这一点,当时他们试图复现和比较多个已发布模型的结果。这几乎是不可能完成的任务:论文或营销发布中的得分缺乏可复现的代码,有时令人怀疑,大多数情况下只是通过优化的提示或评估设置来尽量提升模型表现。因此,他们决定创建一个地方,在完全相同的设置(同样的问题,按相同的顺序提问等)下评估参考模型,从而收集完全可复现和可比较的结果;Open LLM Leaderboard 就这样的背景下发布啦!
zhaosuyuan6 天前
yolo·llm
yolo-world使用自己数据集训练YOLO-World下载: https://github.com/AILab-CVC/YOLO-World/tree/master 1.数据准备 数据格式COCO格式即可 2.配置文件修改 configs/finetune_coco/yolo_world_v2_l_vlpan_bn_sgd_1e-3_40e_8gpus_finetune_coco.py (1) 模型下载路径: yoloworld:https://hf-mirror.com/wondervictor/YOLO-World clip-vit-
Baihai IDP6 天前
人工智能·ai·llm·agi·合成数据·白海科技
高质量数据不够用,合成数据是打开 AGI 大门的金钥匙吗?编者按: 人工智能技术的发展离不开高质量数据的支持。然而,现有可用的高质量数据资源已日渐接近枯竭边缘。如何解决训练数据短缺的问题,是当前人工智能领域亟待解决的一个较为棘手的问题。
OpenMMLab7 天前
人工智能·llm
第二期书生·浦语大模型实战营优秀项目一览书生·浦语社区于 2023 年年底正式推出了书生·浦语大模型实战营系列活动,至今已有两期五批次同学参加大模型学习、实战,线上课程累计学习超过 10 万人次。