开源大模型

TGITCIC7 天前
人工智能·开源大模型·deepseek·deekseek太牛了·deepseek开源·开源deepseek
DeepSeek V3 0324:在Mac Studio上点燃的AI核爆2025年3月25日,DeepSeek在Hugging Face上悄然上传了一个名为V3 0324的模型,没有预热、没有发布会,甚至没有一张产品海报。但6850亿参数的庞然大物,却在AI圈引发了链式反应。开发者们像发现新大陆般涌入仓库——这个被戏称为“参数怪兽”的模型,竟在售价9499美元的苹果Mac Studio上实现了本地化推理,且速度达到每秒20个token。
安替-AnTi18 天前
分布式·免费·qwen·开源大模型
Free QWQ - 世界首个免费无限制分布式 QwQ API一句话简介:基于 QwQ 32B 大语言模型的完全免费、无限制、无需注册登录的分布式 AI 算力平台。
kcarly2 个月前
开源·llama·开源大模型
Llama最新开源大模型Llama3.1Meta公司于2024年7月23日发布了最新的开源大模型Llama 3.1,这是其在大语言模型领域的重要进展。以下是关于Llama 3.1的详细介绍:
技术狂潮AI4 个月前
开源大模型·tülu 3·后训练技术·多阶段训练
Tülu 3:重新定义开源大模型的后训练范式在大型语言模型(LLM)的发展历程中,预训练阶段往往受到最多关注,动辄需要数百万美元算力投入和数万亿token的训练数据。然而,一个鲜为人知但同样关键的事实是:预训练完成的模型实际上并不能直接投入使用。这些"原始"模型往往缺乏安全保障,也无法有效理解和执行人类指令。这就是为什么后训练(Post-training)环节在当代AI发展中占据着举足轻重的地位。
爱喝白开水a5 个月前
人工智能·程序人生·语言模型·开源·大语言模型·开源大模型·大模型入门
零基础入门AI:一键本地运行各种开源大语言模型 - OllamaOllama 是一个可以在本地部署和管理开源大语言模型的框架,由于它极大的简化了开源大语言模型的安装和配置细节,一经推出就广受好评,目前已在github上获得了46k star。
易通慧谷10 个月前
人工智能·开源·开源大模型·闭源大模型
开源VS闭源:谁更能推动AI技术的普及与发展?在人工智能(AI)技术的浪潮中,开源与闭源两种模式一直并存,并各自在推动AI技术普及与发展上发挥着重要作用。然而,关于哪种模式更能有效地推动AI技术的普及与发展,一直存在着激烈的讨论。本文将深入探讨开源与闭源在AI领域的优劣势,结合多业务场景及其解决方案,分析它们各自的发展挑战,并展望未来的规划。
华为云开发者联盟1 年前
llama·华为云modelarts·开源大模型
大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型本文分享自华为云社区《大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型》,作者:码上开花_Lancer 。