开源大模型

技术狂潮AI1 个月前
开源大模型·tülu 3·后训练技术·多阶段训练
Tülu 3:重新定义开源大模型的后训练范式在大型语言模型(LLM)的发展历程中,预训练阶段往往受到最多关注,动辄需要数百万美元算力投入和数万亿token的训练数据。然而,一个鲜为人知但同样关键的事实是:预训练完成的模型实际上并不能直接投入使用。这些"原始"模型往往缺乏安全保障,也无法有效理解和执行人类指令。这就是为什么后训练(Post-training)环节在当代AI发展中占据着举足轻重的地位。
爱喝白开水a2 个月前
人工智能·程序人生·语言模型·开源·大语言模型·开源大模型·大模型入门
零基础入门AI:一键本地运行各种开源大语言模型 - OllamaOllama 是一个可以在本地部署和管理开源大语言模型的框架,由于它极大的简化了开源大语言模型的安装和配置细节,一经推出就广受好评,目前已在github上获得了46k star。
易通慧谷7 个月前
人工智能·开源·开源大模型·闭源大模型
开源VS闭源:谁更能推动AI技术的普及与发展?在人工智能(AI)技术的浪潮中,开源与闭源两种模式一直并存,并各自在推动AI技术普及与发展上发挥着重要作用。然而,关于哪种模式更能有效地推动AI技术的普及与发展,一直存在着激烈的讨论。本文将深入探讨开源与闭源在AI领域的优劣势,结合多业务场景及其解决方案,分析它们各自的发展挑战,并展望未来的规划。
华为云开发者联盟1 年前
llama·华为云modelarts·开源大模型
大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型本文分享自华为云社区《大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型》,作者:码上开花_Lancer 。