Llama3新一代 Llama模型

最近,Meta 发布了 Llama3 模型,从发布的数据来看,性能已经超越了 Gemini 1.5 和 Claud 3。

Llama 官网说,他们未来是要支持多语言和多模态的,希望那天赶紧到来。

未来 Llama3还将推出一个 400B大模型,目前正在训练中,4000 亿参数,继续卷参数。Llama 3 预训练了超过 15 T Token,为了准备即将到来的多语言用例,Llama 3 的预训练数据集中超过 5% 是覆盖 30 多种语言的高质量非英语数据。然而,非英语性能不如英语好。Llam3 是在 2 个 24K GPU 集群上进行训练的,差不多5 万块 GPU,不是一般公司搞得起的。

我本地安装了 8B,能理解中文,但是回答还不是中文,可以让他翻译成中文。

也可以给他 Promote 让他用中文说,速度挺快的。

Meta 官方也有体验的网页,国内用不了,用 Ollama 下载 8b 的模型先玩玩。

相关推荐
try2find1 天前
安装llama-cpp-python踩坑记
开发语言·python·llama
西西弗Sisyphus1 天前
LLaMA-Factory 单卡后训练微调Qwen3完整脚本
微调·llama·llama-factory·后训练
顾道长生'1 天前
(Arxiv-2024)自回归模型优于扩散:Llama用于可扩展的图像生成
计算机视觉·数据挖掘·llama·自回归模型·多模态生成与理解
Zhijun.li@Studio11 天前
【LLaMA-Factory 实战系列】二、WebUI 篇 - Qwen2.5-VL 多模态模型 LoRA 微调保姆级教程
人工智能·自然语言处理·llama·多模态大模型
1213411 天前
LLM:重构数字世界的“智能操作系统”
gpt·aigc·ai编程·llama·gpu算力
冷雨夜中漫步19 天前
Java中如何使用lambda表达式分类groupby
java·开发语言·windows·llama
扫地的小何尚21 天前
全新NVIDIA Llama Nemotron Nano视觉语言模型在OCR基准测试中准确率夺冠
c++·人工智能·语言模型·机器人·ocr·llama·gpu
CFAteam21 天前
DeepSeek AI功能演示:如何生成Verilog脚本
人工智能·ai·fpga开发·llama
Tadas-Gao23 天前
从碳基羊驼到硅基LLaMA:开源大模型家族的生物隐喻与技术进化全景
人工智能·机器学习·大模型·llm·llama
Run_Clover23 天前
llama-factory微调大模型环境配置避坑总结
llama