Hugging News #0912: Hugging Face 2 人入选时代周刊全球百大 AI 人物

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! 🎉😍

重磅更新

🤗 HF 2 人入选时代周刊全球百大 AI 人物

时代周刊首次发布全球百大AI人物,其中有两位来自 Hugging Face 🤗

Hugging Face 联合创始人& CEO: Clément Delangue 入选 领导者 Leader Hugging Face AI 伦理与道德首席科学家: Margaret Mitchell 入选 思想家 Thinker

为他们感到高兴 👏 也感谢每一位为开源社区做贡献的社区小伙伴,让开源成为全球 AI 领域的重要力量 ❤️

我们 HF 的 ICCV 2023 专区开通啦 🎉

Hugging Face 的 ICCV 2023 专区开通了,专区在 ICCV 的官网同步上线 😎

✨ 参会者记得来专区认领你的论文 ✅ 还可以上传你的模型或者创建 demo,让社区内小伙伴来认识你和你的作品: hf.co/spaces/ICCV...

✨ ICCV 2023 将在巴黎举办,Hugging Face 会在现场有自己的展台,欢迎社区小伙伴来交流玩耍 🤗

如果你对建设 ICCV 专区有更好的想法💡或者对我们参展有任何建议,欢迎留言告诉我们 👏

Hugging Face 官方微博正式开通!

为了与更多微博上的 Hugging Face 用户互动和交流,我们正式开通了 Hugging Face 官方微博账号。

欢迎关注并与我们互动: weibo.com/HuggingFace

Code Llama:Llama 2 学会写代码了!

Code Llama 是为代码类任务而生的一组最先进的、开放的 Llama 2 模型,我们很高兴能将其集成入 Hugging Face 生态系统!Code Llama 使用与 Llama 2 相同的社区许可证,且可商用。

我们很高兴能发布 Hugging Face 对 Code Llama 的全面支持 ,包括:

  • Hub 上的模型支持,包括模型卡及许可证
  • Transformers 已集成 Code Llama
  • TGI 已集成 Code Llama,以支持对其进行快速高效的产品级推理
  • 推理终端 (Inference Endpoints) 已集成 Code Llama
  • 对 Code Llama 的代码基准测试结果已发布

代码大语言模型的发展对于软件工程师来说无疑是振奋人心的,因为这意味着他们可以通过 IDE 中的代码补全功能来提高生产力,并利用其来处理重复或烦人的任务,例如为代码编写文档字符串或创建单元测试。

开源更新

🦅 Falcon 180B - 开源大模型上线

由 TII 训练的开源大模型 Falcon 180B 🦅正式登陆 Hugging Face Hub 🤗

它在我们的开源大模型榜单上评分超过了 Meta 的 LlaMA 2,也因此被认为当前最好的开源大模型 🏅️

✨ 从架构来看,Falcon 180B 可以被看做是 Falcon 40B 的升级版本 🔍 并在其基础上进行了创新,比如利用 multiquery attention 等来提高模型的可扩展性。Falcon 180B 是使用 Amazon SageMaker 在多达 4096 个 GPU 上同时对 3.5 万亿个 token 进行训练,总共花费了约 7,000,000 个 GPU 时,这意味着 Falcon 180B 的规模是 Llama 2 的 2.5 倍,而训练所需的计算量是 Llama 2 的 4 倍。🧮

✨ 从能力来看,Falcon 180B 在 MMLU 上的表现超过了 Llama 2 70B 和 OpenAI 的 GPT-3.5 🚀 在 HellaSwag、LAMBADA、WebQuestions等上与谷歌的 PaLM 2-Large 不相上下 🧐

相关博客,模型和 demo 都已经在 Hub 上线 ⬇️

TII: falconllm.tii.ae/

RefinedWeb: hf.co/datasets/ti...

模型: hf.co/tiiuae/falc... hf.co/tiiuae/falc...

Space 应用地址: hf.co/spaces/tiiu...

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油! 💪🎉

相关推荐
yusaisai大鱼36 分钟前
TensorFlow如何调用GPU?
人工智能·tensorflow
珠海新立电子科技有限公司3 小时前
FPC柔性线路板与智能生活的融合
人工智能·生活·制造
IT古董3 小时前
【机器学习】机器学习中用到的高等数学知识-8. 图论 (Graph Theory)
人工智能·机器学习·图论
曼城周杰伦3 小时前
自然语言处理:第六十三章 阿里Qwen2 & 2.5系列
人工智能·阿里云·语言模型·自然语言处理·chatgpt·nlp·gpt-3
余炜yw4 小时前
【LSTM实战】跨越千年,赋诗成文:用LSTM重现唐诗的韵律与情感
人工智能·rnn·深度学习
莫叫石榴姐4 小时前
数据科学与SQL:组距分组分析 | 区间分布问题
大数据·人工智能·sql·深度学习·算法·机器学习·数据挖掘
如若1235 小时前
利用 `OpenCV` 和 `Matplotlib` 库进行图像读取、颜色空间转换、掩膜创建、颜色替换
人工智能·opencv·matplotlib
YRr YRr5 小时前
深度学习:神经网络中的损失函数的使用
人工智能·深度学习·神经网络
ChaseDreamRunner5 小时前
迁移学习理论与应用
人工智能·机器学习·迁移学习
Guofu_Liao5 小时前
大语言模型---梯度的简单介绍;梯度的定义;梯度计算的方法
人工智能·语言模型·矩阵·llama