Hugging News #0912: Hugging Face 2 人入选时代周刊全球百大 AI 人物

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! 🎉😍

重磅更新

🤗 HF 2 人入选时代周刊全球百大 AI 人物

时代周刊首次发布全球百大AI人物,其中有两位来自 Hugging Face 🤗

Hugging Face 联合创始人& CEO: Clément Delangue 入选 领导者 Leader Hugging Face AI 伦理与道德首席科学家: Margaret Mitchell 入选 思想家 Thinker

为他们感到高兴 👏 也感谢每一位为开源社区做贡献的社区小伙伴,让开源成为全球 AI 领域的重要力量 ❤️

我们 HF 的 ICCV 2023 专区开通啦 🎉

Hugging Face 的 ICCV 2023 专区开通了,专区在 ICCV 的官网同步上线 😎

✨ 参会者记得来专区认领你的论文 ✅ 还可以上传你的模型或者创建 demo,让社区内小伙伴来认识你和你的作品: hf.co/spaces/ICCV...

✨ ICCV 2023 将在巴黎举办,Hugging Face 会在现场有自己的展台,欢迎社区小伙伴来交流玩耍 🤗

如果你对建设 ICCV 专区有更好的想法💡或者对我们参展有任何建议,欢迎留言告诉我们 👏

Hugging Face 官方微博正式开通!

为了与更多微博上的 Hugging Face 用户互动和交流,我们正式开通了 Hugging Face 官方微博账号。

欢迎关注并与我们互动: weibo.com/HuggingFace

Code Llama:Llama 2 学会写代码了!

Code Llama 是为代码类任务而生的一组最先进的、开放的 Llama 2 模型,我们很高兴能将其集成入 Hugging Face 生态系统!Code Llama 使用与 Llama 2 相同的社区许可证,且可商用。

我们很高兴能发布 Hugging Face 对 Code Llama 的全面支持 ,包括:

  • Hub 上的模型支持,包括模型卡及许可证
  • Transformers 已集成 Code Llama
  • TGI 已集成 Code Llama,以支持对其进行快速高效的产品级推理
  • 推理终端 (Inference Endpoints) 已集成 Code Llama
  • 对 Code Llama 的代码基准测试结果已发布

代码大语言模型的发展对于软件工程师来说无疑是振奋人心的,因为这意味着他们可以通过 IDE 中的代码补全功能来提高生产力,并利用其来处理重复或烦人的任务,例如为代码编写文档字符串或创建单元测试。

开源更新

🦅 Falcon 180B - 开源大模型上线

由 TII 训练的开源大模型 Falcon 180B 🦅正式登陆 Hugging Face Hub 🤗

它在我们的开源大模型榜单上评分超过了 Meta 的 LlaMA 2,也因此被认为当前最好的开源大模型 🏅️

✨ 从架构来看,Falcon 180B 可以被看做是 Falcon 40B 的升级版本 🔍 并在其基础上进行了创新,比如利用 multiquery attention 等来提高模型的可扩展性。Falcon 180B 是使用 Amazon SageMaker 在多达 4096 个 GPU 上同时对 3.5 万亿个 token 进行训练,总共花费了约 7,000,000 个 GPU 时,这意味着 Falcon 180B 的规模是 Llama 2 的 2.5 倍,而训练所需的计算量是 Llama 2 的 4 倍。🧮

✨ 从能力来看,Falcon 180B 在 MMLU 上的表现超过了 Llama 2 70B 和 OpenAI 的 GPT-3.5 🚀 在 HellaSwag、LAMBADA、WebQuestions等上与谷歌的 PaLM 2-Large 不相上下 🧐

相关博客,模型和 demo 都已经在 Hub 上线 ⬇️

TII: falconllm.tii.ae/

RefinedWeb: hf.co/datasets/ti...

模型: hf.co/tiiuae/falc... hf.co/tiiuae/falc...

Space 应用地址: hf.co/spaces/tiiu...

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油! 💪🎉

相关推荐
带娃的IT创业者31 分钟前
机器学习实战(8):降维技术——主成分分析(PCA)
人工智能·机器学习·分类·聚类
调皮的芋头1 小时前
iOS各个证书生成细节
人工智能·ios·app·aigc
flying robot3 小时前
人工智能基础之数学基础:01高等数学基础
人工智能·机器学习
Moutai码农3 小时前
机器学习-生命周期
人工智能·python·机器学习·数据挖掘
188_djh4 小时前
# 10分钟了解DeepSeek,保姆级部署DeepSeek到WPS,实现AI赋能
人工智能·大语言模型·wps·ai技术·ai应用·deepseek·ai知识
Jackilina_Stone4 小时前
【DL】浅谈深度学习中的知识蒸馏 | 输出层知识蒸馏
人工智能·深度学习·机器学习·蒸馏
bug404_4 小时前
分布式大语言模型服务引擎vLLM论文解读
人工智能·分布式·语言模型
Logout:4 小时前
[AI]docker封装包含cuda cudnn的paddlepaddle PaddleOCR
人工智能·docker·paddlepaddle
OJAC近屿智能5 小时前
苹果新品今日发布,AI手机市场竞争加剧,近屿智能专注AI人才培养
大数据·人工智能·ai·智能手机·aigc·近屿智能
代码猪猪傻瓜coding5 小时前
关于 形状信息提取的说明
人工智能·python·深度学习