Hugging News #0912: Hugging Face 2 人入选时代周刊全球百大 AI 人物

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! 🎉😍

重磅更新

🤗 HF 2 人入选时代周刊全球百大 AI 人物

时代周刊首次发布全球百大AI人物,其中有两位来自 Hugging Face 🤗

Hugging Face 联合创始人& CEO: Clément Delangue 入选 领导者 Leader Hugging Face AI 伦理与道德首席科学家: Margaret Mitchell 入选 思想家 Thinker

为他们感到高兴 👏 也感谢每一位为开源社区做贡献的社区小伙伴,让开源成为全球 AI 领域的重要力量 ❤️

我们 HF 的 ICCV 2023 专区开通啦 🎉

Hugging Face 的 ICCV 2023 专区开通了,专区在 ICCV 的官网同步上线 😎

✨ 参会者记得来专区认领你的论文 ✅ 还可以上传你的模型或者创建 demo,让社区内小伙伴来认识你和你的作品: hf.co/spaces/ICCV...

✨ ICCV 2023 将在巴黎举办,Hugging Face 会在现场有自己的展台,欢迎社区小伙伴来交流玩耍 🤗

如果你对建设 ICCV 专区有更好的想法💡或者对我们参展有任何建议,欢迎留言告诉我们 👏

Hugging Face 官方微博正式开通!

为了与更多微博上的 Hugging Face 用户互动和交流,我们正式开通了 Hugging Face 官方微博账号。

欢迎关注并与我们互动: weibo.com/HuggingFace

Code Llama:Llama 2 学会写代码了!

Code Llama 是为代码类任务而生的一组最先进的、开放的 Llama 2 模型,我们很高兴能将其集成入 Hugging Face 生态系统!Code Llama 使用与 Llama 2 相同的社区许可证,且可商用。

我们很高兴能发布 Hugging Face 对 Code Llama 的全面支持 ,包括:

  • Hub 上的模型支持,包括模型卡及许可证
  • Transformers 已集成 Code Llama
  • TGI 已集成 Code Llama,以支持对其进行快速高效的产品级推理
  • 推理终端 (Inference Endpoints) 已集成 Code Llama
  • 对 Code Llama 的代码基准测试结果已发布

代码大语言模型的发展对于软件工程师来说无疑是振奋人心的,因为这意味着他们可以通过 IDE 中的代码补全功能来提高生产力,并利用其来处理重复或烦人的任务,例如为代码编写文档字符串或创建单元测试。

开源更新

🦅 Falcon 180B - 开源大模型上线

由 TII 训练的开源大模型 Falcon 180B 🦅正式登陆 Hugging Face Hub 🤗

它在我们的开源大模型榜单上评分超过了 Meta 的 LlaMA 2,也因此被认为当前最好的开源大模型 🏅️

✨ 从架构来看,Falcon 180B 可以被看做是 Falcon 40B 的升级版本 🔍 并在其基础上进行了创新,比如利用 multiquery attention 等来提高模型的可扩展性。Falcon 180B 是使用 Amazon SageMaker 在多达 4096 个 GPU 上同时对 3.5 万亿个 token 进行训练,总共花费了约 7,000,000 个 GPU 时,这意味着 Falcon 180B 的规模是 Llama 2 的 2.5 倍,而训练所需的计算量是 Llama 2 的 4 倍。🧮

✨ 从能力来看,Falcon 180B 在 MMLU 上的表现超过了 Llama 2 70B 和 OpenAI 的 GPT-3.5 🚀 在 HellaSwag、LAMBADA、WebQuestions等上与谷歌的 PaLM 2-Large 不相上下 🧐

相关博客,模型和 demo 都已经在 Hub 上线 ⬇️

TII: falconllm.tii.ae/

RefinedWeb: hf.co/datasets/ti...

模型: hf.co/tiiuae/falc... hf.co/tiiuae/falc...

Space 应用地址: hf.co/spaces/tiiu...

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油! 💪🎉

相关推荐
IT_Beijing_BIT1 小时前
tensorflow 图像分类 之四
人工智能·分类·tensorflow
卡奥斯开源社区官方2 小时前
NVIDIA Blackwell架构深度解析:2080亿晶体管如何重构AI算力规则?
人工智能·重构·架构
百锦再3 小时前
第11章 泛型、trait与生命周期
android·网络·人工智能·python·golang·rust·go
数新网络5 小时前
The Life of a Read/Write Query for Apache Iceberg Tables
人工智能·apache·知识图谱
Yangy_Jiaojiao6 小时前
开源视觉-语言-动作(VLA)机器人项目全景图(截至 2025 年)
人工智能·机器人
gorgeous(๑>؂<๑)6 小时前
【ICLR26匿名投稿】OneTrackerV2:统一多模态目标跟踪的“通才”模型
人工智能·机器学习·计算机视觉·目标跟踪
坠星不坠6 小时前
pycharm如何导入ai大语言模型的api-key
人工智能·语言模型·自然语言处理
周杰伦_Jay6 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘
王哈哈^_^7 小时前
【完整源码+数据集】课堂行为数据集,yolo课堂行为检测数据集 2090 张,学生课堂行为识别数据集,目标检测课堂行为识别系统实战教程
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
Elastic 中国社区官方博客7 小时前
Observability:适用于 PHP 的 OpenTelemetry:EDOT PHP 加入 OpenTelemetry 项目
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索·php