Hugging News #0912: Hugging Face 2 人入选时代周刊全球百大 AI 人物

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧! 🎉😍

重磅更新

🤗 HF 2 人入选时代周刊全球百大 AI 人物

时代周刊首次发布全球百大AI人物,其中有两位来自 Hugging Face 🤗

Hugging Face 联合创始人& CEO: Clément Delangue 入选 领导者 Leader Hugging Face AI 伦理与道德首席科学家: Margaret Mitchell 入选 思想家 Thinker

为他们感到高兴 👏 也感谢每一位为开源社区做贡献的社区小伙伴,让开源成为全球 AI 领域的重要力量 ❤️

我们 HF 的 ICCV 2023 专区开通啦 🎉

Hugging Face 的 ICCV 2023 专区开通了,专区在 ICCV 的官网同步上线 😎

✨ 参会者记得来专区认领你的论文 ✅ 还可以上传你的模型或者创建 demo,让社区内小伙伴来认识你和你的作品: hf.co/spaces/ICCV...

✨ ICCV 2023 将在巴黎举办,Hugging Face 会在现场有自己的展台,欢迎社区小伙伴来交流玩耍 🤗

如果你对建设 ICCV 专区有更好的想法💡或者对我们参展有任何建议,欢迎留言告诉我们 👏

Hugging Face 官方微博正式开通!

为了与更多微博上的 Hugging Face 用户互动和交流,我们正式开通了 Hugging Face 官方微博账号。

欢迎关注并与我们互动: weibo.com/HuggingFace

Code Llama:Llama 2 学会写代码了!

Code Llama 是为代码类任务而生的一组最先进的、开放的 Llama 2 模型,我们很高兴能将其集成入 Hugging Face 生态系统!Code Llama 使用与 Llama 2 相同的社区许可证,且可商用。

我们很高兴能发布 Hugging Face 对 Code Llama 的全面支持 ,包括:

  • Hub 上的模型支持,包括模型卡及许可证
  • Transformers 已集成 Code Llama
  • TGI 已集成 Code Llama,以支持对其进行快速高效的产品级推理
  • 推理终端 (Inference Endpoints) 已集成 Code Llama
  • 对 Code Llama 的代码基准测试结果已发布

代码大语言模型的发展对于软件工程师来说无疑是振奋人心的,因为这意味着他们可以通过 IDE 中的代码补全功能来提高生产力,并利用其来处理重复或烦人的任务,例如为代码编写文档字符串或创建单元测试。

开源更新

🦅 Falcon 180B - 开源大模型上线

由 TII 训练的开源大模型 Falcon 180B 🦅正式登陆 Hugging Face Hub 🤗

它在我们的开源大模型榜单上评分超过了 Meta 的 LlaMA 2,也因此被认为当前最好的开源大模型 🏅️

✨ 从架构来看,Falcon 180B 可以被看做是 Falcon 40B 的升级版本 🔍 并在其基础上进行了创新,比如利用 multiquery attention 等来提高模型的可扩展性。Falcon 180B 是使用 Amazon SageMaker 在多达 4096 个 GPU 上同时对 3.5 万亿个 token 进行训练,总共花费了约 7,000,000 个 GPU 时,这意味着 Falcon 180B 的规模是 Llama 2 的 2.5 倍,而训练所需的计算量是 Llama 2 的 4 倍。🧮

✨ 从能力来看,Falcon 180B 在 MMLU 上的表现超过了 Llama 2 70B 和 OpenAI 的 GPT-3.5 🚀 在 HellaSwag、LAMBADA、WebQuestions等上与谷歌的 PaLM 2-Large 不相上下 🧐

相关博客,模型和 demo 都已经在 Hub 上线 ⬇️

TII: falconllm.tii.ae/

RefinedWeb: hf.co/datasets/ti...

模型: hf.co/tiiuae/falc... hf.co/tiiuae/falc...

Space 应用地址: hf.co/spaces/tiiu...

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油! 💪🎉

相关推荐
染指11103 小时前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
闵孚龙3 小时前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python
甲维斯4 小时前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件4 小时前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
专注搞钱5 小时前
GPT-4o写设备Recipe:从3小时到10分钟
数据库·人工智能·gpt·半导体
闻道参看5 小时前
贝芯宠AI灵兽 ELFVET 大模型聚焦临床应用,强化宠物诊疗综合能力
人工智能·宠物
MartinYeung55 小时前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型
财经资讯数据_灵砚智能5 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m0_380167146 小时前
加密货币价格 API、市场数据 API 与 分析 API 有什么区别?
人工智能·ai·区块链
zyplayer-doc6 小时前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新