Dragonfly 发布 v2.1.0 版本!

Dragonfly 最新正式版本 v2.1.0 已经发布! 感谢赵鑫鑫1同学帮助重构 Console 代码,并且提供全新的 Console2控制台方便用户可视化操作 P2P 集群。欢迎访问 d7y.io3网站来了解详情,下面具体介绍 v2.1.0 版本带来了哪些更新。

功能

  • Console v1.0.04已经发布,它是一个全新的可视化控制台,方便用户操作 P2P 集群。

  • 新增虚拟网络拓扑探索功能,能够在 P2P 运行时探测节点之间的网络延迟,从而构建一个虚拟网络拓扑结构提供调度使用。

  • Manager 提供控制 Scheduler 可以提供的服务,例如在 Manager 中设置 Scheduler 不提供预热功能,那么 Scheduler 实例就会拒绝预热请求。

  • Dfstore 提供 GetObjectMetadatasCopyObject 接口,支持 Dragonfly 作为 JuiceFS 的后端存储。

  • 新增 Personal Access Tokens 功能,用户可以创建自己的 Personal Access Tokens 在调用 Open API 的时候鉴权使用。

  • Manager REST 服务提供 TLS 配置。

  • 修复当 Dfdaemon 没有可用的 Scheduler 地址时启动失败的现象。

  • 新增 Cluster 资源单位,Cluster 代表一个 P2P 集群,其只包含一个 Scheduler Cluster 和一个 Seed Peer Cluster,并且二者关联。

  • 修复 Dfstore 在 Dfdaemon 并发下载时,可能导致的对象存储下载失败。

  • Scheduler 新增 Database 配置,并且把之前 Redis 的配置信息移入到 Database 配置中,并且兼容老版本。

  • 在 Dfdaemon 中使用 gRPC 健康检查代替 net.Dial

  • 修复调度器过滤以及评估过程中 candidateParentLimit 可能影响到调度结果的问题。

  • 修复 Scheduler 中的 Storage 在 bufferSize 为 0 的时候,导致的无法写入下载记录的问题。

  • 日志中隐藏敏感信息,例如 Header 中的一些 Token 信息等。

  • Manager 中 Scheduler、Seed Peer 等资源删除过程中,不再使用软删除。

  • Scheduler 数据库表中新增 uk_scheduler 索引,Seed Peer 数据库表中新增 uk_seed_peer 索引。

  • 由于初期功能设计定位不清晰的原因,删除 Security DomainSecurity 的功能。

  • Manager 和 Scheduler 新增 Advertise Port 配置,方便用户配置不同的 Advertise Port。

  • 修复 Task 注册阶段状态机状态变更错误的问题。

破坏性变更

  • 不再提供 Scheduler Cluster 和 Seed Peer Cluster 之间 M:N 的关系。提供了 Cluster 的概念,一个 Cluster 即表示一个 P2P 集群,并且一个 Cluster 只包含一个 Scheduler Cluster 和 Seed Peer Cluster,且二者是 1:1 的关联关系。

控制台

更多的关于控制台的内容可以参考官网文档 Manager Console5

AI 基础设施

  • Triton Inference Server6使用 Dragonfly 下载模型文件,可以参考 #21857。如果有对集成 Triton Inference Server 项目 Drgaonfly Repository Agent8感兴趣的同学,可以联系 gaius.qi@gmail.com

  • TorchServer9使用 Dragonfly 下载模型文件,现正在开发,预计 v2.1.1 版本可以使用,项目仓库在 Dragonfly Endpoint10

  • Fluid11基于 JuiceFS12运行时通过 Dragonfly 下载数据,正在开发,预计 v2.1.1 版本可以使用。

  • Dragonfly 助力火山引擎 AIGC 13推理业务 P2P 镜像加速。

  • 社区中已经有很多案例,基于 P2P 技术使用 Dragonfly 分发 AI 场景中的文件。在 AI 推理阶段,推理服务并发下载模型可以有效通过 Dragonfly P2P 缓解模型仓库的带宽压力,从而提高整体下载速度。在 KubeCon + CloudNativeCon + Open Source Summit China 202314社区联合快手做一次分享,主题是《Dragonfly: Intro, Updates and AI Model Distribution in the Practice of Kuaishou - Wenbo Qi, Ant Group & Zekun Liu, Kuaishou Technology》15,感兴趣的同学可以关注。

维护者

社区新增四位 Maintainer,希望能够帮助更多的 Contributor 参与到社区的工作中。

  • 黄逸炀16:就职于火山引擎,主要专注于社区代码工程方面。

  • 温满祥17:就职于百度,主要专注于社区代码工程方面。

  • Mohammed Farooq18:就职于 Intel,主要专注于社区代码工程方面。

  • 许洲19:大连理工大学在读博士,主要专注于智能调度算法方面。

其他

版本更新包含的更多细节可以参考👇

CHANGELOG:github.com/dragonflyos...

相关链接

1.Xinxin Zhao Github:

github.com/1zhaoxinxin

2.Dragonfly Console Github:

github.com/dragonflyos...

3.Dragonfly 官网:

d7y.io

4.Dragonfly Console Release v1.0.0:

github.com/dragonflyos...

5.Manager Console 文档:

d7y.io/docs/refere...

6.Triton Inference Server:

github.com/triton-infe...

7.issue #2185:

github.com/dragonflyos...

8.Dragonfly Repository Agent Github:

github.com/dragonflyos...

9.TorchServe:

github.com/pytorch/ser...

10.Dragonfly Endpoint Github:

https://github.com/dragonflyoss/dragonfly-endpoint

11.Fluid:

github.com/fluid-cloud...

12.JuiceFS:

github.com/juicedata/j...

13.Volcano Engine AIGC:

mp.weixin.qq.com/s/kY6DxRFsp...

14.KubeCon + CloudNativeCon + Open Source Summit China 2023:

www.lfasiallc.com/kubecon-clo...

15.《Dragonfly: Intro, Updates and AI Model Distribution in the Practice of Kuaishou - Wenbo Qi, Ant Group & Zekun Liu, Kuaishou Technology》:

sched.co/1PTJb

16.Yiyang Huang Github:

github.com/hyy0322

17.Manxiang Wen Github:

github.com/garenwen

18.mfarooq-intel Github:

github.com/mfarooq-int...

19.Zhou Xu Github:

github.com/fcgxz2003

Dragonfly Star 一下✨:

github.com/dragonflyos...

相关推荐
葫芦和十三6 小时前
图解 MongoDB 05|文档模型设计:内嵌 vs 引用,反范式不是免费午餐
后端·mongodb·agent
修己xj7 小时前
GoTab:打造属于你自己的个性化浏览器新标签页
开源
不能放弃治疗9 小时前
单 Agent 实现模式
后端
IT_陈寒11 小时前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
fliter12 小时前
最后一块拼图:用 bitvec 构造 IPv4 包,真正做出自己的 Ping
后端
fliter13 小时前
用 Rust 解析并生成 ICMP 包:checksum、nom 与 cookie-factory
后端
蝎子莱莱爱打怪13 小时前
XZLL-IM干货系列 03|消息 ID 设计:一个 UUID 搞不定的事,我用两个 ID 解决了
后端·面试·开源
fliter13 小时前
从 panic 到 Result:用 Rust 重新整理一个 ping 项目的错误处理
后端
森蓝情丶14 小时前
我给 AI 搭了个法庭:一个前端仔的 LangGraph 实战全记录
前端·后端
JensCS猿14 小时前
从 Spring Boot 回看 SSM 框架:手动挡与自动挡的驾驶哲学
后端