dvc即data version control, 是一种针对人工智能项目(机器学习或者深度学习)的数据版本管理工具。DVC的操作和GIT类似,可以认为为GIT的二次开发封装。结合GIT,DVC可以有效的管理人工智能项目的整个流程,包括代码,数据,训练配置,模型。
GIT和DVC分工如下:
dvc:负责数据和模型等大文件的存储、下载等管理,同时生成元数据(.dvc文件)描述这些数据和模型, 并且串联整个人工智能项目工作流
git:负责代码和dvc生成的元数据文件的版本管理
cpp
# 在本地机器上初始化 DVC 项目
dvc init
# 添加文件或目录到 DVC
dvc add base tx2nx
# 推送数据到远程存储
6. dvc push
7. git add .
8. git commit -m
9. git push origin HEAD
10. git tag release/20240615
11. git push origin release/20240615
# 在另一台机器或不同目录中克隆存储库
git clone <remote_repo_url>
cd <repo_directory>
# 初始化 DVC 项目
dvc init
# 拉取最新的 DVC 数据
dvc pull
# 或者拉取特定标签的数据
dvc pull -T release/20240615
或者仓库的特定文件
--rev release/20240615:指定版本,可以是提交哈希、标签或分支名。在你的情况下,使用标签 release/20240615
dvc get http://192.168.104.100:50000/home/model tx2nx -o ./package/tcs.client.reportor/model --rev release/20240615