如何使用断点续传方式上传大文件到阿里云 OSS

要使用断点续传方式上传大文件到阿里云 OSS,一般可以通过阿里云提供的 SDK 来实现。以下是使用 Java SDK 进行断点续传上传的示例代码,前提条件如下:

  • 已创建存储空间(bucket)。

  • 具有oss:putObject权限。

  • SDK 会将上传的状态信息记录在 checkpoint 文件中,所以要确保程序对 checkpoint 文件有写权限。

  • 请勿修改 checkpoint 文件中携带的校验信息,如果 checkpoint 文件损坏,则会重新上传所有分片。

  • 如果上传过程中本地文件发生了改变,则会重新上传所有分片。

    java 复制代码
    import com.aliyun.oss.OSS;
    import com.aliyun.oss.common.auth.*;
    import com.aliyun.oss.OSSClientBuilder;
    import com.aliyun.oss.model.*;
    
    public class Demo {
        public static void main(String[] args) {
            // endpoint 以华东 1(杭州)为例,其它 region 请按实际情况填写。
            String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
            // 从环境变量中获取访问凭证。运行本代码示例之前,请确保已设置环境变量 oss_access_key_id 和 oss_access_key_secret。
            EnvironmentVariableCredentialProvider credentialProvider = CredentialProviderFactory.newEnvironmentVariableCredentialProvider();
            // 创建 OSSClient 实例。
            OSS ossClient = new OSSClientBuilder().build(endpoint, CredentialProvider);
            try {
                ObjectMetadata meta = new ObjectMetadata();
                // 指定上传的内容类型。
                meta.setContentType("text/plain");
                // 文件上传时设置访问权限 ACL。
                // meta.setObjectAcl(CannedAccessControlList.Private); 
                // 通过 UploadFileRequest 设置多个参数。
                // 依次填写 bucket 名称(例如 examplebucket)以及 object 完整路径(例如 exampledir/exampleobject.txt),object 完整路径中不能包含 bucket 名称。
                UploadFileRequest uploadFileRequest = new UploadFileRequest("examplebucket", "exampledir/exampleobject.txt");
                // 通过 uploadFileRequest 设置单个参数。
                // 填写本地文件的完整路径,例如 d:\\localpath\\examplefile.txt。如果未指定本地路径,则默认从示例程序所属项目对应本地路径中上传文件。
                uploadFileRequest.setUploadFile("d:\\localpath\\examplefile.txt");
                // 指定上传并发线程数,默认值为 1。
                uploadFileRequest.setTaskNum(5); 
                // 指定上传的分片大小,单位为字节,取值范围为 100KB~5GB。默认值为 100KB。
                uploadFileRequest.setPartSize(1 * 1024 * 1024); 
                // 开启断点续传,默认关闭。
                uploadFileRequest.setEnableCheckpoint(true); 
                // 记录本地分片上传结果的文件。上传过程中的进度信息会保存在该文件中,如果某一分片上传失败,再次上传时会根据文件中记录的点继续上传。上传完成后,该文件会被删除。
                // 如果未设置该值,默认与待上传的本地文件同路径,名称为${uploadFile}.ucp。
                uploadFileRequest.setCheckpointFile("yourcheckpointfile"); 
                // 文件的元数据。
                uploadFileRequest.setObjectMetadata(meta);
                // 设置上传回调,参数为 callback 类型。
                // uploadFileRequest.setCallback("yourcallbackevent"); 
                // 断点续传上传。
                ossClient.uploadFile(uploadFileRequest);
            } catch (OSSException oe) {
                System.out.println("Caught an OSSException, which means your request made it to OSS, "
                        + "but was rejected with an error response for some reason.");
                System.out.println("ErrorMessage: " + oe.getErrorMessage());
                System.out.println("ErrorCode: " + oe.getErrorCode());
                System.out.println("RequestId: " + oe.getRequestId());
                System.out.println("HostId: " + oe.getHostId());
            } catch (Throwable ce) {
                System.out.println("Caught an client exception, which means the client encountered "
                        + "a serious internal problem while trying to communicate with OSS, "
                        + "such as not being able to access the network.");
                System.out.println("Error message: " + ce.getMessage());
            }
        }
    }

    上述代码中,通过设置UploadFileRequest对象的相关参数来启用断点续传功能,例如设置并发线程数、分片大小、开启断点续传并指定 checkpoint 文件等。

    不同编程语言的 SDK 使用方式可能会有所差异,如果你使用的是其他编程语言的 SDK,可以参考相应 SDK 的文档来找到断点续传上传的具体方法和示例代码。

    另外,OSS 还提供了一些其他工具,如ossutil,也支持大文件的断点续传,你可以从其官网获取详细的使用说明和示例。同时需注意,在实际使用中要处理好可能出现的异常情况,以确保上传的稳定性和可靠性。

相关推荐
Inhand陈工11 天前
基于台达PLC与映翰通IG502的智慧水产养殖精准投喂与远程运维解决方案
运维·人工智能·物联网·阿里云·信息与通信
Database_Cool_11 天前
什么是数据仓库物化视图?AnalyticDB MySQL 实时物化视图能力解析
人工智能·mysql·阿里云
Database_Cool_11 天前
大规模数据分析降本指南:AnalyticDB Serverless 弹性架构实战
数据仓库·阿里云·架构·数据分析·serverless
tiancaijiben11 天前
阿里云Kubernetes集群托管完全指南:从创建到生产级运维
云计算
我是小bā吖11 天前
Claude Code 模型接入阿里云 AI 网关并统计不同使用者的模型用量
网络·人工智能·阿里云
翼龙云_cloud11 天前
阿里云国际代理商:如何使用RDS MySQL 构建网站数据库?
数据库·mysql·阿里云
互联网推荐官11 天前
上海软件定制开发公司推荐:从PaaS工程化路径看D-coding的技术取舍
云原生·云计算·paas·软件开发·开发经验·上海
sbjdhjd11 天前
从零搭建企业级 CI/CD(下):Jenkins+GitLab+Harbor 全链路实战指南
git·servlet·ci/cd·云原生·云计算·gitlab·jenkins
wcy1008611 天前
为 CentOS 7.6 (7.6.1810) 配置阿里云 Vault 源
linux·阿里云·centos
Inhand陈工11 天前
污水泵站PLC数据上云实战:西门子PLC + 映翰通IG502 + DM平台全流程
人工智能·物联网·网络安全·阿里云·信息与通信·iot