TCGA数据下载问题解决

文章目录

  • 前言
  • 一、原因?
    • [1. 单包体积上限](#1. 单包体积上限)
    • [2. 浏览器兼容性/前端 Bug](#2. 浏览器兼容性/前端 Bug)
    • [3. 国内网络 TCP 长连接被重置](#3. 国内网络 TCP 长连接被重置)
  • 二、解决方式
    • 1.下载Manifest
    • [2. 下载gdc-client](#2. 下载gdc-client)
    • [3. 命令执行](#3. 命令执行)
      • [1. win + R ---> cmd,打开电脑终端](#1. win + R ---> cmd,打开电脑终端)
      • [2. 数据下载命令](#2. 数据下载命令)

前言

TCGA GDC数据库是我们下载公共转录组数据的重要途径,有需要的可以查看2024年TCGA基因表达数据下载(最新版)

由于TCGA数据库可能进行了些许更新,之前TCGA下载数据的方法可能在一些转录组中不适用,本次更新主要是解决往期下载中cart数据不能下载的问题。


一、原因?

1. 单包体积上限

 只要 Cart 里累计大小超过 ≈5 GB,Portal 就强制关闭 HTTP 打包通道,只能走官方命令行工具(gdc-client)。

例如乳腺癌 RNA-seq 一个项目就 6--8 GB,浏览器端直接会提示 "Failed -- network error",其实并非网络问题,而是被限流。

2. 浏览器兼容性/前端 Bug

 官方 Release Notes 里明确写着 Safari 9.0.3、IE 及部分 Chrome 旧版对 "Download Cart" 按钮的 POST 请求解析不完整,会表现为点击无反应或 0 B 空文件。

另外如果之前登录后 session 过期,前端仍显示已登录,再点下载会无限转圈,需要清缓存重新登录。

3. 国内网络 TCP 长连接被重置

 浏览器打包下载走的是 HTTPS 持续连接,一旦中间被 RST,就会停在 "xxx GB/xxx GB 99%" 然后失败;而 gdc-client 自带断点续传,每个文件独立校验,可避开长连接被掐的问题。

二、解决方式

1.下载Manifest



2. 下载gdc-client

本机安装gdc-clinent.exe点击跳转

配置文件地址

将gdc-clinent.exe加入path

  1. win + s ---> 环境变量
  2. 找到path路径
  3. 新建

    将自己的gdc-clinent.exe的文件地址添加即可

3. 命令执行

1. win + R ---> cmd,打开电脑终端

2. 数据下载命令

复制代码
gdc-client download -m gdc_manifest.2026-01-04.183046.txt
即可进行下载

前一段时间因为学业繁忙好久没有更新内容了,在这里向大家说声抱歉,之后我会继续定期更新一些内容,如果有你们想要了解的内容也可评论或者私信我,希望我们可以一同进步

相关推荐
郑洁文1 天前
音乐数据分析研究与应用
大数据·数据挖掘·数据分析·音乐数据分析
babe小鑫1 天前
2026会计专业学数据分析的价值
数据挖掘·数据分析
Bruce_Liuxiaowei1 天前
智能音箱数据分析与优化方案
人工智能·数据挖掘·数据分析·智能音箱·智能体
YangYang9YangYan1 天前
2026数据分析对报考大数据专业的价值分析
大数据·数据挖掘·数据分析·高考
zhumin7261 天前
基于人类行为聚类与虚拟内分泌时间序列的硅基情绪计算模型构建研究
机器学习·数据挖掘·聚类
高洁012 天前
从GPT到开源大模型
python·机器学习·数据挖掘·transformer·知识图谱
叫我:松哥2 天前
基于数据挖掘的旅游景点个性化推荐系统设计与实现,Apriori和FP-Growth算法挖掘景点之间的关联规则
人工智能·python·算法·数据挖掘·数据分析·beautifulsoup
Leo.yuan2 天前
数据挖掘是什么?数据挖掘和数据分析到底有什么区别
人工智能·数据挖掘·数据分析
KaMeidebaby2 天前
卡梅德生物技术快报|噬菌体筛选:技术实操:宽谱大肠杆菌噬菌体筛选全流程与性能验证方案
前端·人工智能·算法·数据挖掘·数据分析
KKKlucifer2 天前
2026 中国数据分类分级系统市场现状及竞争排名调研报告
大数据·分类·数据挖掘