【AlphaFold3】开源本地的安装及使用

文章目录

  • 安装
    • 安装Docker
      • [Installing Docker on Host](#Installing Docker on Host)
      • [启用Rootless Docker](#启用Rootless Docker)
    • [安装 GPU 支持](#安装 GPU 支持)
      • [安装 NVIDIA 驱动程序](#安装 NVIDIA 驱动程序)
      • [安装 NVIDIA 对 Docker 的支持](#安装 NVIDIA 对 Docker 的支持)
    • [获取 AlphaFold 3 源代码](#获取 AlphaFold 3 源代码)
    • 获取基因数据库
    • 获取模型参数
    • [构建将运行 AlphaFold 3 的 Docker 容器](#构建将运行 AlphaFold 3 的 Docker 容器)
  • 参考

AlphaFold3:
https://github.com/google-deepmind/alphafold3

安装

参考官方文档:安装并运行您的第一个预测

本教程使用WSL2-Ubuntu22.04

安装Docker

Installing Docker on Host

参考Docker官方:
https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository

  1. 设置 Docker 的apt存储库。
c 复制代码
# Add Docker's official GPG key:
sudo apt-get update
sudo apt-get install ca-certificates curl
sudo install -m 0755 -d /etc/apt/keyrings
sudo curl -fsSL https://download.docker.com/linux/ubuntu/gpg -o /etc/apt/keyrings/docker.asc
sudo chmod a+r /etc/apt/keyrings/docker.asc

# Add the repository to Apt sources:
echo \
  "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/ubuntu \
  $(. /etc/os-release && echo "$VERSION_CODENAME") stable" | \
  sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update
  1. 安装 Docker 软件包。
    安装最新版本:
c 复制代码
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
  1. 通过运行hello-world映像来验证安装是否成功:
c 复制代码
sudo docker run hello-world

此时报错:

解决方法:

换源

c 复制代码
sudo vim /etc/docker/daemon.json

查询网络各种方法,改用阿里云镜像均不成功

从闲鱼上买了个源成功了= ='

换源后记得重启:

c 复制代码
sudo service docker restart

需注意:!

如果是一般的Linux操作系统,可能是因为Linux中没有使用systemd,想用systemd命令来管理Linux上的服务,因此会报错,很可能是使用的是经典的SysV init(sysvinit)系统。

本教程使用window11下WSL2的Ubuntu,就会使SysV init而不是systemd。

解决方法:

更换命令,用SysV init的命令代替systemd的

启用Rootless Docker

安装 GPU 支持

安装 NVIDIA 驱动程序

官方方法:

bash 复制代码
sudo apt-get -y install alsa-utils ubuntu-drivers-common
sudo ubuntu-drivers install

sudo nvidia-smi --gpu-reset

nvidia-smi  # Check that the drivers are installed.

此步骤个人之前已实现,详见:
CUDA升级/安装/使用 最新说明记录

有以下输入表明安装成功,才可以继续。

安装 NVIDIA 对 Docker 的支持

获取 AlphaFold 3 源代码

bash 复制代码
git clone https://github.com/google-deepmind/alphafold3.git

或手动下载:

获取基因数据库

此步骤需要curlzstd安装在您的计算机上

bash 复制代码
# 检查是否安装
curl -V
zstd -V
#sudo apt install zstd

AlphaFold 3 需要多个遗传(序列)蛋白质和 RNA 数据库才能运行:

官方提供了一个 Python 程序fetch_databases.py,可用于下载并设置所有这些数据库。如果不在本地SSD上安装,这个过程大约需要45分钟。我们建议在 screentmux会话中运行以下命令,因为下载和解压缩数据库需要一些时间。

bash 复制代码
cd alphafold3  # cd 到包含AlphaFold 3存储库的目录
python3 fetch_databases.py --download_destination=<DATABASES_DIR>

此脚本从 GCS 上托管的镜像下载数据库,其中包含所有 版本与 AlphaFold 3 论文中使用的版本相同。
Note: 下载目录<DATABASES_DIR>不应是AlphaFold 3存储库目录中的子目录。如果是这样,Docker构建将很慢,因为大型数据库将在映像创建过程中被复制。
Note: 完整数据库的总下载大小约为252 GB,解压缩后的总大小为630 GB。

请确保您有足够的硬盘空间、带宽和时间来下载。我们建议使用SSD以获得更好的基因搜索性能,以及fetch_databases.py的更快运行时间。
Note: 如果下载目录和数据集没有完全的读写权限,可能会导致MSA工具出现错误,错误消息不明确。请确保应用了所需的权限,例如使用sudo chmod 755 --recursive <DATABASES_DIR>命令。

脚本完成后,应该拥有以下目录结构:

bash 复制代码
pdb_2022_09_28_mmcif_files.tar  # ~200k PDB mmCIF files in this tar.
bfd-first_non_consensus_sequences.fasta
mgy_clusters_2022_05.fa
nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta
pdb_seqres_2022_09_28.fasta
rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta
rnacentral_active_seq_id_90_cov_80_linclust.fasta
uniprot_all_2021_04.fa
uniref90_2022_05.fa

获取模型参数

可参考:AlphaFold 3 权重申请指南

构建将运行 AlphaFold 3 的 Docker 容器

参考

1\][AlphaFold3 最全食用指南](https://mp.weixin.qq.com/s/zOb2UzSplXIZydyN4LXTZQ) \[2\][window10下WSL使用Ubuntu报错: System has not been booted with systemd as init system (PID 1)](https://blog.csdn.net/weixin_44092430/article/details/121511967) \[3\][如何修复 System has not been booted with systemd 报错信息?](https://blog.csdn.net/qfyh_djh/article/details/139197614) \[4

5

6

相关推荐
weixin_511222801 天前
法术施放选择目标逻辑概述
开源
eguid_11 天前
【开源项目分享】JNSM1.2.0,支持批量管理的jar包安装成Windows服务可视化工具,基于Java实现的支持批量管理已经安装服务的可视化工具
java·开源·jar·1024程序员节·windows服务·jar包安装成服务·exe安装成服务
周杰伦_Jay1 天前
【常用设计模式全解析】创建型模式(聚焦对象创建机制)、结构型模式(优化类与对象的组合关系)、行为型模式(规范对象间的交互行为)
设计模式·架构·开源·交互·1024程序员节
周杰伦_Jay1 天前
【Elasticsearch 全解析】分布式搜索引擎的原理、实践与优化
大数据·分布式·elasticsearch·架构·开源·1024程序员节
星空的资源小屋1 天前
Antares SQL,一款跨平台开源 SQL 客户端
数据库·人工智能·pdf·开源·电脑·excel·1024程序员节
DisonTangor2 天前
【2B篇】阿里通义 Qwen3-VL 新增 2B、32B 两个模型尺寸,手机也能轻松运行
人工智能·计算机视觉·语言模型·开源·aigc
Knight_AL2 天前
Spring Boot 实现 DOCX 转 PDF(基于 docx4j 的轻量级开源方案)
spring boot·pdf·开源
CoderJia程序员甲2 天前
GitHub 热榜项目 - 日榜(2025-10-23)
ai·开源·大模型·github·ai教程
FlagOS智算系统软件栈2 天前
与创新者同频!与FlagOS共赴开源之约
人工智能·ai·开源