AlphaFold 3 Conda 部署指南:让普通人也能本地运行 Docker 只是 AlphaFold 3 的一种装法。没有 root 权限、不想研究容器技术你依然可以在自己熟悉的 Conda 环境下把它跑起来。AlphaFold 3 自 2024 年 11 月开源以来许多普通用户都被卡在了入口门槛上GitHub 上官方文档的安装方式只有 Docker没有系统级管理员权限就被挡在了门外。其实社区很早就探索出了一套完全不依赖 Docker 的 Conda 安装方案。本文直接将这套方法完整地写下来不求学术价值只聚焦如何把你的电脑变成一个能跑 AlphaFold 3 的预测环境。前置检查你的设备合格吗AlphaFold 3 是一个算力依赖较重的程序不是所有电脑都能顺畅运行。以下是官方推荐的最低配置配置项最低要求检查命令操作系统Ubuntu 22.04 LTS (或更早 20.04)lsb_release -aGPUNVIDIA GPU建议显存 ≥ 16GB (如 RTX 3060 或更高)nvidia-smiCUDA 工具包版本 12.6 或以上nvcc --version或从nvidia-smi顶部查看内存 (RAM)≥ 64 GBfree -h磁盘空间≥ 700 GB (建议 1 TB)df -hPython3.11python --versionGCC 版本≥ 9.4 (推荐 ≥ 11)gcc --version⚠️ 如没有独立 GPU则无法通过 AlphaFold 3 的推理阶段。数据预处理可跑在 CPU 上但主模型需要 GPU 加速。安装步骤申请模型参数立即开始并行执行由于 DeepMind 对 AlphaFold 3 的参数进行了访问限制官方不会自动提供下载。你需要访问这份 Google 表单填写基本信息等待审核通常 2–3 个工作日会收到下载链接。模型文件约 1.1GB下载后请保存到一个不会丢失的地方。建议现在就去申请然后继续阅读下面步骤等参数到位时数据库也差不多下完了。克隆代码仓库AlphaFold 3 代码托管在 GitHub你需要把它拉取到本地gitclone https://github.com/google-deepmind/alphafold3.gitcdalphafold3如果因网络原因克隆失败可从仓库页面手动下载 ZIP 包并解压。下载数据库后台运行耐心等待运行 AlphaFold 3 需要约 630GB 的公共生物信息数据库。官方提供自动脚本fetch_databases.sh可以帮你下载和验证# 创建存储目录并开始下载mkdir-p~/public_databasesnohup./fetch_databases.sh ~/public_databases数据库下载总大小约 252 GB (压缩包)解压后变为 630 GB整个下载过程需要 2–3 天建议使用nohup后台运行避免终端关闭导致中断。若中途下载失败重新运行脚本会自动校验已有文件继续下载缺失部分不需要从头开始。创建 Conda 环境新开一个终端窗口创建专门的 Conda 环境并指定 Python 版本为 3.11官方 Dockerfile 中使用的版本conda create-naf3python3.11-yconda activate af3安装核心依赖① 安装系统编译工具AlphaFold 3 部分组件需要编译确保 GCC 和 CMake 可用condainstall-cconda-forge cmakemakegcc_linux-64 gxx_linux-64-y② 安装生物信息学工具 HMMERcondainstall-cbiocondahmmer3.4-y用于蛋白质序列搜索和比对。若未安装搜索阶段会直接报错。③ 安装核心 GPU 加速包JAX 是 AlphaFold 3 的推理引擎官方强烈建议使用 JAX 的 CUDA 加速版本推理阶段完全是 GPU 驱动的。请根据你的 CUDA 版本从 JAX 官方仓库安装对应版本下面以 CUDA 12.x 为例pipinstalljax[cuda12]jaxlib-fhttps://storage.googleapis.com/jax-releases/jax_cuda_releases.html④ 安装其他 Python 依赖通过 requirements.txt 批量安装所有其他依赖。pipinstall-rrequirements.txt编译 C 扩展这是 Conda 安装中最容易出现编译错误的一步因为 AlphaFold 3 的 C 组件需要通过 CMake 在本机编译。pipinstall.--no-deps--verbose--no-deps参数是必需的因为我们之前已经单独安装了所有依赖避免重复解析。如果遇到Failed to build installable wheels或CMake error等错误请确认以下两个前置条件是否满足CMake 已成功安装 → 运行cmake --versionCUDA 工具包已安装 → 运行nvcc --version若 CUDA 缺失可以用 conda 快速安装conda install -c nvidia cuda-toolkit准备数据目录将数据库文件刚下完的和模型参数文件申请后下载的分别放置到指定目录# 数据库 (~630GB)mv~/public_databases /path/to/your/alphafold3/# 模型参数 (af3.bin.zst, ~1.1GB)mkdir-pmodelsmv/path/to/download/af3.bin.zst models/运行你的第一次预测运行 AlphaFold 3 只需要一行命令核心参数是三个路径模型目录、数据库目录、输入文件目录。先准备一个输入文件可以用官方提供的示例 example_input.json 进行测试python run_alphafold.py\--json_path/path/to/your_input.json\--model_dir./models\--db_dir./public_databases\--output_dir./af3_results各参数的具体含义参数含义示例值--json_path描述预测目标的 JSON 文件./example_input.json--model_dir模型参数目录 (含 af3.bin.zst)./models--db_dir数据库根目录 (含 mmCIF/FASTA 等)./public_databases--output_dir结果输出目录./af3_results输入 JSON 文件是 AlphaFold 3 的启动入口它的结构比较丰富可定义一个或多个分子链 (蛋白质、DNA、RNA)、配体 (用 SMILES 或 CCD 代码定义)、翻译后修饰以及共价连接。常见问题与排查方案问题 1克隆alphafold3仓库失败 / 拉取数据库超时原因国内网络访问 GitHub 不稳定。解决配置 Git 镜像加速以 ghproxy 为例gitconfig--globalurl.https://mirror.ghproxy.com/https://github.com/.insteadOfhttps://github.com/问题 2编译 C 扩展时 CMake 失败原因CMake 或 CUDA 未正确安装。解决condainstall-cconda-forge cmakemake-ycondainstall-cnvidia cuda-toolkit-y安装完毕后重新运行pip install . --no-deps --verbose。问题 3nvidia-cudnn-cu12 等 CUDA 包版本冲突原因conda 和 pip 混合安装、版本区间不兼容。解决建议在requirements.txt中删除nvidia-cudnn-cu12这一行因为 JAX 包内部已包含同类 CUDA 运行时手动再装一份反而会造成冲突。问题 4运行推理时提示 “No module named X”原因某个 Python 依赖未被安装。解决检查当前 conda 环境的安装列表手动补装缺失的包conda list|grepmissing_package_name# 确认缺失pipinstallmissing_package_name# 补充安装问题 5数据库下载脚本遇到权限错误原因文件夹缺少读写权限。解决重新赋予权限后用nohup继续后台运行chmod-R755/path/to/public_databaseschmodx fetch_databases.shnohup./fetch_databases.sh /path/to/public_databases问题 6下载数据库中断后是否要重新开始不需要。fetch_databases.sh脚本具备断点续传能力重复运行会自动跳过已有文件继续下载缺失部分。总结Cond 部署的每一步本质上都依赖两样东西数据库和模型参数。参数申请提交后即可离线等待数据库启动后放在后台跑 2–3 天这段时间你甚至可以去完成另一篇论文或工作。当申请审批下来、数据库下载完毕你就能用几行 conda 命令把一个拥有顶尖生物结构预测能力的 AI 引擎跑在自己的电脑上。