文章主要内容和创新点总结一、主要内容本文聚焦计算机辅助药物发现中的苗头分子(hit-like molecules)从头生成任务,提出一种名为GxVAEs的深度生成模型,旨在从基因表达谱中生成具有生物活性和类药性的分子。传统药物发现中的高通量筛选(HTS)存在命中率低、耗时耗力、成本高昂且候选药物失败率超90%的问题;现有AI驱动的分子生成模型多仅关注化学性质优化,忽略疾病相关的细胞环境和生物学背景。GxVAEs通过两个联合变分自编码器(VAE)——ProfileVAE和MolVAE,弥补了分子生成与生物系统细胞环境之间的差距:ProfileVAE作为特征提取器,从高维基因表达谱中提取低维潜在特征;这些提取的特征作为条件,引导MolVAE(基于双向GRU和非规范SMILES字符串)生成苗头分子。实验采用LINCS L1000、LINCS及CREEDS数据库的三类基因表达谱(化学诱导型、靶标扰动型、疾病特异性),通过有效性、唯一性、新颖性、QED值、塔尼莫托系数等指标,与TRIOMPHE、ExpressionGAN、DRAGONET等现有先进模型对比。结果表明,GxVAEs在各项指标上表现更优,能成功从患者疾病谱中生成针对胃癌、特应性皮炎、阿尔茨海默病等多种疾病的潜在治疗性分子结构。二、创新点考虑细胞环境的分子生成:首次在分子生成过程中明确纳入特定疾病的细胞环境影响,利用基因表达谱捕捉细胞生理病理状态,使生成的分子更具生物学意义。
GxVAEs: Two Joint VAEs Generate Hit Molecules from Gene Expression Profiles
发布时间:2026/6/2 6:21:21
文章主要内容和创新点总结一、主要内容本文聚焦计算机辅助药物发现中的苗头分子(hit-like molecules)从头生成任务,提出一种名为GxVAEs的深度生成模型,旨在从基因表达谱中生成具有生物活性和类药性的分子。传统药物发现中的高通量筛选(HTS)存在命中率低、耗时耗力、成本高昂且候选药物失败率超90%的问题;现有AI驱动的分子生成模型多仅关注化学性质优化,忽略疾病相关的细胞环境和生物学背景。GxVAEs通过两个联合变分自编码器(VAE)——ProfileVAE和MolVAE,弥补了分子生成与生物系统细胞环境之间的差距:ProfileVAE作为特征提取器,从高维基因表达谱中提取低维潜在特征;这些提取的特征作为条件,引导MolVAE(基于双向GRU和非规范SMILES字符串)生成苗头分子。实验采用LINCS L1000、LINCS及CREEDS数据库的三类基因表达谱(化学诱导型、靶标扰动型、疾病特异性),通过有效性、唯一性、新颖性、QED值、塔尼莫托系数等指标,与TRIOMPHE、ExpressionGAN、DRAGONET等现有先进模型对比。结果表明,GxVAEs在各项指标上表现更优,能成功从患者疾病谱中生成针对胃癌、特应性皮炎、阿尔茨海默病等多种疾病的潜在治疗性分子结构。二、创新点考虑细胞环境的分子生成:首次在分子生成过程中明确纳入特定疾病的细胞环境影响,利用基因表达谱捕捉细胞生理病理状态,使生成的分子更具生物学意义。