深度学习在新蛋白质设计中的应用

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

Deep learning for new protein design

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。但这里有个问题。

“蛋白质的搜索空间是巨大的,”华盛顿大学蛋白质设计研究所和霍华德休斯医学研究所的研究科学家布莱恩考文垂说。

他的实验室研究的蛋白质通常由65种氨基酸组成,每个位置有20种不同的氨基酸选择,就有65的20次方次方的结合组合,这个数字比宇宙中原子的估计数量还要大。

考文垂是2023年5月发表在《自然通讯》杂志上的一项研究的合著者。

在这项研究中,他的团队使用深度学习方法在“从头开始”(从头开始)计算蛋白质设计中增强现有的基于能量的物理模型,结果在实验室中验证了将设计的蛋白质与其目标蛋白质结合的成功率提高了10倍。

“我们表明,通过结合深度学习方法来评估氢键形成或疏水相互作用的界面质量,你可以显著改善管道,”研究合著者纳撒尼尔·贝内特(Nathaniel Bennett)说,他是华盛顿大学蛋白质设计研究所的博士后学者。

“这与试图一一列举所有这些能量是相反的,”他补充说。

读者可能熟悉深度学习应用程序的流行示例,例如语言模型ChatGPT或图像生成器DALL-E。

深度学习使用计算机算法从数据模式中分析和推断,对算法进行分层,逐步从原始输入中提取更高级别的特征。在这项研究中,使用深度学习方法来学习蛋白质序列和可能结构的表示的迭代变换,这些变换非常迅速地收敛于非常准确的模型上。

作者开发的深度学习增强的从头蛋白质粘合剂设计协议包括机器学习软件工具AlphaFold 2和由蛋白质设计研究所开发的RoseTTA折叠。

该研究问题非常适合在Frontera上并行化,因为蛋白质设计轨迹彼此独立,这意味着当计算作业运行时,信息不需要在设计轨迹之间传递。

“我们只是拆分了这个问题,其中有200万到600万个设计,并在Frontera的庞大计算资源上并行运行所有这些设计。它上面有大量的CPU节点。我们给每个cpu分配一个设计轨迹,这样我们就可以在可行的时间内完成大量的设计轨迹。”

作者使用RifDock对接程序生成了600万个蛋白质“对接”,或潜在结合的蛋白质结构之间的相互作用,将它们分成大约10万个块,并使用Linux实用程序将每个块分配给Frontera的8000多个计算节点之一。

这10万个码头中的每一个都将被分成100个工作,每个工作有1000个蛋白质。一千个蛋白质进入计算设计软件Rosetta,在那里,这一千个蛋白质首先以十分之一秒的尺度进行筛选,而那些存活下来的蛋白质则以几分钟的尺度进行筛选。

此外,作者使用蛋白质设计研究所开发的软件工具ProteinMPNN,进一步提高了生成蛋白质序列神经网络的计算效率,比以前最好的软件快200倍以上。

他们在建模中使用的数据是酵母表面显示结合数据,所有这些数据都是由蛋白质设计研究所公开收集的。在这个实验中,数万条不同的DNA链被命令编码一种不同的蛋白质,这是科学家们设计的。

然后将DNA与酵母结合,使每个酵母细胞在其表面表达一种设计好的蛋白质。然后将酵母细胞分为结合细胞和不结合细胞。反过来,他们使用人类基因组测序计划的工具来找出哪些DNA有效,哪些DNA无效。

考文垂表示,尽管研究结果表明,设计结构与目标蛋白质结合的成功率提高了10倍,但仍有很长的路要走。

“我们已经上升了一个数量级,但我们还有三个数量级要做。研究的未来是进一步提高成功率,并转向更困难的新目标,”他说。病毒和癌症的t细胞受体就是最好的例子。

改进计算设计的蛋白质的方法是使软件工具更加优化,或者取样更多。

考文垂说:“我们能找到的电脑越大,我们就能制造出越好的蛋白质。我们正在研发未来抗癌药物的工具。我们制造的许多单独的粘合剂可能会成为拯救人们生命的药物。我们正在努力使这些药物变得更好。”

本文来自作者[如松]投稿,不代表杨青号立场,如若转载,请注明出处:https://m.yangqing88.com/zlan/202507-581.html

(31)

文章推荐

  • 若日尼奥:阿森纳专注于战胜曼城,无惧哈兰德状态

      若日尼奥强调阿森纳不会让哈兰德的出色开局影响他们周日在阿提哈德球场的比赛。在曼城本赛季的完美开局中,哈兰德表现出色,在他的前四场英超比赛中打入9球。曼城目前在积分榜上排名第一,本周末他们将在阿提哈德欢迎阿森纳,而枪手排名第二,仅落后他们两分。枪手必须想办法把哈兰德排除在外,但

    2025年08月27日
    0
  • 盘点一款“微乐麻将开挂器通用版”(必胜开挂神

    >亲,微乐麻将开挂器通用版这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作 

    2025年08月27日
    0
  • 第一夫人与在日华侨的亲切交流

    作者:李海雅首尔,10月11日(韩联社)——总统办公室表示,第一夫人金健熙周三会见了一群旅日韩国妇女,感谢她们对当地韩国社区的贡献以及她们对促进双边交流的帮助。据青瓦台发言人李道云透露,金总统当天在青瓦台与1949年成立、会员超过10万名的旅日

    2025年08月27日
    0
  • 玩家必备“手机斗牛开挂下载”详细分享开挂

    家好,今天小编来为大家解答手机斗牛开挂下载有没有挂这个问题咨询软件客服可以免费测试直接加QQ群了解详细,手机斗牛开挂下载的挂在哪里买很多人还不知道,现在让我们一起来看看吧!一、手机斗牛开挂下载记牌器怎么全显示你需要获得记牌器才能全部显示,否则只显示前面几

    2025年08月27日
    1
  • 泰国北部10省遭遇严重野火灾害

    图片由《国家报》提供据地理信息和空间技术发展局(gisda)透露,一场世界末日般的大火威胁着泰国北部的大片地区,估计在2月19日至25日期间,将有100万泰铢(相当于16万公顷)的土地被野火吞噬。这场地狱般的灾情波及10个省份,包括德省、南邦省、清迈省、碧查汶省

    2025年08月27日
    1
  • 科学直击“牛牛怎么买挂”(确实真的有挂)

    家好,今天小编来为大家解答牛牛怎么买挂有没有挂这个问题咨询软件客服可以免费测试,牛牛怎么买挂的挂在哪里买很多人还不知道,现在让我们一起来看看吧!一、牛牛怎么买挂记牌器怎么全显示你需要获得记牌器才能全部显示,否则只显示前面几张牌的数据。如下图所示:获

    2025年08月27日
    2
  • 指定教程“德扑之星德州透视挂”分享装挂技巧步骤

    德扑之星德州透视挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐麻将可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义微乐麻将系统规律,只需要输入自己想要的开挂功能,一键便可以生成出微

    2025年08月27日
    1
  • 今日实测“玄龙二厅有挂吗”分享装挂技巧步骤

    家们!今天小编来为大家解答玄龙二厅有挂吗这个问题咨询软件客服徽信 的挂在哪里买很多人还不知道,现在让我们一起来看看吧!一、记牌器怎么全显示你需要获得记牌器才能全部显示,否则只显示前面几张牌的数据。如下图所示:获取开挂的软件方法如下:可以通过直接

    2025年08月27日
    1
  • 英伟达计划通过ARM处理器对抗英特尔

      根据知情人士透露,英伟达公司正在利用Arm公司的技术开发芯片,这将对英特尔公司的个人电脑处理器构成挑战,这可能会加剧两家半导体制造商之间的竞争。英伟达的人工智能加速器芯片已经主导了这一市场,该公司正在悄悄研发个人电脑中央处理器。由于此事不对外公开,上述知情人士要求匿名。这款cpu将运

    2025年08月27日
    1
  • 今日热议“郑州微乐麻将怎么开挂”附开挂脚本详细步骤

    网上科普有关郑州微乐麻将怎么开挂”话题很是火热,小编也是针对微乐麻将的技术支持和安全性寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。您好,郑州微乐麻将怎么开挂这款游戏可以开挂的,确实是有挂的,通过微信【游戏】很

    2025年08月27日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • 如松
    如松 2025年07月04日

    我是杨青号的签约作者“如松”!

  • 如松
    如松 2025年07月04日

    希望本篇文章《深度学习在新蛋白质设计中的应用》能对你有所帮助!

  • 如松
    如松 2025年07月04日

    本站[杨青号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 如松
    如松 2025年07月04日

    本文概览:理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

    联系我们

    邮件:杨青号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们