应用化学 ›› 2022, Vol. 39 ›› Issue (1): 3-17.DOI: 10.19894/j.issn.1000-0518.210479

• 综合评述 • 上一篇     下一篇

生成模型在蛋白质序列设计中的应用

伍青林1, 任玉彬2, 翟小威1, 陈东1( ), 刘凯2( )   

  1. 1.浙江大学能源工程学院,杭州 310012
    2.清华大学化学系,北京 100084
  • 收稿日期:2021-09-26 接受日期:2021-11-11 出版日期:2022-01-01 发布日期:2022-01-10
  • 通讯作者: 陈东,刘凯
  • 基金资助:
    国家自然科学基金(21878258┫浙江省自然科学基金┣Y20B060027);资助

Protein Sequence Design Using Generative Models

WU Qing-Lin1, REN Yu-Bin2, ZHAI Xiao-Wei1, CHEN Dong1(), LIU Kai2( )   

RichHTML

61

PDF

1539

摘要:

蛋白质是一切生命体的物质基础,是生命活动的主要承担者,参与各种生理功能的调节。设计具有特定功能的蛋白质在蛋白质工程、生物医药、材料科学等领域具有重要意义。蛋白质序列设计的目标是设计能够折叠成期望结构并具有相应功能的氨基酸序列,是所有理性蛋白质工程的核心问题,具有极其重要的研究和应用潜力。随着蛋白质序列数据的指数型增长和深度学习技术的快速发展,生成模型越来越多地被应用于蛋白质序列设计。本文简要介绍了蛋白质序列设计的重要意义和主要方法,概述了应用于蛋白质序列设计的主要生成模型,介绍了近年来生成模型在蛋白质序列表示、生成和优化方面的最新研究和应用现状,并对未来的发展方向进行讨论与展望。

关键词: 蛋白质序列设计, 生成模型, 变分自动编码器, 生成对抗网络, 表示学习, 强化学习

Abstract:

Protein is the material basis of all livings, which is the main bearer of life activity and participates in the regulation of physiological functions. Designing proteins with specific functions is of great significance in the fields of protein engineering, biomedicine, and material science. Protein sequence design refers to the design and identification of amino acid sequences that can fold into the desired structure with the desired function. Protein sequence design is the core of rational protein engineering and has great potentials for research and application. With the exponential growth of protein sequence data and the rapid development of deep learning technology, generative models are increasingly used in protein sequence design. This review briefly introduces the significance of protein sequence design and the methods developed for protein sequence design. The principles of the four main generative models used for protein sequence design are discussed in detail. Reports on the latest research and application of generative models in protein sequence representation, generation, and optimization over the past several years are presented. Finally, the future developments of protein sequence design are outlooked.

Key words: Protein sequence design, Generative model, Variational autoencoder, Generative adversarial network, Representation learning, Reinforcement learning

中图分类号: 

  • O629.7

地址:长春市人民大街5625号 邮编:130022

电话:0431-85262016 85262330 传真:0431-85685653 E-mail:yyhx@ciac.ac.cn

天下网标王阳春网站怎么优化装修行业网站优化引流长沙网站优化软件服装网站优化做什么网站基础seo 优化网站优化选择沈阳网站排名优化seo南宁seo网站排名优化价格深圳教育网站优化公司有哪些松江区谷歌网站优化案例网站优化好还是推广好优化网站择火15星精湛永州外贸网站优化seo怎么进行关键词网站优化怎么解决网站优化厦门网站排名优化费用崇州如何自己优化网站耒阳网站网址优化宝山区正规网站优化价格从江网站优化与推广开封搜索引擎网站优化代办光山网站优化百度优化网站推荐大兴专业网站优化企业网站优化费用台州网站优化电商网站图片优化网站外链接优化日喀则网站推广优化竞价网站同时做优化可以吗香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化