作者
孙鸣远题图
Folding
Home十几年前,不少人都拥有过这样的经历:同时开着好几个QQ挂机,目的是为了早日升级出头像名片旁边的太阳(等级);后来网络游戏也发展出类似的套路,通过挂机获得经验或者金币。无论是哪种形式,无非都是用户利用电费去置换些蝇头小利,而相关公司也正是通过这种手段来促进日活数据。十年前,比特币出现,人们在这其中看到了巨大的利益,于是疯狂采购硬件进行“挖矿”。由于显卡是主要“算力”,而厂商并未预估到“矿工”如此的疯狂,一度导致市场中显卡的售价翻倍上涨,但仍供不应求。就在这一幕幕“荒诞”事情发生的同时,有一个早在年就启动的“挂机”项目——Foldinghome(下文统称Fh),却鲜为人知,也正是这个项目,让我们每个人都有机会参与到“攻克新冠病毒”甚至是“拯救世界”的队伍中。FoldinghomeFh是一个分布式计算项目,用于模拟蛋白质的分子动力学,其最初的重点是观察分析“蛋白质折叠”问题,但后来已经逐渐延伸到解决诸多生物医学问题,例如阿兹海默症、癌症、囊性纤维化、COVID-19、埃博拉病毒等。该项目在年10月1日由斯坦福大学Pande实验室的VijayPande教授成立,并于年交由华盛顿大学圣乔治分校的GregBowman博士(Pande之前的学生)领导。项目成立后发展迅猛,很多在校学生、在职科学家加入项目志愿者行列,帮助项目方翻译网页、传播推广。目前通过Fh项目的协助,一共诞生了篇学术论文。(Dr.VijayPande)例如Foldinghome借助谷歌Exacycle(谷歌的大规模并行的云资源)研究的B2AR蛋白质动力学,G-蛋白偶联受体(GPCR)在许多医学和生物过程(尤其是哮喘和心脏病)取得重要成绩。该研究成果在化学顶级期刊《NatureChemistry》上发布。所谓分布式计算,即是将一个需要巨大算力的问题拆分成众多小部分,然后将这些“小问题”分配给许多算力设备进行处理,最后把这些反馈的计算数据综合起来得到最终的计算结果。简单理解就是反向的“云计算”,由中心向众多参与者的设备发送“题目”,通过无数设备的“算力”计算出模拟结果,并将数据发送回中心。(云计算则是各个终端设备将未处理数据发送“中心”,由“中心”计算后将结果发送回各个终端设备)理论上来说,类似“蛋白质折叠”这类大型科研课题,应该由超级计算机来解决,不过超级计算机虽然算力强大,但一方面使用成本极高,对于刚刚起步的Fh项目来说难以承担,另一方面对于“蛋白质折叠”这类“长时间模拟、随机性极强”的课题,并非一朝一夕就能见成效,即需要一个能够长期提供算力的系统。所以相对廉价、高效的计算方式——分布式计算,成为了Fh的首选。如果你看过刘慈欣的《球状闪电》,或者你是天文学爱好者,那么你一定听说过SETIhome,同样也是利用分布式计算的方式,通过分析世界上最大的射电望远镜Arecibo获得的数据,帮助分析搜寻外太空文明。(可惜的是SETIhome项目在年3月宣布停止发包,进入休眠期)当人们结束工作休息时,这一屏幕保护程序开始运行,这台看似休息的电脑实际上已经加入到寻找外星人的行列中:接受、分析来自SETIhome已被分解成“工作单元”的数据,分析工作结束后系统会自动联机将分析结果传回主服务器,然后再接受另一新的“工作单元”。——刘慈欣《球状闪电》虽然在一开始Fh项目的志愿者还很少,不过后来随着人们对其逐渐了解,加入Fh的数量越来越多。在年时,其峰值计算速度到达45petaFLOPS,已经接近当时世界最快的超级计算机“天河二号”(54petaFLOPS)。尽管如此,相比于前文提到的“游戏挂机”“挖矿”等数量,Fh仍然属于小众项目。(红色为Fh算力,黑色以深浅分,分别为超级计算机前三名的算力)直到年2月28日,Fh的现任团队领导者GregBowman博士发布了一条推特引起了无数人的