未来计算机改变基因技术是治疗疾病新方法(2)
如果试验的折叠分数很差,那么Rosetta程序会尝试用不同的方式重新折叠蛋白质,以检查是否可以获得一个较好的分数。对每种蛋白质都会数百万次地执行这种计算。科学家们会找出得分最高的蛋白质结构并在接下来的研究步骤中使用。
强大的计算能力“征服癌症”项目
“征服癌症”项目的任务是改进蛋白质X射线结晶学的结果,这不仅能够帮助研究人员解释人类蛋白质组的未知部分,更重要的是还能够提高他们对癌症的产生、发展及治疗的理解。
为了提高对癌症及其治疗方法的理解,研究人员不仅需要发现针对转移性癌症(即可以扩散到人体其他部位的癌症)的新型疗法,而且必须确定能够探测出早期癌变的诊断标记物(也叫疾病指标)。
研究人员在有关蛋白质的信息有限或根本没有此类信息的情况下,也已在多种人类癌症的研究方面中取得了多项重大发现。然而,为了更好地理解和治疗癌症,科学家们发现与癌症相关的新蛋白质及其结构和功能就显得十分重要。
科学家们对可能与癌症有功能关系的蛋白质特别感兴趣。这包括在肿瘤中增生或抑制的蛋白质,以及那些发生改变或变异从而导致结构性变化的蛋白质。
通过改进X射线结晶学,将使研究人员能够更快地确定多种与癌症相关的蛋白质的结构。这将提高我们对这些蛋白质功能的理解,并能帮助我们发现可能的药物介入方法,以便攻克这种致命的疾病。
X射线结晶学(X-raycrystallography)是一种广受欢迎的蛋白质结构确定方法。通过这种方法,科学家们能够使用高通量的结晶管道来帮助说明人类 蛋白质组的未知部分,从而又能帮助理解癌症的产生、发展及治疗。*
机器人成功运行所需的数百万次条件组合
使蛋白质结晶:这就好比把糖放入一杯水中并保持一段时间。当水蒸发之后,微小的糖晶体就会显现出来。当然,蛋白质结晶的过程要比这复杂得多。
使X射线穿过晶体:科学家们使用一种数学模型,根据蛋白质衍射X射线的方式来确定和观察它们的结构。
使蛋白质结晶并不是一个简单的过程。存在数千种可能会影响结晶过程的条件,比如蛋白质的浓度、溶解度、温度、酸碱度、化学添加剂等,但科学家们必须找到适合某种蛋白质结晶的条件组合。以糖为例,如果将水换成其他液体,改变温度或浓度,就可能无法得到晶体。与此类似,对于特定的蛋白质而言,难题在于如何确定能够形成晶体的条件,如溶解度、温度、酸碱度,等等。
为了运行成功地使蛋白质结晶所需的数百万次条件组合,科学家使用机器人来完成这项工作。机器人能够更快更准确的组合各种不同的结晶条件。为了更加促进这一过程,这数百万次结晶实验的所有结果都拍摄成了照片。
这些研究人员所遇到的难题之一是这些数据集的规模实在太大,存储容量总计超过了25TB(相当于9000多张DVD)。IBM的“蓝色基因”(BlueGene)超级计算机为这阶段的工作提供了帮助,它通过一种特殊的图像压缩算法对这些图像进行无损压缩。研究人员还面临另一个挑战,即在一台计算机上全面分析一张图像以确定结晶化结果大约需要10个小时。按照这种进度,研究人员几乎需要10万年才能分析完现有的这些照片。
借助强大的计算能力分析原理
借助强大的计算能力,科学家们能够对通过HWI高通量结晶化管道拍摄的8600万幅现有的蛋白质图像进行处理。运行OCI的研究人员开发的CrystalVision程序,分析每幅图像的特征,以确定结晶化拍摄的结果:晶体、微晶体、相位分离、表面效应、沉淀物还是无变化。
如果是晶体,检晶仪就对该蛋白质执行最优化过程,以确定该结晶的最优化条件,进而执行衍射实验以确定蛋白质的结构。此外,科学家还可以根据结晶拍摄的结果,将已成功结晶的蛋白质与具有相似特性但结构未知的蛋白质进行对比。这可以作为对这些未知结构的蛋白质进行结晶的出发点,进而能够确定它们的结构。
如果产生的晶体结构不佳或不够大,科学家们仍可利用这些信息来帮助他们更好地确定产生结构良好的晶体所必需的条件。举例来说,他们可能了解到蛋白质X在条件A下产生了微晶体,而蛋白质A在条件Z下也产生了微晶体。基于这些信息,他们能够进行其他实验来推断出需要最优化哪些条件才能产生更大、结构更好的晶体。
------分隔线----------------------------