美国科学家利用高倍显微镜和机器学习技术,研制出一种新的算法,它可以自动地从整个细胞的超分辨率图像上识别30多种不同类型的细胞器和其它结构。与此相关的文章刊登在最新一期的自然杂志上。
负责 COSEM (电子显微镜下的细胞分割)项目小组的 ObreeWeigel说,在整个细胞内几乎不可能人工地对这些图像进行解析。单个细胞的数据由数以万计的图像构成,而通过这些图像跟踪细胞内所有的细胞器需要花费超过60年的时间。但新的算法能在几个小时内绘制整个细胞。
与《自然》杂志上的两篇文章不同,研究小组还发布了一个数据门户"开放细胞器",任何人都可以通过它访问自己创建的数据集和工具。它对于研究细胞器如何保持细胞运作非常重要,而在过去,科学家们并不清楚不同细胞器和结构如何相互联系,以及它们占了多少空间。如今,这些隐藏的关系在高效显微镜下第一次变得显而易见。
在过去的十年里,这个团队已经使用显微镜从很多细胞中收集了很多细胞,包括哺乳动物细胞等大量数据资料。
最先进的显微镜,可以精确地定位电子显微学数据中的神经元之间的连接。研究者调整算法,利用显微镜在细胞内对细胞器进行绘图或分割,然后将其分配给图片中每一像素的一个数字,这个数字反映了从最近的突触到的像素距离有多远。COSEM算法的工作方式与之类似,但维度更多。研究者依据每一个像素对30种不同的细胞器和每一种结构之间的距离来划分每个像素。算法将这些数据整合,预测细胞器的位置。
研究者称,通过使用这些数据,算法也可以判断某一特定数字组合是否合理。例如,一个像素无法同时出现在内质网和线粒体中。
为解答细胞内线粒体数量、其表面积大小等问题,研究小组建立的算法将关于细胞器特性的先验性结合起来。经过两年的工作, COSEM团队终于找到了一套能给我们提供良好结果的算法。
现在,研究小组正致力于提高细节处理的程度,并对工具和资源进行进一步优化,以创建更多的细胞学标注数据库以及更多细胞和组织的详细图像。本研究结果对未来4 D细胞生理学研究具有重要意义,并可进一步了解构成有机体的不同组织间的相互作用。