(a)用于输入的裁剪后的FRIL图像(b)人类专家注释的图像(c)带注释的网络生成图像(d)辨别器网络:辨别真实和伪造的图像。(图片来源:马克斯·普朗克佛罗里达神经科学研究所)
从样品制备到图像采集,为了在高分辨率下看清极小的细胞结构,电子显微镜(EM)需要经过精确且耗时的步骤才能得到清晰可见的细节。此外,目前的电子显微镜分析软件通常需要依靠科学家熟练的技术手动地观察几百张图像,这导致图像生成后,从其中分析提取出生物学信息是一个更加费力、耗时的任务。
马克斯·普朗克佛罗里达神经科学研究所(MPFI)的一个跨学科的科学家团队通过一些创新以及尖端神经网络的应用,开发了一个旨在简化部分冗长分析过程的新型软件。该项目与MPFI的电子显微镜核心设备部门以及Christie(本研究作者之一)实验室合作,要求两名高中生对基于计算机的技术进行改进,以用于分析电镜图像中蛋白质的分布。与使用荧光标记的传统光学显微镜不同,电子显微镜要求蛋白质与金纳米颗粒标记结合,以便在细胞内观测到它们。由于这个软件使用深度学习的方法来识别与特定目标蛋白质结合的金颗粒,它也被调侃地称为“掘金者”。
图片来源:Pixabay
在新发表于《科学报告》(Scientific Reports)的一项研究中,MPFI团队设计了一种基于深度学习、可适应的算法,能够准确识别不同大小的金颗粒。这种完全自动化的方法将加快计数过程,并生成更精确的跨膜蛋白质分布的位置信息,从而加速新的突破。
深度学习或神经网络是一种可让软件随着时间的推移逐步学习的计算策略。就像人的大脑一样,这种类型的算法能够将视觉场景分解为各个小的部分,并学习识别某些方面。通过提供预先注释好的“训练数据”,该软件可以学习如何复制和模仿人类完成给定任务时的行为,这是曾经的计算机无法做到的。
“该项目的挑战之一是设计一种方法训练我们的软件,使其仅识别在电子显微照片上显示为暗的金颗粒,而不会识别看起来类似的、由于细胞表面不平整产生的阴影,此前只有受过训练的电镜专家才能完成这样的任务。”MPFI的神经数据科学家兼研究论文的作者Michael Smirnov博士解释说:“我们发现,通过提供足够的训练数据并纠正算法中出现的错误,我们的软件可以以接近人类水平的准确率将金颗粒与这些阴影区分开。这确实证明了我们技术的鲁棒性和实用性。”
图片来源:Pixabay
这个项目始于两位学习数据科学的高中生Diego Jerez和Eleanor Stuart的好奇心,但很快它就发展成为一个更加复杂和跨学科的项目。该论文的第一作者Diego Jerez解释说:“将课堂上学到的知识运用到现实世界的科学研究,并目睹数据科学是如何帮助解决科学问题,这样的机会非常特别,我感觉十分幸运。”“这些年轻的学生对这种编程和概念性工作表现出了真正的天分,我为他们所取得的成就感到骄傲。我迫不及待地想看到他们将来对科学界的贡献。”Smirnov博士说道。
架构小而紧凑的“掘金者”软件主要用于冷冻断裂复型技术的电镜图像识别,但其设计使之可以通用化,并兼容各种电子显微镜应用场景,包括不同的放大率、图像面积、细胞类型和金颗粒大小。该软件将很快以开源的形式发布,并包含一个用户友好的界面。世界各地的科学家将有机会充分利用和改进这种创新算法。
MPFI电子显微镜核心设备部负责人Naomi Kamasawa博士解释说:“我们团队的合作对于弥合这些专业领域之间的隔阂至关重要。这就是马克斯·普朗克学会(Max Planck Society)所做的——将对各学科充满热情的人们聚集在一起,并让他们一起发挥创造力。当我们通力合作时,一切皆有可能。”
翻译:彭琛
审校:董子晨曦
引进来源:马克斯·普朗克佛州神经科学研究所