从图像中分析得到生物学结论并不容易。然而,数据科学或可以彻底改变基于显微成像的细胞生物学!
英国Wiston House
光学成像和分子生物学新技术在近几年迅速发展,内容丰富、高质量的动态和多维影响数据也随之爆炸式增长。目前,新一代细胞成像数据的处理、可视化、集成和挖掘能力正在成为推进细胞生物学的一个关键瓶颈。
2020年2月,The Company of Biologists在美丽的Wiston House成功举办了细胞成像数据科学研讨会(Data Science in Cell Imaging Workshop),多位生物学家和数据科学家参会,共同推进数据科学在细胞成像中的应用。这是我们在疫情封锁之前的最后一次线下研讨会!
研讨会的两个组织者,Meghan Driscoll博士和Assaf Zaritsky博士已经在Journal of Cell Science上发表了一篇新的文章,描述伴随细胞成像而迅速发展的数据科学新领域。
论文重点指出了数据科学工具在当前图像分析领域的使用方式,提出从细胞图像数据中获取新科学假设的计算优先方法,明确了该领域面临的挑战,并提出数据科学将发挥影响力的下一个前沿领域!
图像分析工作流程:(A)在典型的显微镜密集型研究项目中,科学家获取并观察图像,然后根据观察结果形成假设并进行量化检测。(B)论文作者提出,将来有必要调整这一次序:首先获取并量化图像,然后才与数据交互,以进一步形成并检验假设。
培养细胞生物学领域的新一代数据科学家
毫无疑问,数据科学可以彻底改变基于显微镜的细胞生物学,作者在论文中描述了如何培养细胞生物学方面的新一代数据科学家。细胞生物学以技术为驱动力,使用了大量来自生物化学、分子生物学、显微镜检查和基因组学的工具。高效的研究工作者需要能够采用其他领域的技术来推进他们的研究。越来越明显的一项技术就是从显微成像中提取定量信息,这项能力至关重要!
现代细胞生物学家应该能够将图像分析问题分解为子任务,使用现有的计算工具来解决每个子任务,然后系统分析输出。这需要熟悉细胞成像的常见图像分析程序,能够使用简单的编程将模块拼凑在一起,并具备统计学和机器学习的基本知识,以解释系统结果及其局限性。
Driscoll博士和Zaritsky博士认为,必须建立全面的跨学科培训计划,以弥合学科之间的技术和文化差距。统计学和其他数据科学工具应被视为现代生物学家基本培训的一部分。这些技能应该尽早获得,并在整个本科和研究生院持续使用——而不仅仅是在计算密集型课程中!
作者承认,虽然数据科学的实践教学只需要一台笔记本电脑,但缺乏合格的教师和合适的培训材料将是一个挑战。在提出这个问题之前,他们提出了一些可能的解决方案:数据科学家能否成为生物学家?对此,作者提出了让计算专业学生接触细胞成像和细胞生物学的奇妙世界的一些可行策略。
现代生物学正变得越来越复杂!
这种技术驱动的复杂性趋势是不可避免的,科研社区必须适应并接受它,以推动生物学向前发展。随着数据量的增加,更复杂的数据处理需要基础设施的发展进步。能够实现自动化分析的高敏感度、鲁棒性和可用性工具,将是处理大量数据和可再现地分析复杂数据集的关键。我们必须对学生进行数据科学技术培训,以帮助他们应用这些数据。
我们需要齐心协力,走进细胞成像数据科学的新时代!
阅读论文:
http://jcs.biologists.org/content/134/7/jcs254292?utm_source=wechat&utm_medium=social&utm_campaign=china