机器学习结合了硬科学,听说过图神经网络吗?粒子物理学家也在用

来源:ScienceAI
编辑:白菜叶


长期以来,粒子物理学家一直是从电子邮件到互联网的技术的早期采用者——如果不是发明者的话。因此,早在 1997 年,研究人员就在训练计算机模型来标记碰撞过程中产生的杂乱喷流中的粒子,这并不奇怪。从那时起,这些模型一直在不断发展,越来越有能力——尽管并不是每个人都喜欢。

麻省理工学院的理论粒子物理学家 Jesse Thaler 说:「我对机器学习感到非常威胁。」 最初,他说他觉得这危及了他对粒子射流进行分类的人类专业知识。但 Thaler 后来开始接受它,将机器学习应用于粒子物理学中的各种问题。「机器学习是一个合作者。」他说。

在过去的十年中,随着更广泛的深度学习革命,粒子物理学家训练了算法来解决以前难以解决的问题并应对全新的挑战。

首先,粒子物理数据与机器学习中使用的典型数据有很大不同。尽管卷积神经网络(CNN)已被证明在对从树木到猫到食物的日常物体图像进行分类方面非常有效,但它们不太适合粒子碰撞。根据加州大学圣地亚哥分校的粒子物理学家 Javier Duarte 的说法,问题在于大型强子对撞机等碰撞数据自然不是图像。

LHC 上对碰撞的浮华描绘可能会误导整个探测器。实际上,数百万输入中只有少数在记录信号,例如带有几个黑色像素的白屏。这种人口稀少的数据导致图像质量不佳,但它可以在不同的、更新的框架——图神经网络(GNN)中很好地工作。

粒子物理学的其他挑战需要创新。加州大学欧文分校的粒子物理学家 Daniel Whiteson 说:「我们不只是进口锤子来敲钉子……我们有新的怪异钉子,需要发明新的锤子。」一个奇怪的问题是大型强子对撞机产生的大量数据——大约每秒 1 PB。在这巨大的数量中,只有一小部分高质量的数据被保存下来。为了创建一个更好的触发系统,在消除低质量数据的同时尽可能多地保存好数据,研究人员希望训练一种敏锐的算法来比硬编码的算法更好地进行排序。

但要有效,这样的算法需要非常快速,在微秒内执行,Duarte 说。为了解决这些问题,粒子物理学家正在推动剪枝和量化等机器技术的极限,以使他们的算法更快。即使有一个有效的触发器,LHC 也必须在未来几年的数据收集中存储 600 PB(相当于大约 660,000 部 4K 分辨率的电影或相当于 30 个美国国会图书馆的数据),因此研究人员正在研究压缩数据的策略。

机器学习还允许粒子物理学家对他们使用的数据进行不同的思考。他们没有专注于单个事件——比如一个希格斯玻色子衰变为两个光子——他们正在学习考虑在碰撞过程中发生的几十个其他事件。尽管任何两个事件之间都没有因果关系,但像 Thaler 这样的研究人员现在正在接受更全面的数据视图,而不仅仅是通过交互分析事件交互产生的零碎观点。

更引人注目的是,机器学习还迫使物理学家重新评估基本概念。「我自己对什么是对称性的思考并不准确。」 Thaler 说,「强迫自己教电脑什么是对称,这帮助我理解了对称到底是什么。」对称性需要一个参考系——换句话说,一个扭曲的球体在镜子中的图像实际上是对称的吗?如果不知道镜子本身是否变形,就无法知道。

这些仍然是粒子物理学机器学习的早期阶段,研究人员正在有效地将这项技术视为众所周知的厨房水槽。「它可能并不适合粒子物理学中的每一个问题。」Duarte 承认。

随着一些粒子物理学家深入研究机器学习,一个令人不安的问题浮出水面:他们是在做物理学,还是计算机科学?反对编码的污名——有时不被认为是「真正的物理学」——已经存在;类似的担忧围绕着机器学习展开。一个担忧是机器学习会掩盖物理学,将分析变成一个自动化过程的黑匣子,人类无法理解。

「我们的目标不是将机器、实验接入网络并让它发表我们的论文,这样我们就脱离了循环。」Whiteson 说。他的团队正在努力让算法以人类可以理解的语言提供反馈——但算法可能不是唯一有责任进行交流的人。

「一方面,我们希望机器学会像物理学家一样思考,同样我们还需要学习如何像机器一样思考。」Thaler 说,「我们需要学会说彼此的语言。」

相关报道:https://spectrum.ieee.org/machine-learning-in-physics

最新文章