神经网络通过研究任意单个星系，揭示整个宇宙的组成

demi 在周一, 07/04/2022 - 09:44 提交

宇宙学家通常通过尽可能多地观察宇宙来确定宇宙的组成。但这些研究人员发现，机器学习算法可以检查单个模拟星系，并预测其存在的数字宇宙的整体构成——这一壮举类似于在显微镜下分析随机沙粒，并计算出欧亚大陆的质量。这些机器似乎找到了一种模式，有朝一日，天文学家可能仅通过研究其基本组成部分就可以得出关于真实宇宙的全面结论。

「这是一个完全不同的想法，」纽约熨斗研究所（ Flatiron Institute）的理论天体物理学家、该工作的主要作者 Francisco Villaescusa-Navarro 说。「不用测量这数百万个星系，你可以只取一个，这真的很神奇。」

Francisco Villaescusa-Navarro

不应该的。这个不可思议的发现源于 Villaescusa-Navarro 给普林斯顿大学本科生 Jupiter Ding 做的一个练习：建立一个神经网络，通过了解一个星系的属性，可以估计几个宇宙学属性。这项任务只是为了让 Ding 熟悉机器学习。然后他们注意到计算机正在确定物质的整体密度。

「我认为学生犯了一个错误，」Villaescusa-Navarro 说。「说实话，我有点难以置信。」

随后的调查结果发表在 1 月 6 日的预印本中，该预印本已提交出版。研究人员分析了宇宙学和天体物理学与机器学习模拟 (CAMELS) 项目生成的 2,000 个数字宇宙。这些宇宙有一系列的成分，包含 10% 到 50% 的物质，其余的由暗能量组成，这使得宇宙膨胀得越来越快。（我们实际的宇宙由大约三分之一的暗物质和可见物质，以及三分之二的暗能量组成。）随着模拟的进行，暗物质和可见物质一起旋转形成星系。模拟还包括对对复杂事件的粗略处理，比如超新星和超大质量黑洞喷发出的喷流。

论文链接：https://arxiv.org/abs/2201.02202

Ding 的神经网络研究了这些不同数字宇宙中近 100 万个模拟星系。从它神一般的角度来看，它知道每个星系的大小、组成、质量，以及其他十几个特征。它试图将这个数字列表与母宇宙中的物质密度联系起来。

它成功了。当对来自数十个以前从未检查过的宇宙的数千个新星系进行测试时，神经网络能够将宇宙物质密度预测在 10% 以内。「你正在考虑哪个星系并不重要，」Villaescusa-Navarro 说。「没有人想到这是可能的。」

「一个星系的密度可以达到 10% 左右，这让我非常惊讶，」马克斯普朗克天体物理研究所模拟星系形成的专家 Volker Springel 说，他没有参与这项研究。

该算法的性能让研究人员感到惊讶，因为星系本质上是混沌物体。有些是一次性形成的，有些则通过「吃邻居」来成长。巨型星系倾向于保留它们的物质，而矮星系中的超新星和黑洞可能会喷射出大部分可见物质。尽管如此，每个星系都以某种方式设法密切关注其宇宙中物质的总体密度。

一种解释是「宇宙、星系在某些方面比我们想象的要简单得多，」加拿大西安大略大学的天文学家 Pauline Barmby 说。另一种是模拟存在无法识别的缺陷。

该团队花了半年时间试图了解神经网络是如何变得如此聪明的。「神经网络非常强大，但它们超级懒惰，」Villaescusa-Navarro 说。

通过一系列实验，研究人员了解了该算法是如何预测宇宙密度的。通过反复训练网络，同时系统地掩盖不同的星系属性，他们将注意力集中在最重要的属性上。

排名靠前的是一个与星系旋转速度相关的属性，它与星系中心区域有多少物质（暗物质和其他物质）有关。据 Springel 称，这一发现与物理直觉相符。在一个充满暗物质的宇宙中，你会期望星系变得更重并且旋转得更快。所以你可能会猜测旋转速度与宇宙物质密度相关，尽管这种关系本身就太粗略了，没有太大的预测能力。

神经网络发现了大约 17 个星系属性与物质密度之间更精确和复杂的关系。尽管星系合并、恒星爆炸和黑洞爆发，这种关系仍然存在。新西兰奥克兰大学的宇宙学家 Shaun Hotchkiss 说：「一旦你得到了两个以上的属性，你就无法绘制它，并用眼睛眯着眼睛观察趋势，但神经网络可以。」

虽然该算法的成功提出了一个问题，即可以从对一个星系的彻底研究中提取出多少宇宙特征，但宇宙学家怀疑现实世界的应用将受到限制。当 Villaescusa-Navarro 的小组在不同的属性（宇宙块状）上测试他们的神经网络时，它没有发现任何模式。Springel 预计，其他宇宙学属性，例如由于暗能量导致的宇宙加速膨胀，对单个星系几乎没有影响。

这项研究确实表明，理论上，对银河系和其他一些附近星系的详尽研究，可以使我们能够对我们宇宙的物质进行非常精确的测量。Villaescusa-Navarro 说，这样的实验可以为其他数量的宇宙输入提供线索，例如宇宙中三种类型中微子的未知质量的总和。

但在实践中，该技术必须首先克服一个主要弱点。CAMELS 合作使用两种不同的方法来制造它的宇宙。根据其中一种方法训练的神经网络，在给出根据另一种方法「烘焙」的星系时，会做出错误的密度猜测。交叉预测失败表明神经网络正在寻找每个配方规则独有的解决方案。它当然不知道如何处理银河系，一个由真实物理定律塑造的星系。在将该技术应用到现实世界之前，研究人员需要使模拟更加逼真，或者采用更通用的机器学习技术——这是一项艰巨的任务。

「这些可能性给我留下了深刻的印象，但人们需要避免过于得意忘形，」Springel 说。

但 Villaescusa-Navarro 对神经网络能够在两个独立模拟的杂乱星系中找到模式感到振奋。这一数字发现增加了这样一种可能性：真实的宇宙可能隐藏着一种类似的大与小之间的联系。
「这是一件非常美好的事情，」他说。「它在整个宇宙和单个星系之间建立了联系。」

参考内容：
https://www.quantamagazine.org/with-one-galaxy-ai-defines-a-whole-simulated-universe-20220120/

本文转自：ScienceAI，转载此文目的在于传递更多信息，版权归原作者所有。如不支持转载，请联系小编demi@eetrend.com删除。

13张动图快速理解马尔科夫链、PCA、贝叶斯！	使用LIME解释CNN	机器学习降维算法二：LDA（Linear Discriminant Analysis）
在神经网络中，牢不可破的锁可以隐藏看不见的门	Kaggle知识点：7种超参数搜索方法	XGBoost类库使用小结

神经网络通过研究任意单个星系，揭示整个宇宙的组成

最新文章

最新文章