微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

太空探索，PB级海量数据怎么处理？

太空探索，PB级海量数据怎么处理？

作者：科技行者

2021-07-20 17:34

分享至：

天文学家正着手运用AI技术构建新工具，希望在太空探索中获得新的重大突破。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2021-07-20 17:34 • 科技行者

天文学的核心在于数据。随着我们对宇宙的理解愈发深邃，我们掌握的信息也越来越丰富。而下一代天文学研究的核心挑战，就在于如何充分研究我们收集到的这些数据。

为了应对这些挑战，天文学家们开始转向机器学习与人工智能(AI)，希望借此构建新工具并快速寻求新的重大突破。而AI科技也正通过以下四种方式为天文学家提供助力。

1、发现星球

发现一颗行星可以通过多种方式，但成功率最高的靠谱方法还是对凌日现象的研究。所谓凌日，就是当某颗系外行星从其绕行的恒星前面经过时，必然会阻挡到我们所能观察到的光。

通过观察系外行星的不同轨道，天文学家们构建起凌日图像，并借此识别目标行星的实际特性——例如其质量、大小以及与恒星间的距离。NASA的开普勒太空望远镜就利用这项技术取得了巨大成功，能够同时观测数千颗恒星并密切关注各自行星产生的凌日现象。

当行星运行至所围绕恒星前面时，我们会看到光线减弱，这就是所谓凌日现象。

天文学家能够准确观测到凌日现象，但相关技能需要一定时间进行培养。随着人们越来越多地致力于寻求新的系外行星，单凭人力已经很难跟上NASA过境系外行星调查卫星的捕捉速度。在这方面，AI技术正好有机会大显身手。

将时序分析技术——将数据作为时间序列进行分析——与AI技术相结合，能够以高达96%的准确率成功识别系外行星信号。

2、引力波

时序模型不仅适用于寻找系外行星，同时也能有效跟踪到宇宙中最具破坏力的灾难性信号——黑洞或中子星的坍缩。

当这些密度极大的天体内陷收缩时，会在时空当中产生巨大的引力涟漪，人类则可通过测量地球上出现的微弱信号检测到这些涟漪。引力波探测器合作公司Ligo及Virgo已经在机器学习的帮助下，成功识别出数十次这类事件的发生。

借助黑洞坍缩模拟数据训练出的模型，Ligo和Virgo团队能够在事件发生的瞬间将其发现，并向世界各地的天文学家们发出通报，引导他们及时将望远镜指向正确的方位。

3、多变的天空

目前智利正着力建造的维拉鲁宾天文台一旦正式上线，将能够每晚测量整个夜空并一次性收集超过80 TB的图像数据，全面观测宇宙中各恒星及星系如何随时间而变化。顺带一提，1 TB代表8,000,000,000,000比特。

根据运营计划，未来维拉鲁宾天文台将收集并处理高达数百PB规模的数据。作为参考，Facebook上全部图像存储所占的全部空间约为100 PB，换算成全高清视频长度约为700年。

很明显，如此庞大的数据总量恐怕无法登录服务器进行下载;即使下载完成，也无法快速完成内容查找。

机器学习技术将帮助我们搜索数据内容并凸显其中的重要信息。例如，算法可能会在图像中搜索到罕见事件，例如超新星爆发(即恒星生命周期结束时产生的剧烈爆炸)，或者寻找到新的类星体。通过训练计算机识别出特定天文现象的对应信号，该团队希望能更高效地将正确数据交付给正确的研究人员。

4、引力透镜

随着我们收集到的宇宙数据越来越多，研究人员有时候被迫整理并丢弃掉一部分无用的数据。那么，我们该如何甄别哪些数据有价值、哪些信息可以直接清退?

目前众多天文学家都高度关注着一种重要天体现象——强引力透镜。具体来讲，当两个星系沿着我们的视频排列时，距我们较近星系的引力就会发挥引力透镜作用，对较远星系的活动进行放大——由此产生包括环状、十字及重影图像。

但要找到这些图像如同大海捞针——在这片可预测宇宙的海洋中寻找宝贵的一瞬。我们收集到的星系图像越多，搜索难度也将随之攀升。

2018年，来自世界各地的天文学家们共同参与一项强引力透镜挑战赛，各方开展激烈竞争、希望看看谁能设计出自动找到这类透镜的最佳算法。

这项挑战的获胜者采用一种名为卷积神经网络的模型，该模型会学习使用不同的过滤器拆分图像内容，直到准确将其分类为是否包含透镜效应。令人惊奇的是，这些模型甚至比人类表现还要好，神经网络确实能够发现人类难以留意的某些图像细节与微小差异。

在未来十年当中，天文学家将使用维拉鲁宾天文台等新仪器收集数以PB计的数据，即数千TB。随着我们探索宇宙的脚步不断迈进，机器学习技术也将成为天文学家们研究工作中必不可少的重要依托。

分享至

0赞

好文章，需要你的鼓励

推荐文章

人工智能
动态专家搜索
推理优化

2025-10-22 13:24

浙江大学突破：让AI专家团队在考试时"动态组队"，推理能力飙升

浙江大学团队提出动态专家搜索方法，让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率，且不增加计算成本。研究发现不同类型问题偏爱不同专家配置，为AI推理优化开辟新路径。
人工智能
强化学习
模型优化

2025-10-22 13:24

清华大学新突破：AI模型居然能学会"少说话多做事"，推理效率提升一倍还更准确

清华大学研究团队提出SIRI方法，通过"压缩-扩张"交替训练策略，成功解决了大型推理模型"话多且准确率低"的问题。实验显示，该方法在数学竞赛题上将模型准确率提升43.2%的同时，输出长度减少46.9%，真正实现了效率与性能的双重优化，为AI模型训练提供了新思路。
人工智能
视频生成
实时流媒体

2025-10-22 13:24

南洋理工大学突破性研究：用AI实现多分钟视频实时流式生成，就像看电视直播一样

南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术，实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新，解决了长视频生成中的错误累积问题，可在单GPU上以16fps速度生成多分钟高质量视频，延迟仅0.76秒，质量漂移指标从传统方法的1.66降至0.01，为交互式媒体和内容创作开辟新可能。
人工智能
几何学习
空间智能

2025-10-22 10:14

华中科技大学团队突破性发现：让AI像几何学家一样思考，竟能大幅提升空间理解能力

华中科技大学研究团队发现，通过让AI模型学习解决几何问题，能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集，使用强化学习方法训练多个AI模型。实验结果显示，几何训练在四个空间智能测试基准上都带来显著提升，其中最佳模型达到49.6%准确率，超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。

浙江大学突破：让AI专家团队在考试时"动态组队"，推理能力飙升

浙江大学突破：让AI专家团队在考试时"动态组队"，推理能力飙升

2025-10-22 13:24

清华大学新突破：AI模型居然能学会"少说话多做事"，推理效率提升一倍还更准确

清华大学新突破：AI模型居然能学会"少说话多做事"，推理效率提升一倍还更准确

2025-10-22 13:24

南洋理工大学突破性研究：用AI实现多分钟视频实时流式生成，就像看电视直播一样

南洋理工大学突破性研究：用AI实现多分钟视频实时流式生成，就像看电视直播一样

2025-10-22 13:24

华中科技大学团队突破性发现：让AI像几何学家一样思考，竟能大幅提升空间理解能力

华中科技大学团队突破性发现：让AI像几何学家一样思考，竟能大幅提升空间理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情链接

京ICP证15039648号京ICP备15039648号-9 京公网安备 11010802021500号

北京第二十六维信息技术有限公司（至顶网）版权所有。 | 联络我们

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱: jubao@zhiding.cn 　网上有害信息举报专区：https://www.12377.cn