AI可能真的比人更懂这个宇宙

AI可能真的比人更懂这个宇宙
文章图片
宇宙“创造”了人类 , 人类创造了AI 。 但似乎 , AI比人类更“懂”这个宇宙 。
用AI来帮助有“中国天眼”之称的世界最大单口径射电望远镜FAST更好寻找星星的“探星计划”启动已过一年 , FAST找到了22颗脉冲星候选体 。 在没有AI帮助时 , 这很难做到 。
AI可能真的比人更懂这个宇宙】去年的世界人工智能大会上 , 腾讯与国家天文台合作的“探星计划”宣布正式启动 。 腾讯优图实验室的计算机视觉技术能力、腾讯云计算及存储能力 , 将会帮助中国天眼FAST提升脉冲星搜索效率 , 并辅助快速射电暴和近密双星系统中脉冲星的搜索 。
在今年世界人工智能大会的腾讯论坛上 , “探星计划”到目前为止的最新进展首次披露 。
腾讯云副总裁、腾讯优图实验室总经理吴运声表示 , 截至目前 , 优图AI天体探索方案已从巡天观测数据中找到22颗脉冲星候选体 。 其中包括在天体物理中具有较高观测研究价值的高速自转的毫秒脉冲星7颗 , 具有间歇辐射现象的年老脉冲星6颗 。
此外 , 优图实验室的动态谱AI模型还首次探测到了某磁陀星射电脉冲 。
这是FAST与腾讯优图实验室连续第二年一同出现在世界人工智能大会上 , 背后是天文探索与AI的结合愈发紧密 。
AI在几十亿张图片中找10颗星星2017年10月10日 , 中国科学院国家天文台公布世界最大单口径射电望远镜 , 也就是被称为“中国天眼”的FAST所取得的首批成果 。 其中最重要的一项是我国射电望远镜首次发现脉冲星 。 而最新的公开资料显示 , FAST已经捕获了超过660颗脉冲星 。
但FAST的观测只是发现脉冲星的第一步 , 这个500米口径的庞然巨物带来的是峰值每秒接近40G的数据量 , 以多模态的数据形式传输回来 。 于是一个天文问题被转化成了数据标注问题 。 如何在海量而极其相似的数据中判断出目标星体的信号 , 是FAST团队最核心的工作 。
AI可能真的比人更懂这个宇宙
文章图片
“这份22颗脉冲星的候选名单中 , 短周期的脉冲星发现大概是在10颗左右 , 我们是在几十亿张图片中找到这10颗脉冲星的” , 复旦大学教授池明旻做了个粗略的比方 , 她也是“探星计划”中一位同时拥有计算机和天文领域背景的研究成员 。
通过大数据训练 , 机器学习能为天体探索标注处理掉其中很大一部分“一眼假”的数据信息 , 这种能力通过“半监督学习”来实现 。
半监督学习属于无监督学习(没有任何标记的训练数据)和监督学习(完全标记的训练数据)的中间地带 。 以少量标记数据结合大量未标记数据 , 在机器学习领域中被认为可以明显提高机器学习的准确性 , 在对于脉冲星信号数据的辨识中 , 这些“标识数据”可以被理解为天文工作者抽取了某些图片预先做了标注 , 这些标注形成一个初筛的判断标准后会对接收到的所有图片做第一次的过滤 。
“比如色散值 , 色散有一个曲线 , 这个曲线如果没有峰值的话 , 我们就可以排除掉它是脉冲星的可能” , 池明旻表示 , “因此我们在机器学习面有一个色散值的判定标注就非常重要 。 当捕获的天体信号精度足够高 , 色散值就可以起到过滤的作用” , 池明旻说 。
色散值是FAST接收到天体数据的其中一个纬度 。 天体研究中的数据信息往往是跨模态的 , 这有利于对天体是否是脉冲星的综合判断 。 腾讯优图实验室提供的AI解决方案中加入了包括频率、色散以及相位的多模态融合的技术 , 这是腾讯优图实验室为天体探索提供的另一项关键能力 。