唱作人高姗七年前在一本电子舞曲的书中看到这句话,“我当时就觉得音乐和星系、宇宙是相同的,音乐有频率和振动,脉冲星信号也有频率、周期,从而转换为音频产生振动。”
9月23日晚,一场特别的“寻找宇宙心跳”脉冲星演奏会在微信
视频号上直播,高姗创作的一首《遇见你的时候所有星星都落在我头上》歌中,前奏、间奏融合了编号为113的脉冲星的声音,歌曲结束部分融合了114编号的脉冲星的音频,听起来像是水烧开后沸腾的声音。
除了高姗,还有六位新锐音乐人也以脉冲星声音为核心创作歌曲,传递脉冲星信号转换而来的“宇宙心跳”声。这场演奏会,是由腾讯优图实验室与国家天文台、澎湃新闻、复旦大学计算机科学技术学院联合发起的。跨界科技和艺术,吸引了不少天文爱好者的关注,也让更多人进一步接触到天文宇宙的相关知识。
“脉冲星是大质量恒星演化晚期的致密残留物,距离我们非常遥远,可见光波段的信号非常微弱。"博士毕业于中国科学院国家天文台、目前是复旦大学计算机科学技术学院博士后、同时也是“探星计划”的参与者王珅,在直播中表示,在已知的大质量恒星演化晚期产物中,脉冲星属于稳定发射脉冲信号的一类中子星,其会周期性产生一个一个如同脉冲一样的射电信号,形象把它称为脉冲星。
(左起)王珅、王亚彪、池明旻讲述AI+天文的探索历程
“脉冲星还有一些特征,例如自转的时间特别地短,按毫秒来计算,有的甚至自转周期只有几毫秒,蜜蜂还来不及振动一次翅膀,相当于人类心跳一下,那里就度过了几百天。”腾讯优图实验室专家研究员王亚彪在直播中补充说。
如何探索脉冲星?如何将脉冲星的基本特征如轮廓、频率映射到声谱,构造出脉冲星独特的声纹?这背后有着怎样的渊源、技术和故事?在新时代进一步加强科学技术普及工作的大背景下,这显得意义深远。
脉冲星,遭遇发现“瓶颈”
早在1976年发现时,因为脉冲星会发出一个规律性的信号,一度被认为可能是外星文明给我们发了信号,所以称之为小绿人。
2016年9月25日,被誉为“中国天眼”的500米口径球面射电望远镜(Five-hundred-meterApertureSphericalradioTelescope,简称FAST)落成启用。因为接收面积非常大,所以它的灵敏度非常高,能接收到其他望远镜看不到的比较弱的辐射脉冲。截止至今年7月,“中国天眼”已经发现了660余颗新脉冲星。但是FAST的观测只是发现脉冲星的第一步。
复旦大学计算机科学技术学院副教授、博士生导师池明旻在直播中提及了利用中国天眼FAST发现脉冲星过程中的其他难点,比如对于脉冲星搜索任务,按目前的观测时间分配,FAST每周可能产生近500TB的脉冲星观测数据,这些数据经过预处理后,产生3000万~1亿张信号图,如果靠专家人工从这些
图片中寻找可能的脉冲星,1个科研工作者需花至少一年时间才能完成,是非常大的工程。这就亟需人工智能(AI)技术辅助。
而顺着人工智能(AI)技术的思路往下走,又面临新的问题,比如FAST现有脉冲星的样本量较少,自FAST启用以来,中国已发现600多颗脉冲星,但数据隶属于不同科研项目,当前公开可用于AI模型训练的正样本不到100颗,而且这些可以被训练的数据,与当前要处理的要预测的数据分布不一致,这也对AI模型的设计带来很大的挑战。
“转机发生在2021年,腾讯优图从基础研究到产业落地的战略正在全面铺开,从AIforindustry尝试延展到AIforscience。腾讯优图在了解到我们的科研项目后,迅速加入进来,所以在2021年7月宣布了‘探星计划’。“池明旻说。
“云+AI”加持,发现脉冲星
2021年7月,腾讯与国家天文台,携手复旦大学计算机科学技术学院联合启动了“探星计划”,基于腾讯优图实验室领先的计算机视觉技术、腾讯云的计算能力,用“云+AI”帮助中国天眼FAST处理每天接收到的庞大数据,并通过视觉AI分析找到脉冲星线索。
腾讯优图实验室专家研究员王亚彪表示,探星过程中有了云+AI,由中国天眼FAST收集回来的太空信号转化成图像后,可以获取不同维度的信息,比如色散、相位、时间、频率等。通过多模态输入信号的深度融合,将不同维度的信号图进行关联分析,这样就提高脉冲周期信号确认的可信度,提升寻找脉冲星的效率和准确率。
同时,为了解决样本学习量不足的问题,探星计划团队设计了半监督域迁移学习的解决方案——使用非FAST观测设备获取的标记数据,并同时使用少量FAST标记数据以及大量未标记数据进行深度神经网络建模。通过半监督学习获得“伪标签”数据,模型训练可用的样本要比人工标注大的多,因此极大提升了脉冲星自动识别能力。
在工业界和学术界的共同努力下,同等算力下,“云+AI”的方式助力寻找脉冲星的数据处理效率提升了120倍。新设计的多模态+半监督学习的AI解决方案,相比业界原有的AI筛选模型,不仅具有更高的召回率,也促进误报率下降98%。
经过8个月的努力,云+AI已从巡天观测数据中寻找超过22个脉冲星。“这22颗脉冲星,其实是在几十亿张图片中找到的。”王亚彪说。
此次“寻找宇宙心跳”脉冲星演奏会,脉冲星的声音来源,正是将最新发现的8颗脉冲星的基本特征如轮廓、频率映射到声谱上,由此形成脉冲星的声纹。
科技向善,科普与科创并重
“这次特别的演奏会,我们希望通过科技+艺术结合,能够让更多人了解脉冲星,对天文探索产生兴趣。”腾讯优图实验室专家研究员王亚彪说,了解得越深入,越感觉到生命的渺小,对宇宙更存敬畏之心。
就像康德说的:有两种东西,我对他们的思考越是深沉和持久,他们在我心灵中唤起的赞叹和敬畏就会越来越历久弥新,一个是我们头顶上浩瀚璀璨的星空,一是我们心中崇高的道德法则。
探索宇宙的脚步持续向前,以“科技向善”为牵引,人工智能的
应用不仅面对当下,也看向未来。
据了解,2022年腾讯与国家天文台、复旦大学计算机科学技术学院共同开启对M31仙女座星系的射电信号处理,这也是天文界对该星系中脉冲星类致密天体的最深度完整探测。
“目前通过三方合作找到的22颗脉冲星,都在银河系内。我们希望利用FAST高灵敏度特点,通过设计的AI模型开启M31仙女座星系中脉冲星类致密天体的探索,希望有更多的年轻人参与到这从0到1的探索研究中来。让大家能聆听到银河系外宇宙的‘心跳’!”复旦大学计算机科学技术学院副教授、博士生导师池明旻在直播中说。
确实,在这个过程中,科普是非常重要的一环。
2022年9月,中共中央办公厅、国务院办公厅印发的《关于新时代进一步加强科学技术普及工作的意见》指出,科学技术普及是国家和社会普及科学技术知识、弘扬科学精神、传播科学思想、倡导科学方法的活动,是实现创新发展的重要基础性工作。要面向群众实际需求和经济社会发展典型问题,积极开展针对性强的高质量公益科普;坚持把科学普及放在与科技创新同等重要的位置,强化全社会科普责任,提升科普能力和全民科学素质。广大科技工作者要增强科普责任感和使命感,发挥自身优势和专长,积极参与和支持科普事业,自觉承担科普责任。注重提升科普能力,运用公众易于理解、接受和参与的方式开展科普。
可见,全民科普,是趋势所向,不是选择题,而是必选题,腾讯优图实验室与国家天文台、复旦大学计算机科学技术学院等发起的这场特别的演奏会直播,为大家提供了一个“恰逢其时”的创新科普样本。