[口头报告]基于机器学习的月震数据去噪及事件分类方法

基于机器学习的月震数据去噪及事件分类方法
编号:1910 稿件编号:1692 访问权限:私有 更新:2023-04-10 22:15:19 浏览:311次 口头报告

报告开始:2023年05月07日 13:25 (Asia/Shanghai)

报告时间:10min

所在会议:[9B] 9B、地球物理与大地测量 » [9B-2] 9B-2 地球物理与大地测量

暂无文件

摘要
上个世纪七十至八十年代,阿波罗登月计划实现了人类第一次在地外天体布设地震仪器并实现地震数据回传。阿波罗计划中的被动地震实验包含了布设在不同地质单元上的四个宽频地震仪,在仪器正常工作期间为我们提供了宝贵的地震数据,它揭示了月球的内部结构,奠定了我们目前对于月球内部圈层结构的基础。但是,受限于当时技术条件和材料的限制,地震仪记录的数据会受到外界(例如太阳风,昼夜温差等)干扰,并且由于仪器工作模式原因,目前容易挖掘的数据也非常稀有。实际上,我们对目前月球内部结构的结果仍存在未知和争议。比如对月壳厚度的估计,从前人的十几公里到几十公里不等;月背地震活动性弱,是否存在液态外核;不同类型地震事件的构造成因等。这些月球内部结构和性质的不确定性限制了我们对月球的深入理解。
虽然月震数据的质量较差,但是长时间的记录仍能为我们提供宝贵的数据资源。这也成为我们使用机器学习来深度挖掘月震数据的动力。机器学习是基于概率模型对数据进行学习,既能从庞大的数据集中提取复杂的模式和有效的特征,也可以归纳演绎新模式,还有对异常数据较强的鲁棒性。因此,机器学习早已被地震学家应用在地球上的地震数据的挖掘工作中。但是,应用在月震数据,则是一次新的尝试。
在我们开展月震数据的挖掘工作中,数据的清洗尤为重要。阿波罗计划中的原始月震数据是记录在磁带中,随着技术的进步后进行数字化存储。在数据储存和格式转化中,会出现部分数据遗失、错误、颠倒等现象。我们首先需要对错误数据进行清除,然后对颠倒的数据重新排序。由于仪器自身原因,其采样频率也是随机变化的,所以我们还需要进行插值并重新采样。经过清洗后,我们仍能发现振幅异常的波形,我们称为“尖刺噪声”(“Glitch”)。前人使用中值滤波方法去处理月震数据,以去除尖刺噪声的影响。但是,尖刺噪声在数据中随机出现,因此我们只能输入完整的月震数据,会降低我们的效率。而且,中值滤波会对信号本身的振幅和相位产生影响。我们需要避免这种影响,因此,我们使用深度学习直接对波形中存在的尖刺噪声定位,随后将异常的数据置零,以完成数据的清洗工作。
在本工作中,我们使用长短期记忆-自编码器(LSTM-AE)对输入的可能存在有尖刺噪声的波形进行处理。LSTM-AE是使用编码器-解码器LSTM体系结构的序列数据自动编码器的实现。拟合后,模型的编码器部分可用于编码或压缩序列数据,而序列数据又可用于数据可视化或用作监督学习模型的特征向量输入。尖刺噪声本身相对于正常的波形存在着持续时间短、振幅异常变大的特征。因此,很难被网络重构,而对比重构前后的波形,无法被重构的部分就是尖刺噪声存在的部分。对于噪声,我们采用数值置零,以消除其对于频谱的影响。完成对尖刺噪声的处理后,便于我们开展后续工作。
前人对阿波罗台网运行期间的13000 多个月震事件进行了分类,并制作了对应的目录。主要分为深部月震、浅部月震、流星体撞击月震、热月震和人工撞击月震。其中人工撞击月震有着精确的震源信息和撞击事件。月震事件的规模通常比较下,最大的浅层月震的体波震级约为5级,而深层月震的最大震级约为3级。大多数的深部和浅部月震都可以在仪器上观测到。Nakamura等人(Nakamura et al., 1982; Nakamura,2005)利用波形互相关来确定月震事件的类型并完成深部月震的目录,发现它们有高度可重复的波形,说明它们起源于相似的区域。但是由于月震数据非常庞大,也存在很多事件无法成功分类,或是因为数据质量较差,糟糕的相位信息使得互相关结果失效。
所以我们使用 MultiRocket 机器学习算法对月震数据进行分类,并不同类别的月震数据的特征。我们使用Civilini等人(Civilini et al., 2021)整理好的具有较高信噪比的分类数据集作为我们模型的训练集,并从中取部分数据作为验证集。为了模型能更好学习特征,因此我们将三分量的波形数据统一输入进网络训练。MultiRocket 算法是创建若干个随机尺寸、随机权重的卷积核,在创建完成后其权重不再会变化。再将这些卷积核分别对数据卷积,来提取不同维度、不同角度的特征,在通过对特征进行分类,实现对时序数据的分类。经过 100 轮的训练,我们的网络可以做到 92%的分类准确率,即区分深部月震事件和撞击事件的准确率能够达到 92%。
SMOTE

我们通过神经网络对月震事件分类有较高的准确率,进一步可以通过其他的网络来提取分类特征,后续可以探讨不同月震事件对应的不同的波形特征。
 
关键字
月震,机器学习,去噪,分类
报告人
于智瀚
南京大学

稿件作者
于智瀚 南京大学
王涛 南京大学
发表评论
验证码 看不清楚,更换一张
全部评论

联系我们

会务总协调、疫情防控:

沈焕锋(13163235536;shenhf@whu.edu.cn)

管小彬(18007973663;guanxb@whu.edu.cn)

魏秀琴(15871750333;weixiuqin@whu.edu.cn)

会场安排:

沈焕锋(13163235536;shenhf@whu.edu.cn)

李长冬(15327198910;lichangdong2008@126.com)

张 亮(15827200707;lzhang@whigg.ac.cn)

徐 鹏(13554674258;xupengwhu@whu.edu.cn)

学术安排:

王伦澈(13349889828;wang@cug.edu.cn)

庄艳华(13349889826;zhuang@apm.ac.cn)

李星华(15527964369;lixinghua5540@whu.edu.cn)

会议注册:

管小彬(18007973663;guanxb@whu.edu.cn)

赵 林(18071070948;linzhao@whu.edu.cn)

会议财务:

张传喜(13627137374;zhangchuanxi@whu.edu.cn)

石玉婷(13476286537;yutingshi@vip.qq.com)

商业赞助:

阮志敏(15871826028;ruanzm@whu.edu.cn)

黄文丽(13693626212;wenli.huang@whu.edu.cn)

会议服务,酒店预定,网站、注册系统服务:

曹雪峰(18971567453;carol@chytey.com)

金钰壹(18271358859;jinyuyi@whu.edu.cn)

会务总协调、疫情防控:
沈焕锋(13163235536;shenhf@whu.edu.cn)
管小彬(18007973663;guanxb@whu.edu.cn)
魏秀琴(15871750333;weixiuqin@whu.edu.cn)
会场安排:
沈焕锋(13163235536;shenhf@whu.edu.cn)
李长冬(15327198910;lichangdong2008@126.com)
张 亮(15827200707;lzhang@whigg.ac.cn)
徐 鹏(13554674258;xupengwhu@whu.edu.cn)
学术安排:
王伦澈(13349889828;wang@cug.edu.cn)
庄艳华(13349889826;zhuang@apm.ac.cn)
李星华(15527964369;lixinghua5540@whu.edu.cn)
会议注册:
管小彬(18007973663;guanxb@whu.edu.cn)
赵 林(18071070948;linzhao@whu.edu.cn)
会议财务:
张传喜(13627137374;zhangchuanxi@whu.edu.cn)
石玉婷(13476286537;yutingshi@vip.qq.com)
商业赞助:
阮志敏(15871826028;ruanzm@whu.edu.cn)
黄文丽(13693626212;wenli.huang@whu.edu.cn)
会议服务,酒店预定,网站、注册系统服务:
曹雪峰(18971567453;carol@chytey.com)
金钰壹(18271358859;jinyuyi@whu.edu.cn)
注册缴费 提交稿件