機械学習と物理モデルのハイブリッドでより良い地震動予測へ

地震・津波の提供情報
コラム
機械学習と物理モデルのハイブリッドでより良い地震動予測へ

１．はじめに

　近年のAI・機械学習は発展著しく、囲碁や将棋などでの強化学習の成功や自動運転を可能とする物体認識技術の確立など、様々な分野で成果を挙げています。国立研究開発法人防災科学技術研究所（以下、防災科研）では、観測データを用いて地震動や津波の即時予測技術や地震発生可能性の長期評価の高度化に貢献する研究開発を進めており、その一環として地震動データへの機械学習の適用を図っています。ここでは機械学習に基づく地震動指標の予測を試みた研究Kubo et al. （2020）を紹介します。

２．従来手法：地震動予測式

　地震による揺れを予測する地震動予測は、地震防災分野における主たる研究課題の一つです。将来の地震災害に備えるための地震ハザード評価や地震発生直後の緊急地震速報などで使われている地震動予測技術を高精度化していくことは、自然災害に対する社会のレジリエンス（特に防災力・減災力）の向上につながります。Kubo et al. （2020）では、ある規模の地震がある場所で発生した（する）という情報が与えられたときに、任意の場所での地震による揺れの強さ（震度や地表最大加速度などの指標値）を予測する問題を考えています。これまでは地震動予測式と呼ばれる過去の記録に基づいた経験式によって予測されてきました。地震動予測式は、地震の揺れに影響する要素を地球物理学の知見に基づいてモデル化し、地震動強さの指標と説明変数を結び付けた関数形を仮定した上で、過去記録を用いた回帰分析を行うことで得られる方程式のことです。その計算の手軽さから、大量計算が必要な地震ハザード評価や、迅速な計算が必要となる緊急地震速報などで活用されています。
　地震動予測式はこれまでの学術的知見に基づく物理モデルを方程式の形で表現しているため、発生頻度が少ない事象を予測する場合でも、ある程度の予測性能を発揮すると考えられます。しかし方程式の関数形をあらかじめ仮定しており、この点での柔軟性に乏しいため、データが仮定した関数形とは異なる傾向を持っていた場合に、その傾向を表現できないということになります。他方で機械学習は様々な要素が複雑に影響しあう事象について、データに基づく予測を精度よく行うことができます。地震動予測への適用の場合、従来は事前に仮定していた方程式の関数形を、データに基づいて導き出すことができる点が大きな利点です。このデータに基づいて関数形を導き出す利点と、これまでは方程式に組み込むことが難しかった情報を新たに柔軟に追加できる利点から、機械学習を用いることによる地震動予測の精度向上が期待されます。

３．機械学習の適用と地震動データ特有の困難

　Kubo et al. （2020）で作成した予測器では、目的変数を地表最大加速度とし、説明変数には震央と予測地点の間の距離、地震の規模、地震の深さ、予測地点の直下の堆積層の厚さおよび表層付近の地盤の軟弱さの5つのパラメータを用いました。機械学習アルゴリズムには、アンサンブル学習を行うランダムフォレストの派生であるExtremely Randomized Treesを使いました。
　データには、防災科研が運用する陸海統合地震津波火山観測網MOWLASの一つである強震観測網K-NET、 KiK-netの約20年間の地震動記録を用いました。K-NET、 KiK-netは強い揺れを振り切れることなく、確実にとらえることを目的とした観測網であり、全国約1,700ヶ所に展開しています。訓練データとして1997年から2015年までに発生した2,082地震による計186,310の地震動記録を用意しました。またテストデータとして2016・2017年に発生した208地震による計22,323の地震動記録を別途用意し、性能検証に用いました。
　2016年熊本地震本震における観測と機械学習モデルによる予測の比較を図1（a, b）に示します。同地震はテストデータに含まれる地震です。この地震の際には1,000galを越えるもしくはそれに迫る強い揺れが観測されていますが、機械学習による予測ではこの強い揺れを再現できておらず、半分以下の予測値となっており、強い揺れを過小評価していることがわかります。データ全体における観測と予測の比較を図2（a）に示します。観測値が500galを越える場合、予測値が観測値よりも小さい、つまり強い揺れが過小に評価されるというバイアスが機械学習モデルによる予測にはあることがわかります。　なぜこのようなバイアスが生じてしまったのか。機械学習はデータに基づいて予測・識別を行うため、データに大きな偏りがある場合、機械学習モデルの出力にバイアスが生じる可能性があることが指摘されています。その最たる例が顔認識アルゴリズムをめぐる議論です。大手テック企業の顔認識アルゴリズムの認識性能がジェンダー・肌の色によって異なることが指摘されており、白人男性が多いという訓練データの偏りが原因とみられています。地震動データも大きな偏りを持つ不均衡データであり、震度7のような強い揺れの観測記録は非常に少ない一方で、弱い揺れの観測記録は豊富にあるという特徴を持ちます。このような不均衡なデータを学習したため、強い揺れの過小評価という予測バイアスが引き起こされたのではないかと考えています。

４．機械学習と地震動予測式のハイブリッド

　このような地震動データ特有の困難に対応するために、データに合わせて柔軟かつ高精度な予測が可能である機械学習と、物理モデルに基づくことによって発生頻度が少ない事象の予測性能がある程度担保されている地震動予測式を組み合わせたハイブリッド予測アプローチをKubo et al. （2020）では考えました。具体的には、物理モデルに基づく従来の予測式による予測と観測の残差を学習した機械学習モデルを作成しておき、ハイブリッドアプローチの予測として従来予測式による予測値と機械学習による予測値を足し合わせた値を出力します。
　2016年熊本地震本震およびデータ全体における、機械学習・地震動予測式・ハイブリッドアプローチのそれぞれの結果を図1と図2に示します。ここでの地震動予測式は先行研究に則って今回用意した訓練データで作成したものです。比較の結果、ハイブリッド予測アプローチは単一の予測手法に比べて予測性能が良く、強い揺れの過小評価が改善されていることが確認できました。

図1　2016年熊本地震本震における地表最大加速度（PGA）の
（a）観測、（b）機械学習モデルによる予測、
（c）ハイブリッドアプローチによる予測、（d）地震動予測式による予測。
暖色ほど地震の揺れが強いことを表す。図中の×は同地震の震央位置を表す。

図2　訓練データおよびテストデータにおける観測値と予測値の比較。（a）は機械学習モデルの結果、（b）はハイブリッドアプローチの結果、（c）は地震動予測式の結果を示す。

５．まとめ

　今回の成果は、機械学習の導入が地震動予測技術の性能向上につながることを示すとともに、単純に機械学習を適用しただけでは発生頻度が少ない事象を予測する場合に問題が生じ得ることを示唆しています。この問題をこれまで長年にわたり検証されてきた物理モデルと機械学習のハイブリッドによって解決を図るという本研究のアプローチは、他分野でも応用可能なものであり、機械学習の社会導入にあたっての1つのモデルケースとなりうるものと考えます。　

引用： Kubo H., Kunugi T., Suzuki W., Suzuki S., and Aoi S. （2020） Hybrid predictor for ground-motion intensity with machine learning and conventional ground motion prediction equation. Sci. Rep., 10, 11871. https://doi.org/10.1038/s41598-020-68630-x

著者情報

久保　久彦（くぼ　ひさひこ）
国立研究開発法人防災科学技術研究所　地震津波火山ネットワークセンター　研究員、博士（理学）
2015年に京都大学大学院理学研究科地球惑星科学専攻（地球物理学分野）博士後期課程修了、同年に防災科学技術研究所入所。2019年より現職。強震観測網K-NET、KiK-netの運用に携わるとともに、地震による強い揺れおよび大地震の断層破壊過程に関する研究や地震動データへの機械学習の適用に取り組む。

このページの上部へ戻る