Data Science

NVIDIA Earth-2 で 2 週間以降の天気を予報する

Reading Time: 2 minutes

異常気象が当たり前かつ破壊的になりつつある現代において、そうした天候を予測できることは極めて重要です。亜季節予報、すなわち、これから 2 週間以降の天気を予測することは、天候の変動に影響を受けやすいさまざまな分野において、事前の意思決定やリスク管理を支える重要な基盤となります。 

干ばつが起きやすい地域で農家がどの作物を育てるべきか選んだり、水資源を管理したりするのに役立ちます。電力会社はエネルギーの需要と供給のバランスをとることができます。水産会社は海洋熱波対策ができます。亜季節の見通しが悪い地域であれば、移動式消防や熱中症対策インフラを事前に提供するなど、政府は自然災害や公衆衛生上の脅威に備えることができます。

過去 2 年間で、AI モデルを用いた気象/気候予測の研究が大きく進展しており、現在では実際の運用現場でも導入が進みつつあります。NVIDIA Earth-2 プラットフォームは、高性能でスケーラブルなツール スタックを提供することで、科学コミュニティと企業コミュニティの両方をサポートしています。モデルのスキルを評価し、検証したい気象専門家から、さまざまなユース ケースやデータセットに合わせてモデルを開発、カスタマイズ、スケールアップしようとする AI/ML 専門家まで、あらゆる人に恩恵があります。 

本記事では、気象分野の専門家が確率的な亜季節予報のために大規模アンサンブルを開発および検証する際に活用できる、Earth-2 プラットフォームの各種機能について概要を紹介します。計算コストは従来の非機械学習手法に比べてはるかに低くなります。 

AI による亜季節予報

AI 気象モデルの主要な利点のひとつは、従来手法では実現が難しかった大規模な運用アンサンブルを、桁違いに低い計算コストで実行できる点にあります。カリフォルニア大学バークレー校の研究者たちは、Bred Vector/Multi Checkpoint (BVMC) 手法を用いて、高精度に調整された数千メンバー規模のアンサンブル (「Huge Ensemble」、通称 HENS) を生成する有効な方法を今年初めに実証しました。JBA や AXA といった企業は、この HENS アプローチを用い、FourCastNet V2 (SFNO) モデルで保険分野の過去気象再現 (hindcasting) 行っています。 

Earth2Studio の最新リリースでは、Deep Learning Earth System Model (DLESyM) の文脈で実証された、亜季節から季節予報 (S2S: subseasonal-to-seasonal forecasting) の新しい予測機能が導入されました。これは、多層大気 AI モデルと、海面水温の変化を予測する独立した海洋 AI モデルを結合させた、非常に効率的なディープラーニング モデルです。

そのモデル アーキテクチャは U-Net であり、パディング操作が修正されており、HEALPix グリッド (解像度およそ 1 度) を使えるようになっています。 このモデルは位置埋め込みを使用しない局所的なステンシル構造に基づいているため、汎化能力を発揮できる可能性があります。このモデルは、複数か月にわたるタイムスケールで予想される気候学的誤差率に漸近する現実的な能力を示しており、さらにワシントン大学の研究者らは、このモデルが気候スケールのシミュレーションにおいて卓越した自己回帰的安定性を持つことを示しました。 

次のコード スニペットでは、このモデルを使って亜季節予報を生成する手順がいかに簡単であるかが示されています。完全な実装はこちらの Earth2Studio で利用できます。

# Prepare model, data source, and I/O backend
package = DLESyMLatLon.load_default_package()
model = DLESyMLatLon.load_model(package).to(device)
data = ARCO()
io = KVBackend()
 
# 60-day forecast, initialized in June 2021
ic_date = np.datetime64("2021-06-15")
n_steps = 16
 
# Prepare coordinates for forecast outputs
input_coords = model.input_coords()
output_coords = model.output_coords(input_coords)
inp_lead_time = input_coords["lead_time"]
out_lead_times = [
    output_coords["lead_time"] + output_coords["lead_time"][-1] * i
    for i in range(n_steps)
]
output_coords["lead_time"] = np.concatenate([inp_lead_time, *out_lead_times])
 
# Run forecast
io = run.deterministic(
    [ic_date], n_steps, model, data, io, output_coords=output_coords
)

アンサンブルによる確率的予測

しかしながら、S2S 予測は本質的に確率的なものであり、決定論的なものではありません。数か月先の特定の日の天気を正確に予測するのではなく、季節的な気象条件が平年からどの程度逸脱する可能性があるかという確率を示すものです。これらの予報は一般的に「三分位)」の確率として表されます。つまり、気温や降水量などの気候変数について、これからの季節が過去の気候分布の上位 3 分の 1 (平年より高い)、中位 3 分の 1 (平年並み)、または下位 3 分の 1 (平年より低い) に入る可能性を示す形です。 

この新しいモデルが利用可能になる以前は、企業は FourCastNet V2 (SFNO) モデルを用いて、HENS アプローチを拡張し、S2S 予報を行っていました。そして、カリフォルニア大学アーバイン校の研究者たちは、このモデルがマッデン ジュリアン振動 (MJO) の予測可能性において、ECMWF の予報システムと同等の予測精度を持つことを示しました。MJO は大気における S2S 予測可能性の主要な要因のひとつです。

現在、Earth2Studio では、HENS-SFNO、DLESyM、その他のモデルを用いて S2S 予測を行いたいユーザーのために、新しい S2S レシピが提供されています。大規模なアンサンブルや長期の予測タイムスケールへの対応が必要であることを踏まえ、このレシピではマルチ GPU による分散推論をサポートしています。さらに、並列 I/O にも対応しており、生成される予測データを効率的に保存できるようになっています。また、ストレージ容量に制約がある場合には、予測出力の一部のみを保存することも可能です。このレシピの利用を簡略化するために、Earth2Studio の HENS レシピと同様に、アンサンブル実行における複雑な処理部分はすでに自動化されています。動作の制御は、設定を指定するだけで行うことができます。

# DLESyM ensemble with 16 total checkpoint combinations
nperturbed: 4
ncheckpoints: 16
batch_size: 4
defaults:
    - forecast_model: dlesym
    - perturbation: gaussian

この新しいレシピを使うことで、気象分野の専門家は、HENS FourCastNet V2 (SFNO) や DLESyM から大規模アンサンブル予報を生成し、これらのモデルのスキルを評価および検証することが可能になりました。たとえば、初期条件の摂動や異なるモデル チェックポイントの重みによって、予測の不確実性がどのように生じるのかを検証し解析できます。これにより、高精度かつ適切に調整された亜季節予報のアンサンブルを生成することが可能になります。これにより、S2S スケールで AI 予報の最適なキャリブレーション戦略を探求するための基盤が形成されます。 

実例として、このレシピは 2021 年に発生した米国北西部の熱波に対する S2S 予報の生成にも使用でき、その結果が図 1 に示されています。このかつてない熱波は、極端な高温の強さと持続の長さで特筆されるものであり、『Geophysical Research Letters』誌に掲載された「2021 Western North American Heatwave and Its Subseasonal Predictions」の論文によると、S2S スケールでの予測が非常に難しかった事例とされています。どのモデルも熱波の位置と強度の両方を完全に再現できたわけではありませんが、すべてのモデルが北米の暖候偏差を少なくとも 3 週間前から予測し始めていたことがわかります。その予測精度は、HENS-SFNO、IFS ENS、DLESyM の間で異なっていました。

図1. 2021 年の米国北西部熱波に関して、 週平均の S2S 予報を比較したサンプルです。(左上から反時計回りに) IFS ENS (ECMWF API から取得した 11 メンバーのヒンドキャスト)、 SFNO-HENS、および DLESyM の結果が示されています。併せて、予報 3 週目における ERA5 データも比較として掲載されています。どのモデルも北米で一定の暖候偏差を予測していましたが、これほど長いリードタイムでは、極端な高温の正確な位置と強度の両方を捉えるのは困難です。

次の展開

S2S 予報への AI 導入を加速させるためには、このようなモデルとその能力について、分野の専門家によるより厳密な評価が求められます。オープンソースのライブラリを提供することで、AI 分野で必要とされるスキル面の参入障壁を低くすることができます。また、こうしたオープンソース化の取り組みは、モデルの将来的な改良や開発に関するフィードバックを AI/機械学習研究コミュニティへ還元する役割も果たします。

欧州中期予報センター (ECMWF) が主催する AI Weather Quest コンペティションは、S2S 予報の発展に向けたコミュニティの参加を加速させることを目的としています。NVIDIA のエンジニアたちはワシントン大学の研究者らと共にこのコンペティションへの参加準備を進める一方で、NVIDIA はコミュニティが参加できるようにするため、Weather Quest コンペティション向けに提供されている ECMWF のツールと Earth-2 ツールの相互運用性を高める取り組みを進めています。これにより、Earth2Studio で生成した予報データを用いて、ECMWF の AI-WQ パッケージでモデルを直接評価する際の反復サイクルを高速化できるようになります。さらに、PhysicsNeMo 上でカスタム モデルを学習させることも可能になります。これらは NVIDIA の研究チームが実際に使用しているツール群であり、これらを共有することで、他の研究者も自分たちのアイデアを迅速に検証し発展させられるようになることを期待しています。

# Score an earth2studio-generated forecast using ECMWF AI-WQ routines
for var in aiwq_variables:
    fcst_data, fcst_coords = load_forecast_for_aiwq(io_backend, ic, var)
    rpss_wk3, rpss_wk4 = compute_aiwq_rpss(fcst_data, fcst_coords, var)
    write_aiwq_scores(score_io_dict, rpss_wk3, rpss_wk4, var)

一般的に、大規模 S2S アンサンブル予報の効率的な推論とスコアリングは、科学的プロセスの重要な一部を構成しています。モデルを正しく評価するためには、多数の予報をスコアリングして、その予測スキルを判定することが必要です。このようにリソース集約的なプロセスを高速化するために、Earth2Studio では大規模な S2S アンサンブルの実行とスコアリングを効率的に行うことが可能になりました。たとえば、複数の大気モデルと海洋モデルを組み合わせた DLESyM の年間アンサンブル予報でも、8 基の GPU を用いれば 2 時間以内で実行とスコアリングが可能です。

スコアリング結果の例は図 2 をご覧ください。DLESyM モデルが 週 3 〜 5 までの S2S 予報精度において、強力な物理モデルの基準である ECMWF の IFS と競合できるスキルを持っていることを示しています。これらの一般的なスコアリング機能に加え、AI Weather Quest 向けの専用機能も含めて、Earth2Studio の S2S レシピとしてリリースされています。これにより、ユーザーは自分が試したいモデルの性能をさまざまな方法で評価できるようになります。

図 2. IFS ENS モデルと DLESyM モデルを対象に、2018 年を通して評価された週平均 S2S 予報の公平 CRPS z500 スコア。DLESyM は全体的にはIFSと同等の性能を示していますが、モデルの広がりが小さいため、初期の週では予測スキルがやや劣る傾向があります。

要点

S2S 予報は気候の影響を受けやすい幅広い分野にとって不可欠です。本記事では、Earth2Studio の新しい主要機能について説明しました。これにより、企業は DLESyM のような大気/海洋結合型の事前学習済み AI 予測モデルを評価および検証し、アンサンブル予報を生成できるようになります。 

こちらはスタートに役立つ情報です。

これらの GTC セッションで Earth-2 プラットフォームについて詳しく学習できます。これらのリソースからは、AI を活用して大規模なアンサンブル予報を生成している企業の手法がよくわかります。 

Tags