目次

概要

前回の記事では、AlphaEarth Foundations Satellite Embeddings(AEF)を使った近似最近傍探索による構造物検索を検証しました。

AlphaEarth Satellite Embeddingsで似た場所を探す:構造物の特徴をどこまで捉えられるか
Google DeepMindのAlphaEarth Satellite Embeddingsを用いた近似最近傍探索による構造物検出の検証。
https://yag.xyz/post/alphaearth-embedding-structure-search/

Satellite Embeddingsは、Sentinel-2やLandsatの光学画像を入力とし、USDA Cropland Data Layerなどの土地被覆分類データを学習ターゲットとして訓練されたモデルから生成されています。こうして作成されたSatellite Embeddingsは、2017年から毎年データが更新されています。このため、同一地点の異なる年のembeddingsを比較することで、その場所の土地被覆がどの程度変化したかを定量的に評価できます。建設工事による大規模な造成、農地の転用、太陽光発電所の新設といった変化があった場所では、年をまたいだembeddingsに変化が生じるはずです。

今回はこの性質を利用して、北海道全域で2024年と2025年の間に起きた土地被覆の変化を検知する仕組みを実装してみました。

衛星画像からの変化検知

衛星画像からの変化検出(Change Detection)は、任意の地点の異なる時期の衛星データを比較することで、地表面の変化を識別する技術です。

変化検出の2つのアプローチ

変化検出のアプローチは大きく2つに分かれます。1つ目は、可視光/マルチスペクトル画像をそのまま使う方法で、ピクセル値の差分や植生指数(NDVI等)の比較、ディープラーニングによる変化マスク予測などがあります。物理量に基づくため解釈性が高い一方で、大気条件や太陽高度角、雲、季節の植生サイクルといった撮像条件の違いが偽変化として検出されやすいという課題があります。2つ目は、基盤モデル等で画像をembeddingに圧縮してから比較する方法です。同一地点の異なる時期のembeddingを取得し、コサイン類似度等の距離メトリクスで変化の大きさを定量化します。撮像条件のノイズに対してロバストなセマンティックな変化を捉えられる一方で、「何がどう変わったか」の解釈が困難であり、embeddingの生成モデルの学習特性に結果が大きく依拠します。

Embeddingのコサイン類似度による比較

今回の変化検知では、AEFが提供しているSatellite Embeddingsを用いて2つの時期のembedding間のコサイン類似度を検出に使います。AEFのembeddingsは単位超球面上に制約された単位ベクトルであるため、コサイン類似度はベクトルの内積(ドット積)と一致します。Google Earth Engineの類似度検索チュートリアルでも、embeddingのドット積による類似度比較が紹介されています。

これが年次比較にも使えるのは、AEFのembedding空間が年をまたいで一貫しているためです。データカタログには以下のように記載されています。

The embedding space is consistent across years, and embeddings from different years can be used for condition change detection by considering the dot product or angle between two embedding vectors.

2024年と2025年のembeddingsが同じベクトル空間上に配置されているからこそ、年をまたいだ内積の比較が意味を持ちます。

ちなみに、embeddingベースの変化検知ではコサイン距離以外にユークリッド距離やKLダイバージェンスなども使われます。RaVÆn(Ruzicka et al., Nature Scientific Reports 2022)は、VAEベースの128次元embeddingに対してこれらのメトリクスを比較し、コサイン距離が最も高い検出性能を示すことが報告されています。

方法

変化スコアの定義

コサイン類似度を使って、任意の地点の変化スコアを定義しています。

change_score = 1.0 - cosine_similarity(embedding_2024, embedding_2025)

変化スコアの概念図

変化スコアは0(変化なし)から最大で2(正反対のベクトル)までの値を取りますが、実際には大きな変化があった地点でも0.3〜0.9程度の範囲に収まることが多いです。

データと実装

前回の記事と同様に、北海道全域(139.3°E〜145.9°E, 41.3°N〜45.6°N)の2024年/2025年のSatellite Embeddingsを100m/pixelスケールでEarth Engine APIから取得しています。各年のデータは約1,566万地点、64次元のベクトルです。

また、変化が大きい地点が空間的に隣接する場合にそれらをひとまとまりの領域として認識するために、Union-Findによる連結成分クラスタリングも実装しました。変化スコアが閾値(0.3)を超えるセルをグリッド上の4近傍で接続し、連結成分ごとにセル数、平均変化スコア、最大変化スコア、bboxを集計しています。

結果

全体的な統計と傾向

北海道全域の2024年→2025年の変化スコアの統計は以下の通りです。

指標
対象地点数 15,662,989
平均類似度 0.9710
平均変化スコア 0.0290
最大変化スコア 0.8842
変化スコア > 0.3 の地点数 111,040(0.7%)

大半の地点は類似度が0.97前後と高く、1年間ではほとんど変化していないことがわかります。変化スコアが0.3を超えるのは全体の0.7%、約11万地点です。

北海道全域の変化検知ヒートマップ

北海道全域の変化スコアを可視化すると、十勝平野を中心に変化の点が密集していることがわかります。私が目視で確認する限り、これらは農地の変化によるものです。

この傾向にはAEFの学習ターゲットが影響していると考えられます。AEFはSentinel-2やLandsatの光学画像だけでなく、USDA NASS Cropland Data Layer(CDL)を学習ターゲットの一つとして利用しています(AEF論文 Table 1)。CDLは米国の農作物分類データですが、この学習により農作物の種類や植生パターンの違いに対する感度が高くなっていると思われます。結果として、輪作や休耕などによる農地の年次的な植生変化が変化スコアに反映されやすくなっているのでしょう。

以下では、変化スコアの高かった代表的な場所について詳細を見ていきます。

苫小牧 データセンター開発区画

今回最も変化スコアが高かったのが、この苫小牧エリアの変化クラスタです。中央の赤い矩形で囲われている範囲で、大規模な造成工事が行われているのが確認できます。

苫小牧エリアの変化検知結果

この工事を色々調べてみたところ「北海道苫小牧AIデータセンター」の建設予定地であることがわかりました。なお、データセンターという建造物の性質上住所は正式には公開されていないので、ここでは位置情報を一部マスクしています。

次世代社会インフラ構想実現への第一歩。最先端のAI基盤を搭載する日本最大級「北海道苫小牧AIデータセンター」起工式 - ITをもっと身近に。ソフトバンクニュース
ソフトバンクの次世代社会インフラ構想における主要拠点「北海道苫小牧AIデータセンター」は、大規模な計算基盤を持ち、北海道内の再生可能エネルギーを100%利用する地産地消型のAIデータセンターとして、将来的に日本最大級の規模まで拡大する予定です。2025年4月15日に現地で起工式を開催し、建設工事の安全と成功を祈願して、鍬入れの儀などを執り行いました。
https://www.softbank.jp/sbnews/entry/20250421_01

この記事の空撮動画をみると、この地点の造成工事の前後の様子が確認できます。草原や森だった区画を大規模に伐採して整地したことで、そうした変化をSatellite Embeddingが捉えられたのだと思います。

苫小牧エリア 2024年 Before
苫小牧エリア 2025年 After
出典: https://www.youtube.com/watch?v=eZgY-5mD2EU

造成工事による地表面の大規模な変化がembeddingsに明確に反映されており、開発行為の検出にはembeddingsの時系列比較が有効だと言えそうです。

置戸町 山林伐採

他の事例では、置戸町の山林も開発されている様子を捉えることができました。これに関してはどういった開発が行われているのかはわかりませんでした。

置戸町の山林変化検知結果

なお、この地域はGoogle Earthの最新の衛星画像が2024年5月22日となっており、2025年以降の工事の様子は確認することができませんでした。

置戸町の衛星画像

出典:Google Earth

十勝平野 農地転換

農地と思われる箇所についても触れておきます。十勝平野で最も変化スコアが高かったのが以下の地点です。Google Map等で確認する限り、林だった区画を横の農地と同じような状態に変更したことが推測できます。

十勝平野の農地変化

十勝平野はこうした高い変化スコアを示す農地の地点が多数存在し、こうした地点と開発された地点の区別が変化スコアだけではつけられません。

まとめ

今回はAlphaEarth Satellite Embeddingsの年次データを比較することで、北海道全域の約1,566万地点から土地被覆の変化を検知する仕組みを実装しました。データセンター建設予定地のような大規模な開発行為を変化スコアの上位から見つけ出すことができ、embedding空間の時間的一貫性を活用した変化検知が実際に機能することを確認できました。

こうしたAEFの教師なし変化検出性能は、論文のベンチマークではViTベースラインに対してわずかに劣る結果(Balanced Accuracy 71.4% vs 72.9%)が報告されています。embeddingベースのゼロショット変化検知は、ファインチューニングされた専用モデルの精度には及ばないものの、ラベルなし/追加学習なしで広域の変化スクリーニングが可能な点は実用上の大きな利点と言えます。

一方で、今回の検証からはいくつかの課題も見えてきました。

課題1. 年次データの時間解像度

AEFの公開データは年次コンポジット(annual composite: 1年分の衛星画像を合成して1枚にまとめたもの)であるため、洪水や山火事のような短期的な現象は捉えにくい構造になっています。AEFの論文でも「短命な現象は十分に捉えられない可能性がある」と明記されています。こうした短期間の変化の検出には、可視光/マルチスペクトル画像を直接比較するアプローチのほうが適しています。

課題2. 農作物の植生変化への感度の高さ

今回の結果では、十勝平野を中心とした農地の転用等に由来する変化が大量に検出されました。AEFはUSDA Cropland Data Layerを学習ターゲットの一つとしているため、農作物の種類や植生パターンの違いに対する感度が高く、結果として変化スコア上位の多くを農地が占めます。建設や造成のような構造的な変化だけを選択的に抽出するには、土地利用種別でのフィルタリングや地図情報の活用といった工夫が必要です。

空間解像度の面でも、現在の100mグリッドでは農地のような広域の植生変化は捉えやすい一方、小規模な建築物の新設や道路の拡幅は検知しにくいという特性があります。AEFは最小10m間隔のデータを提供しているため、より細かい解像度を使えばこうした変化も拾える可能性がありますが、データ量が100倍になるため計算コストとのトレードオフになる点も注意が必要です。