WACV

Contrastive Integrated Gradients: Whole Slide Image分類のための特徴アトリビューションベース手法

Authors Explaining Whole Slide Image Classification

Original Paper Published 2026-01

ISOM Posted 2026-03-18 06:16 UTC

Read Time 40M

Open PDF

背景と学術的系譜

起源と学術的系譜

本論文で取り組む問題は、計算病理学、特にWhole Slide Image (WSI) 解析の分野における解釈可能性の喫緊の必要性から生じている。病理学は現代医療の礎であり、不可欠な診断と予後情報を提供する。伝統的に、病理医はWSIを綿密に検査し、細胞組成と組織構造を評価するが、このプロセスは時間のかかるものであり、観察者間のばらつきが生じやすい。

人工知能と深層学習の登場により、計算ツールが登場し、病理医を支援し、関心領域の事前セグメンテーションや診断の一貫性およびワークフロー効率の向上を提供するようになった。しかしながら、WSI分類およびセグメンテーションのためのこれらの高度な深層学習モデルは、驚くほど高い性能を発揮する一方で、しばしば「ブラックボックス」として機能し、その予測を駆動する特定の組織学的パターンに関する洞察をほとんど提供しない。この透明性の欠如は、AI支援診断への信頼を損ない、その広範な臨床導入における大きな障壁となっている。

この問題の学術的系譜は、AIモデルを人間にとってより理解しやすくすることを目指す、より広範なExplainable AI (XAI) の分野に遡る。コンピュータビジョン内では、XAI手法は一般的にヒートマップベース（モデルが「どこ」に焦点を当てるかを示す）と概念ベース（モデルが「何」に依存するかを説明する）に大別され、ポストホック（学習後の説明）とアンテホック（モデルに統合された解釈可能性）に分けられる。本研究は特に、ポストホックアトリビューション手法を進展させるものであり、WSI内でのモデルの意思決定に関連する領域を強調する局所的なヒートマップを生成することを目的としている。

以前のアプローチの根本的な限界、すなわち著者が本論文を執筆するに至った「ペインポイント」は多岐にわたる。Integrated Gradients (IG) のような既存の勾配ベースアトリビューション手法は、生の画像空間で動作することが多い。これは有用ではあるが、WSIパッチから派生した複雑な学習済み特徴埋め込みに依存するモデルにとっては効果が低い場合がある。さらに重要なことに、これらの手法はしばしば、必ずしもクラス識別的ではない視覚的に顕著な領域を強調する。これは、例えば腫瘍領域と非腫瘍領域を区別することが最も重要であるWSI分類タスクにおいて、目立つが関連性のない特徴を指し示す可能性があることを意味し、それによって解釈可能性が制限される。さらに、Integrated Gradientsのような手法の効果は、「ベースライン」入力の選択に大きく依存するが、病理学のような複雑なドメインでは、このベースラインの定義が曖昧で困難な場合がある。他の高度なアトリビューション手法は、より高い精度を提供するものの、しばしば高い計算コストを伴い、大規模なWSI解析には実用的ではない。著者の動機は、画像空間だけでなく、より意味のある「ロジット空間」で動作し、より焦点を絞ったクラス識別的なアトリビューションを提供する手法を開発することによって、これらの限界を克服することにある。

直感的なドメイン用語

以下に、本論文の専門用語を、ゼロベースの読者向けに直感的な日常的なアナロジーで翻訳したものをいくつか示す。

Whole Slide Image (WSI): 顕微鏡スライドにマウントされた、組織サンプルの全体像を捉えた巨大な超高解像度デジタル写真だと想像してほしい。これは、Googleマップを使って都市全体から個々の建物までズームインするのと同様に、全体像から個々の細胞までズームインできるほど詳細である。病理医はこれらの画像を用いて疾患を診断する。
Multiple Instance Learning (MIL): 大箱のチョコレートの品質検査員を想像してほしい。検査員はすべてのチョコレートを開封するわけではないが、箱の中に一つでも腐ったチョコレートが見つかれば、箱全体が「腐敗」とラベル付けされる。MILは、箱の中のすべての「チョコレート」（個々の組織パッチ）の正確なラベルを知る必要なしに、これらの「箱」（全体像スライド）から学習する方法である。
Integrated Gradients (IG): 複雑なスープの最終的な味に各材料がどれだけ寄与しているかを理解しようとしていると想像してほしい。最終的なスープを味わうだけでなく、プレーンなブロスから完全に味付けされた料理まで、その調理のあらゆる小さなステップで味わい、その過程で各材料が味をどのように変化させるかを記録する。IGはAIに対しても同様のことを行い、「味」（モデル出力）を「材料」（入力特徴）まで滑らかな経路に沿って追跡する。
Logit Space: AIモデルが予測（例：「腫瘍」または「非腫瘍」）を行うとき、各オプションの正規化されていない生のスコアを計算してから、それらを確率（例：腫瘍の確率90%）に変換する。ロジット空間は、それらがパーセンテージに平滑化される前の、これらの生の「証拠スコア」を直接見ることのようなものである。これは、各カテゴリに対するモデルの内部的な推論と信頼度をより明確かつ直接的に表示する。
Attribution Method: AIモデルが画像に犬が含まれていると伝えた場合、アトリビューション手法はAIに「画像のうち、犬だと考えた正確な部分を教えてほしい」と尋ねるようなものである。これは、モデルの意思決定に最も影響を与えた特定のピクセルまたは領域を強調し、その推論を理解するのに役立つ。

記法表

記法	説明

問題定義と制約

コア問題定式化とジレンマ

本論文で取り組むコア問題は、計算病理学におけるWhole Slide Image (WSI) 分類のための深層学習モデルの解釈可能性を高めることにある。

出発点（入力/現在の状態）には、深層学習モデルによって処理される高解像度WSIが含まれ、多くの場合、Multiple Instance Learning (MIL) パラダイムに従う。Integrated Gradients (IG) のような既存のアトリビューション手法は、その予測を説明するためにこれらのモデルに適用される。これらの手法はモデルの意思決定に影響を与える領域を特定できるが、画像空間または学習済み埋め込みで動作することが多く、クラス識別に直接関連しない視覚的に顕著な特徴を強調する傾向がある。これらは一般的なモデルの意思決定パターンを捉えるが、異なる腫瘍サブタイプ間、あるいは腫瘍と非腫瘍領域間を区別するために重要な特定のシグナルを見落とすことが多い。

望ましい終点（出力/目標状態）は、WSI内のクラス識別的な領域を正確に強調する、より有益で焦点を絞った正確なアトリビューションを達成することである。これらのアトリビューションは、グラウンドトゥルース腫瘍領域と密接に一致し、それによってAI支援診断ツールの信頼性を高める必要がある。さらに、望ましい手法は、理論的な健全性と一貫した説明を保証するために、アトリビューションの基本的な公理的特性（完全性、感度、実装不変性）を満たす必要がある。

本論文が橋渡ししようとする正確な欠落リンクまたは数学的ギャップは、ロジット空間における対照情報を効果的に捉える従来の属性手法の能力の欠如である。以前の手法は主に、モデルの出力に対する入力特徴の勾配に基づいて重要性を属性化することに焦点を当てている。しかし、このアプローチは、単に顕著な特徴と、参照と比較して特定のクラスにとって真に識別的な特徴を区別できないことが多い。本論文は、i番目の特徴に対するアトリビューションを数学的に定義するContrastive Integrated Gradients (CIG) を導入することによって、このギャップを橋渡しすることを提案する。
$$ \text{CIG}_i^c(x) = (x_i - x'_i) \int_0^1 \frac{\partial ||f_{\text{logit}}(\gamma(\alpha)) - f_{\text{logit}}(x')||_2^2}{\partial x_i} d\alpha $$
ここで、$f_{\text{logit}}(\cdot)$はモデルのロジット出力を表し、$x$は入力、$x'$は参照ベースラインであり、$\gamma(\alpha)$は$x$と$x'$間の直線経路を定義する。この定式化は、補間された入力とベースライン参照のロジット出力の二乗差の勾配を明示的に統合する。これにより、CIGはモデルの決定境界が参照に対してどのように進化するかを測定でき、それによってロジット空間で直接対照情報を捉え、クラス識別的な特徴を強調する。

過去の研究者を閉じ込めてきた痛みを伴うトレードオフまたはジレンマは、包括的な顕著性マップの生成と、クラス識別的な説明の生成との間の固有の緊張関係である。標準的なIntegrated Gradientsのような手法は、予測に寄与するすべての特徴を示す広範な顕著性マップを提供することが多い。しかし、診断の文脈では、病理医は、単に活性領域が「何」であるかだけでなく、例えば腫瘍と非腫瘍を区別するためにモデルが「なぜ」区別するのかを理解する必要がある。アトリビューションの包括性を改善することは、しばしば特異性と識別力の犠牲を伴い、視覚的に顕著ではあるが、関心のある特定のクラスの区別に関連性のない特徴を含む説明につながる。これにより、臨床意思決定のための実行可能な洞察を提供することが困難になる。

制約と失敗モード

WSI分類のための解釈可能な説明を提供する問題は、いくつかの厳しい現実的な制約によって非常に困難になっている。

WSIの高解像度性質: 全スライド画像はギガピクセル規模であり、直接処理するには計算的に困難である。これは、それらをより小さなパッチに分割する必要があり、それらは深層学習モデルによって処理されることが多く、Multiple Instance Learning (MIL) フレームワークで処理される。このパッチベースの処理は、元のWSIへの重要性の属性付けに複雑さを加える。
弱い教師あり学習: 計算病理学では、グラウンドトゥルースラベルは通常、スライドレベル（例：スライド全体が「腫瘍」または「非腫瘍」とラベル付けされる）でのみ利用可能であり、パッチレベルではない。この「弱い教師あり学習」は、スライド内の特定の腫瘍領域を特定するようにモデルを訓練することを非常に困難にし、 subsequently、アトリビューション手法がこれらの正確な領域を正しく強調しているかを評価することを困難にする。
曖昧なベースライン選択: Integrated Gradientsのような勾配ベースアトリビューション手法は、特徴量の重要性を測定するための参照点として機能する「ベースライン」入力の選択に決定的に依存する。病理学では、適切なベースラインの選択は曖昧である。一般的なベースライン（例：ゼロベクトル、データセット平均、ランダムパッチ）は、分布外の問題、意味論的バイアス、または識別性の低下につながる可能性があり、アトリビューションを意味のないもの、あるいは誤解を招くものにする可能性がある。本論文では、ゼロベクトルベースラインが埋め込み空間で分布外の問題を引き起こす可能性がある一方、データセット平均またはランダムパッチは意味論的漏洩または識別性の低下を被る可能性があると明示的に指摘している。
アトリビューション評価のためのグラウンドトゥルースの欠如: ピクセルレベルの顕著性グラウンドトゥルースが存在する可能性のある一部の自然画像タスクとは異なり、WSI解析ではモデル予測のための詳細なピクセル単位のグラウンドトゥルース説明が利用できないことが多い。この欠如は、アトリビューションマップの品質と精度を定量的に評価することを非常に困難にする。顕著性マップの標準的な評価指標（Performance Information CurvesやRISEなど）は、MILベースのWSI分類のように、予測が突然変化したり、ピクセルレベルの制御が可能であったりするわけではないため、MILベースのWSI分類設定には直接適用できない。
パス積分における計算コスト: Integrated GradientsやCIGを含むパスベースのアトリビューション手法は、入力とベースライン間のパスに沿った勾配の積分を必要とする。このプロセスには複数の補間ステップが含まれ、特にWSIから派生した高次元特徴空間の場合、計算集約的になる可能性がある。明示的な失敗モードではないが、高い計算コストは展開における実用的な制約である。
学習済み埋め込みへのモデルの依存: 多くのWSI解析モデルは、特徴抽出器（例：Vision TransformersまたはCNN）からの学習済み埋め込みに依存している。画像空間で直接動作する勾配ベース手法は、モデルの意思決定が生のピクセル値よりも抽象的な学習済み埋め込みによって主に駆動される場合、効果が低い可能性がある。

なぜこのアプローチか

選択の必然性

Contrastive Integrated Gradients (CIG) の開発は、単なる漸進的な改善ではなく、計算病理学におけるWhole Slide Image (WSI) 解析の固有の課題に適用された際の既存のアトリビューション手法の固有の限界によって駆動された、必然的な進化であった。著者は、従来の「SOTA」手法、例えば標準的なIntegrated Gradients (IG) およびそのバリアント（例：Gradient $\times$ Input、Grad-CAM、Expected Gradients）が、一般的なコンピュータビジョンタスクでは有望であったにもかかわらず、この特定のドメインでは不十分であったことを認識した。

この認識の正確な瞬間は、2つの重要な欠点の特定によって示唆されている。
1. WSIの高解像度性質: ギガピクセル規模のWSIにこれらの手法を直接適用すると、計算上および解釈上の大きな課題が生じた。その巨大な規模は、これらの手法が意味のある局所的な説明を提供することを困難にした。
2. クラス識別的なシグナルの欠如: さらに重要なことに、従来の属性手法は、主に画像空間で動作することにより、必ずしもクラス識別的ではない視覚的に顕著な特徴を強調することが多かった。これは、それらが重要に見える領域を指し示すことができるが、例えば腫瘍サブタイプ間、あるいは腫瘍と非腫瘍組織間を区別するのに実際に役立たないことを意味する。例えば、ある領域は視覚的に顕著であっても診断上の意思決定には関連性がなく、病理医にとって誤解を招く説明につながる可能性がある。単なる顕著性から、対照的で、意思決定に関連する特徴への移行の必要性が、CIGの推進力となった。

比較優位性

CIGは、特に、より焦点を絞った診断的に関連性の高いアトリビューションを提供する能力において、以前のゴールドスタンダードと比較して質的な優位性を提供する。その構造的利点は、画像空間または出力確率空間で直接ではなく、ロジット空間で対照勾配を計算することに由来する。

これが圧倒的に優れている理由は以下の通りである。
* シャープなクラス差別化: モデルの出力（例：確率スコア）の勾配に基づいてアトリビューションを属性化するIGとは異なり、CIGは入力とベースラインとのロジット差の二乗の勾配を計算する。これは、特徴量がベースライン参照と比較して、モデルのロジット出力の差にどれだけ寄与するかを明示的に測定することを意味する。この構造設計により、CIGはクラス識別的な領域を強調でき、腫瘍と非腫瘍領域間のよりシャープな差別化を提供し、病理学にとって不可欠である。
* 局所化された一貫したアトリビューション: 定性的に、論文の図に示されているように、CIGは補間パス全体で腫瘍領域内に、より安定した局所化された勾配を生成する一方、IG勾配は空間的に分散する傾向がある。これは、CIGが高次元ノイズと無関係な視覚的キューを、クラスを真に区別するものに焦点を当てることによって、真の意思決定領域を分離するのに優れていることを示している。
* 対照的な力を持つ公理的健全性: CIGは、Integrated Gradientsの望ましい公理的特性（完全性、感度、実装不変性）を維持し、理論的な健全性と一貫性を保証する。しかし、それは対照的な要素を組み込むことによってこれを拡張し、アトリビューションを単に一貫性があるだけでなく、微分的な文脈で意味のあるものにする。これは、比較的な視点なしに絶対的な重要性のみを提供する手法に対する重要な構造的利点である。

論文では、メモリ複雑度を$O(N^2)$から$O(N)$に削減することについて明示的に詳述していないが、より正確で局所化された説明を生成する上での質的および構造的な利点は明確に実証されている。

制約との整合性

選択されたCIG手法は、計算病理学におけるWSI解析の厳しい要件に完全に整合し、問題と解決策の強力な「結婚」を形成する。

信頼のための解釈可能性: 主要な制約は、臨床医の信頼を構築するために、高度に解釈可能なAIシステムが必要であることである。CIGは、「より有益で安定したアトリビューション」を提供し、グラウンドトゥルース腫瘍領域と密接に一致することにより、これを直接的に解決する。クラス識別的な特徴を強調する能力は、説明が診断上の意思決定に関連していることを保証し、臨床的な自信を育む。
高解像度WSI: この手法は、WSI解析の標準的なパラダイムであるMultiple Instance Learning (MIL) フレームワーク内で動作するように設計されている。WSIから抽出されたパッチレベルの特徴で動作することにより、CIGはこれらの画像の高解像度性質に効果的にスケーリングし、WSIレベルのヒートマップに集約される個々のパッチのアトリビューションを提供する。
弱い教師あり学習: WSI解析は、スライドレベルのラベルのみが利用可能で、ピクセルレベルのアノテーションは利用できない弱い教師あり学習の下で動作することが多い。MILフレームワークへのCIGの統合は、MIL-AICおよびMIL-SICの導入と組み合わされ、この弱い教師あり設定に特別に対応する。これらの指標は、サリエントパッチが導入されるにつれて、モデルの予測と信頼度がどれだけ早く進化するかを評価し、この困難なコンテキストでのアトリビューション品質を直接評価する。
クラス識別的なシグナル: 特定されたコア問題は、従来のアルゴリズムがクラス識別的なシグナルを見落とすことであった。ロジット空間での対照勾配の計算というCIGのユニークな特性は、単なる一般的な顕著性ではなく、一方のクラスを他方から区別する特徴を強調することによって、これを直接的に解決する。これにより、腫瘍サブタイプまたは疾患状態の区別に関連する説明が保証される。

代替案の却下

本論文は、WSI解析の特定の要求を満たせないため、主に他の勾配ベースのアトリビューション手法および一般的なベースライン選択肢を含む、いくつかの代替アプローチを暗黙的かつ明示的に却下している。

従来のIntegrated Gradients (IG) およびそのバリアント: 本論文では、IGおよび関連するアトリビューション手法が「有望であることが示されている」ものの、それらをWSIに直接適用すると「高解像度性質による課題」が生じ、「クラス識別的なシグナルを見落とす」傾向があると述べている。これは、変更なしでの直接的な適用可能性の直接的な却下である。Gradient $\times$ Input、EG、IDGのような手法は、CIGと比較してベンチマークされており、これらの問題に対する定量的劣位性を示す、MIL-AICおよびMIL-SICの観点からCIGが一貫してそれらを上回っている。
画像空間アトリビューション手法: 「ほとんどのアトリビューション手法が画像空間で動作し、視覚的に顕著ではあるがクラスに関連性のない特徴を強調する可能性がある」という、より広範な却下がなされている。この限界は、診断的に関連性の高い領域ではなく、視覚的に目立つ領域を特定することを目指すWSI分類の解釈可能性を著しく妨げる。CIGのロジット空間アプローチは、決定境界に焦点を当てることによってこれを直接的に解決する。
IGベース手法の標準ベースライン選択: 本論文は、「アトリビューションベースラインの設計」にセクションを割き、一般的なベースライン（例：ゼロベクトル、データセット平均、ランダムパッチ）がWSIに不十分である理由を説明している。
- ゼロベクトルベースラインは、埋め込み空間で「分布外の問題」を引き起こす可能性がある。
- データセット平均は、「意味論的バイアス」を導入し、支配的なクラスを優先する。
- データセット分布からのサンプリングまたはランダムパッチの使用は、入力とベースラインが同じクラスに属する場合、「意味論的漏洩または識別性の低下」を被る。
  これらの問題は、解釈可能性の低い顕著性マップにつながる。CIGは、「反対クラスからのベースライン」を使用することによってこれを克服し、モデルの予測を駆動する意味のある違いを捉えるために、その対照的な性質にとって不可欠である。

本論文は、GANやDiffusionモデルのような生成モデルの却下については議論していない。なぜなら、それらは本研究の焦点である解釈可能性のための特徴アトリビューションとは異なる目的（例：画像生成）を果たしているからである。考慮され却下された代替案は、主に他のアトリビューション技術とそのコンポーネントである。

数学的・論理的メカニズム

マスター方程式

Contrastive Integrated Gradients (CIG) を駆動する絶対的なコア方程式は、論文で提示されているように、i番目の特徴に対するアトリビューションの定義である。

$$ \text{CIG}_i(x) = (x_i - x'_i) \int_0^1 \frac{\partial}{\partial x_i} ||f_{\text{logit}}(\gamma(\alpha)) - f_{\text{logit}}(x')||_2^2 d\alpha $$

項ごとの解剖

この方程式を分解して、その数学的定義、CIGメカニズムにおけるその役割、および選択された演算子の根拠を理解しよう。

$\text{CIG}_i(x)$:
1. 数学的定義: これは、入力$x$のi番目の特徴に対するContrastive Integrated Gradientsアトリビューションスコアを表す。
2. 物理的/論理的役割: これは、特定のi番目の特徴に対するCIG計算の最終出力である。入力$x$のi番目の特徴が、ベースライン$x'$に対して対照的な方法でモデルの予測を駆動するのにどれほど重要かを定量化する。絶対値が大きいほど重要度が高く、その符号は特徴が予測をベースラインが示唆するクラスに近づけるか遠ざけるかを示すことができる。
$x$:
1. 数学的定義: これは、アトリビューションを計算したい入力特徴ベクトル（例：Whole Slide Imageパッチの特徴埋め込み）である。
2. 物理的/論理的役割: これは、その特徴を説明しようとしている特定のデータポイントである。「ターゲット」入力である。
$x'$:
1. 数学的定義: これは、ベースラインまたは参照特徴ベクトルである。
2. 物理的/論理的役割: 論文では、$x'$は通常「反対クラス」からサンプリングされる（例：腫瘍陽性スライドの非腫瘍パッチ）と指定されている。これは、特徴空間における中立的または非情報的な参照点として機能する。CIGは、ベースライン$x'$と比較して入力$x$を比較することによって特徴の重要性を測定し、$x$から$x'$を区別する特徴を強調する。
$(x_i - x'_i)$:
1. 数学的定義: これは、入力特徴ベクトル$x$のi番目の成分とベースライン特徴ベクトル$x'$のi番目の成分との間のスカラー差である。
2. 物理的/論理的役割: この項は、積分勾配のスケーリング係数として機能する。もし特徴$x_i$がそのベースライン対応物$x'_i$と同一であれば、そのアトリビューション$\text{CIG}_i(x)$はゼロになることを保証する。なぜなら、それは違いを何も貢献しないからである。また、ベースラインから入力へのその特定の特徴の変化の大きさや方向も考慮する。
3. 乗算の理由: これは直接的なスケーリングであり、特徴の総「影響」はベースラインからの変化の量に比例すべきであることを反映している。
$\int_0^1 \dots d\alpha$:
1. 数学的定義: これは、スカラーパラメータ$\alpha$に関する0から1までの定積分である。
2. 物理的/論理的役割: この積分は、「Integrated Gradients」の概念の核心である。ベースライン$x'$から入力$x$への連続的なパスに沿った勾配を蓄積する。この積分は、「勾配飽和」問題に対処するために重要である。勾配飽和問題では、既に強く活性化されている特徴に対して勾配が非常に小さくなる可能性があり、それによってそれらの重要性を過小評価する。パス全体にわたる無限小の寄与を合計することにより、特徴の重要性の、より堅牢で完全な尺度を提供する。
3. 合計ではなく積分の理由: 積分は連続パスに沿って合計するために使用され、望ましい公理（完全性など）を満たす理論的に健全で完全なアトリビューションを提供する。合計（リーマン和近似のような）は、この連続プロセスの離散近似となる。
$\frac{\partial}{\partial x_i}$:
1. 数学的定義: これは、入力のi番目の特徴に対する偏微分演算子である。積分の文脈では、それは二乗L2ノルム項に適用される。
2. 物理的/論理的役割: この演算子は、パス上の各点$\gamma(\alpha)$における二乗ロジット差の、i番目の特徴に対する感度を計算する。これは、パス上の特定の点における$x_i$のわずかな変化が、ベースラインとの「対照」（二乗ロジット差）にどれだけ影響するかを教えてくれる。これは、手法がどの特徴が局所的に影響力があるかを特定する方法である。
$|| \cdot ||_2^2$:
1. 数学的定義: これは、ベクトルの二乗ユークリッド（L2）ノルムを表す。ベクトル$v$に対して、$||v||_2^2 = \sum_j v_j^2$である。
2. 物理的/論理的役割: この項は、補間された入力のロジット出力とベースラインのロジット出力との間の、ロジット空間における「距離」または「非類似性」を定量化する。L2ノルムを二乗することにより、尺度が常に非負であることを保証し、より大きな差をより顕著に強調する。これは、CIGが説明しようとする中心的な「対照的」尺度である。
3. L2ノルムの理由: L2ノルムは、ユークリッド空間におけるベクトル大きさおよび距離を測定するための標準的な尺度である。それを二乗することにより、平方根が除去され、勾配計算に適した滑らかで微分可能な関数が得られるため、計算が簡略化される。
$f_{\text{logit}}(\cdot)$:
1. 数学的定義: これは、モデルのロジット層の出力を表す。分類モデルの場合、これらはソフトマックス活性化の前に、各クラスの生の正規化されていないスコアである。
2. 物理的/論理的役割: ロジットはモデルの各クラスに対する信頼度と証拠を直接反映するため、CIGはロジット空間で動作する。ロジット出力の差を測定することにより、CIGはクラス識別的な情報を捉え、腫瘍と非腫瘍領域を区別するために不可欠である。これは、画像空間またはソフトマックス確率で動作する手法とは異なる重要な区別である。
$\gamma(\alpha)$:
1. 数学的定義: これは、$\gamma(\alpha) = x' + \alpha(x - x')$として定義される直線パス関数であり、$\alpha \in [0, 1]$である。
2. 物理的/論理的役割: この関数は、ベースライン$x'$（$\alpha=0$のとき）から入力$x$（$\alpha=1$のとき）への直線経路上の特徴空間の中間点を生成する。これは、勾配が積分される連続的な軌跡を提供する。
$\alpha$:
1. 数学的定義: 0から1まで連続的に変化するスカラーパラメータである。
2. 物理的/論理的役割: このパラメータは、補間パス$\gamma(\alpha)$上の位置を制御する。$\alpha$が増加すると、補間された点はベースラインから入力に向かって移動する。
$f_{\text{logit}}(x')$:
1. 数学的定義: ベースライン特徴ベクトル$x'$が入力として提供されたときのモデルのロジット出力である。
2. 物理的/論理的役割: これは、ロジット空間における固定された参照点として機能する。CIG手法は、補間された入力$\gamma(\alpha)$のロジット出力が、この一定のベースラインロジット出力とどのように異なるかを測定する。この一定の参照は、CIGの「対照的」性質の基本であり、ベースラインからの逸脱を引き起こす特徴を強調することを可能にする。

ステップバイステップフロー

単一の抽象データポイントがその特徴ベクトル$x$でこの数学的エンジンに入力されると想像してほしい。CIGがそれを処理して特徴アトリビューションを決定する方法は次のとおりである。

ベースライン選択: まず、適切なベースライン特徴ベクトル$x'$が選択される。論文では、腫瘍陽性スライドを分析する際に非腫瘍領域からサンプリングされた特徴のような、対照的なベースラインの使用を強調している。この$x'$は、中立的または「反対の」参照点として機能する。
パス構築: 特徴空間に直線パス$\gamma(\alpha)$が構築される。このパスは、ベースライン$x'$（$\alpha=0$のとき）と入力$x$（$\alpha=1$のとき）を滑らかに補間する。これは、参照点から実際の入力点への線を描くようなものである。
ロジット変換: このパスに沿ったすべての無限小ステップ、$\gamma(\alpha)$で表される、モデルのロジット出力$f_{\text{logit}}(\gamma(\alpha))$が計算される。同時に、固定ベースライン$f_{\text{logit}}(x')$のロジット出力も取得される。
対照的測定: パス上の各点$\alpha$で、現在の補間されたロジット出力とベースラインロジット出力との差、$f_{\text{logit}}(\gamma(\alpha)) - f_{\text{logit}}(x')$が計算される。この差の二乗ユークリッドノルム、$||f_{\text{logit}}(\gamma(\alpha)) - f_{\text{logit}}(x')||_2^2$が計算される。この値は、補間された入力に対するモデルの生の予測が、そのパス上の特定の時点でのベースラインの予測とどれだけ「異なるか」を定量化する。
勾配計算: この二乗ロジット差（対照的尺度）の偏微分が、入力の各個々の特徴$x_i$に対して計算される。この勾配、$\frac{\partial}{\partial x_i} ||f_{\text{logit}}(\gamma(\alpha)) - f_{\text{logit}}(x')||_2^2$は、パス上のその特定の時点$\alpha$における特徴$i$の変化に対する対照的尺度の感度を示している。
勾配積分: これらの偏微分勾配は、$\alpha=0$から$\alpha=1$までのパス全体に沿って積分される。このステップは、入力がベースラインからその実際の値に移行するにつれて、各特徴の感度の無限小の寄与をすべて効果的に合計する。これにより、単一の時点での勾配が誤解を招く可能性のある問題を回避し、重要性の包括的な評価が保証される。
スケーリングと最終アトリビューション: 最後に、各特徴$i$について、蓄積された積分は差$(x_i - x'_i)$でスケーリングされる。このスケーリングにより、ベースラインと同一の特徴はゼロアトリビューションを受け取り、ベースラインからの特徴の変化の大きさが考慮されることが保証される。結果は、特徴$i$の対照的積分勾配である$\text{CIG}_i(x)$となる。

このプロセスはすべて特徴に対して繰り返され、入力$x$のどの部分がベースライン$x'$に対する予測に最も責任があるかを強調するアトリビューションスコアのベクトルが得られる。

最適化ダイナミクス

Contrastive Integrated Gradients (CIG) は、モデルパラメータを損失関数に基づいて調整するような、従来の意味での「学習」や「更新」や「収束」を行わない、アトリビューション手法であることに注意することが重要である。むしろ、その「ダイナミクス」は、アトリビューションスコアがどのように計算され、意味のある説明を提供するためにどのように振る舞うかに関するものである。

メカニズムの「ダイナミクス」は、その信頼性と解釈可能性を保証する、いくつかの公理的特性によって支配されている。

完全性公理: 論文（式7）で述べられているように、入力$x$のすべてのCIGアトリビューションの合計は、入力とベースラインとの間の二乗ロジット差の総変化に等しい：$\sum_{i=1}^n \text{CIG}_i(x) = ||f_{\text{logit}}(x) - f_{\text{logit}}(x')||_2^2$。これは、手法が入力とベースラインとの間のモデルのロジット出力の全差を完全に説明し、この差を特徴全体に分散させることを意味する。説明されない寄与はない。
感度公理: CIGは、ベースライン対応物$x'_i$と異なる変化し、モデルのロジット出力に影響を与える特徴$x_i$にゼロ以外の属性を割り当てる。逆に、特徴$x_i$が$x'_i$から変化しない場合、またはモデルのロジット出力が$x_i$に完全に依存しない場合、その属性はゼロになる。これにより、CIGはモデルの意思決定に寄与する関連特徴のみを正確に特定し、強調し、無関係な特徴から区別できることが保証される。この特性は、焦点を絞った解釈可能な顕著性マップを生成するために不可欠である。
実装不変性公理: CIGのアトリビューションは、モデルの出力関数（$f_{\text{logit}}(\cdot)$）とその勾配のみに基づき、ニューラルネットワークの特定の実際の実装詳細には基づかない。これにより、機能的に同等のモデルは、内部的にどのようにコーディングまたは構造化されていても、一貫したアトリビューションを生成することが保証される。これにより、CIGは異なるモデルアーキテクチャ全体で堅牢で信頼できるものとなる。

したがって、CIGの「ダイナミクス」は、損失ランドスケープ上での反復更新に関するものではなく、これらの理論的特性に準拠する特徴重要性スコアの堅牢で一貫した計算に関するものである。ロジット空間でのパスに沿った勾配の積分は、対照的なベースラインと組み合わされることにより、モデルの意思決定プロセス、特に異なるクラスを区別するプロセスに直接結びついた、論理的に健全な説明だけでなく、より局所的でクラス識別的なアトリビューション値の形状を形成する。

Figure 1. Overview of Contrastive Integrated Gradients (CIG). Given a whole-slide image (WSI), patch-level features are extracted and compared to a baseline sampled from non-tumor regions. An interpolated path \ga m ma (\a lpha ) = x + \alpha (x' - x) is constructed between the input x and the baseline x' . CIG computes attributions by integrating the gradients of the squared logit difference along this path, where f_{\text {logit}}(\cdot ) denotes the model’s logit output and \ | \cdot \|_2 is the Euclidean norm. Row (a) shows interpolated features at different \alpha values ( \ alpha = 0.167 to 1 ). Row (b) illustrates how contrastive gradients evolve with increasing \alpha , indicating the sensitivity of each feature at each interpolation step. The full attribution is computed by summing the gradients across all \alpha values and multiplying by the input difference x - x' . The final heatmap (bottom right) shows the CIG attribution result, indicating which regions most strongly influence the model’s decision relative to the baseline

結果、限界、結論

実験設計とベースライン

Contrastive Integrated Gradients (CIG) の有効性を厳密に検証するために、著者は多様な計算病理学シナリオにわたる包括的な実験セットアップを設計した。CIGが打ち負かすことを目指した「犠牲者」またはベースラインモデルには、Vanilla Gradient、Integrated Gradients (IG) [32]、Expected Gradients (EG) [29]、およびIntegrated Decision Gradients (IDG) [33]といったいくつかの確立された勾配ベースアトリビューション手法、および比較のための単純なRandomベースラインが含まれていた。CIGを含むすべてのパスベース手法は、一貫性のために50回の補間ステップで設定された。

実験は、3つの公開されている、ハイステークスの癌病理学データセットで実施された：CAMELYON16（リンパ節の乳がん転移）、TCGA-Renal（3つの腎臓がんサブタイプ：KIRC、KIRP、KICHをカバー）、およびTCGA-Lung（LUADおよびLUSC肺がんサブタイプをカバー）。この多様な選択により、異なる癌の種類および診断設定全体でのCIGの一般化可能性が保証された。

2つの異なるMultiple Instance Learning (MIL) 分類モデルが、アーキテクチャ全体でのアトリビューションパフォーマンスを評価するために使用された：単純なMLPバッグ分類器と広く使用されている注意ベースのCLAM [19]モデルである。両モデルは、事前学習済みResNet-50からのパッチレベル特徴を使用し、データ分割のために患者レベルの分離を用いて200エポック訓練され、漏洩を防いだ。

実験設計の重要な側面は、アトリビューションベースラインの新しい構築であった。従来のベースライン（例：黒い画像、データセット平均）とは異なり、CIGおよび他のIGベース手法は、反対クラスの30スライドからサンプリングされたパッチ特徴を使用することにより、対照的なベースラインを採用した。例えば、腫瘍陽性スライドを評価する場合、非腫瘍スライドパッチが参照として機能した。この戦略は、CIGの対照情報を捉えるという中核メカニズムに沿って、クラス識別的な特徴をより効果的に強調するように設計された。

弱い教師ありWSI設定では、グラウンドトゥルース説明が利用できないことが多いため、アトリビューション品質を定量的に評価するために、著者はPerformance Information Curves (PICs) フレームワーク [9] を適応させ、2つの特殊な指標を導入した。
- MIL-Accuracy Information Curve (MIL-AIC): この指標は、高顕著性パッチが段階的に導入されるにつれて、モデルの分類精度（正しいスライドレベルラベル予測）を追跡する。より高いMIL-AICは、アトリビューション手法が正しい分類に不可欠な領域を迅速に特定することを示す。
- MIL-Softmax Information Curve (MIL-SIC): この指標は、情報パッチが明らかにされるにつれて、正しいクラスに対するモデルのソフトマックス信頼度を測定する。より高いMIL-SICは、アトリビューション手法がモデルの確実性を急速に増加させる領域を強調していることを示唆する。

評価は特に腫瘍陽性スライドに焦点を当てた。制御特徴（反対クラスからのもの）から開始し、アトリビューションスコアでランク付けされたターゲットスライドからの特徴に段階的に置き換えることにより、「無慈悲な証明」が設計された。このプロセスは、2つの補完的な情報レベルビンを使用して構造化された：「トップkパッチ」（例：$k=1, \dots, 500$）は初期段階の予測シフトを捉えるため、「顕著性しきい値」（例：20%から99%パーセンタイルカットオフ）は後期段階の遷移と完全性を評価するためである。この綿密な設計により、CIGによって特定された顕著な領域が導入されるにつれて、モデルの予測がどれだけ迅速かつ自信を持って変化するかを詳細に分析でき、その有効性の否定できない証拠を提供した。

証拠が証明すること

実験結果は、CIGがWSIにおける意思決定関連領域の特定において、既存のアトリビューション手法を大幅に上回るという説得力のある定量的および定性的な証拠を提供する。

定量的には、CIGはすべての3つの癌データセットおよび両方の分類器アーキテクチャ全体で、一貫して最も高いMIL-AICおよびMIL-SICスコアを達成した。例えば、CAMELYON16データセット（表1）では、CLAMモデルを使用したCIGは、MIL-AICで$0.950 \pm 0.166$、MIL-SICで$0.945 \pm 0.128$を記録し、次の最良手法（IG：$0.891 \pm 0.261$ MIL-AIC、$0.896 \pm 0.243$ MIL-SIC）を大幅に上回った。MLP分類器でも同様の傾向が見られ、CIGは$0.965 \pm 0.128$ MIL-AICおよび$0.913 \pm 0.130$ MIL-SICに達した。CIGによって特定されたパッチが導入されるにつれて、モデルの予測が正しいラベルに向かってどれだけ迅速かつ自信を持ってシフトするかを測定したこの決定的な証拠は、CIGの中核メカニズムであるロジット空間での対照勾配の計算が、真にクラス識別的な特徴を効果的に強調することを示している。

TCGA-Renalデータセット（表2）全体で、CIGは3つの腎臓サブタイプ（pRCC、ccRCC、chRCC）および両モデル全体で引き続き高いパフォーマンスを示し、一貫してトップパフォーマーの1つとなった。例えば、ccRCCでCLAMを使用した場合、CIGは$0.776 \pm 0.297$ MIL-AICおよび$0.783 \pm 0.286$ MIL-SICを達成し、すべてのベースラインを上回った。TCGA-Lungデータセット（表3）はこれらの発見をさらに強化し、CIGはLUSCでCLAMを使用した場合に最高のスコア（$0.759 \pm 0.296$ MIL-AIC、$0.765 \pm 0.277$ MIL-SIC）を達成し、LUADに対しては強力なバランスを示した。これらの結果は総じて、対照情報を捉えるCIGの能力が、より有益で安定したアトリビューションにつながることを裏付けている。

定性的に、視覚化はCIGの優位性をさらに確固たるものにする。補間ステップ全体での中間勾配マップを示す図2は、IGがより分散したパターンを示すのとは対照的に、CIGがパス全体で腫瘍領域内に、より局所化され一貫した勾配を生成することを明確に示している。これは、CIGのアトリビューションがより安定しており、関連領域に焦点を当てていることを示唆している。

さらに重要なことに、最終的なアトリビューションマップを示す図3は、CIGが一貫して注釈付きグラウンドトゥルース腫瘍領域と密接に一致する領域を強調していることを示している。対照的に、IGやEGのようなベースライン手法は、実際の腫瘍の一部ではない、視覚的に顕著ではあるが識別性の低い特徴を強調することが多い。グラウンドトゥルースとのこの視覚的な一致は、CIGのメカニズムが意思決定関連腫瘍領域を効果的に特定することの否定できない証拠を提供する。

最後に、論文はCIGが統合アトリビューション手法の基本的な公理的特性：完全性、感度、および実装不変性を満たすことを理論的に証明している。この理論的な健全性は、強力な定量的および定性的な実験結果と組み合わされ、CIGの主張の堅牢な基盤を提供する。

限界と将来の方向性

CIGはWSI分類の解釈可能性において顕著な進歩を示しているが、著者はいくつかの限界を認め、明確な将来の研究の方向性を提案している。

1つの注目すべき限界は、評価フレームワーク自体に由来する。現在のMIL-AICおよびMIL-SIC指標は、主に腫瘍陽性スライドのために設計されており、それに最も適している。著者が説明するように、正常スライドは異なる予測ダイナミクスを示し、予測が変化する前にほぼすべての特徴を削除する必要があることが多く、その場合AUCのような指標は意味がなくなる。これは、CIGが腫瘍領域の特定において非常にうまく機能する一方で、非腫瘍または正常組織分類、あるいは「反対クラス」ベースラインが明確に定義されていないシナリオへの適用性および解釈可能性は、さらなる調査または評価方法論の適応を必要とする可能性があることを示唆している。

今後、最も重要な将来の方向性は、解釈可能性の厳密な人間被験者評価の組み込みである。定量的指標と定性的な視覚化は強力な証拠を提供するが、計算病理学における解釈可能性の究極の目標は、信頼を構築し、臨床意思決定を支援することである。CIGのアトリビューションが、AI支援診断に対する理解と信頼を実際に高めるかどうかを評価する研究を設計することになる。

人間被験者評価を超えて、さらなる開発のためのいくつかの他の議論トピックが現れる。
- 他の医療画像モダリティへの一般化可能性: CIGの対照的アプローチは、解釈可能性が同様に重要であるが、特徴空間とベースラインが大きく異なるMRIやCTスキャンなどの他の複雑な医療画像タスクに適合させることができるか？
- 計算効率とスケーラビリティ: CIGは強力なパフォーマンスを示すが、アトリビューション手法、特にパスベースの手法は計算集約的になる可能性がある。さらなる研究は、非常に大きなWSIまたはリアルタイム臨床アプリケーションの効率を改善するための最適化を探求する可能性があり、おそらく近似技術またはハードウェアアクセラレーションを通じて。
- 動的なベースライン選択: 現在の手法は、「反対クラス」ベースラインからのサンプリングに依存している。将来の研究は、特に多クラスシナリオや明確な「反対」クラスが容易に利用できない、または明確に定義されていない場合、より動的または適応的なベースライン選択戦略を調査する可能性がある。
- Ante-hoc手法との統合: CIGはポストホックアトリビューション手法である。解釈可能性をモデルアーキテクチャに直接組み込むante-hoc解釈可能性手法との統合を探求することは、両者の強みを組み合わせたハイブリッドアプローチにつながる可能性があり、局所化された説明とグローバルなモデル理解の両方を提供する。
- 二項分類を超えて: 論文は多サブタイプ分類（例：TCGA-Renal）に触れているが、CIGがどのように機能し、多くのクラス間の微妙な違いを強調する必要がある高度に詳細な多クラス問題に対してどのように最適化できるかについての詳細な調査は価値があるだろう。

Table 3. Attribution performance on each class from the TCGA-Lung dataset, evaluated using MIL-AIC and MIL-SIC metrics

Figure 2. Comparison of Integrated Gradients (IG) and Con- trastive Integrated Gradients (CIG) across interpolation steps ( \alpha ), each row shows intermediate gradient maps at increasing \alpha val- ues, from 0.167 to 1.0, illustrating how gradients evolve along the interpolation path. Note that the final heatmap ( \ alpha = 1 ) shows only the gradient at the last step and is not the complete attribution result. The full attribution is computed by summing the gradients across all \alpha values and multiplying by the input difference x ' - x . CIG produces more stable and localized gradients in tumor regions throughout the path, while IG exhibits more dispersed patterns

Table 1. Attribution performance on tumor-positive slides from the Camelyon16 dataset, evaluated using MIL-AIC and MIL-SIC metrics

他分野との同型性

構造的骨格

本論文のコア数学的メカニズムは、対照的な参照へのパスに沿ってロジット出力の二乗差を積分することにより、モデルの意思決定に対する入力特徴の差分影響を定量化する手法である。

遠い親戚

Contrastive Integrated Gradients (CIG) の基本的な論理は、遠く離れた分野に興味深い「鏡像」を持っている。

ターゲット分野：金融リスク管理とポートフォリオ最適化
- 関連性: 金融では、長年の問題は、特定の市場要因（例：金利、商品価格、セクターパフォーマンス）が、ベンチマークインデックス（例：S&P 500）または競合ポートフォリオと比較して、ポートフォリオのパフォーマンスまたはリスクをどのように駆動するかを理解することである。これは、CIGがクラス識別的な特徴を対照的な参照と比較することによって特定するという目標と正確に類似している。定量的アナリストは、ポートフォリオのボラティリティに寄与するものは何かだけでなく、特定の経済条件下で市場平均よりも具体的に何がポートフォリオをよりボラティルにするかを知りたいかもしれない。「ロジット空間」は、リスク調整後リターンまたはベンチマークからの逸脱の変換された尺度であり、パス積分は、異なるシミュレートされた市場シナリオまたは投資戦略の下でこれらの要因寄与がどのように進化するかをモデル化する可能性がある。
ターゲット分野：気候科学と地球システムモデリング
- 関連性: 気候科学者はしばしば、観測された気候変動またはモデル予測を、産業革命前ベースラインまたは「介入なし」シナリオと比較して、特定の人間活動強制（例：CO2排出、土地利用変化）に帰属させることに苦労している。これは、CIGの対照的アトリビューションの直接的な並列である。彼らは、特定の気候結果（例：特定の地域気温上昇または異常気象の頻度）を、それらの強制がない世界と比較して、複雑な地球システムモデルにおける特定の入力パラメータまたは初期条件のどれが最も責任があるかを特定する必要がある。「ロジット空間」は、気候異常または安定状態からの逸脱の変換された尺度を表し、パス積分は、強制の漸進的な増加とその気候システムへの影響をモデル化する可能性がある。

もしシナリオ

ヘッジファンドの定量的アナリストが明日CIGの正確な方程式を「盗む」と想像してほしい。ポートフォリオ価値に対する様々な市場要因の感度を単純に計算するのではなく、彼らはCIGを適用して、選択されたベンチマークと比較してポートフォリオのパフォーマンスアウトパフォーマンスまたはアンダーパフォーマンスの対照的なドライバーを理解することができるだろう。対照的な参照と比較して、彼らのポートフォリオの対数リターン（ロジット出力に類似）とベンチマークの対数リターンの二乗差を、市場条件の変化を表すパスに沿って積分することにより、彼らは彼らのポートフォリオのパフォーマンスをベンチマークから区別する特定の資産または要因エクスポージャーを正確に特定することができるだろう。これは、対照的アルファ生成とリスクヘッジにおけるブレークスルーにつながるだろう。彼らは、ポートフォリオがベンチマークから逸脱する正確な市場条件または資産特性を特定し、相対リターンを最大化または相対リスクを軽減するための超ターゲット調整を可能にするだろう。これは、単純なアトリビューションを超えて、金融分析における識別的アトリビューションへと、アクティブマネージャーが市場の非効率性を特定し、利用する方法に革命をもたらす可能性がある。

構造の普遍的ライブラリ

本論文は、医療画像における識別的な特徴を特定するという課題が、金融および気候科学のような多様な分野における対照的アトリビューションの問題と深い数学的親和性を共有していることを実証し、科学的理解の普遍的なライブラリに重要な新しい構造を貢献することにより、すべての科学的問題が相互接続されているという考えを強力に強化している。