プロジェクト

マルチモーダル動的予測

医療の分野では、ある時点まで生存した患者について、その後一定期間内にイベント（再発や死亡など）が発生する確率を予測する「動的予測」が重要な課題となっています。従来の生存時間解析が固定的な予測を行うのに対し、動的予測は時間の経過に伴い更新される情報を取り込みながら予測を刷新できる点に強みがあります。

本研究では、検査値などのテーブルデータに加え、X線画像や医師の所見テキストなど複数種類のデータを統合する「マルチモーダル動的予測」に取り組みます。医療データには欠損や取得タイミングの不揃いといった特有の困難があるため、まずマルチモーダルに対応したデータ補完手法を構築し、その上で予測モデルを開発・評価します。目標は、単一モダリティの予測を有意に上回る性能を達成することです。

ゲノム解析

ゲノム情報の解析は、疾患の原因遺伝子の特定や個別化医療の実現に不可欠な技術です。本研究では2つのアプローチを並行して進めます。1つは、DFKI（ドイツ人工知能研究センター）が構築したゲノム・プロテオミクス解析プラットフォーム「ECGPlat」を活用した解析です。もう1つは、自然言語処理の考え方をDNA配列やタンパク質配列に応用する、言語モデルベースの解析です。たとえば、DNA配列中のN-gramパターンの分布からメチル化関連の遺伝子パターンを推定するなど、情報科学と生命科学の融合的な手法を開発しています。目標は、我々が新たに設定した課題に対して世界最高水準（SOTA）の性能を達成することです。

XAI（説明可能AI）

深層学習をはじめとするAIモデルの高度化・ブラックボックス化に伴い、AIがなぜその判断に至ったかを説明する技術（Explainable AI; XAI）の重要性が増しています。特に医療分野では、AIの予測や診断支援の結果に基づいて治療方針を決定するのは医師であり、医師がその根拠を理解・納得できることが不可欠です。

本研究では、DFKIがさまざまな応用分野で蓄積してきたXAIの知見を活かし、医療の各場面に特化した説明手法を開発します。まず単一モダリティに対応したXAIを構築し、続いてマルチモーダルな説明へと拡張します。評価にあたっては、医師へのアンケート調査などを通じて、実際の利用者にとって有用な説明が生成できているかを検証します。

医療データ解析におけるLLM利用

大規模言語モデル（LLM）や各種基盤モデルは、医療分野においてもゲームチェンジャとなり得る技術であり、その活用が急速に広がっています。電子カルテに蓄積された大量のテキスト情報を解析するだけでなく、上記(1)〜(3)で取り上げた動的予測、ゲノム解析、XAIの各テーマにおいても、LLMの活用は今後標準的な手法となると予想されます。

本研究では、LLMや各種基盤モデルを医療データ解析に効果的に導入するため、モデルの評価・選択と利用環境の整備を進めます。DFKIにおける自然言語処理の知見を活かしつつ、電子カルテデータの解析やデータ補完へのLLM応用にも取り組みます。