研究:AIによるよりスマートな説明が医師のがんスキャンの読影に役立つ

スティーブンス工科大学の新たな研究によると、人工知能は医師の乳がん画像診断の精度を高めることができるが、それはその説明が臨床医に負担をかけるのではなく、サポートするように設計されている場合に限られる。

人工知能(AI)は既に医師ががんをより早期かつ正確に発見するのに役立っています。しかし、スティーブンス工科大学の新たな研究によると、AIが判断をどのように説明するかが、命を救う支援と危険な注意散漫の違いを生む可能性があることが示唆されています。

スティーブンス研究所の研究者らは、乳がん画像診断に焦点を当てた最近の2つの研究で、AIツールが腫瘍専門医と放射線科医による医用画像の読影精度を向上させることを明らかにしました。同時に、AIが結論に至った経緯についての説明を積み重ねることで、臨床医の作業速度が低下し、精神的な負担が増大し、場合によってはミスを犯しやすくなることも発見しました。

この研究は、現代医学の中心的な緊張、つまり人間の専門家による制御をしっかりと維持しながら AI の力をどのように活用するかという問題に焦点を当てています。

AIシステムは、X線、MRI、CT画像をスキャンし、人間には見分けにくい微細なパターンを検出するために既に広く利用されています。大規模な医療データセットと強力なコンピューティング能力を活用することで、これらのシステムは人間には到底及ばない速度でデータを精査することができます。

「AIシステムは数千枚の画像を迅速に処理し、人間のレビュー担当者よりもはるかに速く予測を行うことができます」と、スティーブンス大学の准教授で、医療分野におけるテクノロジーとの関わり方を研究するオヌール・アサン氏はニュースリリースで述べています。「人間とは異なり、AIは時間の経過とともに疲れたり、集中力を失ったりすることはありません。」

しかし、多くの臨床医はAIへの依存に依然として慎重です。その主な理由は、多くのシステムがいわゆる「ブラックボックス」として機能し、予測やリスクスコアを提示しても、その根拠を明確に説明できないためです。

「臨床医がAIがどのように予測を生成するかを知らない場合、AIを信頼する可能性は低くなります」とアサン氏は付け加えた。「そこで私たちは、追加の説明を提供することが臨床医にとって役立つかどうか、そしてAIの説明可能性の程度の違いが診断精度とシステムへの信頼にどのような影響を与えるかを明らかにしたいと考えました。」

この疑問を探るため、アサン氏はスティーブンス大学の博士課程学生オリャ・レザエアン氏とリーハイ大学の助教授アルパルスラン・エムラ・バイラク氏と共同研究を行いました。研究チームは、28人の腫瘍専門医と放射線科医がAIシステムを用いて乳がん画像を分析する様子を研究しました。

全ての臨床医は、AIが生成した画像の評価を確認しました。一部の臨床医は、AIがどのようにしてその結論に至ったかについて、追加の説明を受けました。画像を確認した後、参加者はAIの評価に対する信頼度と、その課題の難しさについて質問されました。

研究者らは、AIを活用した臨床医は、AIのサポートを受けなかった対照群の臨床医よりも全体的に診断精度が高かったと報告した。しかし、その利点には重要な条件が伴っていた。

重要な発見の 1 つは、説明が多ければ多いほど良いとは限らないということだ。

「説明可能性が増しても、信頼度が増すわけではないことがわかりました」とアサン氏は付け加えた。

研究チームは、説明がより詳細または複雑になると、臨床医は情報処理に多くの時間を費やす必要があることを観察しました。この余分な労力は画像自体への注意を逸らし、意思決定を遅らせ、結果として全体的なパフォーマンスを低下させました。

「より多くの情報を処理することは、臨床医の認知負荷を増加させます。また、ミスを犯しやすくなり、患者に危害を及ぼす可能性も高まります」とアサン氏は付け加えた。「タスクを追加することで、ユーザーの認知負荷を増やすことは避けたいものです。」

これらの研究は、AIへの過信という別の種類のリスクも指摘しています。臨床医がシステムの出力をあまりにも強く信頼しすぎて、たとえそれが間違っていたとしても、疑問を抱く可能性が低くなるケースもありました。

「AIシステムが適切に設計されておらず、ユーザーが高い信頼を寄せているにもかかわらずエラーを起こした場合、一部の臨床医はAIが示唆するものはすべて真実であると盲目的に信じ込み、結果を十分に精査しなくなる可能性がある」とアサン氏は付け加えた。

チームの調査結果は2つの論文で詳しく述べられている。1つはAIの説明が乳がんの信頼と診断精度に与える影響に関するもので、 応用人間工学誌に掲載2つ目は、臨床意思決定支援システムにおける説明可能性とAIの信頼性についてです。 国際ヒューマン・コンピュータ・インタラクションジャーナルに掲載.

これらの研究を総合すると、次世代の医療 AI の設計上の課題が浮かび上がります。それは、信頼できるほど透明性が高く、かつ、プレッシャーのかかる臨床ケアの環境でも使用できるほどシンプルなツールを構築することです。

「私たちの研究結果は、設計者はAIシステムに説明を組み込む際に注意を払う必要があることを示唆しています」とアサン氏は述べた。

同氏は、説明は臨床医の思考を圧倒するのではなく、サポートするような内容にすべきだと付け加えた。

トレーニングも重要になります。アサン氏は、AIは人間の専門知識に代わるものではなく、補助的なものとして捉えるべきだと主張しました。

「AIを使用する臨床医は、AIの出力をただ信頼するのではなく、解釈することに重点を置いたトレーニングを受ける必要がある」と彼は述べた。

アサン氏は、説明可能性を超えて、テクノロジー採用研究から得られたより広範な原則を指摘した。それは、人々がツールを最も利用しそうなのは、それが役に立つと同時に使いやすいと信じているときだということである。

「研究によると、人があらゆるテクノロジーを使う際には、主に二つの基準があります。それは、認識される有用性と、認識される使いやすさです」と彼は付け加えた。「ですから、医師がこのツールが自分の仕事に役立つと感じ、使いやすいと思えば、彼らはそれを使うでしょう。」

患者にとって、そのリスクは大きいです。乳がんは依然として世界で最も罹患率の高いがんの一つであり、早期かつ正確な発見は治療成績を劇的に向上させます。AIは、腫瘍の早期発見、診断の見落としの削減、そして病院や診療所におけるケアの標準化に貢献する可能性を秘めています。

しかし、スティーブンス氏の研究は、単に読影室にAIを導入するだけでは不十分であることを強調しています。ケアを真に改善するには、臨床医の認知能力の限界とワークフローを考慮したシステムを設計する必要があり、医療システムは医師がAIに頼るべき時とAIに疑問を持つべき時を理解できるよう支援する研修に投資する必要があります。

AI が医療の分野に広がり続ける中で、こうした研究はロードマップを示しています。それは、人間の判断力を増幅し、すでに多忙を極める臨床医の過負荷を回避し、あらゆる設計上の選択において患者の安全を最優先にするツールを構築することです。

出典: スティーブンス工業技術大学