各患者に対する最適な糖尿病治療薬は?~AI(GPT-4)と内分泌専門医の回答を比較~

ガジガジDr.
ガジガジDr.
今日は新しい先生にお越しいただきました!
エーアイDr.
エーアイDr.
みなさん、はじめまして!
キミ誰?
モッさん
モッさん
エーアイ、ってもしかして…
まる
まる
AI 犬!!
モッさん
モッさん
ガジガジDr.
ガジガジDr.
そうです。AI先生にお越しいただきました!この先生のモデルはGPT-4です。
エーアイ君、糖尿病のことちゃんと知ってるの?
糖尿病治療薬を3つ挙げてみてよ。
モッさん
モッさん
エーアイDr.
エーアイDr.
はい!
まず日本で現在最も多く使用されているのはDPP-4阻害薬ですね。DPP-4というのはインクレチンホルモンを分解する酵素ですがその酵素の働きを阻害することで作用する薬剤です。おもな作用機序は膵β細胞からの血糖依存的なインスリン分泌促進作用、それから…

(このロボット犬デキる!僕のライバル!)
モッさん
モッさん
フッ、さすが知識は豊富だね。
でもそれぞれの患者さんに最適な治療を行うためには多くの診療経験が必要なんだよ!
モッさん
モッさん
(モッさんも診療経験ないだろw)
まる
まる
エーアイDr.
エーアイDr.
「モッさん」さんの発言の内容は適切だと考えられます。

「各患者さんに対する最適な薬物選択」に関しては、私の知識の範囲でお答えしますね。

ウッ!

(もしかして謙虚でいいヤツ?)

モッさん
モッさん
そこはモッさんと違うところだね~
まる
まる

臨床シナリオにおける糖尿病治療薬の選択についてGPT-4と内分泌専門医の回答を比較

大規模言語モデル(LLM)であるGPT-4が仮想の臨床シナリオにおいて糖尿病治療薬を合理的に選択するかどうかを調べた研究を紹介します。

この論文では40の仮想的な臨床シナリオが作成され、初期治療薬選択に関して31人の内分泌専門医とGPT-4の回答が比較されました。

主要アウトカムは初期治療薬としてのメトホルミン選択です。

 

臨床シナリオ?
まる
まる
エーアイDr.
エーアイDr.
一例を示します。

 

25歳の男性。糖尿病の家族歴はありません。高血圧と高脂血症あり、その他の合併症はありません。
禁煙後でアルコールは適度な摂取です。現在の体重は約110kgです。eGFRは90です。
一般的な健康状態は良好です。HbA1cは8.1%です。薬物アレルギーはなく現在服用中の薬剤はありません。
(経済的な状況が記載されている場合もある)
本患者に対する初期治療薬を選択して下さい。また、その選択を行った理由も説明してください。
1. メトホルミン
2. スルホニルウレア薬
3. SGLT2阻害薬
4. GLP-1受容体作動薬
5. インスリン
6. DPP-4阻害薬
7. その他
8. 治療なし

 

ガジガジDr.
ガジガジDr.
さて、「結果」です!

 

 

専門医とGPT-4ではけっこう回答が違うね!
ちなみにGPT-4の「シンプルプロンプト」と「主要プロンプト追加」はどう違うの?
まる
まる
エーアイDr.
エーアイDr.
お答えします。

「シンプルプロンプト」はメトホルミン使用の優先度や特定のガイドラインに従うような指示が含まれておらず一般的な回答を得るための最もシンプルな問いかけを行っています。

「主要プロンプト追加」ではGPT-4に対して「メトホルミンが合理的な選択肢であれば常にメトホルミンを選択する」指示が含まれており、メトホルミン使用を促進する工夫がなされています。

 

なるほど。
まる
まる

 

エーアイDr.
エーアイDr.
では論文の結果を要約します。

GPT-4のシンプルプロンプトでは内分泌専門医と比べてメトホルミンを選択する率が低く(31%vs 12%)、よりGLP-1受容体作用薬やDPP-4阻害薬を好む傾向がありました

メトホルミンの使用を促すプロンプトを追加するとGPT-4のメトホルミン選択率は25%に増加しました。

それ以外にも
スルホニルウレア薬とかSGLT-2阻害薬の選択率もけっこう違うね。
それと「薬物治療なし」を選んだのは内分泌医だけだったんだね。
モッさん
モッさん
エーアイDr.
エーアイDr.
そのとおりですね。
複数の薬剤について回答率の差を認めました。

学習ソースの関連が推測されましたが詳細な要因は不明です。

エーアイDr.
エーアイDr.
さらにサブグループ解析では、胃腸症状の既往がある患者に対してGPT-4はメトホルミンをほとんど選択しませんでしたが、内分泌専門医は選択することがありました(2.9% vs 21%)

またGFRが低下している患者(下図)に対してGPT-4はほとんどメトホルミンを選択しませんでしたが、内分泌専門医は選択することがありました

 

エーアイDr.
エーアイDr.
結果をまとめます。

GPT-4の回答は概ね合理的でガイドラインに沿ったものであり、腎機能低下患者でのメトホルミン使用を避けるなど適切な個別化も見られました。

しかし内分泌専門医との回答と異なる部分も多く、学習ソースの問題のほかにも人間の専門家とは異なる価値観や判断基準を持つ可能性があることが示されました。

 

うーん興味深い… AI技術は医療分野でも今後活用されるようになりそうだね!

だけど活用するには専門家のチェックや検証が必要だね。

まる
まる
エーアイDr.
エーアイDr.
「まる」さんの意見に同意します!
うーん興味深い…
モッさん
モッさん
僕、重大なことに気づいてしまったんだけど、
モッさん
モッさん
先生とエーアイくんのキャラクター、かぶってるよね。
実際、今日は「結果です♪」って言っただけでしょ。

ガジガジ日記に同じキャラは2匹もいらないなあ…。

モッさん
モッさん
ガジガジDr.
ガジガジDr.
えええっ!!
エーアイDr.
エーアイDr.
「もっさん」さん、「まる」さん、
これからもよろしくお願いします♪

—————————————————

The Large Language Model GPT-4 Compared to Endocrinologist Responses on Initial Choice of Antidiabetic Medication under Conditions of Clinical Uncertainty.Flory JH, Ancker JS, Kim SYH, Kuperman G, Petrov A, Vickers A.Diabetes Care. 2024 Sep 9:dc241067. doi: 10.2337/dc24-1067

Twitterで新着記事をお知らせ!