薬学部

人工知能(AI)が医師国家試験を突破?医療従事者の未来や如何に

今回は日米国際研究チームが発表したオープンAIが日本の医師国家試験の合格ラインを超えたというニュースについて私なりに調べてみたことを解説していきます。以前、当ブログでも薬剤師国家試験をAIに解かせた記事がありますが、今回は医師国家試験ということで中身が気になるところですね。




医師国家試験とは

私は薬剤師なので医師国家試験について実体験をベースに語ることはできません。ですので、厚生労働省など公式HPに記載された情報をまとめています。

医師国家試験2022 厚生労働省リンク

第117回(2023年施行)医師国家試験の基本情報

合格者数 9432人

合格率  91.6%

非常に高い合格率ですよね。まあ入学難易度の高い医学部で6年間必死に勉強してきた猛者の方々が受験しているので納得です。

ちなみに医学部で最も偏差値が低い大学は川崎医科大学というところで入学偏差値は60程度と言われています。(パスナビ 旺文社より引用

川崎医科大学の受験科目は数学(数Ⅲ・B)、英語、理科(物理、化学、生物)、小論文です。国公立の医学部を目指すことを考えたら頑張れば手が届くかもしれませんね。

余談ですが、川崎医科大学の6年間の学費は日本一高いと言われており、なんと6年間で47365000円!!これ学費だけでこの値段なので、生活費なども含めたら5000万円いきますね。これだけで豪邸が建ってしまいそうです。さすがに庶民には手が出ない学費です。

医師国家試験は全400問を2日間かけて解いていく過酷な試験です。(薬剤師は345問を2日)

問題は【各論】【必修】【総論】に大別され、さらに全般的な知識を問う【一般問題】と症例提示で始まる【臨床問題】に分けられるようです。

117回一般問題

これは薬剤師でも答えられそうな問題ですね。答えは【b】です。

ただし、薬剤師国家試験では必須とか理論とか実践という文言が記載されるので、どの問題が必須なのかなどが分かるのですが、医師国家試験は記載がないのでわからないのが新鮮でした。

第117回 臨床問題

○○歳●性など具体的な情報が提示されている問題はより臨床に近い問題として出題されているようです。これも薬剤師でもわかる問題でした。答え場【b】のジアゼパムです。

ほかにも実際の検査画像(レントゲン、CT、MRI、血管造影、エコー。超音波など)や爪、唇の色など体の一部を診察した上で答えを求めるような問題も多く、この辺りはやはり高度な専門性を求められる問題だなと感じました。

より詳細を知りたいという方はこちらのサイトを参照してみてください。↓

https://informa.medilink-study.com/regularpost/11669/

使用した人工知能(AI)の種類について

今回ニュースとなっていた研究では、オープンAIである【Chat-GPT】【GPT-4】を用いて行われたようです。

Chat-GPTを用いた国家試験解答については以前私も記事を上げていますのでこちらもよかったらぜひご覧ください↓↓↓↓↓↓↓↓

Chat-GPTについてはご存じの方も多いかと思いますが、オープンAIと呼ばれる一般公開されていてだれでも無料で使用できるAIのことです。

GPT-4とは言語モデルと呼ばれるAIであり、Chat-GPTのような会話形式というよりは問題を論理的に考察することが得意なAIと言われています。

異なる点を以下に示します。

  • ・有料である。(月額20ドル)→Chat-GPT plus加入
  • ・画像から状況を読み取り返答することができる(ここがすごい)
  • ・投入できる情報量が莫大

抽象的な表現ですみません。

最大の特徴は画像を渡すと、それについて反応をするという点です。Chat-GPTには画像を貼ることはできません。そのため、グラフの読み取りや検査データの画像を見せることができませんでした。

GPT-4はそれを可能としているため、診察に必要な画像を添付し、その画像の内容を理解して問題に回答することが可能となります。

察しの良い方はもうお気づきかと思いますが、成績についてはそれなりに差が出ることが予測できますよね。

AI別の成績について

始めに参考にしたニュースのリンクを貼っておきます

https://www.yomiuri.co.jp/science/20230509-OYT1T50319/ ①

https://news.yahoo.co.jp/articles/cf3b953e9bab801ddb4f4f16673ba29a62babe0e ②

ワシントン大学笠井淳吾研究員の報告より引用(リンク①)

上記図の通り、Chat-GPTは残念ながら合格ラインに届きませんでしたが、GPT-4は見事に合格しています。GPT-4は米国司法試験突破などの実績があり、学習させることでさらに正確な情報処理を行うことができるとされていますので、医学生の平均に届く日もそう遠くないのかもしれませんね。

Chat-GPTは画像問題を解くことができないので点数が低くなってしまうのは一部仕方ないのかもしれません。人間にも得意不得意があるように、会話が得意な人に高度な論理的思考まであったら人間なんて太刀打ちできませんからね。

リンク②では日本の医学部6年生が行った研究です。

この研究では画像を使わない問題限定ですが、必須、臨床問題において合格最低ラインを3%上回ったと報告しています。ですが、記事を読み進めていくと、Chat-GPTに問題を解かせるために問題を一度要約(一部改変)してから問うなどの苦労があったとのことです。私も以前薬剤師国家試験を解かせたときにこの部分に非常に苦労しました。

現状はAIが分かるような表現に変えてあげたり、聞き方を変えたりなどの小細工はある程度必要でした。問題を細切れにすると正しい答えを返してくれたりとまだまだChat-GPTを上手く使う方法はありそうです。




見えてきたAIの得意・不得意分野

GPT-4になることで画像処理も可能となりいよいよ診断までできるか?と思われましたが、前項のリンク①の記事では、禁忌肢(絶対に選んではいけない択)を選んでしまったり、安楽死を促す対応を適切なものとして選んだりと数々の問題は見えてきたようです。

日本の法律を学んでいないなどの背景もあるようですが、妊婦などの特殊な状況を考慮できないのは由々しき問題であると思います。倫理観などもAIにはまだ難しい問題なのかもしれません。

数々のエビデンスに基づいた医学・薬学情報にアクセスして正しいものを選ぶことは得意であることは間違いないですが、それぞれの情報を上手く連携させて現場に投下していくことはまだ現実的ではないようです。

以前書いた記事で私も述べましたが、医師・薬剤師に取って代わるのではなく、業務の効率化、手助けという位置づけで考えていくのがいいのかなと思います。人間にしかできないこともたくさんありますし、AIはどんな時でも合理的な判断をしがちです。

生きていれば非合理でもやったことがいい方がいいことってたくさんありますよね?

すべてをAIに任せようということ自体が傲慢なのかもしれません。

まとめ

いかがだったでしょうか?

今回は気になったニュースの深堀というスタイルでしたが、以前自分がやった検証(極浅ですが)に似ているけどちゃんと研究したケースについて解説しました。

AIのこれからの活躍に期待しつつ、自分磨きも忘れないようにしたいですね。

ABOUT ME
hiropon
初めまして。ヒロポンです。 私は大学病院で薬剤師をしています。 医療や健康についての情報発信をしたいと思いブログを始めました。 定期的に皆さんの健康に寄与する記事を更新しますので、よろしくお願いします。