AIは認知機能低下を受けることができますか？調査では、チャットボットが時間の経過とともに正確さを失うことを示唆しています

医療診断が人工知能（AI）をますます使用するにつれて、新しい研究はその長期的な一貫性に関して懸念を引き起こしています。 12月20日にリリースされたこの調査では、大規模な言語モデル（LLMS）とAIベースのチャットボットが苦しむ可能性があることが示されています。、人間に似ています。

この発見は、人間の医師がAIにすぐに置き換えられ、医療診断における可能性のある脅威を特定するという考えを弱めています。

AIは医療診断をより速くしました

ブレット・ジョーダン/アンクラッシュ

AIは、人間の目に明らかになる前に異常を検出するために、病歴、X線、およびその他のデータセットを迅速に分析することにより、ヘルスケアに革命をもたらしました。

これらの進歩により、診断速度と精度が大幅に改善されました。ただし、最近の研究では、OpenaiのChatGpt、Anthropic's Sonnet、AlphabetのGeminiを含むAIを搭載したチャットボットが、時間の経過とともに有効性を失う可能性があることを示唆しています。ライブサイエンス。

認知能力のAIのテスト

AIシステムが認知機能低下に苦しんでいるかどうかを判断するために、研究者はモントリオール認知評価（MOCA）テスト。神経科医が一般的に採用して人間の認知能力を評価するこのテストは、以下を含む分野の能力を定量化します。

注意と記憶
言語と抽象化
空間スキルと実行機能

このテストには、100から7つを繰り返し減算し、読み取りリストからアイテムを覚えているなどのアクティビティが含まれ、特定の時間を時計の表面にマークします。人間の場合、30人中26人は通常の認知状態を表し、それよりも少ないかもしれませんが、認知障害を示す可能性があります。

AIチャットボットの採点方法

の結果BMJ研究驚くべき傾向を示しました。 CHATGPT-4は30のうち26で最高のスコアを持ち、通常の認知機能の人間レベルに達しました。 Gemini 1.0はそれほど成功しておらず、スコアはわずか16であり、LLMの古いバージョンの認知機能の劣化を示しています。

AIは、命名、注意、言語テストで最善を尽くしましたが、空間的および実行機能テスト、特に遅延リコールと抽象的な思考では不十分でした。

AIは本当に認知機能低下を患っていますか？

結果は、古いAIモデルのパフォーマンスの低下を指していますが、科学者は調査結果が観察的であると警告しています。 AIがデータを処理する方法は、本質的に人間の脳とは異なるため、2つを簡単に比較することはできません。この研究は、AIシステムに医療診断で完全に機能することを妨げる可能性のある欠陥がある可能性があることを依然として示唆しています。

主な懸念事項の1つは、AIが視覚的な抽象化と実行機能タスクでひどく機能することです。これは、健全な医療診断に不可欠な2つのドメインです。 AIチャットボットが複雑な視覚情報を信頼できるほどデコードできない場合、臨床環境でのアプリケーションが損なわれる可能性があります。