Professione medica

Intelligenza artificiale

14/04/2026

AI in medicina, accurati sulla diagnosi finale ma carenti nel ragionamento clinico. Lo studio

Uno studio pubblicato su JAMA Network Open valuta 21 modelli di AI: alta accuratezza nella diagnosi finale, ma limiti rilevanti nella diagnosi differenziale

Intelligenza artificiale nella scrittura medica (300 x 250 px)

I modelli di intelligenza artificiale raggiungono un’elevata accuratezza nella diagnosi finale, ma mostrano limiti significativi nel ragionamento clinico, in particolare nella diagnosi differenziale. È quanto emerge da uno studio pubblicato il 13 aprile 2026 su JAMA Network Open.

La ricerca, condotta da Arya S. Rao e colleghi del Mass General Brigham, ha analizzato 21 modelli linguistici di grandi dimensioni (LLM), tra cui GPT, Claude, Gemini e Grok, utilizzando 29 vignette cliniche standardizzate tratte dal MSD Manual. I modelli sono stati valutati lungo le diverse fasi del processo clinico: diagnosi differenziale, scelta dei test, diagnosi finale e gestione terapeutica.

I risultati indicano che la principale criticità riguarda le fasi iniziali del ragionamento. In particolare, la diagnosi differenziale rappresenta il punto più debole, con tassi di errore superiori all’80% per tutti i modelli. Al contrario, la diagnosi finale risulta corretta nella maggior parte dei casi quando sono disponibili tutte le informazioni cliniche.

Per valutare le prestazioni in modo più completo, i ricercatori hanno sviluppato un indicatore specifico, il PrIME-LLM, che misura la capacità dei modelli di mantenere un livello di accuratezza equilibrato lungo l’intero percorso clinico. I punteggi variano da 0,64 per i modelli meno performanti a 0,78 per quelli più avanzati, con risultati migliori per i sistemi ottimizzati per il ragionamento.

L’analisi evidenzia inoltre una tendenza dei modelli a convergere rapidamente verso una diagnosi finale, senza mantenere un adeguato livello di incertezza o sviluppare un ventaglio completo di ipotesi alternative. Secondo gli autori, questo comportamento riflette una differenza strutturale rispetto al ragionamento clinico umano, che si basa su un processo progressivo di esclusione diagnostica.

Un ulteriore elemento riguarda l’integrazione di dati multimodali. In alcuni modelli, l’uso di immagini diagnostiche, come radiografie o elettrocardiogrammi, migliora l’accuratezza, ma con risultati non uniformi tra i diversi sistemi.

Alla luce dei risultati, gli autori sottolineano che i modelli attualmente disponibili non sono pronti per un utilizzo clinico autonomo. «I modelli linguistici di grandi dimensioni disponibili sul mercato non sono ancora pronti per un’implementazione clinica non supervisionata», evidenziano i ricercatori, indicando la necessità di limitarne l’impiego a contesti controllati e sotto supervisione medica.

Lo studio introduce inoltre un nuovo benchmark per la valutazione dell’intelligenza artificiale in medicina, proponendo un approccio più aderente alla pratica clinica rispetto ai test basati su domande a scelta multipla, che non riflettono la complessità del processo diagnostico. Secondo gli autori, il ruolo attuale dell’AI resta quello di supporto al medico, in particolare nelle attività a bassa incertezza, mentre persistono limiti nella gestione dei processi decisionali complessi.

Se l'articolo ti è piaciuto rimani in contatto con noi sui
nostri canali social seguendoci su:

Oppure rimani sempre aggiornato in ambito farmaceutico iscrivendoti alla nostra Newsletter!

POTREBBERO INTERESSARTI ANCHE

Prescrizione

Prescrizioni, il medico di famiglia non può limitarsi a formalizzare quelle dello specialista. La sentenza

Il Tar del Lazio annulla parte della delibera regionale sulle liste d'attesa: la prescrizione è un atto professionale e non può essere ridotta a un adempimento amministrativo

Medici di famiglia

Medicina, aumentano i posti per il 2026-2027. Ecco come cambia il fabbisogno

È quanto emerge dalla bozza di Accordo trasmessa alle Regioni, che dovrà essere approvata in Conferenza Stato-Regioni e che fissa il fabbisogno complessivo dei corsi di laurea dell'area sanitaria a 84.196 posti

Professioni sanitarie

Professioni sanitarie, via libera all'emendamento sui radiati. Ecco quando è possibile chiedere la reiscrizione

La Commissione Affari sociali approva una norma che introduce una procedura di richiesta di reiscrizione per alcuni professionisti radiati durante la pandemia. Critica la Fnomceo

Università

Medicina, firmato il decreto sul semestre aperto. Ecco calendario e novità

La ministra Bernini firma il decreto per l'anno accademico 2026-2027: confermato il semestre aperto, definite le date di lezioni, esami e graduatoria nazionale

Resta aggiornato con noi!

La tua risorsa per news mediche, riferimenti clinici e formazione.

I più letti della settimana

Prescrizione

Prescrizioni, il medico di famiglia non può limitarsi a formalizzare quelle dello specialista. La sentenza

Diabete

Diabete tipo 2, orforglipron e semaglutide orale a confronto. Ecco che cosa emerge

Demenza

Demenza, l'Oms aggiorna le raccomandazioni sulla prevenzione. Le nuove indicazioni

ANNUNCI

Offro lavoro | Piemonte

Medico Fisiatra

Cerco Fisiatra per Direzione Tecnica ambulatorio privato di Fisioterapia in Torino. Ottime condizioni.Chiamare 011 3179222 o scrivere a centromedicoerbora@libero.it

EVENTI

Al via la 2° edizione Milan Longevity Summit, un laboratorio urbano per una vita più lunga e in salute

Edra S.p.A sarà media partner della seconda edizione del Milan Longevity Summit che si svolgerà a Milano dal 21 al...

AZIENDE

Eurosets presenta Landing Advance

Eurosets presenta Landing Advance, un sistema completo e intuitivo che apre nuove frontiere nel campo del monitoraggio multiparametrico in cardiochirurgia...

Libreria

Emergenze cardiologiche

Il manuale è stato scritto per colmare una...

Imaging della mammella

La radiologia senologica incarna un ramo dell'imaging di...

Malattie del cuore di Braunwald

Negli ultimi anni, i progressi scientifici e clinici...

PSICOLOGIA IN CURE PALLIATIVE

Questo manuale offre una panoramica aggiornata sul ruolo...

L’ETÀ GRANDE: LA NUOVA LEGGE PER GLI ANZIANI - SECONDA EDIZIONE

Questo testo vuole aiutare a comprendere la legge...

Corsi

Algoritmi di medicina di emergenza per le professioni sanitarie

Gli algoritmi relativi alla medicina di emergenza rappresentano una risorsa fondamentale per i professionisti sanitari che, ciascuno nel proprio ambito...

L’INTELLIGENZA ARTIFICIALE NELLA GESTIONE DELLE MALATTIE INFETTIVE

L’impatto dell’Intelligenza Artificiale (AI) e dei Big Data nel settore sanitario è innegabile. L’AI sta rivoluzionando la scoperta di farmaci, la...

Social media in medicina. Al via nuovo corso di formazione Fad

Edra, sempre attenta a garantire una formazione completa e adeguata alle esigenze del sistema salute, ha progettato il nuovo corso...

Progettare la cura con la medicina narrativa. Strumenti per un uso quotidiano

Introdurre la Medicina Narrativa nella progettazione dei percorsi di cura. Integrare la narrazione nel sistema cura e nel sistema persona...