Professione medica
Intelligenza artificiale
04/03/2026

Intelligenza artificiale, i chatbot sanitari, non migliorano le decisioni dei pazienti. Lo studio

Uno studio mostra che l’uso di chatbot medici da parte dei cittadini non aumenta l’accuratezza nell’identificazione delle condizioni e delle decisioni assistenziali

Intelligenza artificiale nella scrittura medica (300 x 250 px)

L’utilizzo di modelli linguistici per supportare i cittadini nella valutazione dei sintomi e nella scelta del livello di assistenza non migliora l’accuratezza decisionale rispetto alle fonti tradizionali. È quanto emerge da uno studio randomizzato preregistrato pubblicato su Nature Medicine, che ha coinvolto 1.298 partecipanti del Regno Unito impegnati nell’analisi di scenari clinici simulati.

I partecipanti sono stati assegnati a gruppi che potevano utilizzare un modello linguistico — GPT-4o, Llama 3 o Command R+ — oppure ricorrere alle fonti abituali, come motori di ricerca o siti sanitari. L’obiettivo era identificare possibili condizioni cliniche e scegliere il percorso assistenziale appropriato, su una scala che andava dall’autogestione alla chiamata dei servizi di emergenza.

I risultati mostrano che, se interrogati direttamente, i modelli sono in grado di individuare condizioni rilevanti in circa il 94,9% dei casi e di suggerire correttamente il livello di assistenza nel 56,3%. Tuttavia, quando utilizzati dai partecipanti, la capacità di identificare condizioni pertinenti è risultata inferiore al 34,5%, mentre l’accuratezza nella scelta del percorso assistenziale non ha superato il 44,2%, valori comparabili al gruppo di controllo.

L’analisi delle interazioni ha evidenziato che le criticità derivano soprattutto dalla comunicazione tra utenti e modelli. In numerosi casi i partecipanti hanno fornito informazioni incomplete oppure non hanno incorporato nei propri ragionamenti le indicazioni corrette fornite dal sistema. Gli autori segnalano inoltre episodi di interpretazioni errate da parte dei modelli e risposte incoerenti a input simili.

Lo studio evidenzia anche che le performance ottenute dai modelli nei benchmark di conoscenza medica o nelle simulazioni con utenti artificiali non risultano predittive dell’efficacia nelle interazioni reali. Nei test comparativi, infatti, i modelli hanno mostrato risultati migliori nelle prove strutturate rispetto alle situazioni di utilizzo con partecipanti umani.

Secondo gli autori, la diffusione crescente dell’impiego di chatbot per quesiti sanitari rende necessario considerare l’interazione uomo-AI come elemento centrale della sicurezza e dell’affidabilità dei sistemi. Il lavoro raccomanda pertanto programmi sistematici di valutazione con utenti reali prima di eventuali implementazioni su larga scala in ambito sanitario.

FONTE

Reliability of LLMs as medical assistants for the general public: a randomized preregistered study | Nature Medicine

Se l'articolo ti è piaciuto rimani in contatto con noi sui
nostri canali social seguendoci su:
Oppure rimani sempre aggiornato in ambito farmaceutico iscrivendoti alla nostra Newsletter!
POTREBBERO INTERESSARTI ANCHE
L’allarme del presidente della Cassa Alberto Oliveti: “Rischio instabilità in caso di passaggio alla dipendenza di una parte dei camici bianchi”
All’Aran il primo tavolo con i sindacati: sul tavolo risorse, indennità, carichi di lavoro e misure per rendere più attrattivo il Servizio sanitario nazionale
Il presidente FNOMCeO critica il progetto di riforma della medicina generale basato sul passaggio alla dipendenza e propone invece un rafforzamento del modello convenzionato
Il Sindacato medici italiani annuncia un reclamo al Comitato europeo dei diritti sociali contro le norme che regolano lo sciopero dei medici di medicina generale

Resta aggiornato con noi!
La tua risorsa per news mediche, riferimenti clinici e formazione.

I più letti della settimana
ANNUNCI
Altro | Toscana
stanza con accesso anche per disabili, studio piano terra vicino poste di San Marco (Prato)affitto mensile per 2/3/4 mezze giornate...

EVENTI
Al via la 2° edizione Milan Longevity Summit, un laboratorio urbano per una vita più lunga e in salute
Edra S.p.A sarà media partner della seconda edizione del Milan Longevity Summit che si svolgerà a Milano dal 21 al...

AZIENDE
Eurosets presenta Landing Advance
Immagine in evidenza Eurosets presenta Landing Advance, un sistema completo e intuitivo che apre nuove frontiere nel campo del monitoraggio multiparametrico in cardiochirurgia...

Libreria
Il manuale è stato scritto per colmare una...
La radiologia senologica incarna un ramo dell'imaging di...
Negli ultimi anni, i progressi scientifici e clinici...
Questo manuale offre una panoramica aggiornata sul ruolo...
Questo testo vuole aiutare a comprendere la legge...
Corsi
Algoritmi di medicina di emergenza per le professioni sanitarie

Gli algoritmi relativi alla medicina di emergenza rappresentano una risorsa fondamentale per i professionisti sanitari che, ciascuno nel proprio ambito...


L’INTELLIGENZA ARTIFICIALE NELLA GESTIONE DELLE MALATTIE INFETTIVE

L’impatto dell’Intelligenza Artificiale (AI) e dei Big Data nel settore sanitario è innegabile. L’AI sta rivoluzionando la scoperta di farmaci, la...


Social media in medicina. Al via nuovo corso di formazione Fad

Edra, sempre attenta a garantire una formazione completa e adeguata alle esigenze del sistema salute, ha progettato il nuovo corso...


Progettare la cura con la medicina narrativa. Strumenti per un uso quotidiano

Introdurre la Medicina Narrativa nella progettazione dei percorsi di cura. Integrare la narrazione nel sistema cura e nel sistema persona...