Professione medica
Intelligenza artificiale
04/03/2026

Intelligenza artificiale, i chatbot sanitari, non migliorano le decisioni dei pazienti. Lo studio

Uno studio mostra che l’uso di chatbot medici da parte dei cittadini non aumenta l’accuratezza nell’identificazione delle condizioni e delle decisioni assistenziali

Intelligenza artificiale nella scrittura medica (300 x 250 px)

L’utilizzo di modelli linguistici per supportare i cittadini nella valutazione dei sintomi e nella scelta del livello di assistenza non migliora l’accuratezza decisionale rispetto alle fonti tradizionali. È quanto emerge da uno studio randomizzato preregistrato pubblicato su Nature Medicine, che ha coinvolto 1.298 partecipanti del Regno Unito impegnati nell’analisi di scenari clinici simulati.

I partecipanti sono stati assegnati a gruppi che potevano utilizzare un modello linguistico — GPT-4o, Llama 3 o Command R+ — oppure ricorrere alle fonti abituali, come motori di ricerca o siti sanitari. L’obiettivo era identificare possibili condizioni cliniche e scegliere il percorso assistenziale appropriato, su una scala che andava dall’autogestione alla chiamata dei servizi di emergenza.

I risultati mostrano che, se interrogati direttamente, i modelli sono in grado di individuare condizioni rilevanti in circa il 94,9% dei casi e di suggerire correttamente il livello di assistenza nel 56,3%. Tuttavia, quando utilizzati dai partecipanti, la capacità di identificare condizioni pertinenti è risultata inferiore al 34,5%, mentre l’accuratezza nella scelta del percorso assistenziale non ha superato il 44,2%, valori comparabili al gruppo di controllo.

L’analisi delle interazioni ha evidenziato che le criticità derivano soprattutto dalla comunicazione tra utenti e modelli. In numerosi casi i partecipanti hanno fornito informazioni incomplete oppure non hanno incorporato nei propri ragionamenti le indicazioni corrette fornite dal sistema. Gli autori segnalano inoltre episodi di interpretazioni errate da parte dei modelli e risposte incoerenti a input simili.

Lo studio evidenzia anche che le performance ottenute dai modelli nei benchmark di conoscenza medica o nelle simulazioni con utenti artificiali non risultano predittive dell’efficacia nelle interazioni reali. Nei test comparativi, infatti, i modelli hanno mostrato risultati migliori nelle prove strutturate rispetto alle situazioni di utilizzo con partecipanti umani.

Secondo gli autori, la diffusione crescente dell’impiego di chatbot per quesiti sanitari rende necessario considerare l’interazione uomo-AI come elemento centrale della sicurezza e dell’affidabilità dei sistemi. Il lavoro raccomanda pertanto programmi sistematici di valutazione con utenti reali prima di eventuali implementazioni su larga scala in ambito sanitario.

FONTE

Reliability of LLMs as medical assistants for the general public: a randomized preregistered study | Nature Medicine

Se l'articolo ti è piaciuto rimani in contatto con noi sui
nostri canali social seguendoci su:
Oppure rimani sempre aggiornato in ambito farmaceutico iscrivendoti alla nostra Newsletter!
POTREBBERO INTERESSARTI ANCHE
La Federazione dei medici di famiglia propone di definire entro il 30 giugno il contributo della medicina generale alle Case della Comunità attraverso il rinnovo dell'Acn
Dopo lo stop al decreto sulla riforma dei medici di famiglia, si riapre il confronto tra ministero della Salute, Regioni e sindacati. Sul tavolo il ruolo dei medici nelle Case di comunità
Dopo l'atto di indirizzo approvato dalle Regioni, il ministro conferma il confronto sulle sei ore nelle Case di comunità. FIMMG: "Pronti a lavorare subito
La Regione Veneto e i sindacati dei medici di medicina generale hanno raggiunto un accordo per rafforzare l'attività delle Case di comunità

Resta aggiornato con noi!
La tua risorsa per news mediche, riferimenti clinici e formazione.

I più letti della settimana
ANNUNCI
Offro lavoro | Lombardia
Per nuovo punto vendita c/o il centro commerciale LE TORRI a Vimercatehttps://www.farmaciecomunalivimercate.it/amministrazione.asp?idNotizia=897828&idCat=39190&idCatPadre=34429

EVENTI
Al via la 2° edizione Milan Longevity Summit, un laboratorio urbano per una vita più lunga e in salute
Edra S.p.A sarà media partner della seconda edizione del Milan Longevity Summit che si svolgerà a Milano dal 21 al...

AZIENDE
Eurosets presenta Landing Advance
Immagine in evidenza Eurosets presenta Landing Advance, un sistema completo e intuitivo che apre nuove frontiere nel campo del monitoraggio multiparametrico in cardiochirurgia...

Libreria
Il manuale è stato scritto per colmare una...
La radiologia senologica incarna un ramo dell'imaging di...
Negli ultimi anni, i progressi scientifici e clinici...
Questo manuale offre una panoramica aggiornata sul ruolo...
Questo testo vuole aiutare a comprendere la legge...
Corsi
Algoritmi di medicina di emergenza per le professioni sanitarie

Gli algoritmi relativi alla medicina di emergenza rappresentano una risorsa fondamentale per i professionisti sanitari che, ciascuno nel proprio ambito...


L’INTELLIGENZA ARTIFICIALE NELLA GESTIONE DELLE MALATTIE INFETTIVE

L’impatto dell’Intelligenza Artificiale (AI) e dei Big Data nel settore sanitario è innegabile. L’AI sta rivoluzionando la scoperta di farmaci, la...


Social media in medicina. Al via nuovo corso di formazione Fad

Edra, sempre attenta a garantire una formazione completa e adeguata alle esigenze del sistema salute, ha progettato il nuovo corso...


Progettare la cura con la medicina narrativa. Strumenti per un uso quotidiano

Introdurre la Medicina Narrativa nella progettazione dei percorsi di cura. Integrare la narrazione nel sistema cura e nel sistema persona...