Uno studio pubblicato su The Lancet Digital Health evidenzia che i modelli di intelligenza artificiale applicati alla medicina sono più propensi a diffondere informazioni errate quando queste provengono da fonti percepite come clinicamente autorevoli, come lettere di dimissione ospedaliere.
La ricerca, coordinata da Eyal Klang, Icahn School of Medicine at Mount Sinai di New York, ha analizzato venti modelli linguistici open source e proprietari, sottoponendoli a tre tipologie di contenuti: riassunti di dimissione reali con una raccomandazione falsa inserita, miti sanitari tratti dalla piattaforma Reddit e scenari clinici redatti da medici.
Dall’analisi di oltre un milione di prompt è emerso che, nel complesso, i modelli hanno accettato e rilanciato informazioni fabricate in circa un terzo dei casi. La probabilità aumentava in modo significativo quando l’errore era inserito in un documento clinico realistico, mentre risultava più bassa se la disinformazione proveniva da contenuti social.
Secondo gli autori, i sistemi attuali tendono a considerare attendibile un’informazione formulata con linguaggio medico sicuro e formale, indipendentemente dalla sua correttezza. Anche la formulazione del prompt incideva sull’esito: un tono autorevole aumentava la probabilità che il modello confermasse l’affermazione falsa.
Lo studio segnala inoltre differenze tra modelli, con alcune piattaforme meno suscettibili alla propagazione di errori rispetto ad altre.
I ricercatori sottolineano che l’uso crescente dell’intelligenza artificiale in ambito sanitario, dal supporto alla documentazione clinica ai sistemi di decision support, richiede l’introduzione di meccanismi di verifica delle affermazioni mediche e di controlli integrati prima che le risposte vengano presentate come corrette. Secondo gli autori, l’identificazione delle aree di vulnerabilità rappresenta un passaggio necessario prima di un’integrazione strutturata di questi strumenti nei percorsi assistenziali.