L’intelligenza artificiale potrebbe supportare l’identificazione precoce del decadimento cognitivo direttamente dalle note cliniche contenute nelle cartelle elettroniche. È quanto emerge da uno studio pubblicato su npj Digital Medicine, che ha sviluppato un workflow “agentico” basato su large language model (LLM) per individuare segnali di compromissione cognitiva a partire dalla documentazione clinica non strutturata.
Lo studio, coordinato da Jiazi Tian e colleghi, nasce dall’esigenza di superare alcuni limiti degli strumenti tradizionali di screening cognitivo, spesso legati alla necessità di valutazioni in presenza, tempi lunghi e disponibilità limitata di specialisti. Secondo gli autori, molte informazioni rilevanti sul deterioramento cognitivo emergono già nelle note cliniche quotidiane, attraverso descrizioni di difficoltà linguistiche, problemi di memoria, osservazioni dei familiari o alterazioni dell’organizzazione narrativa.
I ricercatori hanno sviluppato due workflow distinti. Il primo era guidato da esperti clinici attraverso un processo iterativo di ottimizzazione dei prompt. Il secondo era invece un sistema autonomo “agentico”, composto da cinque agenti AI specializzati nel miglioramento progressivo delle istruzioni operative, con funzioni dedicate all’aumento della sensibilità, all’ottimizzazione della specificità, alla sintesi del ragionamento clinico e alla revisione degli errori di classificazione.
L’analisi è stata condotta su oltre 3.300 note cliniche relative a 200 pazienti del Mass General Brigham, utilizzando modelli Llama 3.1, Llama 3.2 e Med42. Nel dataset di validazione il sistema agentico ha raggiunto un F1 score di 0,74, con specificità del 98% e sensibilità del 62%. Il workflow guidato dagli esperti ha ottenuto una sensibilità più elevata, pari all’82%, ma il sistema autonomo ha mostrato risultati complessivamente comparabili senza intervento umano diretto.
Uno degli aspetti più rilevanti del lavoro riguarda la rivalutazione clinica dei casi discordanti. In circa il 44% dei casi inizialmente classificati come falsi negativi, la revisione specialistica ha stabilito che il sistema AI aveva in realtà formulato una valutazione clinicamente appropriata. Secondo gli autori, questo dato suggerisce che workflow autonomi basati su AI potrebbero contribuire non solo allo screening, ma anche alla revisione critica delle annotazioni cliniche tradizionali.
Lo studio richiama inoltre un tema centrale per l’applicazione clinica dell’intelligenza artificiale: la differenza tra performance ottenute in dataset bilanciati e risultati osservati nel mondo reale. Quando il sistema è stato testato in condizioni di prevalenza clinica più realistiche, la sensibilità è diminuita significativamente, evidenziando la necessità di modelli calibrati sui contesti assistenziali reali.
Secondo gli autori, sistemi AI “agentici” e interpretabili potrebbero diventare strumenti di supporto nei percorsi neurologici e cognitivi, soprattutto nelle fasi iniziali dell’Alzheimer e del mild cognitive impairment, contribuendo a identificare pazienti da inviare a valutazione specialistica o a follow-up dedicati.
Il lavoro si inserisce nel crescente filone di ricerca sull’utilizzo dei large language model nella neurologia cognitiva, con particolare attenzione all’analisi automatizzata della documentazione clinica e all’organizzazione dei percorsi assistenziali per le demenze.