ChatGPT si è dimostrato in grado di sviluppare strategie personalizzate per il controllo glicemico con performance comparabili a quelle dei medici di medicina generale, ma inferiori rispetto agli specialisti in endocrinologia. È quanto emerge da uno studio comparativo pubblicato su Frontiers in Endocrinology, che ha valutato la capacità dell'intelligenza artificiale di assistere i professionisti sanitari nella gestione del diabete.
Il diabete rappresenta un onere significativo per i sistemi sanitari. L’intelligenza artificiale potrebbe assistere i professionisti nello sviluppo di strategie personalizzate, ma ad oggi esistono pochi studi che analizzano il suo impatto e che comparino i suoi esisti con quelli dei medici umani
Il nuovo studio svolto in Cina si è articolato in due fasi. Inizialmente, è stata valutata la performance di ChatGPT-4o sull'esame per divenire medici specialisti in endocrinologia. Successivamente, è stato condotto uno studio trasversale che ha confrontato le strategie ipoglicemizzanti formulate da ChatGPT-4o, medici di medicina generale (MMG) e medici specialisti in endocrinologia su 30 casi reali di diabete.
Tre esperti clinici hanno valutato in cieco la ragionevolezza di ciascuna strategia utilizzando una scala di punteggio. I casi sono stati stratificati in tre livelli di complessità (A, B e C) con valutazione dei punteggi medi per ciascun livello.
ChatGPT-4o ha superato con successo tutte le sezioni dell'esame di qualificazione, ottenendo punteggi superiori alla soglia del 60%. Questo risultato preliminare ha dimostrato la capacità del sistema di comprendere e applicare conoscenze endocrinologiche di base.
Nello sviluppo di strategie ipoglicemizzanti, ChatGPT- ha ottenuto un punteggio medio comparabile a quello dei medici di medicina generale, ma significativamente inferiore rispetto agli specialisti in endocrinologia. La performance è diminuita all'aumentare della complessità dei casi, con valutazioni medie che scendevano da 89,90 su 100 per i casi semplici (livello A) a 76,12 per i casi complessi (livello C).
I risultati indicano che ChatGPT-4o si comporta in modo affidabile nella generazione di strategie ipoglicemizzanti per i casi più semplici di diabete, normalmente gestiti dai medici di base. Tuttavia, la sua accuratezza nei casi complessi, specialmente per quanto riguarda le controindicazioni farmacologiche, richiede miglioramenti.
In conclusione, lo studio suggerisce che i modelli linguistici di grandi dimensioni come ChatGPT potrebbero rappresentare uno strumento di supporto decisionale per i medici, in particolar modo in zone da risorse limitate o per alleggerire il carico di lavoro per i medici di base nella la gestione di casi a bassa complessità.
Tuttavia, la supervisione di specialisti rimane essenziale per i casi più complessi, dove le decisioni terapeutiche richiedono l'integrazione di molteplici fattori clinici, l'identificazione di controindicazioni e la valutazione di rischi specifici del paziente. L'intelligenza artificiale potrebbe fungere da strumento di screening iniziale o di supporto educativo, ma non sostituire il giudizio clinico esperto nella gestione dei casi complessi.
I risultati sottolineano la necessità di continuare a sviluppare strumenti di AI, migliorando in particolare la capacità di riconoscere situazioni cliniche complesse e controindicazioni farmacologiche, prima di un'eventuale implementazione su larga scala nella pratica clinica.