Un percorso che è solo all’inizio
L’intelligenza artificiale (IA) sta rapidamente trasformando numerosi settori, e la medicina non fa eccezione. In particolare, l’applicazione dei Large Language Models (LLM*) nella diagnostica medica promette di rivoluzionare il modo in cui i medici affrontano le sfide diagnostiche, offrendo il potenziale per diagnosi più rapide, accurate e personalizzate.
* Un LLM è un tipo di intelligenza artificiale che è stato “addestrato” su una quantità enorme di testi ed informazioni
Lo studio di Stanford University
Un recente studio pubblicato su JAMA Network Open, condotto presso la Stanford University, ha investigato l’impatto di questi modelli di IA sul processo diagnostico, offrendo preziose informazioni sulle potenzialità e soprattutto sulle sfide di questa innovativa tecnologia.
L’obiettivo dello studio era molto semplice e chiaro: valutare se l’utilizzo di un LLM migliora le prestazioni diagnostiche dei medici, in termini di ragionamento e accuratezza della diagnosi finale, e se influenza il tempo impiegato per analizzare ogni caso.
Lo studio è stato organizzato dividendo 50 medici statunitensi in due gruppi: ad un gruppo è stata data la possibilità di affiancare un LLM alle risorse diagnostiche convenzionali, mentre l’altro gruppo poteva utilizzare solo risorse convenzionali quali banche dati online, manuali e la propria esperienza/conoscenza.
L’esperimento si è concentrato sull’analisi di sei casi clinici complessi. Questi casi, basati su pazienti reali, includevano informazioni complete relative all’anamnesi, all’esame obiettivo e agli esami di laboratorio.
Per valutare le performance diagnostiche, i medici hanno utilizzato una griglia di “riflessione strutturata”, un approccio che incoraggia un’analisi sistematica e completa del caso clinico. La griglia richiedeva l’identificazione delle tre principali ipotesi diagnostiche, un’analisi dettagliata dei fattori a supporto o contro ciascuna diagnosi, la formulazione della diagnosi finale ritenuta più probabile e la definizione dei successivi step diagnostici necessari.
Un sistema di punteggio rigoroso, basato su criteri predefiniti, ha permesso di quantificare le performance dei partecipanti, assegnando punti per la plausibilità delle diagnosi, l’accuratezza della diagnosi finale e l’appropriatezza degli step diagnostici proposti. Ai partecipanti è stata concessa un’ora per completare quanti più casi possibile tra i sei presentati, con l’istruzione di dare priorità alla qualità delle risposte piuttosto che alla quantità.
È stata infine condotta un’analisi secondaria confrontando le prestazioni dei due gruppi di medici con quelle dell’LLM utilizzato da solo.
Un risultato inaspettato?
I risultati dello studio sono stati per certi versi sorprendenti: l’IA, quando utilizzata da sola, ha superato i medici in termini di accuratezza diagnostica (dato che evidenzia il notevole potenziale dei LLM nell’assistere i medici nel processo decisionale clinico) ma parallelamente l’utilizzo combinato di LLM e risorse convenzionali non ha portato a un miglioramento significativo delle performance rispetto all’utilizzo delle sole risorse tradizionali.
Questo risultato inaspettato suggerisce che l’integrazione dell’IA nella pratica clinica non è un processo semplice e richiede un’attenta considerazione di come medici e macchine possono collaborare efficacemente.
Ma come mai, mentre l’LLM utilizzato “in autonomia” ha superato le prestazioni di entrambi i gruppi, i medici che hanno potuto avvalersi della IA non hanno ottenuto risultati significativamente migliori rispetto a quelli che si avvalevano delle sole risorse convenzionali?
Un’ipotesi è che l’accesso simultaneo a molteplici fonti di informazione, tra cui l’IA e le risorse tradizionali, possa aver creato un sovraccarico cognitivo per i medici, rendendo più difficile integrare le informazioni e giungere a una diagnosi accurata. Inoltre, la fiducia eccessiva nell’IA o la difficoltà nell’interpretare le sue raccomandazioni potrebbero aver influenzato negativamente le performance dei medici.
Un’altra spiegazione potrebbe trovarsi nella capacità dei medici di formulare prompt (le istruzioni o le domande che si fanno ad una IA) ottimali: lo studio ipotizza che la formazione dei medici sulle migliori pratiche di prompting o l’investimento in prompt predefiniti integrati nei flussi di lavoro clinici potrebbero migliorare le prestazioni dei medici con gli LLM.
La strada è chiara ma ancora lunga
In definitiva, lo studio mette in luce sia il potenziale che le attuali limitazioni dell’IA nella diagnostica medica. Mentre i LLM dimostrano una capacità impressionante di analizzare informazioni complesse e fornire supporto diagnostico, la loro integrazione nella pratica clinica richiede un approccio olistico che consideri attentamente l’interazione uomo-macchina. Il design dell’interfaccia, la modalità di presentazione delle informazioni da parte dell’IA e la formazione dei medici sull’utilizzo efficace di questi strumenti sono tutti fattori cruciali per garantire un’implementazione di successo.
L’obiettivo non è sostituire i medici con l’IA, ma piuttosto potenziarne le capacità e migliorare la qualità dell’assistenza sanitaria. È infatti evidente che la semplice fornitura di accesso a un LLM non si traduce automaticamente in un miglioramento delle capacità diagnostiche. Piuttosto, emerge la necessità di sviluppare strategie che consentano ai medici di interagire con l’IA in modo sinergico, sfruttandone appieno il potenziale senza compromettere il proprio ragionamento clinico.
L’IA può liberare i medici da compiti ripetitivi e dispendiosi in termini di tempo, consentendo loro di concentrarsi sull’aspetto umano della medicina, come l’empatia, la comunicazione e la presa di decisioni complesse che richiedono intuizione e giudizio clinico.
Fonte: Large Language Model Influence on Diagnostic Reasoning – A Randomized Clinical Trial
Sabato 1 Marzo 2025 – Sede di Sesto Fiorentino, Via A. Ragionieri, 101
[Convegno]
L’Intelligenza Artificiale nel trattamento dell’infertilità – Nuovi orizzonti di diagnosi e terapia tra presente e futuro
(scarica il programma)