Per tutta la vita nnU
Rapporti scientifici volume 13, numero articolo: 9381 (2023) Citare questo articolo
Dettagli sulle metriche
Man mano che cresce l’entusiasmo attorno al Deep Learning, sia i medici che gli organismi di regolamentazione stanno esplorando modi per introdurre in modo sicuro la segmentazione delle immagini nella pratica clinica. Una frontiera da superare quando si traduce la ricerca promettente nel mondo clinico aperto è il passaggio dall’apprendimento statico a quello continuo. L’apprendimento continuo, la pratica di modelli formativi durante tutto il loro ciclo di vita, sta riscontrando un crescente interesse ma è ancora agli inizi nel settore sanitario. Presentiamo Lifelong nnU-Net, un framework standardizzato che pone la segmentazione continua nelle mani di ricercatori e medici. Costruito sulla base di nnU-Net, ampiamente considerato il segmentatore con le migliori prestazioni per molteplici applicazioni mediche, e dotato di tutti i moduli necessari per la formazione e il test dei modelli in sequenza, garantiamo un'ampia applicabilità e abbassiamo gli ostacoli alla valutazione di nuovi metodi in modo continuo moda. I nostri risultati di benchmark su tre casi d’uso di segmentazione medica e cinque metodi di apprendimento continuo forniscono una visione completa dello stato attuale del settore e rappresentano un primo benchmark riproducibile.
I metodi di deep learning per i casi d’uso medici continuano a essere valutati in un contesto statico, in cui tutti i dati disponibili vengono mescolati e il modello viene testato su un sottoinsieme di campioni in distribuzione. Ciò si basa sul presupposto irrealistico che (a) tutti i dati di addestramento siano disponibili in una posizione centrale e (b) le condizioni di acquisizione non cambino nel tempo dopo l'implementazione clinica1. Una valutazione in questo modo crea un divario considerevole tra le prestazioni riportate dei nuovi metodi e la loro utilizzabilità nella pratica2,3,4, che ostacola l’impiego vitale di agenti di apprendimento permanente in ambienti clinici dinamici5.
L'apprendimento continuo non trascura la dimensione temporale dei dati e forma i modelli in modo sequenziale, come illustrato in Fig. 1. L'obiettivo è quello di adattarsi a nuovi ambienti senza perdere prestazioni rispetto alle condizioni di formazione e ai gruppi di soggetti precedentemente osservati. I metodi di apprendimento federato distribuito sono stati esplorati in contesti multiclinici e inoltre non richiedono la condivisione di dati tra istituzioni6,7. Tuttavia, non affrontano le restrizioni temporali sulla disponibilità dei dati né forniscono un quadro per gli agenti che si adattano continuamente alle mutevoli dinamiche della popolazione. L'apprendimento continuo nel settore sanitario, che affronta queste preoccupazioni, sta ricevendo un crescente entusiasmo8,9,10,11 e le procedure normative sono oggetto di un dibattito attivo5,12,13. Attualmente, è necessaria una nuova approvazione ogni volta che un modello viene adattato durante l’implementazione, ma esistono iniziative sia da parte della FDA che della Commissione Europea per un protocollo di regolamentazione del ciclo di vita che consenta l’uso di algoritmi in continuo adattamento14. Queste ricerche potrebbero portarci alla rara situazione in cui le linee guida normative sono in vigore mentre la tecnologia è ancora agli inizi.
In un'impostazione statica (a sinistra), tutti i dati di allenamento vengono riuniti. Le impostazioni continue (a destra) considerano il momento dell'acquisizione e addestrano il modello in sequenza.
La letteratura tecnica sull'apprendimento continuo per compiti più semplici di visione artificiale è afflitta da controversie sulla mancanza di una configurazione di valutazione standardizzata15,16,17. Recentemente, il progetto Avalanche18 è emerso come soluzione a questo problema di classificazione continua fornendo una base di codice unificata. Il campo non è così maturo per la segmentazione continua, che assegna un’etichetta a ciascun pixel dell’immagine ed è probabilmente il compito principale dell’intelligenza artificiale nel dominio clinico. Sebbene negli ultimi anni sia stato svolto più lavoro8,10,19,20,21,22,23, esso né (1) si basa su pipeline di segmentazione ad alte prestazioni né (2) esamina il modo in cui i metodi più diffusi si trasferiscono alla segmentazione delle immagini per più benchmark open source.
In questo lavoro presentiamo Lifelong nnU-Net, un quadro standardizzato per la formazione e la valutazione dei modelli di segmentazione in contesti continui. Costruiamo il nostro codice sulla pipeline nnU-Net, che è ampiamente popolare e all'avanguardia per 33 attività di segmentazione medica (e competitiva per altre venti) in 11 sfide internazionali di segmentazione biomedica24. Ciò garantisce l'elevata usabilità e prestazioni del nostro framework esteso. I nostri contributi sono: