La valutazione diagnostica delle persone con afasia: una riflessione metodologica
di Klaus Willmes
Nell'ultimo decennio si è registrato un rinnovato interesse nello sviluppo e nello studio delle proprietà degli strumenti di misurazione comunemente utilizzati con le persone affette da afasia. Questo fenomeno può essere considerato nel contesto più ampio dello sviluppo e della valutazione di metodi di trattamento e terapia basati su prove scientifiche, ad esempio per le patologie neurologiche, che richiedono appropriate misure diagnostiche (iniziali) e dei risultati.
Tali misure consentono di stimare i tassi di risposta alla terapia individuale negli studi sugli interventi e, in questo modo, contribuiscono a ottimizzare le decisioni terapeutiche e a fornire un feedback oggettivo, statisticamente affidabile e significativo sulla risposta al trattamento individuale in ambito clinico.
Come primo passo verso questo obiettivo, sono stati proposti criteri basati sul consenso per la valutazione delle proprietà di misurazione più importanti degli strumenti di valutazione dei risultati sanitari (esclusi i puri strumenti di screening) nella ricerca e nella pratica clinica (si vedano, ad esempio, nelle linee guida COSMIN). Questi avevano anche lo scopo di aiutare a selezionare i cosiddetti core outcome set (COS) degli strumenti di misurazione rispetto a particolari ambiti di contenuto della ricerca sui risultati [n.d.r. un core outcome set è un insieme standardizzato di domini e strumenti che definiscono i risultati minimi da misurare e riportare in tutti gli studi clinici relativi a una specifica area clinica].
Wallace e colleghi (2019) hanno fornito un COS di questo tipo per la ricerca sul trattamento dell'afasia per i cinque ambiti di esito identificati come essenziali: linguaggio, comunicazione, soddisfazione del paziente rispetto al trattamento e impatto del trattamento, benessere emotivo e qualità della vita. Ovviamente, non ci si può aspettare che uno strumento di valutazione completo riesca a cogliere tutti e cinque gli aspetti. Tuttavia, questi autori (Wallace et al., 2022) hanno fornito una revisione completa dei diversi strumenti di misurazione focalizzando l’attenzione ai diversi ambiti che interessano le persone affette da afasia. Secondo i criteri di selezione degli autori, sono stati inclusi solo gli strumenti di valutazione descritti in articoli in lingua inglese. Tra i 18 test ammissibili per la valutazione complessiva delle funzioni linguistiche – il primo aspetto essenziale del risultato – è stata inclusa la versione originale tedesca dell'Aachen Aphasia Test (AAT), così come gli adattamenti in inglese, portoghese e thailandese, ma non le versioni olandese e italiana dell'AAT, già pubblicate. Fortunatamente, era già in corso una terza versione italiana aggiornata con una sostituzione minore di due voci obsolete e una nuova indagine completa delle proprietà di validità e affidabilità basata su un campione normativo quasi raddoppiato (n = 734) (Luzzatti et al, 2023) e, infine, la versione rivista del test AAT-IT-3 è stata pubblicata alla fine del 2024 da Hogrefe.
L'Aachen Aphasia Test
L'AAT, come tutti gli altri test per l’afasia che mirano a caratterizzare la qualità e il grado di compromissione del linguaggio e della parola a livello sublessicale, lessicale e morfosintattico (cioè suoni, parole semplici, parole complesse e frasi), non ha lo scopo di valutare direttamente l'indipendenza funzionale nelle attività comunicative quotidiane, che è comunque un obiettivo per le persone con afasia, i loro partner e le loro famiglie e che richiede altri compiti. Tuttavia, una qualche forma di cosiddetto “linguaggio spontaneo”, elicitato dall'esaminatore in una breve intervista con domande aperte, ad esempio relative alla situazione attuale e personale del paziente, è spesso inclusa nella valutazione diagnostica. Altre funzioni cognitive correlate alle attività linguistiche, come la memoria di lavoro verbale, le funzioni esecutive e attentive o l'elaborazione dei numeri e il calcolo, sono generalmente considerate più facilmente valutabili con test specifici e non vengono esaminate in brevi subtest compresi nel test per l'afasia.
Poiché il linguaggio è comunemente considerato un costrutto complesso e sfaccettato, le prestazioni dei pazienti affetti da afasia sono solitamente valutate in un profilo di prestazioni multivariato composto da diversi set di item, ciascuno dei quali comprende diversi item, per l'esame di diverse unità linguistiche (fonemi, lessemi semplici, lessemi complessi prodotti secondo regole di combinazione morfologica e frasi). Il contenuto dei singoli item viene solitamente valutato in base a criteri più specifici di complessità linguistica per la lingua in questione, al fine di consentire al test di differenziare i disturbi afasici per un'ampia gamma di gravità, come nel caso della popolazione affetta da afasia generale.
La valutazione della qualità della misurazione
Oltre alla creazione di un test per l'afasia, la valutazione empirica della qualità delle sue proprietà di misurazione e la generazione di informazioni normative dettagliate è un compito arduo, che richiede solitamente anni di test su campioni di grandi dimensioni, idealmente casi consecutivi in una o più istituzioni cliniche ospedaliere o ambulatoriali con criteri di inclusione ed esclusione specifici, che consentono di ottenere dati su un'ampia gamma di età, livelli di istruzione e, di solito, anche intervalli di tempo più ampi dopo l'insorgenza dell'ictus, escludendo solo i casi di afasia post-ictus molto acuti e molto cronici.
La valutazione della qualità riguarda principalmente vari aspetti della validità e dell'affidabilità dello strumento di valutazione. La validità di contenuto richiede una selezione trasparente e informata degli elementi linguistici, specificando possibilmente i parametri psico-linguistici rilevanti e le regolarità linguistiche da includere con aspettative specifiche sulla difficoltà di elaborazione a livello di item e di set di item. Nel caso di scale di valutazione del linguaggio spontaneo, i punteggi devono essere chiaramente specificati e la loro affidabilità inter-rater deve essere studiata su un campione considerevole di pazienti estratto dalla popolazione target di pazienti afasici con diversi livelli di gravità e su un campione considerevole di valutatori, idealmente provenienti dalla popolazione dei potenziali futuri utilizzatori del test coinvolti abitualmente nella diagnosi di persone con afasia. Strettamente correlato è l'esame della validità di costrutto, che comprende la dimostrazione empirica della gradazione del livello di difficoltà previsto per gli item e i set di item all'interno dei subtest e tra i gruppi con sindromi afasiche in un ampio campione di pazienti afasici, compresi tutti i livelli di gravità fino ai sintomi residui dell'afasia e a persone sane del gruppo di controllo. Un altro aspetto riguarda l'ampia conferma della struttura di intercorrelazione utilizzando procedure di analisi fattoriale (esplorativa e confermativa), scaling multidimensionale, clustering gerarchico o più moderne procedure di analisi grafica di rete tra insiemi di item e subtest, in modo che le misure del profilo di prestazione riflettano adeguatamente la dimensionalità del costrutto valutato. Altri aspetti della validità del criterio sono la dimostrazione empirica di un'elevata coerenza con la decisione degli esperti clinici sulla presenza di afasia e l'assegnazione a un gruppo di soggetti con sindromi afasiche utilizzando un qualche tipo di analisi discriminante o una procedura di regressione logistica multinomiale basata sul profilo delle prestazioni. Per quanto riguarda le proprietà di misurazione pura, la coerenza interna dovrebbe essere dimostrata per insiemi di item e subtest che forniscono i punteggi totali utilizzati per l'interpretazione delle prestazioni dei pazienti afasici. Vengono calcolati il coefficiente alfa di Cronbach e, più recentemente e spesso in modo più adeguato, il coefficiente omega di McDonald, compreso il suo intervallo di confidenza e l'errore standard di misurazione come indicatore della precisione dei punteggi grezzi ottenuti per un paziente con afasia. Per ottenere una diagnosi valida per una persona con afasia è inoltre necessario un elevato grado di riproducibilità (affidabilità del retest) dei punteggi dei test nell'arco di pochi giorni.
D'altra parte, la reattività, ovvero la proprietà di indicare i cambiamenti reali nelle prestazioni dopo un intervento terapeutico o eventualmente dovuti al recupero (parziale) spontaneo della condizione neurologica nelle prime settimane o mesi dopo l'ictus, dovrebbe essere identificabile tramite la determinazione del cambiamento minimo rilevabile (SDC o differenza critica). Operazionalizzare il successo del trattamento individuale sulla base di parametri di riferimento statisticamente significativi e clinicamente rilevanti (possibilmente riportati dal paziente) è una priorità fondamentale nella riabilitazione dell'afasia (Breitenstein et al., 2023). Sebbene una misura composita, calcolata a partire da un profilo di prestazione sia meno informativa rispetto al pattern delle difficoltà di linguaggio di una persona affetta da afasia, essa è spesso richiesta negli studi sui risultati del trattamento che necessitano della specificazione di una misura iniziale di risultato. Nel caso dell'AAT, il programma informatizzato di valutazione fornisce a tale scopo un punteggio T a livello di profilo e una media ponderata di affidabilità sui punteggi T dei subtest. Un aumento significativo del livello di prestazione complessivo dopo un periodo di terapia sul linguaggio e sull’eloquio (determinato regolarmente da tale software) può essere considerato un successo terapeutico per il singolo paziente con afasia, nonché un modo per definire un tasso di risposta all’intervento in uno studio sul trattamento.
Infine, il campione normativo per un test sull’afasia dovrebbe essere sufficientemente ampio (e composto da dati su persone con afasia raccolti consecutivamente in contesti clinici che comprendono un'ampia gamma di livelli di età, istruzione e durata) da consentire una gradazione della gravità della menomazione (interpretabilità) per subtest rispetto all'intero campione normativo (popolazione) e ai sottogruppi rilevanti.
Il campione normativo dovrebbe inoltre essere tale da escludere effetti soffitto e pavimento per i punteggi totali dei subtest (ovvero basse percentuali di punteggi grezzi estremi). Di solito ciò impedisce anche di determinare i dati normativi per i pazienti affetti da afasia valutati nella fase post-ictus precoce o che presentano disturbi del linguaggio dovuti a eziologie non vascolari (ad esempio afasia progressiva primaria o trauma cranico dopo un incidente).
Infine, con l'aumento delle meta-analisi internazionali sugli studi di efficacia, è auspicabile che i test di afasia elencati nei core outcome set siano disponibili in diverse versioni linguistiche con caratteristiche degli item e proprietà di misurazione altamente comparabili.
L'autore
Klaus Willmes
Professore ordinario (ritiratosi nel 2016) di Neurosicologia presso il Dipartimento di Neurologia della Facoltà di Medicina Rheinisch-Westfälische Technische Hochschule (RWTH) di Aquisgrana. Dal 1983 è stato membro del gruppo di lavoro interdisciplinare di neurolinguistica e neuropsicologia della Facoltà di Medicina di Aquisgrana (diretto dal neurologo Klaus Poeck) fino alla sua nomina a Professore nel 1997. Dal 2014 al 2016 è stato direttore del Centro per la lingua dei segni e il gesto (SignGes) presso la Facoltà di Filosofia della stessa Università. La sua ricerca si concentra su diversi argomenti di neuropsicologia e psicologia cognitiva, tra cui la cognizione numerica e i suoi disturbi, la valutazione e il trattamento dei disturbi del linguaggio afasico e i disturbi neuropsicologici della memoria e dell’attenzione. Inoltre, ha un forte interesse per l’applicazione dei moderni metodi statistici e psicometrici in neuropsicologia. Nel 2005 ha ricevuto il premio Alfred Binet per il progresso della diagnostica psicologica dalla Società tedesca di psicologia per il suo lavoro sull’Aachener Aphasie Test (AAT).
Bibliografia
- Breitenstein, C., Hilari, K., Menahemi-Falkov, M., Rose, M., Wallace, S.J. Brady, M.C., (…) & Willmes, K. (2023). Operationalising treatment success in aphasia rehabilitation. Aphasiology, 37(11), 1693-1732.
- Luzzatti, C., De Bleser, R., Scola, I., Frustaci, M., & Willmes, K. (2022). Update on the psychometric properties for the Italian version of the Aachen Aphasia Test (IT-AAT). Aphasiology. 37(4), 658-695.
- Wallace, S. J., Worrall, L., Le Dorze, G., Brandenburg, C., Foulkes, J. & Rose, T. A. (2022). Many ways of measuring: a scoping review of measurement instruments for use with people with aphasia. Aphasiology, 36(4), 401-466.
- Wallace, S. J., Worrall, L., Rose, T., Le Dorze, G., Breitenstein, C., Hilari, K., (…) &23 Webster, J. (2019). A core outcome set for aphasia treatment research: The ROMA consensus statement. International Journal of Stroke, 14(2), 180-185.