Abbi pazienza, ma è un lunghissimo discorso che cercherò di sintetizzarti al massimo (anche se è impossibile). Chiedo scusa in anticipo per le imprecisioni dovute alla estrema sintesi.
La tecnologia degli arrays a cui mi riferisco è quella dei microarray a DNA (nota anche come gene chip, chip a DNA, biochip). Su di una superficie solida (vetro, plastica, silicio) si attaccano delle sonde molecolari, o probe, di DNA a singola catena a formare una matrice di migliaia di sonde (da cui array = matrice). Parliamo di migliaia di sonde in uno spazio di pochi cm per pochi cm. Sfruttano una particolare tecnica di ibridazione (interazione tra eliche complementari) e sono quindi capaci di estrarre da un campione di DNA tutti i geni complementari alle sonde e permette di ottenere una profilazione genica o profilo di espressione genica in grado di dirci quali geni sono spenti (non funzionanti o down-expressed) e quali sono espressi (funzionanti, o up-expressed, cioè che daranno origine a RNA e poi, alcuni, anche a proteine). Con la tecnologia dei microarray si possono avere decine di migliaia di risultati (geni) in pochissimo tempo (immagina un esperimento a tempo fatto sull’intero genoma, dove ogni ora estrai migliaia di geni, tutto x 24 ore). Per questo motivo questa tecnologia ha permesso notevoli accelerazioni in diversi campi della investigazione biochimica. Si possono avere un numero enorme di informazioni metaboliche, funzionali, patologiche, sul contesto che si è esaminato (sangue o tessuti).
Se come sonda si usano proteine si ha un proteinchip che ci permette di capire quali geni espressi hanno generato RNA (l’insieme degli RNA umani si chiama trascrittoma) che si è poi trasformato in proteine funzionali (l’insieme delle proteine umane si chiama proteoma). Oggi queste tecnologie sono estremamente sofisticate e permettono di avere informazioni di profilazione sull’intero genoma umano caratterizzando tutte le biomolecole metabolicamente presenti in cellule e tessuti di individui normali e patologici. Il cancro, per es., si studia così, come anche moltissime malattie metaboliche. Ormai i microarray si comprano perché hanno complessità simili a quelli dei chips dei computers e sono fatti da aziende ad elevatissima specializzazione (Affymetrix, Agilent Technologies, Applied Biosystems, e tante altre).
L'uso di microarray per lo studio del profilo d'espressione genetica è stato pubblicato per la prima volta nel 1995 (Science) e il primo genoma eucariotico completato con analisi di microarray fu quello del Saccharomyces cerevisiae nel 1997 (Science), poi siamo venuti anche noi (abbiamo finito del tutto questo anno).
Il punto dolente è la rappresentazione grafica di migliaia di oggetti e l’analisi statistico/matematica dei dati. Per questo si usa una vecchia teoria matematica, la teoria dei grafi (non grafici, i grafi, che sono delle reti di migliaia di nodi interagenti) che è una teoria matematica quantitativa usata nel 1700 (e poi dimenticata) ed inventata da Von Euler che se ne serviva per calcolare il cammino più breve per l’esercito germanico che si muoveva in un vasto territorio, per raggiungere (a piedi e cavallo) il campo di battaglia per primi e mettersi nella posizione più favorevole (questo segreto rendeva all'epoca l'esercito germanico quasi imbattibile). Questa teoria, totalmente dimenticata, fu riesumata negli anni 90 da Laszlo Barabasi, un matematico ungherese/americano che l’applicò per analizzare per la prima volta la rete internet (internet networking). E’ uno strumento molto potente che permette di fare molti calcoli in modo quantitativo nel caratterizzare le proprietà dei singoli nodi e della loro connettività. Dall’internet dell’informatica all’internet della rete metabolica (metabolic networking) il passo è stato breve, e, senza i grafi, gli array non sarebbero serviti a molto. Oggi si è raggiunta una complessità inimmaginabile nel descrivere il reale funzionamento metabolico di cellule, tessuti e organi studiando in modo integrato le reti genomiche, trascrittomiche, proteomiche, metabolomiche, ecc… Quando lavoriamo in modo integrato spesso parliamo di interattomica, forse lo strumento più potente capace di definire se un gruppo di geni lavorano tutti insieme per svolgere una attività funzionale integrata che è alla base, per es. di una specifica patologia. I dati di queste analisi sono quelli che formano i Big Data Biomedici in archivi internazionali accessibili a tutti.
Senza tutto questo, niente medicina di precisione. Se tutto questo non è introdotto negli studi universitari per poi riversarlo nella pratica sanitaria e clinica saremo inesorabilmente tagliati fuori.
C’è ancora una cosa. La parola Array viene anche utilizzata per una tecnologia diversa. La tecnica array-CGH (Array - Comparative Genomic Hybridization o Array-CGH o anche cariotipo molecolare) che ha lo scopo di indagare l'intero genoma per l'identificazione di perdite o acquisizioni di sequenze di DNA, anche di piccole dimensioni, che generalmente non vengono rilevate attraverso l'analisi tradizionale del cariotipo e che possono essere causa di diverse patologie. Per es. viene molto utilizzata per la diagnosi di fenotipi complessi associati a ritardo mentale o a diagnosi prenatale. Si esegue in molti laboratori di genetica medica ospedalieri o universitari o IRCSS. Il test è basato sulla comparazione quantitativa del DNA del paziente (DNA test) e del DNA di riferimento ottenuto da un pool di soggetti sani (DNA reference). Per lo studio del genoma mediante array-CG si seguono le attuali linee guida nazionali ed europee. Per l’esecuzione del test è necessario ottenere il DNA del paziente attraverso il prelievo di materiale biologico (sangue periferico, villi coriali, liquido amniotico, altri tessuti). È un array diverso, ma pur sempre un array.
Spero di essere stato tanto chiaro da farmi capire nonostante la sintesi.
Un saluto