Nuove prove e regioni “Eureka”

Mentre gli sviluppatori continuano con il loro lavoro, il nostro gruppo di ricerca sta continuamente testando il gioco per verificare la sua funzionalità. Sempre utilizzando la linea cellulare non cancerosa GM12878, stiamo ora facendo nuove prove con i cromosomi 1, 20 e 21. 

Per mostrare i risultati del gioco abbiamo iniziato a disegnare un primo grafico che permette di illustrare in maniera visuale i risultati ottenuti dai test. Vi mostriamo qui l’esempio dell’analisi dei giochi effettuati sul cromosoma 21.

L’idiogramma di forma rettangolare rappresenta il nostro cromosoma, che è suddiviso in regioni che sono colorate secondo le loro caratteristiche funzionali. In figura si notano una regione rossa e una azzurra: esse formano parte della regione cromosomica centrale (chiamata centromero) che normalmente contiene molte sequenze ripetitive.  Le atre altre regioni sono colorate in scala di grigio ed indicano la densità dei  geni. Le regioni terminali del cromosoma (chiamate telomeri) sono anch’esse ricche in sequenze ripetute.

Sotto l’ideogramma abbiamo riportato (in giallo) l’istogramma del numero di partite giocato per ciascuna regione del cromosoma: i picchi indicano che per questo test ci siamo concentrati su regioni specifiche, ovvero quelle vicine al centromero, giacché sono queste zone dove gli algoritmi non riescono a essere molto precisi nella ricostruzione. 

Al di sopra del cromosoma sono riportati 2 livelli di informazione sovrapposti: i punti indicano il punteggio di ogni partita giocata rispetto al risultato dell’algoritmo e le bande verticali indicano se le corrispondenti regioni del cromosoma sono state risolte con poca (bianco) o molta (verde) accuratezza. Le regioni bianche hanno quindi bisogno di più analisi, mentre le verdi si possono ritenere risolte. 

Quello su cui vogliamo centrare l’attenzione sono i punti rossi, in corrispondenza con la banda verticale di colore verde acceso: le due cose indicano che quella regione specifica è stata risolta molto bene dai giocatori e con molta probabilità si tratta di una regione “Eureka!” su cui il team di ricercatori dovrà svolgere analisi più accurate.

In questo caso possiamo notare come le regioni prossime al centromero (rettangolo rosso) siano quelle interessanti. 

È possibile mostrare chiaramente molta informazione in una sola immagine? In questo periodo di allarme sanitario abbiamo imparato che un grafico può non essere di interpretazione immediata, anche per gli addetti ai lavori. Perciò nelle prossime settimane ci confronteremo con gruppi selezionati di cittadini per rendere la presentazione dei risultati più fruibile da tutti e ovviamente informativa su tutti gli aspetti interessanti del progetto.