Giocatori e algoritmi

Molti di voi si chiederanno come ci assicureremo che giocare a Genigma ci permetterà di ottenere risultati scientifici. In questi giorni abbiamo lavorato proprio in questa direzione con i dati dei giochi che sono stati ottenuti da 12 volontari che hanno giocato tra il 20 e il 22 novembre. Tutti i risultati delle partite sono stati raccolti nel server per poter essere analizzati successivamente.

I volontari erano incaricati di riorganizzare i blocchi del gioco (corrispondenti a pezzi di DNA) per ottenere il punteggio massimo (più alto il punteggio, più la soluzione è vicina a quella corretta). In questo test, i giocatori hanno fornito 176 possibili soluzioni corrispondenti a vari giochi di diversi livelli: facile (8 blocchi), medio (16 blocchi) o difficile (35 blocchi).

Per questo test abbiamo utilizzato dati di genomica 3D estratti da una linea cellulare umana non affetta da tumore, chiamata GM12878. Poiché si conosce già la sequenza di questa linea, abbiamo potuto verificare se la soluzione fornita dai giocatori corrispondesse o meno a quella corretta. In particolare, abbiamo usato un frammento del cromosoma 3, che va dal nucleotide 125,000,000 al 130,000,000, o come normalmente si denota in genomica, il frammento chr3:125Mb-130Mb.

Come è stato fatto il controllo?

Alessandra e Marco, del team scientifico, hanno confrontato le soluzioni ottenute dai giocatori con le soluzioni di due diversi algoritmi bioinformatici: il primo, che chiameremo algoritmo veloce, fornisce una soluzione approssimata del gioco in un tempo molto basso, mentre il secondo, che chiameremo algoritmo completo, analizza tutte le soluzioni possibili e fornisce la soluzione esatta. Purtroppo, l’algoritmo completo ha bisogno di tempi di calcolo estremamente lunghi per risolvere giochi complessi (è capace di controllare una singola soluzione in 0.4s, ma avrebbe bisogno di 10^34 giorni di calcoli ininterrotti per risolvere un singolo gioco da 35 pezzi!), ed è quindi stato utilizzato per risolvere solamente il livello facile (8 pezzi).

Dall’analisi di questi dati abbiamo ottenuto due conclusioni molto interessanti:

  1. I punteggi più alti (soluzioni più vicine a quella corretta) si ottengono quando molte persone affrontano lo stesso gioco, ovvero analizzano lo stesso frammento di DNA. La competizione tra giocatori, generata dal sapere che qualcuno ha ottenuto un punteggio migliore in quello stesso gioco, facilita il raggiungimento della soluzione esatta. Nel test, questi giochi multiplayer hanno ottenuto soluzioni migliori di quelle fornite dal primo algoritmo, indipendentemente dal livello di difficoltà.
  2. Nei livelli facili (8 blocchi), i giocatori sono riusciti a trovare la soluzione corrispondente al massimo punteggio possibile (comprovata con l’algoritmo completo) e nel caso in cui ciò non è accaduto, la soluzione fornita era comunque molto vicina.

Questi risultati ci fanno pensare che stiamo andando nella giusta direzione! Come continuiamo d’ora in poi?

Al momento stiamo lavorando sulla la parte di bioinformatica automatizzata per normalizzare correttamente i dati e fornire nuovi giochi per il prossimo test. Allo stesso tempo, stiamo migliorando l’esperienza dell’utente, in modo che Genigma sia sempre più attraente per i giocatori.

Una volta perfezionato il meccanismo del gioco e verificato che è possibile raggiungere soluzioni corrette, potremo fornire ai giocatori frammenti di DNA di cellule tumorali (di cui non conosciamo tutti i dettagli della sequenza) ed essere sufficientemente sicuri che le migliori soluzioni ottenute saranno risultati utili per la scienza. L’obiettivo finale è capire come è strutturato il genoma di alcuni tumori e pensare a possibili applicazioni mediche basate su queste nuove informazioni.