Jugadores y algoritmos, a prueba

Quizás muchos os preguntéis de que manera nos vamos a asegurar de que jugar a Genigma permitirá obtener resultados científicos. Estos días hemos estado trabajando justo en esta dirección con los datos de las partidas que 12 voluntarios jugaron entre el 20 y el 22 de noviembre y que fueron almacenados en el servidor para el análisis.

Los voluntarios tenían que jugar al prototipo de Genigma reorganizando los bloques del juego (correspondientes a piezas de ADN) para poder conseguir la máxima puntuación (cuanto más alta, más cercana a la correcta está la solución encontrada).

Conseguimos para el test 176 posibles soluciones correspondientes a diferentes partidas de distintos niveles: fácil (8 piezas), medio (16 piezas) o difícil (35 piezas).

Para la prueba se utilizaron datos genómicos en 3D extraídos de una línea celular no tumoral humana llamada GM12878. Como ya se conoce la secuencia de esta línea, era relativamente fácil verificar si la solución de los jugadores correspondía a la correcta o no. En particular, se utilizó un fragmento del cromosoma 3 (el fragmento chr3: 125Mb-130Mb), que va desde el nucleótido 125,000,000 hasta el 130,000,000.

¿Cómo se hizo la comprobación?

Alessandra y Marco, del equipo científico, compararon las soluciones obtenidas de los jugadores con las soluciones de dos algoritmos bioinformáticos diferentes: el primero (algoritmo rápido), proporciona una solución aproximada al juego en muy poco tiempo, mientras que el segundo (algoritmo completo), analiza todas las soluciones posibles y proporciona la solución exacta. Desafortunadamente, el algoritmo completo necesita tiempos de cálculo extremadamente largos para resolver juegos complejos (puede encontrar una solución única en 0.4 segundos, pero necesitaría 10^34 días de cálculos ininterrumpidos para resolver un solo juego de 35 piezas). Por este motivo, para este test este algoritmo se utilizó únicamente para comprobar los juegos del nivel fácil (8 piezas).

Del análisis de estos datos sacaron dos conclusiones muy interesantes:

1. Las puntuaciones más altas (soluciones más cercanas a la correcta) se obtienen cuando muchas personas se enfrentan al mismo juego (fragmento de ADN). Esto se consigue dando a analizar este mismo fragmento a personas distintas. La competición entre ellos, generada por saber que alguien ha obtenido mejor puntuación que tú en aquel juego, hace más fácil que se alcance la solución exacta. En el test estas partidas con multijugador obtuvieron mejores soluciones que las proporcionadas por el primer algoritmo, independientemente del nivel de dificultad.

2. En los niveles fáciles (de 8 bloques), los jugadores pudieron encontrar la solución correspondiente a la máxima puntuación (comprobada por el algoritmo completo) y en el caso de que esto no sucediera, la solución encontrada estaba muy cerca del resultado correcto.

¡Vamos en la dirección correcta!

¿Cómo seguimos a partir de ahora?

En estos momento estamos refinando la parte de bioinformática automatizada para normalizar los datos adecuadamente y proporcionar nuevos juegos para el siguiente test. Paralelamente, estamos mejorando la experiencia de usuario, para que sea cada vez más atractivo para los jugadores.

Una vez hayamos ajustado el mecanismo de juego y comprobado que es posible alcanzar soluciones correctas jugando, podremos proporcionar a los jugadores fragmentos de ADN de células cancerosas (de las cuales no conocemos todos los detalles de la secuencia) y estar suficientemente seguros de que las mejores soluciones proporcionadas serán resultados útiles para la ciencia. El objetivo final es entender cómo està estructurado el genoma de ciertos tumores y pensar en posibles aplicaciones médicas basadas en esta nueva información.

¿Contamos contigo para el próximo playtest? ¡Contacta con nosotros!