Estudian la matriz de Google para analizar redes complejas
El algoritmo que utiliza el gigante de Internet para mostrar resultados de búsqueda en milésimas de segundos fue perfeccionado por un físico argentino para obtener un ranking paralelo, cuya funcionalidad permite ordenar mejor los elementos de sistemas altamente complejos.
Guillermo Meliseo (Agencia CTyS) - ¿Cómo funciona el motor de búsqueda de Google para que sus resultados se generen en muy pocos segundos? ¿Qué hace la empresa de tecnología para que su buscador se posicione como el mejor por excelencia a nivel mundial? ¿Cuántas clases de redes se pueden examinar utilizando la expresión algorítmica de la compañía de Mountain View?
Con motivo de su decimoquinto aniversario, el grupo de investigación liderado por Leonardo Ermann, doctor en física e investigador CNEA y CONICET, se propuso comprender cómo funciona el megabuscador por dentro. El secreto está en la matriz (o algoritmo) que utiliza la empresa para medir la importancia de los resultados, algoritmo que Ermann perfeccionó para clasificar todo tipo de sistemas complejos, como las ciudades, las finanzas, las funciones neuronales, etc.
En diálogo con la Agencia CTyS, el experto explica que la matriz del Google está preparada para armar un ranking unidireccional, es decir, “al haber tanta cantidad de información en la Internet, es necesario ordenarla, clasificarla y seleccionarla de acuerdo a un determinado nivel de importancia. Esta forma de ordenar los elementos es lo que se llama PageRank y es lo que utiliza la empresa para barrer todos los datos de la red”.
Tomando las herramientas que se ponen en práctica en física cuántica, Ermann retocó la versión del PagaRank para que su lógica sea más eficiente y, así, observar mejor ciertos patrones de conducta. Si en la matriz original los resultados se dan en una sola dimensión, en el nuevo algoritmo los resultados se puedan divisar de forma bidimensional: arriba/abajo, derecha/izquierda, una especie de batalla naval, donde los números se clasifican en forma horizontal y las letras en forma vertical.
Al finalizar la “actualización”, el siguiente paso consistió en buscar sistema complejos de redes para ordenar los elementos, “primero pensamos en cómo se puede propagar una enfermedad, es decir, cómo puede actuar un determinado virus (como la gripe) en una región determinada; pero, después, pensamos en los mercados de las economías mundiales, algo que fue muy desafiante para el grupo de trabajo”, cuenta el físico.
Patrones de conducta
Para poner en práctica su trabajo, el experto utilizó como modelo de patrón complejo las transacciones del mercado mundial, con el objetivo de observar los movimientos económicos (importación y exportación) que realizan los países de todo el globo. Las referencias que se tomaron para armar el ranking de importancia son: el volumen de dinero que cuenta cada país y su posición global en la red, o sea, el peso de sus páginas.
El algoritmo bidimensional descubrió que los países que tienen una economía dependiente de otros países y cuentan con una escasa posición en la Internet, son los que menos volumen de dinero cuentan para autoabastecer sus necesidades. Sin embargo, si la medición se hacía con un indicador convencional (aquellos que no mide el lugar que ocupan en la red), los resultados mostraban que estos países tenían un volumen de dinero altamente favorable para su economía.
“Hay países que pueden manejar mucho volumen de plata, pero si no están bien posicionados en la red, nuestro algoritmo de búsqueda los posiciona para abajo, por ejemplo, lo vimos con Canadá y México, que mueven mucho volumen de plata, pero al estar muy focalizados en los EE.UU. no tienen un posicionamiento central”, detalla el investigador del CONICET.
Otro de los sistemas complejos analizados fue la página Wikipedia. “Por ejemplo, de acuerdo al algoritmo original de Google, lo importante de la enciclopedia son los países, o sea, las cosas a las que más se apuntan. En cambio, en el ranking bidimensional pasa a ser más importante las personalidades que figuran en la página, primero, porque son apuntados por enlaces (links) y, segundo, porque apuntan a muchos enlaces”, explica el físico.
Si bien esta nueva versión del algoritmo de Google puede medir cualquier clase de patrón complejo, el grupo del CONICET tomó como referencia (entre otros sistemas) al mercado mundial y a la página Wikipedia, para demostrar “cómo varían los resultados de acuerdo al ranking utilizado”, detalla el experto. Y concluye: “Sin embargo, creo que en un futuro la empresa debería pensar en un algoritmo de dos dimensiones, ya que hay una mayor libertad para seleccionar los datos y su procesamiento es más eficiente”.