Educación y Ciencia

12 junio, 2014

Cómo funciona Google

El buscador más famoso del mundo esconde un algoritmo que vale millones y fue copiado hasta el hartazgo por otros sitios.

El buscador más famoso del mundo esconde un algoritmo que vale millones y fue copiado hasta el hartazgo por otros sitios.

¿Por qué Google es lo que es? Sus creadores Larry Page y Sergei Brin escribieron en conjunto un artículo paradigmático en 1998 que explica gran parte del funcionamiento del buscador. Allí describen el algoritmo (conjunto de instrucciones o reglas, ordenadas y finitas que permite definir una operación) del “PageRank” (PR) para calcular la “importancia” de cada web a partir de los links que cada una recibe y emite.

Desarrollado por Page y Brin en la Universidad de Stanford mientras estudiaban el posgrado en ciencias de la computación, el PR es definido por ellos como “un método para valorar las páginas web de forma objetiva y mecánica, midiendo de forma efectiva la atención e interés humanos dirigidos hacia cada página”. A partir de este criterio, las webs se ordenan en la lista de búsquedas. O sea que cuánto más popular sea un sitio, más trafico llevará hacia allí y más arriba “rankeará” en las búsquedas de Google.

El éxito del método radica en la estructura de enlaces como un indicador del valor de una página. Esto funciona como un sistema democrático de votos donde Google interpreta los vínculos de una web hacia a otra como un “voto” de la página de inicio hacia la de destino, pero también analiza a quién “emite el voto”. Por este motivo aquellas web con un PR más elevado (o más “importantes”) valen más y con su “voto” ayudan a otras páginas a tomar notoriedad. La escala es del 0 al 10 donde el 10 es el máximo (número que muy pocos sitios pueden ostentar orgullosos) y el 1 es lo mínimo para un sitio de importancia normal 0 puede significar que esa web tiene algún tipo de penalización o que aún no ha sido calificada.

El algoritmo inicial del PR apareció en el documento original del prototipo de Google y pronto escaló posiciones dentro de la comunidad científica. En 1999 el PR fue patentado por la incipiente Google Inc., luego de haber lanzado el motor de búsqueda un año antes. En 2002, Yahoo ofreció 3.000 millones de dólares por el PR pero sus creadores rechazaron la propuesta, lo cual resulta curioso porque en 1997 Page y Brin intentaron sin éxito venderlo a esa misma empresa por sólo un millón de dólares.

Pero el PR no es una invención original de Google sino que su implementación eficiente en una red de miles de millones de nodos lo convirtió en un éxito. El antecedente del algoritmo lo presentó el economista ruso-estadounidense Wassily Leontief cuando era profesor en Harvard. Desarrolló su modelo Input-Output tratando a la economía como una red gigante. De esta forma podía identificar qué sectores económicos constituían un “cuello de botella” al requerir demasiados factores productivos cuando la demanda de su producto aumentaba, para lo cual recurrió a una versión primitiva del PR de Google. En 1973 Leontief recibió el Premio Nobel de Economía por esta teoría.

Dime qué algoritmo usas…

Google ocupa hoy el 66.7% del mercado tech, seguido de Microsoft (18.1%), Yahoo (11.2%), Ask (2.6%) y AOL (1.4%). Su PR es el algoritmo más conocido en el universo cibernético, pero otras webs también tienen sus propios métodos de funcionamiento basados en conteo, ubicación, votos, intereses, etc.

• Facebook cuenta con el News Feed, más conocido como “Noticias del Inicio”. Excepto que el usuario haya marcado la opción “Mostrar todo”, la red social de Mark Zuckerberg se basa en el número de comentarios, quién realizó la publicación, cuánto interactúan entre sí las personas y qué tipo de post es (video, contenido compartido, status) para decidir cuándo y a quién mostrarlo.

• Los sitios de citas tienen su propio algoritmo basado en intereses similares, edad, preferencias sexuales y ubicación geográfica, entre otras cosas, con el objetivo de unir a dos extraños.

• El famoso “También puede interesarte…” de sitios como Netflix y Amazon consideran las elecciones previas del usuario para recomendarle acciones futuras y también son resultado de formulas muy similares al Page Rank googleano.

• Adwords es el sistema de publicidad online de Google y utiliza las búsquedas de los usuarios para orientarlas hacia anuncios relacionados con el tema que, lógicamente, están pagados por las empresas y determinados por el uso de palabras clave.

 

Martina Bondone – @marbondo

 

Si llegaste hasta acá es porque te interesa la información rigurosa, porque valorás tener otra mirada más allá del bombardeo cotidiano de la gran mayoría de los medios. NOTAS Periodismo Popular cuenta con vos para renovarse cada día. Defendé la otra mirada.

Aportá a Notas