http://www.madrimasd.org/informacionIDI/noticias/Imprimir_noticia.asp?id=55036&sec=&ImprimirByN=1
Las búsquedas que muestra Google no dependen sólo de robotsEl cierto que el funcionamiento de las búsquedas de Google se realiza casi exclusivamente mediante algoritmos, pero poca gente sabe que existe un grupo de personas que actúan como filtro manual para ciertos temas que escapan a los automatismos.FUENTE | lainformacion.com29/11/2012The Register ha tenido acceso a los manuales de Google que marcan las líneas a seguir para clasificar páginas web. Los términos que se usan califican el estilo de la página en base a sus contenidos como ‘vital’, ‘útil’, ‘relevante’, ‘bastante relevante’, ‘fuera de tema o sin utilidad’ e incluso ‘inclasificable’. El ‘spam’ o información basura, es algo que también tienen muy en cuenta: ‘no es spam’, ‘podría ser spam’, ‘spam’, ‘porno’ y ‘dañino’ son las etiquetas más usadas.El objetivo de estos filtros es separar los sitios de calidad y con contenido original de las webs llenas de ‘spam’ y actualizadas automáticamente. El Page Rank de Google fue creado inicialmente para clasificar a las páginas web en función de su popularidad. Es un sistema que ha funcionado bien durante años, pero con la popularización de los blogs en 2003 causó varios problemas a Google. Las herramientas automáticas de creación de blogs pueden crear miles de sitios web en unos pocos minutos, llenándolos de contenido generado por robots que en ocasiones es difícil de distinguir de publicaciones originales. Esto ha supuesto un dilema para Google. La publicidad que usan estos blogs de baja calidad viene casi siempre a través de Google, lo que le ayuda a crecer. Sin embargo, popularizar este tipo de sitios no es bueno para los resultados del buscador, que deberían ofrecer siempre los sitios de mejor calidad y evitar el ‘spam’. Los filtros humanos de Google procuran equilibrar los resultados y ayudar a que los sitios de calidad aparezcan donde deben. Parece obvio que una cadena hotelera para perros no debería aparecer en la búsqueda de hoteles, pero no lo es tanto para un algoritmo. Sin embargo, eliminar este término de una consulta determinada (cuando también es un negocio y tiene derecho a aparecer junto con todos los demás contenidos) depende de decisiones subjetivas sobre lo que es adecuado y lo que no. Los técnicos deben distinguir en muchas ocasiones entre la intención de la búsqueda y los contenidos que deberán mostrarse. Por ejemplo, una página que muestre una noticia sobre el mundo del porno, no es una página porno, y por tanto la etiqueta ‘porno’ no debería figurar en las características de esa web, aunque en ella, efectivamente, se hable de pornografía. Sin embargo clasificar páginas manualmente puede ser muy controvertido. Los técnicos tiene que decidir en ocasiones sobre asuntos tan vitales para la web como su reputación. ¿Es buena?, ¿mala?, ¿positiva?, ¿negativa?. Pese a que Google tiene en cuenta las opiniones de grupos de expertos a la hora de tomar ciertas decisiones, estas siempre serán interpretables, con lo que la neutralidad de los resultados puede verse afectada.PERO, ¿QUIENES SON LOS CLASIFICADORES? Google utiliza empresas subcontratadas para realizar estos trabajos. Los empleados (que a menudo trabajan desde casa) deben pasar un examen y varias evaluaciones por parte de Google, en el que se miden sus capacidades a la hora de tomar decisiones en un periodo de tiempo corto. Pese a que Google promociona y presume de su tecnología de algoritmos para las búsquedas, lo cierto es que su funcionamiento todavía está altamente influido por el factor humano, con sus virtudes y sus errores.