Personas que hacen Data Mining en Wikipedia revela algunas diferencias sorprendentes en la forma en culturas orientales y occidentales identifican figuras importantes en la historia, dicen los antropólogos computacionales.
MIT Technology Review
El estudio de las diferencias entre las culturas se ha visto revolucionado por la Internet y el comportamiento de las personas en línea. De hecho, este fenómeno está detrás del nacimiento de la nueva ciencia de la antropología computacional.
Una ventana especialmente fructífera en las almas de diferentes culturas es Wikipedia, la enciclopedia en línea multitud de fuentes con más de 31 millones de artículos en 285 idiomas diferentes. Una categoría importante consiste en artículos sobre personas importantes. Y no cualquiera puede aparecer. Wikipedia tiene criterios específicos que las personas notables deben cumplir para la inclusión mérito.
Así que una pregunta interesante es cómo las personas más importantes varían de una versión de idioma de Wikipedia a otra. Es evidente que estas diferencias deben surgir de las fuerzas culturales que determinan la notabilidad (o notoriedad) en diferentes partes del mundo.
Hoy en día, Peter Gloor en el Instituto de Tecnología de Massachusetts en Cambridge y algunos compañeros dicen que han calculado las personas más importantes en cuatro versiones lingüísticas diferentes de Wikipedia-Inglés, alemán, chino y japonés. Y dicen diferencias importantes surgen, no sólo en los nombres que aparecen, pero en el más amplio de maquillaje de las listas.
El objetivo del equipo es crear una red social de todas las personas que aparecen en alguna versión lingüística de Wikipedia. Empiezan por la descarga de los artículos para todas las personas de un prominente total de 800.000 en la versión en Inglés, por ejemplo.
Ellos junto extraen las fechas de nacimiento y muerte y trabajan fuera que la gente estaba vivo al mismo tiempo. Posteriormente, se examinan los enlaces en cada página para determinar quien señala a quién. Esto permite Gloor y co que elabore una red de vínculos entre las personas que vivían en el mismo tiempo para cada año entre 3000 y 1950 antes de Cristo.
Por ejemplo, las personas más importantes en el año 0 incluyen el historiador griego y biógrafo Plutarco que está vinculado a los contemporáneos como Adriano, César y Nerón. Sin embargo, los vínculos de la página de Plutarco a personas que vivieron antes o después de él se ignoran.
Por último, Gloor y co clasifican las personas en estas redes de importancia utilizando el famoso algoritmo PageRank. Este es el mismo algoritmo que Google utiliza para clasificar las páginas en sus páginas de búsqueda. Su acción consiste en la clasificación de las entradas más altamente si son señaladas por otras entradas que también los primeros puestos.
Las listas resultantes son una lectura interesante. Las versiones más largas contienen 50 entradas pero incluso las primeras entradas revelan algunas diferencias interesantes entre las diferentes versiones lingüísticas.
Los cinco primeros en la versión en Inglés son George W Bush, William Shakespeare, el biógrafo victoriano Sidney Lee, Jesús y Carlos II de Inglaterra.
Los cinco primeros en alemán son: Adolf Hitler, Johan Goethe, Aristóteles, el Papa Benedicto XVI y Platón.
En la versión china son: Mao Zedong, a principios del siglo 20 emperador y general Yuan Shikai, el cantante taiwanés Jay Chou, el guerrero samurái del siglo 16 Oda Nobunaga y el gobernante japonés del siglo 16 Tokugawa Ieyasu.
Y en japonés: el biógrafo del siglo 20 Ikuhiko Hata, el gobernante japonés del siglo 16 Tokugawa Ieyasu, el guerrero japonés del siglo 16 Toyotomi Hideyoshi, Adolf Hitler y el guerrero samurai del siglo 16 Oda Nobunaga.
Estas listas muestran las personas más importantes de todos los tiempos en estas culturas, decir Gloor y co. Hay varias características notables que distinguen este del oeste. Por ejemplo, la parte superior 50 de la versión japonesa contiene sólo los guerreros y los políticos al igual que los 10 de la versión china. Por el contrario, cerca de la mitad de los diez primeros y top 50 son científicos, artistas o líderes religiosos en las versiones occidentales.
Del mismo modo que llama la atención es la prevalencia de cifras de otras partes del mundo. Los líderes no son en inglés constituyen el 80 por ciento de las entradas de la lista de idiomas Inglés. Por el contrario, sólo un puñado de líderes que no son chinos aparecen en la versión en idioma chino.
Un artefacto de la forma en que estas listas se compilan es el papel de los historiadores. Los biógrafos Sidney Lee y Ikuhiko Hata son tanto prominente debido a los enlaces desde sus páginas a los contemporáneos que han escrito sobre. Eso les da claramente una importancia exagerada en este ranking.
Sin embargo, la clasificación proporcionan una interesante visión de las fuerzas que dan forma al sentido cultural de importancia en todo el mundo. "Sondeo de la perspectiva histórica de muchos diferentes Wikipedias en lengua específica ofrece una vista de rayos X profundamente en los fundamentos históricos de la comprensión cultural de los diferentes países", dicen Gloor y co.
Fascinante trabajo y claramente hay más oro que se extrae de la cada vez más rico mineral culturales en la Wikipedia.
Ref: arxiv.org/abs/1502.05256 Cultural Anthropology Through the Lens of Wikipedia - A Comparison of Historical Leadership Networks in the English, Chinese, Japanese and German Wikipedia
No hay comentarios:
Publicar un comentario