domingo, 19 de junio de 2016

Redes de normas y temas en Wikipedia

La evolución de la red de normas de Wikipedia
Bradi Heaberlin y Simon DeDeo
Future Internet


Resumen: Las normas sociales han sido tradicionalmente difíciles de cuantificar. En cualquier sociedad en particular, su cantidad y las interdependencias complejas a menudo limitan un análisis a nivel de sistema. Una excepción es la de la red de normas que sustentan la comunidad de Wikipedia en línea. Estudiamos la evolución de quince años de esta red con el conjunto interconectado de páginas que se establecen, describiendo e interpretando las normas de la comunidad. A pesar de la reputación de Wikipedia de gobernabilidad ad hoc, nos encontramos con que su evolución normativa es muy conservadora. Los primeros usuarios crean normas que tanto dominan la red y persisten en el tiempo. Estas normas básicas rigen tanto el contenido como las interacciones interpersonales utilizando principios abstractos como la neutralidad, verificabilidad, y asumen de buena fe. A medida que la red crece, vecindarios de normas se desacoplan topológicamente el uno del otro, mientras que el aumento en la coherencia semántica. Tomados en conjunto, estos resultados sugieren que la evolución de la red de Wikipedia norma es similar a los sistemas burocráticos que son anteriores a la era de la información.
Palabras clave: normas sociales; redes de normas; Wikipedia; oligarquía; burocracia; gobernancia; conocimiento común


1. Introducción

Las ideas comunes de la sociedad sobre cómo se "debe" gobernar comportan características esenciales de la vida económica y política [1,2,3,4,5,6]. Fuera de ambientes idealizados de teoría de juegos, por ejemplo, los incentivos económicos se complementan con las normas sobre la honestidad y un salario más alto es posible cuando los trabajadores creen que no deberían engañar a su empleador [7]. Y, si bien la estructura racional de las normas y leyes es una parte importante de las acciones de coordinación y deseos [8], las personas a determinar la legitimidad de estas soluciones basadas en las creencias acerca de la imparcialidad y la autoridad. Una fuerza policial sin legitimidad no puede hacer cumplir la ley [9,10].
Las normas también están en desarrollo continuo. La norma moderna contra la violencia física, por ejemplo, tiene raíces inesperados y sigue evolucionando [11,12,13]. Sin embargo, entendemos mucho menos acerca de la historia y el desarrollo de las normas que sobre la economía o la ley [14]. A menudo carecen de los datos que nos permita hacer el seguimiento de la coevolución de las ideas complejas, interrelacionadas e interpretativos, tales como la honestidad, la justicia, y la autoridad, la forma en que podemos realizar un seguimiento de los precios y los flujos monetarios o la creación y el cumplimiento de los estatutos.
Los sistemas en línea, tales como Wikipedia, proporcionan nuevas oportunidades para estudiar el desarrollo de normas en el tiempo. Junto con los repositorios de información y de códigos en el centro de la economía mundial moderna, tales como GNU / Linux, Wikipedia es un ejemplo canónico de un conocimiento común [15,16,17,18]. conocimientos comunes se basan en las normas, en lugar de los mercados o leyes, para la mayor parte de su gobierno [19,20]. En Wikipedia, editores colaboran para escribir artículos enciclopédicos en un entorno de código abierto gestionado por la comunidad [21,22], y que se basan en las normas sociales para estandarizar y gobiernan sus decisiones de edición [23]. los registros del servidor minuto a minuto de Wikipedia cubren más de quince años de creación de normas y la evolución de una población de editores que se contaban por decenas de miles. Las normas son importantes en la Wikipedia en formas que hacen que sea imposible para que los participantes pasan por alto: es el sistema de normas, en lugar de leyes justas, que dicta lo que el contenido está o no está incluido, que participa, y lo que hacen.
Paralelamente a los hallazgos en el estudio de la evolución regla en grandes instituciones académicas [24], esperamos que las normas de Wikipedia que juegan un papel en la preservación de la memoria institucional, para ser una fuente de estabilidad institucional y el cambio, y que tienen una relación compleja con el circunstancias que llevaron a su creación. páginas norma desempeñan un papel clave en la coordinación de comportamiento entre los editores de la Enciclopedia [25]. Editores citan habitualmente las normas sobre las páginas de discusión de artículos en un intento de coordinar [26], crear consenso y resolver conflictos [23,27].
Este estudio se centra en un subespacio de la enciclopedia dedicada a la información y discusión acerca de las normas de la propia enciclopedia. Las comunidades asociadas a cada uno de 291 idiomas y ediciones tienen una gran independencia para definir y modificar las normas que utilizan de Wikipedia; o sea, se puede seguir una trayectoria evolutiva diferente. Aquí, nos centramos únicamente en las normas de la Wikipedia en idioma Inglés. Se estudia la evolución de estas normas utilizando un subconjunto de las páginas enlazadas estrechamente que establecen, describir e interpretar ellos. Estas páginas, junto con las relaciones entre ellos, nos permiten cuantificar cómo los editores describen las expectativas de comportamiento y, en consecuencia, la forma de crear y volver a interpretar las normas de su comunidad.
Nos centramos en los enlaces entre páginas norma. la formación en línea de enlace se produce por una variedad de razones [28], incluyendo la asociación estratégica por la persona que hace la cita [29]. En el caso de Wikipedia, enlaces entre páginas en la enciclopedia "mainspace" codifican información acerca de las relaciones semánticas [30,31] y la importancia relativa de las páginas [32,33]. La extensión de estos análisis a las páginas de la enciclopedia norma nos permite ver cómo se describen las normas, justificados y explicados por referencia a otras normas. Nuestro uso de esta red es paralela a los estudios de citaciones en los sistemas jurídicos; los investigadores utilizan citas legales para realizar un seguimiento a través de la influencia de precedencia [34] y la legitimación [35], así como el prestigio de la citada [35,36]. El paralelo a las citaciones legales no es exacta: las páginas de la red norma de Wikipedia no (por lo general), creado en respuesta a un evento en particular, como en un caso judicial, sino más bien en respuesta a una necesidad percibida son; páginas pueden ser creados por cualquier usuario, en lugar de un juez o tribunal en particular; y las páginas pueden ser editadas de forma retrospectiva (que conduce, por ejemplo, a la posibilidad de ciclos de gráfico cuando se introducen nuevos enlaces).
Esta perspectiva de la red nos permite ir más allá del seguimiento de un solo comportamiento a través del tiempo (un enfoque común en los estudios de la evolución cultural [37]) para examinar la evolución de las relaciones entre cientos, e incluso miles, de ideas distintas. Utilizamos estos datos para formular tres preguntas críticas. En un sistema en el que constantemente se están discutiendo y crean normas, cómo y cuándo algunas normas llegan a dominar sobre los demás? ¿Qué tipo de comportamiento es lo que gobiernan? Además, ¿cómo esas normas básicas evolucionan con el tiempo?
Las respuestas son sorprendentes. Mientras que algunas cuentas de Wikipedia subrayan su flexibilidad y la naturaleza ad hoc de su gobierno [38,39,40], nos encontramos con que la evolución normativa de la Wikipedia es muy conservadora. Normas que dominan el sistema en los últimos años de la Wikipedia se crearon temprano, cuando la población era mucho menor. Estas normas básicas dicen los editores de la forma de escribir y artículos de formato; también describen cómo colaborar con los demás cuando se enfrentan a los desacuerdos e incluso acaloradas discusiones. Para ello, las normas básicas de referencia, principios racionalizadas universales, como la neutralidad, verificabilidad, la cortesía, y el consenso. Con el tiempo, los barrios de la red de estas normas se desacoplan topológicamente. Mientras lo hacen, su coherencia semántica interna aumenta, tal como se mide utilizando un modelo tema del texto de la página. normas básicas abstractas de Wikipedia y proceso de desacoplamiento muestran que adopta una estructura "organización institucionalizada" similar a los sistemas burocráticos que son anteriores a la era de la información [41].

2. Métodos

Para recopilar datos sobre la red de normas en la Wikipedia, que SPIDER enlaces dentro del "espacio de nombres" reservado para (entre otras cosas) las políticas, lineamientos, procesos y discusión. Estas páginas pueden ser identificados debido a que llevan el prefijo "Wikipedia:" o "WP:". Los nodos de red son páginas. aristas dirigidas entre páginas se producen cuando una página enlaza a otra a través de al menos un hipervínculo que cumple con nuestros criterios de filtrado; estos enlaces se encuentran analizando el código HTML en bruto de cada página y con exclusión de las plantillas de navegación estándar y listas. Nuestra red es, pues, ambos dirigidos y no ponderado. Comenzamos nuestro rastreo en la (seleccionado arbitrariamente) página norma "Asumir la buena fe". Los detalles del proceso de rastreo, los filtros de hipervínculo y el post-tratamiento de los enlaces entre páginas aparecen en el Apéndice A; tanto los datos sin procesar y procesada nuestra red están libremente disponibles en línea [42].
Editores clasifican las páginas del espacio de nombres mediante la adición de etiquetas; estas etiquetas incluyen, sobre todo, "la política", "guía", y "ensayo", entre otros. Cuando descargamos texto de la página, también registrar estas categorizaciones. Estas categorizaciones describen los niveles de gradated expectativas para la adhesión [43]. En el texto "plantilla" que se incluye de forma automática-, las políticas se describen como "normas ampliamente aceptadas" que "todos los editores debe seguir normalmente" [44], las directrices como "normas de aceptación general" que "los editores deben intentar seguir" y para el que "de vez en cuando excepciones pueden ocurrir "[45], mientras que los ensayos proporcionan" apoyo y opinión ":" [s] ome ensayos representan normas generalizadas ", mientras que" otros sólo representan puntos de vista minoritarios "[46]. Una cuarta categoría es la "propuesta", que describe las posibles políticas y directrices "Sin embargo ... en el desarrollo, en discusión, o en el proceso de reunir consenso para la adopción" [47].
Los análisis previos de entorno de políticas de Wikipedia ha hecho hincapié en los muchos, a menudo se superponen, las funciones que las normas de juego en la enciclopedia, como las políticas que tanto intento de controlar el uso no-autorizado de material con derechos de autor y para establecer la legitimidad a través del uso de la dicción legal y la gramática [ 25]. En el estudio actual, consideramos un sistema de clasificación complementaria que se centra en los tipos de interacciones de las normas regulan, en lugar de sus funciones. Proponemos tres categorías distintas normativas en base a, y la clasificación se extiende, preexistente de las normas que rigen [19] y conocimientos comunes naturales [20].
Las normas pueden intentar regular la creación de contenido (normas "-Contenido de Usuario") e interacciones entre los usuarios (normas "usuario-usuario"). Además, las normas pueden intentar definir una estructura administrativa más formal con distintas funciones, deberes y las expectativas de los administradores (normas "usuario-admin"). Los dos autores de este trabajo clasifican de forma independiente una muestra aleatoria de cuarenta páginas que utilizan este esquema, y ​​se calculó la confiabilidad entre codificadores utilizando kappa de Cohen [48].
Para nuestro análisis semántico, incluimos todos los textos, excepto que se encuentra en cajas especiales cuyo texto es reproducido por la plantilla a través de múltiples páginas. Para construir nuestra distribución a través de uno-gramas, se normaliza todo el texto a minúsculas, combinar palabras con guiones ( "corrección de errores" a "errorcorrection"), y soltar puntuación ( "no" a "don't"). Hacemos ninguna corrección derivada ni de ortografía.
Una variable externa crítico es el número de usuarios activos en la enciclopedia en cualquier punto en el tiempo. Tras [49], definimos un usuario activo como uno que ha hecho cinco o más ediciones dentro de un mes; estas estadísticas se mantienen públicamente en [50].

2.1. Medidas de centralidad y atención 

Las páginas de nuestro corpus se crean para explicar las normas de Wikipedia para editores e influir en sus interacciones con la comunidad de edición de la enciclopedia y el contenido. Los usuarios navegar por el sistema de normas como una estructura de red y por lo tanto se encuentran con algunas de las páginas más que otros.
Lo medimos utilizando centralidad del vector propio (CE), que cuantifica la importancia de una página en función de su accesibilidad global dentro de la red. La CE de una página es la probabilidad de que ocurra a través de una página durante una caminata al azar; equivalente al algoritmo PageRank, que se utiliza en las ciencias del comportamiento para identificar a un consenso sobre el dominio y el poder [51]. Hemos establecido ε, la probabilidad de un salto al azar, a 0,15.
Esperamos que algunas de las páginas que se convierten en ideal para acceder a la red, mientras que otros permanecen en gran parte periférica. Estamos cuantificar la desigualdad del sistema utilizando el coeficiente de Gini (GC). GC varía entre cero (igualdad perfecta, todas las páginas tienen la misma CE) y uno (una página tiene un alto CE; todas las demás páginas tienen el mismo valor bajo). GC es ampliamente utilizado en economía para medir la desigualdad en los ingresos. A continuación, se proporciona una medida global de la medida en que un sistema está dominado por unas pocas normas. Como una cantidad sin dimensiones, que permite a los investigadores comparar este sistema con otras que pueden ser objeto de una investigación posterior.
Debido a que estamos interesados ​​en la forma en que evoluciona la red norma citación y el papel que juegan las normas en el contexto de esta estructura, la CE es una medida ideal de la importancia de una norma. Además de cuantificar importancia estructural, sin embargo, se espera que la CE para correlacionar con, y para predecir, medidas de comportamiento de la atención que recibe una página. Para medir la relación entre centralidad y de comportamiento medidas de atención, hacemos un seguimiento de visitas de página de datos (a partir de los registros del servidor de Wikipedia puestos a disposición por StatsGrok [52], véase el Apéndice B), el número total de ediciones de una página ha recibido, el número de ediciones en diversas su página de discusión asociada, y el número de editores que han editado la página. Llevamos a cabo una regresión lineal multivariable sobre estas medidas de atención, junto con la edad y el tamaño de página de la página (en bytes) como predictores de la página de un CE (véase el Apéndice C).

2.2. Influencia y superposición

Una característica importante de la red de norma es la esfera de influencia: las páginas que se basan en cualquier página en particular para el contexto.
Consideremos, por ejemplo, la página norma "Punto de vista neutral" (PVN), una página instando a los editores para describir los sujetos de artículos sin tomar partido. Una página que enlaza con PVN se refiere a su propio sujeto NPOV de alguna manera. Por ejemplo, entre muchas páginas que enlazan con PVN es "Propaganda", un ensayo instando a los editores que tener cuidado con el uso de medios de propaganda de los gobiernos autoritarios. La página de enlaces a la página de la propaganda de PVN el fin de definir la noción de "peso indebido"; El contenido de PVN por lo tanto se puede decir de influir en la interpretación de lo que se encuentra en la propaganda.
La influencia es distinta de centralidad; medidas de centralidad en la medida en que páginas enlazan a la página en cuestión. Por el contrario, la influencia mide el grado en que el contenido de esa página influencias otras páginas. En nuestro formalismo, un nodo p puede ser entendida para influir en un nodo q cuando Q enlaces a p. Influencia no necesita ser directa, sin embargo: p puede influir q si q enlaces a R y R enlaces a p. Para medir la influencia no local, consideramos paseos aleatorios en la red la dirección invertida.
Más formalmente, la colocación de un caminante aleatorio en el nodo p, permitimos que ella tome n pasos de este punto de partida a lo largo de la red de orientación invertida; escribimos la distribución de probabilidad resultante sobre la posición final como pi, la probabilidad de que el caminante terminando en el nodo i. El pi de distribución define la influencia que tiene en p i.
Para cuantificar la distancia entre dos nodos, se considera además la superposición influencia entre dos nodos arbitrarias p y q. Solapamiento cuantifica el grado en que dos caminantes al azar, a partir de estos nodos, tenderán a visitar las mismas páginas. Si pi y qi son las distribuciones de probabilidad asociados con la influencia de nodo p y q, a continuación, se superponen, se define como:


     (1)

Por varias páginas, podemos calcular la media de superposición de par en par simplemente promediando la superposición entre todos los pares posibles dentro del conjunto.
Alta superposición entre p y q indica que dos páginas influyen en un gran número de nodos comunes. Cuando n tiende a infinito, los caminantes al azar convergen a la distribución estacionaria, y la superposición es uno; A la inversa, cuando n es pequeño, caminantes aleatorios tienen menos tiempo para encontrar uno al otro. Tomamos n igual a cinco, más grande que el camino más corto promedio (aproximadamente tres, en nuestra red), de manera que los nodos son potencialmente alcanzable, pero mucho menos que el tiempo de convergencia a la distribución estacionaria.
La superposición puede ser pensado como una medida de la separación de las esferas de influencia. Se invoca únicos mecanismos locales: los usuarios que viajan de una página a otra mediante los enlaces que los conectan. Esto es en contraste a una medida, tal como los caminos más cortos, lo que es computacionalmente caro y requiere un conocimiento detallado, global del enlace-estructura de la red. En general, por ejemplo, el número de nodos de un algoritmo necesita visitar el fin de determinar el camino más corto entre dos nodos por lo general será mucho mayor que la longitud de la trayectoria final.
Tanto la influencia y la superposición requieren que especifique los nodos particulares de interés; nos centramos en este trabajo sobre pares de páginas de alta CE, o normas básicas.

2.3. La coherencia semántica

Consideramos que las relaciones semánticas entre las páginas. Esto proporciona una noción de relación que es distinta de cómo las normas se conectan a través de hipervínculos. Para ello, hacemos (asignación de Dirichlet latente [53]) El modelado de tema en los uno-gramos del, texto legible aparece en cada página. Tema modelos nos permiten representar textos cortos, incluso cuando se obtienen de un rico vocabulario: temas de grano grueso de las distribuciones subyacentes más palabras.
Con el modelo resultante tema, entonces podemos calcular la distancia semántica entre todos los pares de páginas utilizando la distancia Jensen-Shannon (JSD), una medida que cuantifica la posibilidad de distinguir de las dos distribuciones [54]. Esto nos da una red semántica con peso que se puede comparar a la red de enlaces entre páginas. En particular, podemos calcular la coherencia semántica: la correlación de Pearson entre pi (la influencia del nodo p en el nodo i) y el JSD negativo desde el nodo P al nodo i, Ji. Cuando los nodos que están estrechamente relacionadas topológicamente también están estrechamente relacionadas semánticamente (JSD baja), la coherencia es alta.

2.4. La detección de la comunidad

Esperamos que los enlaces que los editores hacen a nivel local para dar lugar a grupos distintos, o haces norma, a nivel mundial. Usamos el algoritmo de detección de Lovaina comunidad [55] para detectar la agrupación entre los nodos de la red. El algoritmo de Lovaina maximiza la modularidad en cada partición local de la red. El primer algoritmo asigna a cada nodo i al otro clúster, a continuación, calcula la ganancia potencial de la modularidad i para unirse al grupo de su nodo vecino j. Cada voy a unirse al grupo de j cuando la combinación de la ganancia ofrece modularidad positiva más alta. Si no hay un posible aumento de la modularidad, que permanece en su grupo inicial.



3. Resultados

En un primer momento, la población de Wikipedia se sometió a un crecimiento exponencial. A mediados de 2007, sin embargo, el crecimiento demográfico se estancó y entró en un período de disminución a largo plazo [49]; véase la Figura 1. En el transcurso de este rápido crecimiento y decadencia escala de tiempo más largo, los usuarios crean un gran número de páginas que se establecen, que describen, e interpretación de las normas comunitarias. Nuestro análisis encuentra un total de 1976 páginas asociadas con las normas. Hay 17.235 bordes entre estos nodos; la densidad de la red, 0,0044, es del mismo orden de magnitud que las observadas para redes de citación académicas [56]; 1872 (95%) de estas páginas están unidos entre sí en un componente de gigante.


Figura 1. Crecimiento acumulado en la política (rojo / línea continua) y no la política (verde / línea discontinua) páginas, superpuesta sobre la población activa (azul / línea de puntos). la creación de políticas precede a la llegada de la mayoría de los usuarios, mientras que la creación de páginas que no son de política, por lo general en forma de ensayo y comentario, se retrasa el crecimiento de la población.


Hay un total de 56 páginas clasificadas como de políticas y 113 marcado como directriz; de ser breves, nos referimos a las páginas de ambos tipos como "política". La mayoría de las páginas que no son de política (1807) se clasifican como "ensayos" (1255), seguido de "propuestas" (182) (sugerencias, ya sea rechazada por la comunidad o en discusión), y las páginas de "humor" similar a los ensayos, pero teniendo un tono más irreverente (125).
Hemos sido capaces de lograr una buena, pero no perfecta, la categorización de acuerdo en páginas como usuario-contenido, de usuario a usuario, o las normas facilidad de administración. Nuestra tasa de acuerdo categorización fue del 75% más de cuarenta páginas seleccionadas de forma aleatoria. Esto está muy por encima del azar (p «10-3), con un valor de κ de Cohen, de 0,59 indicando el acuerdo" moderado "[57]. No estamos de acuerdo, por ejemplo, en "Editors_should_be_logged-in_users_ (failed_proposal)" (usuario-usuario vs. facilidad de contenido) y "Paid_editor's_bill_of_rights" (usuario-usuario vs. usuario-administrador). En la misma muestra de cuarenta páginas al azar, nos encontramos única que creíamos no era una norma, dando una tasa de precisión aproximada del 97,5%.

3.1. Construcción de la red

La mayoría de las páginas de política aparecen antes de que el grueso de la población llega: más de la mitad de las páginas de política se han creado en mayo de 2005, antes de que la población alcanzó el 20% de su máximo. Por el momento la población alcanzó su máximo en marzo de 2007, más del 80% de las páginas de política ya habían sido creados. Por el contrario, la creación de páginas que no son asegurados en forma de ensayos y comentarios se retrasa el crecimiento de la población. Cuando la población alcanzó su máximo marzo de 2007, menos de un tercio de las páginas de política no estaban en su lugar. No fue hasta un año después de que la mitad de las páginas de política estaban en su lugar. Esto se muestra en la Figura 1.
Centralidad del Vector Propio conduce a una clara jerarquía de páginas, con un poco de la obtención de una fracción significativa de la centralidad global en el sistema. Esto se muestra en el Apéndice D, figura D.1, roto por cuatro principales categorías de páginas-políticas, directrices, ensayos y propuestas. Políticas y directrices dominan el sistema de centralidad. La medida de centralidad se correlaciona con la totalidad de la conducta de las medidas de atención consideramos (véase el Apéndice B, Tabla B.1).
La jerarquía se establece temprano y, sin embargo es muy estable durante la vida útil del sistema. La correlación de Pearson entre la centralidad del vector propio de nodos en 2001 y sus valores finales de 2015 es de 0,87; un año a otro, es siempre mayor que 0,9. El crecimiento de los nodos "en grados es más o menos multiplicativo; En nodos con grado menor de cien (93% del total de la red), la tasa de crecimiento es, en promedio, 12,7% ± 0,3% de un año al siguiente. Existe cierta evidencia de los beneficios de super-multiplicativo a escala; la tasa de crecimiento anual para páginas con grados en menos de diez es sólo el 10,6% ± 0,4%.
Todo esto significa que, como nuevas páginas entran en el sistema, no logran ganar la prominencia de las normas básicas tempranas. Esto conduce a un aumento de la desigualdad general de la red, que se muestra en la Figura 2.


Figura 2. Evolución del coeficiente de Gini en el tiempo. A medida que nuevas páginas entran en el sistema, la desigualdad aumenta en general la red, la estabilización en 2008.


En resumen, el crecimiento de la política precede crecimiento de la población. Las políticas tienen mucho mayor centralidad en la red que otros tipos de páginas. Centralidad en la red se distribuye de forma desigual y se hace menos igual con el tiempo.

3.2. Normas básicas

La Tabla 1 enumera las veinte primeras páginas de nuestra red. Estas normas básicas rigen una serie de comportamientos, incluyendo acciones en el contenido de usuario (artículos de escritura desde un punto de vista neutral, # 1; incluir sólo información verificable, # 2, y fuentes confiables, # 3), las acciones de usuario a usuario (encontrar consenso , # 6; asume la buena fe, # 11; ser civiles, # 16; no "editar guerra", # 19), y el usuario-administrador relaciones que implican funciones definidas especialmente (política de bloqueo, # 13; comité de arbitraje, # 17). En algunos casos, una norma abarca varias clases; "¿Qué Wikipedia no es", por ejemplo, incluye tanto "Wikipedia no es un diccionario" (una norma de la naturaleza de los contenidos que se incluye) y "Wikipedia no es un campo de batalla" (una norma sobre cómo los usuarios deben interactuar con cada otro).


Table 1. Normas básicas. Top veinte de páginas, por centralidad del vector propio, en 2015. Todos son páginas ya sea política o directriz, y todos estaban en su lugar antes de finales de 2006. La mayoría de estas normas básicas fueron creadas antes de 2004, cuando la población era de menos del 3% de su pico.
RankNameClassificationCreation Date
1Neutral_point_of_viewUser-content24 December 2001
2VerifiabilityUser-content2 August 2003
3Identifying_reliable_sourcesUser-content28 February 2005
4What_Wikipedia_is_notUser-user/user-content24 September 2001
5Biographies_of_living_personsUser-content17 December 2005
6ConsensusUser-user11 July 2004
7Policies_and_guidelinesUser-user/user-content1 November 2001
8AdministratorsUser-admin16 May 2001
9No_original_researchUser-content21 December 2003
10Citing_sourcesUser-content19 April 2002
11Assume_good_faithUser-user3 March 2004
12NotabilityUser-content7 September 2006
13Blocking_policyUser-admin8 June 2003
14Dispute_resolutionUser-user/user-admin12 January 2004
15RedirectUser-content25 February 2002
16CivilityUser-user5 February 2004
17Arbitration_CommitteeUser-admin16 January 2004
18VandalismUser-content29 March 2002
19Edit_warringUser-user26 April 2003
20Talk_page_guidelinesUser-user15 April 2005


Todas estas normas básicas fueron creados temprano en la historia del sistema. La mayoría fueron creadas antes de 2004, cuando la población era inferior al 3% del pico de marzo de 2007. Los primeros miembros de la comunidad primera definen y articulan sus normas básicas.
Es importante tener en cuenta que, si bien las normas más importantes son los que se creó a principios, no todas las páginas creadas anticipada se vuelven, o permanecer, en el centro de la red. Esto se muestra visualmente en el Apéndice C, Figura C.1; hay muchas páginas de edad, que nunca llegó a tener importancia y que los EC comparable a las páginas más jóvenes. Debido a esto, edad de la página por sí sola no es un predictor significativo de la centralidad del vector propio. Confirmamos esto con una regresión lineal multivariable (véase la Tabla C.1). El número de editores es un predictor fuerte; No sólo las páginas altos de EC atraer a un gran número de editores únicas, pero hay pocas páginas bajo la CE que lo hacen.

3.3. La superposición y la coherencia semántica

En el transcurso de la construcción de redes, las normas básicas se dibujan aparte topológicamente. Al mismo tiempo, la coherencia semántica de sus barrios se eleva.
La Figura 3 muestra la superposición de pares media entre las diez primeras páginas de nuestra red (ya que algunas normas se crean más tarde, el número de normas en este conjunto final es más bajo desde el principio). A principios de la historia del sistema, cuando la red es pequeño, la superposición es muy alta. La creación de nuevas páginas conduce a una rápida disminución de la superposición; incluso en 2006, cuando todas las normas básicas están en su lugar, la superposición sigue disminuyendo. La figura 3 también muestra la evolución de la coherencia semántica, que se eleva rápidamente y estabiliza temprano.


Figura 3. Evolución de la influencia de solapamiento entre las normas básicas (arriba veinte normas de centralidad del vector propio) a través del tiempo (línea continua, con la etiqueta). En cuanto a las páginas que influyen, las normas básicas aprovechan separados en el tiempo, la estabilización en 2008. Al mismo tiempo, la coherencia semántica (línea discontinua, con la etiqueta) aumenta. Barrios se convierten en topológicamente distinta, pero internamente coherente.




El crecimiento de la red se podría haber imaginado para conducir un tejer juntos de principios distintos. En cambio, ocurre lo contrario: las normas básicas lentamente atraen entre sí como la creación de páginas conduce a distintas esferas de influencia. En lugar de nucleación en torno a un conjunto de principios básicos conectados densamente, la red norma sigue condensándose alrededor de múltiples puntos.
Observamos que el coeficiente de la agrupación local, una medida del grado en que dos nodos, vinculados al mismo nodo, también tienden a enlazar juntos, permanece esencialmente constante en el lapso de los datos (véase el Apéndice E, Figura E.1). Las formas en que se enlazan entre sí editores pequeños grupos de páginas cambia poco, mientras que su efecto acumulativo produce cambios grandes y duraderos tanto en la desigualdad de la atención y la página de solapamiento.

3.4. Los clusters emergentes

El componente conectado de red, que contiene 95% de todos los nodos, las particiones en 10 grupos. En la Tabla 2, se describe la nueve superior, que en conjunto casi todo el componente gigante. Mediante la inspección de los diez primeros nodos de cada grupo, los clasificamos en el usuario-contenido, de usuario a usuario, y las normas de usuario-admin (véase la Tabla F.2). Un diseño de la fuerza dirigida (ForceAtlas2, implementado en Gephi [58]) nos permite visualizar la red de norma y las relaciones topológicas entre sus grupos emergentes (véase la Figura 4).

Figura 4. La topología de la red de la norma está organizada en torno a cinco grupos centrales, se encontró con el algoritmo de Lovaina. temas de racimo se basan en una muestra de alta centralidad del vector propio nodos (CE) en cada grupo y confirmados por referencia a un modelo tema de uso de la palabra. Panel izquierdo: la red completa, con la pertenencia al clúster indicado por el color. Panel derecho: estructura de grupos. Cada nodo es un cúmulo de Lovaina, y el tamaño de nodo indica el tamaño del clúster por número de páginas. pesos de las aristas se definen como la fracción de enlaces fuera del cluster origen que enlazan entre sí clúster (libre bucles no se muestran).





Tabla 2. Principales nueve grupos Louvain, por número de nodos. Las comunidades se dividen en tres clasificaciones (usuario-usuario, usuario-contenido, facilidad de administración), en base a las interacciones que gobiernan; determinamos estas etiquetas mediante la inspección de los diez primeros nodos de centralidad dentro de cada grupo.
RankFraction of SystemClassificationTopic
124.8%User-ContentArticle Quality
222.9%User-UserCollaboration
317.1%User-AdministrationAdministrators
414.7%User-ContentFormatting Articles
510.5%User-ContentContent Policies
65.4%User-UserWiki-larping
72.0%User-ContentPage Templates
81.3%User-User/User-ContentExperts and Credentials
91.0%User-UserHumor


Los cinco grupos más grandes comprenden aproximadamente 90% de la red. El cluster de artículos de calidad incluye nodos como punto de vista neutral, verificabilidad y fuentes confiables, que regula cómo los artículos deben ser escritos. El cúmulo de colaboración incluye páginas de Consenso, Asumir la buena fe, y guerra de ediciones, que describe las políticas y normas relacionadas con la interacción interpersonal. El cluster Administradores contiene páginas correspondientes a las acciones administrativas, como la política de bloqueo y el Comité de Arbitraje. El cúmulo de formato contiene artículos tales como Manual de estilo, títulos de los artículos, y de desambiguación. Además, el grupo Políticas de contenido contiene artículos sobre derechos de autor, violaciónes de derechos de autor, y las políticas sobre el uso de la imagen y el uso de contenidos no libre. Los grupos restantes incluyen un pequeño grupo de artículos sobre las plantillas de página; uno en el papel de los expertos de Wikipedia; dos grupos de páginas de humor (Wiki-LARPing, un sentido del humor de Wikipedia como si se tratara de un juego de mazmorras y dragones, y un grupo de páginas, incluyendo "Bad Jokes y otras tonterías Borrada").
Cada uno de los nueve grupos se asocia con un tema distinto en nuestro modelo tema (ver Apéndice F, Tabla F.1); mientras que el grupo de la calidad del artículo es el más grande por número de nodo, el tema asociado con el clúster colaboración domina el sistema de palabra. Incluso las normas basadas en tareas parecen basarse en la semántica de la cooperación interpersonal.

4. Discusión

Las páginas más influyentes en la red norma también son los primeros en ser creado. Un efecto Mateo [59] parece operar de las normas sociales, en las adiciones posteriores a la red no crecen en influencia con la suficiente rapidez para desestabilizar la jerarquía. Por qué no hay revoluciones normativos en la Wikipedia?
Tal vez los primeros usuarios saben mejor: sus políticas funcionan bien y son simplemente adoptados por los que vienen después; o, los usuarios posteriores pueden unirse precisamente porque se suscriben a las normas que ya han sido articulados. Los usuarios que no están de acuerdo con estas normas pueden encontrar que la reinterpretación, en lugar de reemplazo, es una respuesta más eficaz dada la distribución desproporcionada de atención a los principios de páginas.
El hecho de que las normas básicas son creados tan temprano significa que un número relativamente pequeño de usuarios de las puso en su lugar. Este grupo puede haber creado normas que satisfagan sus propias necesidades, pero no las necesidades de aquellos que llegan más tarde. Por ejemplo, si los primeros usuarios son en su mayoría estudiantes universitarios con horarios de trabajo flexibles, por ejemplo, pueden desarrollar normas que implícitamente se basan en la posibilidad de responder a las críticas en ráfagas cortas y rápidas. Si llegan más tarde no tienen la misma flexibilidad, pero las normas persisten, se encontrarán en desventaja relativa en los conflictos que surgen, incluso si la cantidad de esfuerzo que le dedican al sistema cada semana es el mismo.
Un trabajo reciente [60] ha sugerido que los primeros usuarios más tarde forman una oligarquía que monopoliza el poder, subvierte el control democrático, y entra en creciente conflicto con el colectivo mayor. Si esto es cierto, la centralidad perdurable de sus propios intereses en la red norma puede ser una fuente de poder.
Por otra parte, la influencia de un pequeño grupo de editores puede persistir a través de las normas básicas a pesar de una descentralización progresiva de poder dentro de la enciclopedia. Una descripción etnográfica de la comunidad de editores de Wikipedia [61] sugiere que un grupo de "veteranos" trae importantes normas sociales con ellos en las estructuras de gobierno locales cada vez más de la enciclopedia, como las comunidades WikiProject. Nuestros resultados muestran que la estructura de la red norma es, por medidas de recuento de páginas, el agrupamiento, se superponen norma básica, y la coherencia semántica, en gran medida estables para el año 2008. Por lo tanto, las normas básicas y la estructura global de la norma analizada aquí pueden proporcionar una base de principios normas para las comunidades pequeñas y descentralizadas que se forman más tarde en el desarrollo de la enciclopedia.
Gran parte de la red de Wikipedia simplemente coordina las prácticas técnicas, como los convenios de denominación del artículo. Las normas más importantes, sin embargo, intentan racionalizar el sistema en torno a los conceptos universales, como la neutralidad, verificabilidad, el consenso y la cortesía. Una idea importante proviene de una teoría de la burocracia y la organización institucional desarrollado por Meyer y Rowan (1977 [41]). Proponen que las normas de este tipo pueden funcionar como mitos institucionales que conforman el sistema aparecen legítimo y menos ad hoc, mediante la conexión a un marco racional.
creación de la página sigue creciendo mucho después de que las normas básicas ya están en su lugar. ¿Qué ocurre cuando los editores siguen para desarrollar y perfeccionar esta red?
La teoría de Meyer y Rowan predice el fenómeno de disociación, impulsado por la aparición de inconsistencias entre los diferentes mitos. El Civil_POV_pushing ensayo, por ejemplo, se describe cómo algunos usuarios pueden ser capaces de violar la norma de neutralidad por el estricto cumplimiento de las normas de urbanidad. En la teoría de Meyer y Rowan, páginas como éstas, que el intento de resolver las incoherencias entre mitos, serán raros. Mitos tendrán lugar tienden a separar el uno del otro en el tiempo.
Nuestros resultados cuantitativos son consistentes con esta predicción. A medida que el sistema crece, la creación de páginas de normas que abarcan, como Civil_POV_pushing, son raros e insuficiente para evitar que los barrios de las normas básicas de dibujo aparte en esferas separadas de influencia con una alta coherencia semántica interna. En los sistemas exitosos, también se espera que el desacoplamiento a pasar no sólo entre los mitos, pero entre estos mitos y la práctica real, un fenómeno al que apunta la existencia de la página "Ignore_all_rules" ( "si una norma que impide mejorar Wikipedia, ignorarlo" ).
Nuestros resultados también son consistentes con la segunda predicción importante Meyer y Rowan: sistemas que dependen cada vez más en una lógica de buena fe, en lugar de seguir el procedimiento. No sólo se "Supongamos buena fe" en sí misma una norma básica, pero el tema asociado domina el sistema como un todo.
La red norma estudiamos aquí es la culminación de más de treinta mil ediciones. Se analiza el desarrollo de este sistema en el tiempo a través de las decisiones colectivas de la comunidad de edición y su distribución de la atención dentro de la red. Si bien este método nos dice mucho sobre el proceso de creación colectiva norma, que no sabemos cómo editores individuo comprender las relaciones entre las normas o utilizarlos para orientar la forma en que editar e interactuar con los demás. En lugar de memorizar la compleja red en su totalidad, un editor puede grano grueso sus propiedades para formar su propia representación mental de la estructura normativa de la enciclopedia. representaciones mentales de los redactores pueden entonces informar a sus comportamientos de enlace y de edición, creando un bucle de retroalimentación entre la representación y la red de norma en su conjunto.

5. Conclusiones

Las normas son una unidad fundamental de la evolución cultural, y que adquieren sentido y la fuerza de las relaciones que los conectan. Nuestro trabajo aquí ha estudiado la evolución, a lo largo de quince años, de la red interdependiente de las normas en el centro de la Wikipedia.
La evolución de esta red es un proceso muy conservadora. Los primeros características se mantienen, y en algunos casos incluso amplificados, en el curso de desarrollo de la red. Nuestros resultados son consistentes con la "ley de hierro" de la oligarquía en los sistemas peer-producción; También complementan las cuentas de la descentralización gradual de la estructura de gobierno de la Wikipedia.
normas básicas de la Enciclopedia abordan los principios universales, como la neutralidad, verificabilidad, la cortesía, y el consenso. La ambigüedad y la interpretación de estos conceptos abstractos pueden conducir a desacoplan entre sí con el tiempo. Wikipedia es un ejemplo paradigmático de un patrimonio común del conocimiento del siglo 21. Sin embargo, sus normas básicas desempeñan un papel estructural análoga a los mitos institucionales de la burocracia del siglo 20 racionalizados.
Expresiones de gratitud
Agradecemos a John Miller (Carnegie Mellon), Stephen Benard (Universidad de Indiana) y Cris Moore (Instituto de Santa Fe) útil para los debates, y el Instituto de Santa Fe por su hospitalidad cuando se inició este trabajo. Bradi Heaberlin fue apoyada por la experiencia de investigación del programa de pregrado en el Instituto de Santa Fe bajo Premio de la Fundación Nacional de Ciencias # ACI-1.358.567, por el Programa de Becas de Investigación y Cox por la Universidad de Indiana Ciencia, Tecnología y el programa de becarios de investigación (STARS). Los datos utilizados en este análisis están disponibles en línea [42].
Contribuciones de autor
Los autores diseñaron conjuntamente el concepto de la investigación, se reunieron los datos y llevaron a cabo los análisis. Ambos autores escribieron conjuntamente el papel.
Conflictos de interés
Los autores declaran no tener ningún conflicto de intereses.

Apéndice A. Corpus Construcción 

Como se describe en el texto principal, construimos nuestro corpus por spidering hacia el exterior desde la página "Asumir buena fe", siguiendo todos los enlaces en el espacio de nombres Wikipedia para construir una red dirigida no ponderado. No todas las páginas dentro del espacio de nombres son normativos, sin embargo. Después de completar el proceso de rastreo, eliminamos páginas que son únicamente las listas (por ejemplo, las páginas de "lista de directrices" o "listas de páginas protegidas") que describen "proyectos", u otras iniciativas centradas en la divulgación (por ejemplo, "Wikipedia ama Bibliotecas "), o en la adición de un cierto tipo de contenido de la enciclopedia (por ejemplo," WikiProject Libertarianismo "), o que sirven como tablones de anuncios (por ejemplo, la" bomba de la aldea "," cuestiones relativas a los medios de comunicación de derechos de autor "), con filtros en ambos títulos de la página y redactor asignado categorías.
Muchos nombres de las páginas tienen sinónimos (por ejemplo, "AGF" vuelve a dirigir a "Asumir buena fe"); fusionamos sinónimos. No todos los enlaces entre páginas indican una decisión deliberada para conectar una norma a otra. Muchas páginas, por ejemplo, contienen "cajas", pequeños fragmentos de código que categorizan páginas o proporcionan índices de navegación para normas similares. Estas cajas pueden ser creados por un solo comando y se replican a través de múltiples páginas; no incluimos out-bound enlaces que se encuentran en estas cajas. No contamos múltiples enlaces entre páginas; nuestros bordes no están ponderados; un borde dirigido entre A y B se refiere sólo a la presencia de al menos un enlace de A a B. Páginas a veces tienen enlaces internos; dejamos caer todas las auto-bordes. Nuestro rastreo incluye sólo las páginas que existían en 12:00:00 GMT, 20 de Agosto de 2015.

Apéndice B. Relación entre las centralidad del vector propio y medidas de atención

Para comparar la estructura de la red norma y la atención del usuario, se mide la correlación entre la centralidad de una página norma y el porcentaje de páginas vistas de la red que la norma se acumula durante un período de 31 días (julio de 2015). Encontramos una correlación moderada [62], r = 0,32, entre la CE y páginas vistas. (La distribución de los valores de la visualización Página CE y es ligeramente no lineal. Llevamos a cabo un ajuste de ley de potencia y encontramos que α = 1,42 ± 0,02. En consecuencia, una página que duplica su CE más que duplica su cuota de páginas vistas de la red. por simplicidad, en este análisis, se presentan las correlaciones lineales.)
CE se correlaciona significativamente con todas las medidas de atención de comportamiento que consideramos; no sólo a páginas vistas, pero el número de ediciones, el número de ediciones de páginas de conversación y número de editores; véase la Tabla B.1.

Tabla B.1. La correlación de la centralidad del vector propio con medidas conductuales de atención.

Medida de atenciónrp Value
Page views0.32<10−3
Number of edits0.70<10−3
Number of talk page edits0.63<10−3
Number of editors0.72<10−3

Figura B.1. La relación entre la EC de una página y el porcentaje de páginas vistas de la red se acumula.




Apéndice C. La regresión de la edad y ediciones

Para ver cómo las propiedades intrínsecas de una página afectan a su centralidad del vector propio (CE) en la red final, se realizó una regresión multivariante con la edad de la página, el número de ediciones de página, número de ediciones de página charla, el número de editores y tamaño (en bytes) como predictores de la CE. Incluyendo páginas vistas como un factor predictivo no mejora significativamente R2; lo dejamos fuera de nuestro modelo de regresión.
Hemos normalizado todos los predictores por z-score para permitir la comparación entre los coeficientes. Se consideraron dos relaciones entre la CE y las variables de predicción: un modelo lineal y un modelo logístico. Hemos encontrado el modelo lineal tiene el error cuadrático medio menor y reportar los coeficientes de la Tabla C.1.

Tabla C.1. Los coeficientes de una regresión lineal multivariante para centralidad página vector propio (IS). El R2 para el ajuste, incluyendo todos los predictores, es de 0,57.

PredictorCoefficient × 10−5p Value
Number of editors95 ± 6<10−3
Number of talk edits46 ± 3<10−3
Page size2 ± 2n.d.
Age2 ± 2n.d.
Number of edits−30 ± 7<10−3


Como se señala en el texto principal, nuestros resultados muestran que la edad es un predictor débil de la CE, una vez que se incluyen otras variables. El número de editores únicas es un predictor muy fuerte, como es el número de edición en la página de discusión. Figura C.1 muestra el efecto distinto de la edad de la página y el número de editores. Mientras que las páginas más importantes son también los más antiguos, hay muchas páginas viejas que no son importantes en absoluto; la desigual distribución de la centralidad del vector propio significa que esta señal se lava en gran medida en un modelo lineal simple que no toma en cuenta el aumento de la varianza. Para llegar a la cima del 1% en la CE, debe ser viejo; pero para ser viejo no es suficiente.
Por el contrario, las páginas con muchos editores tienden a ser altos-CE, y hay muy pocas páginas con muchos editores que no son también altos en la CE. páginas de alta CE, no sólo atraen más visitas de página (véase el Apéndice B), pero también más editores. Curiosamente, el número total de cambios tiene un coeficiente negativo en nuestro regresión; mientras que hay una fuerte correlación positiva entre el número de editores y el número de ediciones, hay una serie de bajas-CE páginas con muchas ediciones por un pequeño número de personas (por ejemplo, un ensayo, escrito en muchas etapas, por una sola autor, que nunca se gana tracción).


Figura C.1. Las páginas importantes son viejas, pero no todas las páginas viejas son importantes. Panel de la izquierda: edad de la página (desde el final de nuestros datos, en agosto de 2015) vs. vector propio centralidad; "normas básicas" (top veinte páginas de la CE) se caracterizan por un límite inferior en la CE y un límite inferior de edad. Mientras que las páginas muy superiores en la jerarquía son todos de edad (en la región superior derecha), hay muchas páginas viejas que tienen centralidad del vector propio comparables a las páginas mucho más jóvenes. Panel derecho: número de editores (únicas) en la página vs centralidad del vector propio. Una correlación mucho más apretado que muestra las páginas que atraen a muchos editores únicos tienen una mayor CE. Cuando se tienen en cuenta tanto los efectos de un simple modelo de regresión lineal, el número de editores domina.


Figura D.1. Centralidad del vector propio ordenada para las páginas, desglosado por categoría de página. Política (diamante azul) y de referencia (más rojo) páginas dominan el sistema. Más ensayos interpretativos (cuadrados verdes; incluye humor y páginas relacionadas), el más común por número, aparecerá un menor rango relativo; el ensayo de más alto rango, por ejemplo, tiene carácter central más baja que la política de 10º clasificado. Propuestas, fracasaron o actuales (triángulos grises), se clasifican los más bajos de todos.


Figura D.2. La centralidad del vector propio para todas las páginas de nuestros datos, ordenados por rango. divisiones principales (véase el texto) están marcados por líneas verticales.




La Figura D.1 muestra la distribución rango de CE, página por página, desglosados por clase de página. Definición de la IE como la centralidad del vector propio de la norma de orden i clasificado nos permite definir el tamaño de la rotura, Ei - Ei + 1, entre esta norma y la siguiente. Clasificación desintegraciones tamaños permiten que notemos posiciones en las que el resto de las normas del sistema tienen significativamente menor CE. La restricción se rompe sea mayor de cinco páginas de separación conduce a los cinco principales divisiones que se muestran en la Figura D.2. En el papel principal, enumeramos los nodos hasta el tercer punto de ruptura.

Apéndice E. Coeficiente de agrupación local

Nuestro trabajo aquí se centra en la evolución de las propiedades de la red mundial, como vector propio centralidad, la superposición y la coherencia semántica, que no pueden ser conocidos por romper el gráfico en subgrafos. Es interesante considerar medidas más locales, sin embargo, ya que éstas suelen estar bajo un mayor control directo del usuario. El ejemplo tenemos en cuenta aquí es la agrupación local promedio, definida como:

          (2)
o, en otras palabras, el número de aristas que conectan los nodos en la vecindad de i, como una fracción del número total de posibles conexiones entre esos vecinos. Si las personas tienen una tendencia a conectar la red cuando se crea un nuevo nodo, uniendo los nodos que tiene un enlace, esto tenderá a aumentar la agrupación. Figura E.1 muestra esto con el tiempo. A pesar de los grandes cambios en la población y el tamaño de la red, la agrupación sigue siendo sorprendentemente constante, en alrededor de un tercio.

Figura E.1. El coeficiente de agrupación local promedio, como una función del tiempo. A pesar de los cambios a gran escala en las propiedades generales de la red, esta propiedad local, se mantuvo notablemente constante.



Apéndice F. Modelado de Clusters y Temas

Para nuestro modelo base con k = 20 temas, el cuadro F.1 muestra las primeras veinte palabras representativas de cada tema; en esta tabla que eliminar la palabra "wikipedia", plurales (excepto la palabra "wikipedias") y los términos de fecha / hora ( "Enero", "UTC", etc.). Utilizamos el paquete Jason Adams paquete de software "lda-rubí" (https://github.com/ealdent/lda-ruby), un envoltorio de rubí para el código C de David M. Blei; Da una estimación del código de los parámetros del modelo utilizando un algoritmo de Maximización Expectativa variacional (http://www.cs.princeton.edu/~blei/lda-c/ [53]). En la Tabla F.1, mostramos los temas, y sus palabras asociadas, ordenadas por (a nivel de palabra) del tema prevalencia dentro de la enciclopedia.
Para cada página, podemos calcular una distribución más temas; esto es sólo el promedio de las distribuciones de nivel de palabra. Promediando estas distribuciones tema más páginas, podemos calcular la distribución tema para cada comunidad Lovaina (Colaboración, el artículo de calidad, etc.). Resulta que cada uno de los ocho mejores comunidades tiene un tema más común diferente. Esto nos permite asociar algunos de los temas que nos encontramos con un grupo determinado, y que la lista esta correspondencia en la tercera columna de la Tabla F.1. La inspección de las palabras representativas de estos ocho temas proporciona evidencia complementaria a favor de las etiquetas de la comunidad, que previamente fueron escogidos por la inspección manual de las diez primeras páginas de vector propio centralidad (Tabla F.2).









Referencias

  1. Sherif, M. The Psychology of Social Norms; Harper: New York, NY, USA, 1936. [Google Scholar]
  2. Durkheim, E. The Rules of Sociological Method; Free Press: New York, NY, USA, 1938. [Google Scholar]
  3. Akerlof, G. The economics of caste and of the rat race and other woeful tales. Q. J. Econ. 197690, 599–617. [Google Scholar] [CrossRef]
  4. Geertz, C. Thick description: Toward an interpretive theory of culture. In Readings in the Philosophy of Social Science; Martin, M., McIntyre, L.C., Eds.; MIT Press: Cambridge, MA, USA, 1994; pp. 213–231. [Google Scholar]
  5. Ellickson, R.C.; Ellickson, R.C. Order without Law: How Neighbors Settle Disputes; Harvard University Press: Cambridge, MA, USA, 2009. [Google Scholar]
  6. Bowles, S. Microeconomics: Behavior, Institutions, and Evolution; Princeton University Press: Princeton, NJ, USA, 2009. [Google Scholar]
  7. Simon, H.A. A formal theory of the employment relationship. Econometrica 195119, 293–305. [Google Scholar] [CrossRef]
  8. Brennan, G.; Buchanan, J.M. The reason of rules; Cambridge University Press: Cambridge, UK, 2008. [Google Scholar]
  9. Tyler, T.R. Psychological perspectives on legitimacy and legitimation. Annu. Rev. Psychol. 200657, 375–400. [Google Scholar] [CrossRef] [PubMed]
  10. Tyler, T.R.; Fagan, J. Legitimacy and cooperation: Why do people help the police fight crime in their communities.Ohio State J. Crim. Law 20086, 231. [Google Scholar] [CrossRef]
  11. Elias, N. The Civilizing Process: Sociogenetic and Psychogenetic Investigations, 2nd ed.; Dunning, E., Goudsblom, J., Mennell, S., Eds.; Wiley: New York, NY, USA, 2000. [Google Scholar]
  12. Pinker, S. The Better Angels of Our Nature: Why Violence Has Declined; Penguin Group: New York, NY, USA, 2011. [Google Scholar]
  13. Klingenstein, S.; Hitchcock, T.; DeDeo, S. The civilizing process in London’s Old Bailey. Proc. Natl. Acad. Sci. USA2014111, 9419–9424. [Google Scholar] [CrossRef] [PubMed]
  14. Ehrlich, P.R.; Levin, S.A. The evolution of norms. PLoS Biol. 20053, 943. [Google Scholar] [CrossRef] [PubMed]
  15. Ostrom, E.; Hess, C. A framework for analyzing the knowledge commons. In Understanding Knowledge as a Commons; Hess, C., Ostrom, E., Eds.; MIT Press: Cambridge, MA, USA, 2006. [Google Scholar]
  16. Benkler, Y. The Wealth of Networks: How Social Production Transforms Markets and Freedom; Yale University Press: New Haven, CT, USA, 2006. [Google Scholar]
  17. Bollier, D. The growth of the commons paradigm. In Understanding Knowledge as a Commons; Hess, C., Ostrom, E., Eds.; MIT Press: Cambridge, MA, USA, 2006. [Google Scholar]
  18. Frischmann, B.; Madison, M.; Strandburg, K. Governing Knowledge Commons; Oxford University Press: Oxford, UK, 2014. [Google Scholar]
  19. Ostrom, E. Governing the Commons: The Evolution of Institutions for Collective Action; Cambridge University Press: Cambridge, UK, 1990. [Google Scholar]
  20. Hess, C.; Ostrom, E. Understanding Knowledge as a Commons: From Theory to Practice; MIT Press: Cambridge, MA, USA, 2011. [Google Scholar]
  21. West, J.; Lakhani, K.R. Getting clear about communities in open innovation. Ind. Innov. 200815, 223–231. [Google Scholar] [CrossRef]
  22. O’Mahony, S. The governance of open source initiatives: What does it mean to be community managed? J. Manag. Gov. 200711, 139–150. [Google Scholar] [CrossRef]
  23. Beschastnikh, I.; Kriplean, T.; McDonald, D.W. Wikipedian self-governance in action: Motivating the policy lens. In Proceedings of the ICWSM, Seattle, WA, USA, 30 March–2 April 2008.
  24. March, J.G.; Schulz, M.; Zhou, X. The Dynamics of Rules: Change in Written Organizational Codes; Stanford University Press: Palo Alto, CA, USA, 2000. [Google Scholar]
  25. Butler, B.; Joyce, E.; Pike, J. Don’t look now, but we’ve created a bureaucracy: The nature and roles of policies and rules in wikipedia. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, Florence, Italy, 5–10 April 2008; ACM: New York, NY, USA, 2008; pp. 1101–1110. [Google Scholar]
  26. Schneider, J.; Passant, A.; Breslin, J. A qualitative and quantitative analysis of how Wikipedia talk pages are used. In Proceedings of the 2010 ACM Conference on Web Science, Raleigh, NC, USA, 26–27 April 2010; ACM: New York, NY, USA, 2010. [Google Scholar]
  27. Kriplean, T.; Beschastnikh, I.; McDonald, D.W.; Golder, S.A. Community, consensus, coercion, control: CS*W or how policy mediates mass participation. In Proceedings of the 2007 International ACM Conference on Supporting Group Work, Sanibel Island, FL, USA, 4–7 November 2007; ACM: New York, NY, USA, 2007; pp. 167–176. [Google Scholar]
  28. Park, H.W.; Thelwall, M. Hyperlink analyses of the World Wide Web: A review. J. Comput. Med. Commun. 20038, 4. [Google Scholar] [CrossRef]
  29. Gonzalez-Bailon, S. Opening the black box of link formation: Social factors underlying the structure of the web. Soc. Netw. 200931, 271–280. [Google Scholar] [CrossRef]
  30. Strube, M.; Ponzetto, S.P. WikiRelate! Computing semantic relatedness using Wikipedia. In Proceedings of the AAAI 21st National Conference on Artificial Intelligence, Boston, MA, USA, 16–20 July 2006; Volume 6, pp. 1419–1424.
  31. Witten, I.; Milne, D. An effective, low-cost measure of semantic relatedness obtained from Wikipedia links. In Proceedings of the AAAIWorkshop onWikipedia and Artificial Intelligence: An Evolving Synergy, Chicago, IL, USA, 13 July 2008; AAAI Press: Menlo Park, CA, USA, 2008; pp. 25–30. [Google Scholar]
  32. Bellomi, F.; Bonato, R. Network analysis for Wikipedia. In Proceedings of the Wikimania, Frankfurt am Main, Germany, 4–8 August 2005.
  33. Lizorkin, D.; Medelyan, O.; Grineva, M. Analysis of community structure in Wikipedia. In Proceedings of the 18th International Conference on World Wide Web, Madrid, Spain, 20–24 April 2009; ACM: New York, NY, USA, 2009; pp. 1221–1222. [Google Scholar]
  34. Fowler, J.H.; Jeon, S. The authority of Supreme Court precedent. Soc. Netw. 200830, 16–30. [Google Scholar] [CrossRef]
  35. Walsh, D.J. On the meaning and pattern of legal citations: Evidence from state wrongful discharge precedent cases.Law Soc. Rev. 199731, 337–361. [Google Scholar] [CrossRef]
  36. Caldeira, G.A. The transmission of legal precedent: A study of state Supreme Courts. Am. Political Sci. Rev. 198579, 178–194. [Google Scholar] [CrossRef]
  37. Henrich, J.; Boyd, R.; Richerson, P.J. Five misunderstandings about cultural evolution. Hum. Nat. 200819, 119–137. [Google Scholar] [CrossRef] [PubMed]
  38. Shirky, C. Here Comes Everybody: The Power of Organizing without Organizations; Penguin: New York, NY, USA, 2008. [Google Scholar]
  39. Konieczny, P. Governance, Organization, and Democracy on the Internet: The Iron Law and the Evolution of Wikipedia. Sociol. Forum 200924, 162–192. [Google Scholar] [CrossRef]
  40. Konieczny, P. Adhocratic governance in the Internet age: A case of Wikipedia. J. Inf. Technol. Politics 20107, 263–283. [Google Scholar] [CrossRef]
  41. Meyer, J.W.; Rowan, B. Institutionalized organizations: Formal structure as myth and ceremony. Am. J. Sociol. 197783, 340–363. [Google Scholar] [CrossRef]
  42. Open Data for the paper the Evolution of Wikipedia’s Norm Network. Available online: https://bit.ly/wikinorm(accessed on 21 August 2015).
  43. Morgan, J.T.; Zachry, M. Negotiating with angry mastodons: The wikipedia policy environment as genre ecology. In Proceedings of the 16th ACM International Conference on Supporting Group Work, Sanibel, FL, USA, 7–10 November 2010; ACM: New York, NY, USA, 2010; pp. 165–168. [Google Scholar]
  44. Template:Policy. Available online: https://en.wikipedia.org/wiki/Template:Policy (accessed on 17 April 2016).
  45. Template:Guideline. Available online: https://en.wikipedia.org/wiki/Template:Guideline (accessed on 17 April 2016).
  46. Template:Essay. Available online: https://en.wikipedia.org/wiki/Template:Essay (accessed on 17 April 2016).
  47. Template:Proposed. Available online: https://en.wikipedia.org/wiki/Template:Proposed (accessed on 17 April 2016).
  48. Cohen, J. A coefficient of agreement for nominal scales. Educ. Psychol. Meas. 196020, 37–46. [Google Scholar] [CrossRef]
  49. Halfaker, A.; Geiger, R.S.; Morgan, J.T.; Riedl, J. The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. Am. Behav. Sci. 201357, 664–688. [Google Scholar] [CrossRef]
  50. Wikipedia Statistics: Active Wikipedians. Available online: https://stats.wikimedia.org/EN/TablesWikipediansEditsGt5.htm (accessed on 21 August 2015).
  51. Brush, E.R.; Krakauer, D.C.; Flack, J.C. A family of algorithms for computing consensus about node state from network data. PLoS Comput. Biol. 20139, e1003109. [Google Scholar] [CrossRef] [PubMed]
  52. StatsGrok. Available online: http://stats.grok.se (accessed on 17 April 2016). Data from service created by Domas Mituzas, visualized by Wikipedia User Henrik.
  53. Blei, D.M.; Ng, A.Y.; Jordan, M.I. Latent dirichlet allocation. J. Mach. Learn. Res. 20033, 993–1022. [Google Scholar]
  54. DeDeo, S.; Hawkins, R.X.; Klingenstein, S.; Hitchcock, T. Bootstrap methods for the empirical study of decision-making and information flows in social systems. Entropy 201315, 2246–2276. [Google Scholar] [CrossRef]
  55. Blondel, V.D.; Guillaume, J.L.; Lambiotte, R.; Lefebvre, E. Fast unfolding of communities in large networks. J. Stat. Mech. Theory Exp. 20082008, P10008. [Google Scholar] [CrossRef]
  56. Yan, E.; Ding, Y. Scholarly network similarities: How bibliographic coupling networks, citation networks, cocitation networks, topical networks, coauthorship networks, and coword networks relate to each other. J. Am. Soc. Inf. Sci. Technol. 201263, 1313–1326. [Google Scholar] [CrossRef]
  57. Landis, J.R.; Koch, G.G. The Measurement of Observer Agreement for Categorical Data. Biometrics 197733, 159–174. [Google Scholar] [CrossRef]
  58. Jacomy, M.; Venturini, T.; Heymann, S.; Bastian, M. ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software. PLoS ONE 20149, e98679. [Google Scholar] [CrossRef] [PubMed]
  59. Merton, R.K. The Matthew effect in science. Science 1968159, 56–63. [Google Scholar] [CrossRef] [PubMed]
  60. Shaw, A.; Hill, B.M. Laboratories of oligarchy? How the Iron Law extends to peer production. J. Commun. 201464, 215–238. [Google Scholar] [CrossRef]
  61. Forte, A.; Larco, V.; Bruckman, A. Decentralization in Wikipedia governance. J. Manag. Inf. Syst. 200926, 49–72. [Google Scholar] [CrossRef]
  62. Cohen, J. A power primer. Psychol. Bull. 1992112, 155. [Google Scholar] [CrossRef] [PubMed]




1 comentario:

  1. Wow, es super interesante!
    Sólo leí el resumen (debo decir que la traducción automática dejo mucho que desear) pero la investigación y sus resultados son muy interesantes, no sólo para el análisis de redes sociales sino para las pocas teorías acerca del funcionamiento de las instituciones que existen, como las de la antropóloga Mary Douglas.
    Gracias por dar a conocer esta investigación! Sino nunca la hubiese llegado a encontrar.

    ResponderEliminar