martes, 5 de mayo de 2015

Centralidades por paseo aleatorio

Centralidad de cercanía de paseo aleatorio 
Wikipedia

La centralidad de cercanía por camino aleatorio [random walk] es una medida de centralidad en una red, que describe la velocidad media con la que los procesos caminando al azar llegan a un nodo desde otros nodos de la red. El concepto fue propuesto por primera vez por Noh y Rieger (2004). [1]


Intuición

Considere una red con un número finito de nodos y un proceso de paseo aleatorio que se inicia en un determinado nodo y procede de un nodo a otro a lo largo de los enlaces. Desde cada nodo, se elige aleatoriamente el enlace a seguir. En una red no ponderada, la probabilidad de elegir un determinado enlace es igual en todos los enlaces disponibles, mientras que en una red ponderada es proporcional a la ponderación de los enlaces. Un nodo se considera para estar cerca de otros nodos, si el proceso de paseo aleatorio iniciado desde cualquier nodo de la red llega a este nodo particular en relativamente pocos pasos en promedio.


Definición

Considere una red ponderado - ya sea dirigido o no dirigido - con n nodos notados por j = 1, ..., n; y un proceso de paseo aleatorio en esta red con una matriz de transición M. El  elemento de M describe la probabilidad de que el caminante aleatorio que ha alcanzado el nodo i, procede directamente al nodo j. Estas probabilidades se definen de la siguiente manera.

 donde  es el (i, j) -ésimo elemento de la matriz de ponderación A de la red. Cuando no hay ningún borde entre dos nodos, el elemento correspondiente de la matriz A es cero.
La proximidad central paseo aleatorio de un nodo i es la inversa del tiempo medio primer pasaje media a ese nodo:

Primero tiempo de paso media

La media primera tiempo de paso del nodo i al nodo j es el número esperado de pasos que tarda el proceso para alcanzar el nodo j desde el nodo i por primera vez:
 
donde P (i, j, r) denota la probabilidad de que se necesita exactamente pasos r para alcanzar j de i por primera vez. Para calcular estas probabilidades de llegar a un nodo por primera vez en los pasos r, es útil considerar el nodo de destino como una absorción, e introducir una transformación de M mediante la supresión de su fila y la columna j-ésima y denotando por M_ { -j}. Como la probabilidad de un proceso a partir de i y estar en k después de r-1 pasos es simplemente dadas por el (i, k) th elemento de , P (i, j, r ) se puede expresar como
 
Sustituyendo esto en la expresión para medias rendimientos tiempo primero paso
 
Usando la fórmula para la suma de la serie geométrica para matrices nos da

donde I es la matriz identidad dimensional n-1.
Por conveniencia computacional, esta expresión puede ser vectorizada como

donde  es el vector para la primera tiempos de paso para un paseo termina en el nodo j, y e es un vector n-1dimensional de 1.
El tiempo medio primer pasaje no es simétrico, incluso para grafos no dirigidos.

Centralidad de cercanía por paseo aleatorio en modelos de redes 

Según las simulaciones realizadas por Noh y Rieger (2004), la distribución de paseo aleatorio cercanía centralidad en un modelo Barabási-Albert está determinada principalmente por el grado de distribución. En una red de este tipo, la proximidad central paseo aleatorio de un nodo es aproximadamente proporcional a, pero no aumenta monotónicamente con su grado.

Aplicaciones para redes reales

La centralidad de cercanía por paseo aleatorio es medida más relevante que la proximidad central sencilla en el caso de aplicaciones en las que el concepto de caminos más cortos no es significativo o es muy restrictivo para una evaluación razonable de la naturaleza del sistema. Este es el caso por ejemplo cuando el proceso analizado evoluciona en la red sin ninguna intención específica para llegar a un cierto punto, o sin la capacidad de encontrar el camino más corto para alcanzar su objetivo. Un ejemplo de un paseo aleatorio en una red es la forma en que una cierta moneda circula en una economía: se pasa de una persona a otra a través de transacciones, sin ninguna intención de llegar a un individuo específico. Otro ejemplo donde el concepto de rutas más cortas no es muy útil es una red conectada densamente. Además, como los caminos más cortos no son influenciados por la libre bucles, proximidad central paseo aleatorio es más una medida más adecuada que proximidad central en el análisis de redes en la libre bucles son importantes.
Una aplicación importante en el campo de la economía es el análisis del modelo de insumo-producto de una economía, que está representado por una red ponderada densamente conectada con importantes libre bucles. [2]
El concepto es ampliamente utilizado en las ciencias naturales. Una aplicación biológica es el análisis de las interacciones proteína-proteína. [3]

Centralidad de intermediación por paseo aleatorio 

Un concepto relacionado, propuesto por Newman, [4] es la centralidad de intermediación por paseo aleatorio. Así como la centralidad cercanía por paseo aleatorio es una contraparte de la centralidad de cercanía, la centralidad de intermediación por paseo aleatorio es, del mismo modo, la contraparte de centralidad de intermediación tradicional. A diferencia de la medida habitual centralidad de intermediación, no sólo cuentan los caminos más cortos que pasan por el nodo dado, sino todos los caminos posibles que cruzan ella.
Formalmente, la centralidad de intermediación paseo aleatorio de un nodo es

 donde el elemento   de la matriz R contiene la probabilidad de un paseo aleatorio a partir de nodo j con absorción del nodo k, que pasa a través del nodo i.
El cálculo de intermediación por paseo aleatorio en grandes redes es computacionalmente muy intensivo. [5]


Referencias

  1. J.-D. Noh and H. Rieger. Random walks on complex networks. Phys. Rev. Lett. 92, 118701 [1]
  2. Blöchl F, Theis FJ, Vega-Redondo F, and Fisher E: Vertex Centralities in Input-Output Networks Reveal the Structure of Modern Economies, Physical Review E, 83(4):046127, 2011. [2] (Reproducido al final de esta entrada)
  3. Aidong, Zhang: Protein Interaction Networks: Computational Analysis (Cambridge University Press) 2007 [3]
  4. Newman, M.E. J.: A measure of betweenness centrality based on random walks. Social Networks, Volume 27, Issue 1, January 2005, Pages 39–54
  5. Kang, U., Papadimitriou, S., Sun, J., and Tong, H.: Centralities in Large Networks: Algorithms and Observations. SIAM International Conference on Data Mining 2011, Mesa, Arizona, USA. [4]


viernes, 1 de mayo de 2015

Redes de visualización de consumo pornográfico

Los datos de la pornografía: visualizando el espacio fetiche
¿Cuáles son las torceduras más caras? Está porno hacer el seguimiento de la inflación, y es posible mapear 'fetiche-espacio'? Los metadatos porno podría ayudar a encontrar las respuestas a estas y muchas otras preguntas acerca de la sexualidad humana.

Martin Robbins - The Guardian



Un intento de visualizar el "espacio fetiche". Las categorías están vinculados por el número de veces que aparecen juntos en los estudios de Clips4Sale, y los círculos más grandes representan categorías con más clips. Fotografía: Martin Robbins

La pornografía es uno de los mayores temas si bien todavía peor cubiertos en el discurso popular. Es una industria de miles de millones de dólares que se encuentra en el corazón de la sexualidad humana en el siglo 21. Muchas personas ven que, aunque pocos hablan de ello, y para mejor o peor ejerce una gran influencia sobre nuestra cultura; pero sabemos relativamente poco acerca de ella.

¿Y si pudiéramos encontrar algún gran fuente de datos? La página web Clips4Sale.com es uno de los principales sitios de porno comerciales en la web. Es el hogar de miles de estudio vendiendo millones de clips. Todos los clips se indexan con metadatos sobre su precio, tamaño del archivo, la categoría de fetiche, longitud, título, descripción y así sucesivamente, y la política robots permisivas del sitio permite a los rastreadores web que arrastre el contenido. ¿Cuánta información útil podría cavar hacia fuera de él? ¿Qué cosas interesantes pudiste encontrar?

El otro fin de semana me escribió un guión para averiguarlo. Se arrastró los datos de recolección de sitio en 4.814.732 clips, que es más bien un montón de porno y probablemente significa que estoy en alguna lista negra BT ahora. Los primeros clips se remontan a finales de 2003, lo que hace el corpus Clips4Sale un 12 años de historia del porno pagado en Internet. Los datos de cada mes es como un anillo en un tronco de árbol, que nos dice lo que el mercado era como en ese momento. No es perfecto - clips de más edad pueden haber desaparecido o han eliminado - pero es suficiente para darnos una imagen aproximada.

Los primeros clips se agrupan en un puñado de categorías con nombres asiáticos, Fetiche de pie, Cosquillas y amateur, pero el número de fetiches cubiertos crecieron rápidamente. Para 2005, había más de 100 categorías de activos en un mes determinado. Para el año 2010 ese número había llegado a 500. En marzo 2015 el contenido fue publicado en casi 900 categorías, y el sitio continúa ganando amplitud. En total, más de 946 fetiches existían en el sitio en el momento de mi análisis, a partir de 1920 de la pornografía a Zit Estrujar, y el número sigue creciendo.


El crecimiento en las categorías a través del tiempo. Facebook Twitter Pinterest

El recuento de clips está creciendo demasiado, con el sitio ganando cerca de 80.000 clips por mes este año. Estoy escépticos del clima seguro querrán centrarse en la lectura inusual de octubre de 2014 y sostengo que la pornografía está ahora en declive, pero la verdad incómoda es que parece estar creciendo más rápido que nunca. Para entonces se habrán subido el próximo año otro millón de clips.


El crecimiento en los clips por mes durante la última década. Facebook Twitter Pinterest

(¿Qué es un poco extraño en esa carta es el período plana entre 2009 y 2011. Si no lo sabía mejor que empezaría a mano que agita de la recesión mundial que golpea a la misma hora, pero yo sí, así que no lo hará. Se podría ser sólo una coincidencia, o un artefacto de algún tipo en los datos.)

Las cosas se ponen un poco más interesante cuando se trata de la fijación de precios. El siguiente gráfico muestra el precio medio por clip. En los primeros días que va por todo el lugar (y recuerde que hay muy pocos clips en ese entonces), pero como el sitio madure el mercado se estabiliza y ves una muy clara tendencia a largo plazo. En 2005 el precio promedio es de un poco más de $ 8 por clip, y en marzo de 2015 en algún lugar alrededor de $ 9,70.


Precio clip de media, 2003-2015. Facebook Twitter Pinterest

Hay un sitio llamado la calculadora de inflación de Estados Unidos que le permite introducir dos fechas, y ajustar los precios para la cantidad de la inflación que se produjo entre ellos. Entrando en las cifras, resulta que un artículo que cuesta 8,10 dólares en Estados Unidos en 2005 costaría $ 9,79 en la actualidad. En otras palabras, los precios del porno han rastreado casi exactamente la inflación.

O ¿verdad? ¡Un ahoy muy pervertido!

Resulta que el precio no es la única cosa cada vez más grande en el porno ... las longitud también los son, y no estoy hablando de los artistas (que los datos no estaba disponible, por desgracia). El clip de media se ha hinchado de un respetable ocho minutos en una nueve-y-uno-mitad ojo-riego durante la última década, mientras que el precio por minuto ha pasado de $ 1.15 a $ 1.25. Si ajustamos la cifra de 2015 para la inflación, precios realmente han caído en 2.005 dólares de $ 1.15 a $ 1.03.


Duración media en minutos, 2003-2015. Facebook Twitter Pinterest

El precio promedio por minuto, 2003-2015 Facebook Twitter Pinterest

Así, mientras que el costo total por clip ha seguido el ritmo de la inflación, los productores han tenido que empacar más contenido en cada clip - que, literalmente, conseguir más porno por su dinero ahora. Por supuesto eso va para megapíxeles también. El tamaño promedio de los archivos ha aumentado de unos 60 megabytes de hace una década a más de 250 hoy en día, en la era HD.


Tamaño de archivo promedio (MB), 2003-2015 Facebook Twitter Pinterest

Incluso cuando nos fijamos en los fetiches de especialidades con las demandas de producción inusuales, el precio todavía se mantiene en alrededor de un dólar por minuto. Giantess clips de efectos especiales, que hacen un uso intensivo de los efectos de pantalla azul, animación y post-producción, en realidad cuestan alrededor de diez centavos menos por minuto que los clips Giantess convencionales, por ejemplo. La categoría de animación es un poco más caro que la media, pero sólo por unos pocos centavos.

La imagen esta pinta para la industria del porno no es exactamente uno sano. Aficionados que inundan el mercado han mantenido los precios bajos. Es cierto que los productores se han beneficiado de los sistemas de facturación, equipo más barato, más grandes audiencias potenciales y así sucesivamente, pero, al mismo tiempo que estás atrapado en un apretón implacable.

Hasta ahora hemos visto todos los clips juntos, pero resulta que no todos los fetiches son iguales. Una de las diferencias más crudos es entre las categorías BDSM y Fetiche de pie. Clips de BDSM en los últimos meses han tenido un promedio de alrededor de $ 1.10 por minuto, mientras que los vídeos Fetiche de pie han sido más de $ 1.20 por un tiempo ahora, pero que palidece en comparación con la diferencia de longitud - clips BDSM promedio de alrededor de 11 a 12 minutos, pero fetichistas de los pies tienen que conformarse con clips promedio apenas 7 u 8 minutos.

Entonces ¿por qué es eso? ¿Es que ver con la naturaleza de la fantasía y los escenarios involucrados? Haz guiones BDSM con un elemento psicológico más profundo requieren más tiempo, exposición o la configuración de lograr? ¿Se necesita menos tiempo para fetichistas de los pies para alcanzar el orgasmo, lo que lleva a una preferencia por los clips más cortos? Quién sabe, pero sería interesante investigar más a fondo, y si alguien tiene alguna ideas do ponerse en contacto.

Vamos a explorar fetiche espacio un poco más, a partir de la 40 lista más leído Más:

  • BONDAGE
  • FEMALE DOMINATION
  • FOOT FETISH
  • TICKLING
  • FACE SITTING
  • SMOKING
  • HANDJOBS
  • FOOT WORSHIP
  • BLOW JOBS
  • TRAMPLING
  • MASTURBATION INSTRUCTION
  • FOOTJOBS
  • BALLBUSTING
  • PANTYHOSE/STOCKINGS
  • FARTING
  • FOOT DOMINATION
  • AMATEUR
  • 18 & 19 YRS OLD
  • BALLOONS
  • MILF
  • HUMILIATION
  • MIXED WRESTLING
  • LESBIAN
  • INTERRACIAL
  • MASTURBATION
  • CBT
  • HIGH HEELS
  • SUPERHEROINES
  • CAT FIGHTING
  • BIG TITS
  • BDSM
  • SPANKING
  • PANTY FETISH
  • GIANTESS
  • PEDAL PUMPING
  • ASS WORSHIP
  • ANAL
  • FEMALE WRESTLING
  • STRAP-ON
  • FEMALE TRAINING
Esta lista no es una brillante porque las categorías han cambiado y evolucionado con el tiempo y están muy vagamente forzada. Categorías más grandes son propensos a ser dividido, para hacerlos más fáciles de buscar. Esto lleva a algunos resultados bastante confusas y engañosas: Bondage y BDSM están en categorías separadas, por ejemplo, mientras que el Rope Play sería fácilmente en el Top 10 si se incluye todos los clips que mencionan la frase, pero que son en realidad bajo la esclavitud. Sin embargo, hay algunas cosas interesantes aquí. Resulta que un montón de problemas aparentemente oscuros son mucho más populares que se podría esperar. Ok quizás no Big Tits, pero la popularidad de los fetiches Pedal-Pumping, Giantess, Balloons y Smoking fue una sorpresa para mí.

Es difícil hacer el mismo tipo de lista de precios porque resulta que ese gasto es en sí mismo un fetiche. Los tres principales categorías más caras son, por tanto, timo, dinero Fetiche y dominación financiera. Otra tendencia es clara, aunque - clips dirigidos a hombres gay son un largo camino hacia abajo en la clasificación. Ninguna de la docena de categorías porno tan gay clasificados en la mitad superior, con Gay sí languideciendo en lugar 730a, con un precio promedio de sólo $ 1.05 por minuto.

¿Podemos vincular estos fetiches juntos de alguna manera, para crear una especie de mapa de la sexualidad humana? Para averiguarlo, busqué fetiches que frecuentemente aparecían juntos en los mismos estudios. Después de haber construido una tabla de enlaces que filtran los candidatos más débiles, cargado todo en JUNG (una biblioteca de Java para la visualización gráfica), y se aplica un sencillo algoritmo de agrupamiento por que agrupa fetiches de acuerdo con el número de conexiones dentro del grupo.

Es la parte menos científica de un artículo ya muy poco científica, y las representaciones 2D de espacios complejos no son particularmente precisa, pero yo quería tener una imagen suck-él-y-ver mostrando más o menos lo fetiche-espacio se parece. El resultado es lo más parecido que he visto a un mapa real, basado en datos de la sexualidad humana, y aunque es muy deficiente todavía es bastante fascinante.


Un intento de visualizar el "espacio fetiche ', generado a partir de conexiones entre los fetiches que comúnmente aparecen en los mismos estudios Clips4Sale. Enlaces conectan fetiches que con frecuencia aparecen juntos en los mismos estudios, y los círculos más grandes representan categorías con más clips (de un puñado de más de 100.000). Facebook Twitter Pinterest

Puede explorar la imagen en su tiempo libre, pero mientras tanto aquí están unos pocos grupos destacables:

Un conjunto de categorías con el objetivo de promover una mayor diversidad de edades entre las mujeres artistas. Puede Ser.

Tamaño de clúster fetiche Facebook Twitter Pinterest
 El cluster tamaño fetiche (derecha) es uno de los pocos que cuentan con categorías tanto de 'recta' (giganta) y (Gigante) porno 'gay'.

No fetiche es demasiado oscuro para tener una categoría, o de hecho una subcategoría.


Un grupo de categorías inspirada en la industria de grabaciones estadounidense.

Entonces, ¿qué podemos sacar de este? Así potencialmente un montón de cosas, pero esto no pretende realmente ser un análisis en profundidad, me acaba de entretenerse para tener un poco de diversión. Hay realmente sólo una conclusión concreta que quiero hacer, y es esto: hay un vasto océano de datos en la web acerca de la sexualidad humana, mucho más de lo que yo creo que la gente se da cuenta, y podría ser una herramienta de enorme valor en el desarrollo de nuestra comprensión de un tema muy importante.

En el espacio de un par de fines de semana tuve la oportunidad de improvisar algo de código y llegar a algunas conclusiones interesantes. Un buen investigador en el campo puede hacer mucho mejor, y espero que lo hacen. Mire este espacio ...

mjrobbins

Nota 1: Traté de contactar Clips4Sale antes de este artículo, pero no estaban disponibles para hacer comentarios.

Nota 2: Si usted es un académico o usted trabaja en la industria del porno y tienes alguna idea interesante o desea saber más, puedes enviarme un e-mail a layscience@googlemail.com.

miércoles, 29 de abril de 2015

Las redes de hormigas son más complejas que Google

Las hormigas tienen una red más compleja que la de Google
Por Alexander Saltarin - Tech Times



Una nueva investigación muestra que las colonias de hormigas tienen una red de información que puede rivalizar con Google en términos de complejidad. Las redes de comunicación utilizadas por muchas especies de hormigas son a la vez eficiente y eficaz.


Un nuevo estudio arroja luz sobre la extraordinaria complejidad de las redes de comunicación utilizadas por las hormigas. Los nuevos hallazgos muestran que estas redes pueden rivalizar con las redes masivas utilizados por las empresas de tecnología como Google en gran complejidad.

A primera vista, las hormigas obreras parecen exhibir movimientos aleatorios sin ningún patrón absoluto. Tras una inspección más cercana, sin embargo, las hormigas forrajeras muestran notable organización. Este nivel de organización es sólo es posible con una red de comunicación complejo e intrincado que puede ayudar a las hormigas cubren sistemáticamente áreas relativamente grandes al tiempo que garantiza un suministro de alimentos estable para toda la colonia.

"Las hormigas tienen un nido por lo que necesitan algo así como una estrategia para traer a casa la comida que encuentran", dijo Lixiang Li, investigador de postdoctoral en Comunicaciones de la Universidad de Beijing. "Nosotros sostenemos que este es un factor, en gran parte subestimado hasta ahora, que realmente determina su comportamiento." Li también es el autor principal de un estudio sobre el tema publicado en la revista en línea las Proceedings of the National Academy of Sciences of the United States of America (PNAS)..

En términos de tamaño del cerebro, las hormigas se sabe que tienen los mayores cerebros entre los insectos. Individualmente, sin embargo, las hormigas son criaturas relativamente poco impresionantes. Cuando toda la colonia reúne sin embargo, las hormigas pueden lograr hazañas que podrían poner incluso los seres humanos a la vergüenza. La red de comunicación utilizado por las colonias de hormigas se puede ver cuando las hormigas obreras salen en busca de alimento.

"Mientras que la sola hormiga luego, no es inteligente, los actos colectivos de una manera que me siento tentado a llamar inteligente", dijo el Instituto de Potsdam para la Investigación del Impacto Climático (PIK) científico Jürgen Kurths. "El principio de la auto-organización es conocida a partir de enjambres instancia de pescado, pero es la mensajera que hace que las hormigas tan interesante." Kurths es también co-autor del estudio, así como el jefe de los conceptos transdisciplinarios y métodos de dominio del PIK.

Para comunicarse entre sí, las hormigas utilizan una red de feromonas para transferir y difundir información. Cada hormiga deja un rastro de feromonas que pueden ser detectados por otras hormigas. Una vez que una hormiga pasa sobre una fuente de alimento, otras hormigas pueden seguir el rastro dejado por la hormiga originales. Mientras que la feromona puede disipar con relativa rapidez, las hormigas son rápidos para el seguimiento y el número de hormigas que van hacia y desde una fuente de alimento crecer en número; el rastro de feromona se refuerza y ​​otra vez. Como las hormigas proceden con forrajeo, se imaginan gradualmente el camino más corto posible entre su nido y una fuente viable de alimentos.

Los investigadores responsables del estudio han comparado la complejidad de la red utilizada por forrajeo hormigas a la de la tecnología utilizada por Google en su motor de búsqueda líder en la industria.

"Las hormigas colectivamente forman una compleja red altamente eficiente", agregó Kurths. "Y esto es algo que encontramos en muchos sistemas naturales y sociales."

domingo, 26 de abril de 2015

El congreso en USA incrementa su polarización


El ascenso del partidismo y los super cooperadores en la Cámara de Representantes de EE.UU.
Clio Andris, David Lee, Marcus J. Hamilton, Mauro Martino, Christian E. Gunning, John Selden Armistead
PLOS One
DOI: 10.1371/journal.pone.0123507

Abstract

Se informó ampliamente que el partidismo en el Congreso de los Estados Unidos está en un máximo histórico. Dado que los individuos son persuadidos a seguir las líneas del partido, mientras que tener la oportunidad y los incentivos para colaborar con los miembros de la otra parte, nuestro objetivo es medir el grado en que los legisladores tienden a formar relaciones ideológicas con miembros del partido opuesto. Estamos cuantificar el nivel de cooperación, o falta de ella, entre Demócratas y republicanos miembros de la Cámara de Representantes 1949 a 2012. Definimos una red de más de 5 millones de pares de representantes, y comparar las tasas de acuerdo mutuo de las decisiones legislativas entre dos tipos distintos de pares: los del mismo partido y las formadas por miembros de diferentes partidos. Encontramos que las fluctuaciones a pesar de corto plazo, el partidismo o la falta de cooperación en el Congreso de Estados Unidos ha ido en aumento de manera exponencial durante más de 60 años sin señales de disminuir o revertir. Sin embargo, un grupo de representantes que siga cooperando a través de las líneas del partido pese a la creciente partidismo.


Introducción

Los estadounidenses hoy están representados por figuras políticas que luchan por cooperar a través de las líneas del partido a un ritmo sin precedentes, lo que resulta en batallas de alto perfil fiscales y de política, paradas del gobierno, y la incapacidad para resolver problemas o promulgar leyes que guía la política interior y exterior de la nación [1 ]. El partidismo se ha atribuido a una serie de causas, incluyendo la distribución de la riqueza la estratificación de los estadounidenses [2]; redistritación límite [3]; actividad militante en las elecciones primarias [4]; cambios en las reglas de procedimiento del Congreso [5]; realineamiento político en la América del Sur [6]; el cambio de la elección de los miembros moderados para elegir a los miembros partidistas [7] el movimiento por los miembros existentes hacia polos ideológicos [8]; y un aumento de los medios de comunicación, políticos generalizados [9].

El papel de la persona física representante para facilitar el partidismo es menos clara. Afiliación de partido da forma significativa el expediente de un legislador de votación [10], [11], tanto que en algunos casos, un cambio en los resultados de la afiliación del partido de un legislador en un reajuste inmediato y significativo del comportamiento electoral hacia la nueva agenda del partido [12]. Este cambio es demasiado rápido para ser atribuible a los cambios contemporáneos en la ideología constituyente, lo que indica una desconexión entre el representante y su circunscripción. Los líderes del partido también garantizan la obediencia al ofrecer incentivos tales como la posibilidad de asignar un miembro de un comité favorecida o la promoción de la legislación elaborada por el miembro de alcanzar etapas definitivo de la votación, es decir, con lo que la legislación "a la baja" [13]. Como muchos han llegado a la conclusión [1], hay mucho en juego con este tipo de arreglo conducido por las Partes.

A pesar de las presiones a nivel de partido, existen incentivos para que los representantes individuales de voto con los miembros de la otra parte sobre temas que son específicos de la geografía de un distrito, como el envejecimiento de la población, la gestión de los recursos naturales, asuntos de veteranos, o preocupaciones regionales [14]. Por otra parte, independientemente de su afiliación política, las relaciones de pares pueden formar como resultado de las interacciones sociales, como el patrocinio de proyectos de ley, la interacción con los grupos de presión, la creación de redes de confianza para la comunicación, el intercambio de ideas, la obtención de apoyo para las iniciativas, la negociación de disposiciones y compartir el propio sentido de la ética y ortopraxis. Intercambio de votos, también conocido como intercambio de favores, es otro incentivo para la cooperación entre los partidos [15]. Aunque es difícil de cuantificar debido a las discusiones comerciales voto no son información pública, éstas conducirían a una mayor cooperación entre los partidos en votos ideológicas.

Dado que los individuos son persuadidos a seguir las líneas del partido [10-13], mientras que tener la oportunidad y los incentivos para colaborar con los miembros de la otra parte [14], [15], nuestro objetivo es medir el grado en que los legisladores tienden a formar relaciones ideológicas con los miembros de la parte contraria. En concreto, nos permite descubrir las tasas de cooperación entre los miembros individuales del Congreso, mediante el aprovechamiento de un amplio conjunto de datos de las decisiones de votación nominal de cada legislador en acuerdo o desacuerdo con cada otro legislador durante un congreso específico. Este proceso da lugar a una red de representantes en el Congreso. Tales estructuras de red se han demostrado predecir futuras reelecciones, definir las comunidades intra-congreso y describir la dinámica temporal de Congresos [16-21].

En los estudios que representantes del Congreso modelo como nodos de una red, los nodos están conectados con un borde basado en una similitud dada entre nodos, como proyecto de ley de co-autoría o pertenencia en el mismo comité [16-21]. Nos conectamos nodos con los registros de votación similares en votos nominales individuales, que representan las similitudes en la ideología. Cabe destacar que el método de la red difiere de los métodos predominantes partidismo legislador indexación [22-24] como estos últimos requieren la cuantificación subjetiva de cada miembro en una sola escala lineal (liberal-conservador a) (es decir, dimensión). Estas dimensiones son considerados valiosos porque temporalmente se correlacionan con los casos de períodos de tiempo históricas y eventos en Historia de Estados Unidos [24]. Distintivo y rompedor, estas dimensiones son aceptados como práctica estándar para la cuantificación de la polarización, ya que sirven como un indicador fiable de la situación política.

Sin embargo, los métodos anteriores son los más utilizados para medir el comportamiento de los sistemas completos, y no muy adecuados para descubrir patrones interpersonales de acuerdo forjado por pares de representantes. El método de la red es capaz de dejar de lado las consideraciones siguientes de las actuales herramientas de medición partidismo [22-24]. En primer lugar, cuando clasificación representantes en términos de un vector elegido de decisiones que se estime importante, el índice puede ser (quizás incorrectamente) manipulado para que coincida con correlación con eventos. El cóctel real votación utilizado para crear el índice, así como la forma de este valor se transforma en un valor lineal no está claro para la persona común, tal vez ni al científico social experimentado. Además, la escala de polarización parece tener un mínimo arbitrario y máximo que depende de las elecciones subjetivas de los creadores. En segundo lugar, cuando se utiliza la diferencia entre los valores de índice dos representantes describir la distancia ideológica entre un par de representantes, como en [24], puede producirse falsas similitudes. En este método, el índice está centrado en cero, lo que indica la neutralidad, y cada vez más miembros 'fuertes' de una de las partes (la otra parte) están aumentando los números positivos (negativos). Sin embargo, dos miembros moderados pueden tener cada uno un índice de cero, pero en realidad podría no estar de acuerdo en todos los temas no de procedimiento. En tercer lugar, los métodos de indexación se describen en su totalidad por las medidas globales, tales como la media de los índices de los miembros como indicadores de polarización [22-24], que ofuscar el papel del individuo. En cambio, los métodos de redes de apalancamiento bruto, los datos desagregados sobre el comportamiento electoral de cada miembro para descubrir cómo pares de distintos partidos forman relaciones orgánicas en el Congreso. Más inconvenientes de los métodos de índices tradicionales, con un enfoque en la de su incapacidad para detectar grupos, están astutamente describen en [21].

En este artículo, vamos primero a examinar la disminución de los representantes que están de acuerdo con los representantes del partido político opuesto a la legislación propuesta, y cómo esta falta de colaboración de votación refleja cambios partidismo en los últimos 60 años (1949-2012). Nuestros resultados muestran cómo la relativa facilidad de la cooperación de todos los partidos a finales de 1960 y principios de 1970 conduce a la disociación de las partes y el surgimiento de un selecto grupo de personas que conducen altas tasas de cooperación entre los partidos. Analizamos a continuación la correlación entre la disminución de la cooperación y la disminución de la productividad legislativa en los años 1990 y 2000. Finalmente interpretamos los resultados en términos de tendencias globales en el clima político, los procesos de crecimiento multiplicativos, el comportamiento público y las implicaciones para el distrito electoral de Estados Unidos.


Materiales y métodos

Utilizamos los datos de votación nominal de la Cámara de Representantes desde 1949 (inicio del Congreso 81a) a 2012 (aplazamiento del Congreso 112a) (ver Tabla 1) según lo dispuesto por la Oficina del Secretario de la Cámara de Representantes de Estados Unidos a través Govtrak [26] como se describe en [27], en una votación nominal, un representante elige si responder ('yay' / 'nay') o abstenerse de votar sobre un proyecto de ley o de movimiento. Las abstenciones son relativamente raras, y se cuentan como 'noes', ya que no son compatibles con la legislación. La mayoría de abstenciones provenir de los miembros ausentes o no podrá votar en la mayoría de votos, y no tienen conexiones de red (es decir, que no se consideran). Sustantivas votos nominales se proponen acciones, proyectos de ley y la legislación sobre temas que producen nuevas leyes, como los beneficios de veteranos, el seguro de presupuesto y la salud. Procedimiento votos nominales reflejan votos en la organización y el calendario del programa [27], como un gesto hacia el recreo. No discriminamos entre estos tipos aunque estos últimos son a menudo votaciones unánimes y están excluidos en gran medida del conjunto de datos.


Tabla 1. Resumen de estadísticas de Representantes del Congreso y Registros Electorales.
doi: 10.1371 / journal.pone.0123507.t001

Para todos los B (n, 2) los posibles pares de representantes en el Congreso dado, nos cuentan el número de Roll Call califican donde votaron de la misma manera. Nos Tally un acuerdo cuando un par califican ya sea 'yay' / 'yay' o 'nay' / 'nay'. Por ejemplo, el congresista A ha votado de manera similar con el congresista B cinco veces más a menudo que con el congresista C en una sesión, dando la relación AB cinco veces el peso del AC. El resultado es una B (n, 2) las células beta, ponderado, grafo no dirigido de relaciones de par entre los representantes. Cada par se clasifica como "del mismo partido" (SP) si son miembros de un mismo partido político, o "de todos los partidos" (CP), si es un representante republicano y otro demócrata. Los independientes son raros y se incluyen como CP con el resto de los no independientes. Los independientes no figuran como super-cooperadores debido a su tendencia a ser en un par de todos los partidos, con la mayoría del Congreso. Ausencias representativos se descartan. Acuerdos no están normalizados por el total de votos posibles o cualquier otro factor.

Resultados

Hay un total de 3.424.343 pares de todos los partidos (CP) (las compuestas por un solo republicano y un solo demócrata) Pares y 2239357 del mismo partido (SP) (las compuestas por dos demócratas o dos republicanos) en los 60 años de nuestra estudio (Tabla 1).

Para cada Congreso, un valor umbral se define como el punto de cruce entre las distribuciones de frecuencia de duelo (es decir, histogramas) de acuerdos roll call CP y pares SP (Fig 1). Por ejemplo, el valor umbral 109a Congreso está en 766 acuerdos (Tabla 1, gráficamente visible en la figura 1). Aunque el valor en sí depende en gran medida del número total de votaciones nominales durante un Congreso dado, el umbral significa el valor en el que cualquier par aleatorio que presenta esta serie de acuerdos es la misma probabilidad de ser un par CP o SP. Un par encontrado a la derecha (es decir, con más acuerdos de voto) es más probable que sea del mismo partido (SP); a la izquierda (es decir, con menos acuerdos), de dos partes diferentes (CP) (Fig 1). Pares CP y SP son casi indistinguibles unos de otros en el Congreso 91o, pero son inconfundiblemente diferente hoy (Figura 1). Para encontrar acuerdos pares del legislador individuo con el tiempo, se construye una red de representantes (nodos) conectados con bordes a otros nodos si la tasa de acuerdo voto de la pareja está por encima del valor umbral para que el Congreso en particular (Figura 2). Esta configuración ilustra la separación de los partidos políticos a través del tiempo mientras que destaca cada individuo. (Visualizaciones interactivas están disponibles en la Base de datos S1.)


Figura 1. Funciones de densidad de probabilidad de parejas del mismo partido y entre los partidos en el tiempo.
Funciones de densidad de probabilidad de que el número de acuerdos de votación nominal entre parejas del mismo partido (SP) y los pares de pares de todos los partidos (CP). Los gráficos muestran la divergencia constante de las PC y las tasas de acuerdo SP con el tiempo. Por encima de cada distribución es el número Congreso (81 a 112), seguido del año el Congreso comenzó, y el número total de votos nominales durante las dos sesiones de cada Congreso. Se quitan pares con unos acuerdos (por debajo de los mínimos locales de una distribución CP creciente consistently-), incluidos los representantes de Washington DC, Puerto Rico.
doi: 10.1371 / journal.pone.0123507.g001



División 2. La figura de Demócratas y republicanos miembros a través del tiempo.
Cada miembro de la Cámara de Representantes de 1949-2012 se dibuja como un nodo único. Representantes (R) republicanos están en rojo y demócratas representantes (D) están en azul, los cambios de afiliación del partido no se reflejan. Los bordes se dibujan entre los miembros que están de acuerdo por encima del valor umbral del Congreso de los votos. El valor umbral es el número de acuerdos en los que es igualmente probable que consta de dos miembros del mismo partido (por ejemplo, DD o RR), o un par de todos los partidos (por ejemplo, DR) cualquier par exhibir este número de acuerdos. Cada nodo es de tamaño con respecto a su número total de conexiones; bordes son más gruesas si la pareja está de acuerdo con más votos. El año de inicio de cada 2 años el Congreso se escribe encima de la red. La red se extrae mediante un modelo lineal-lineal repulsión-atracción con la optimización de Barnes Hut [33].
doi: 10.1371 / journal.pone.0123507.g002

Pares Cooperadores

Pares interpartidarios (CP) por encima del valor umbral (Tabla 1) se distinguen como cooperadores. Estos colaboradores están de acuerdo en votación nominal más a menudo que un par SP azar. La prevalencia de cooperadores ha disminuido en dos órdenes de magnitud a partir de la década de 1970 a 2000. De 1967 a 1979, el Congreso tenía a menudo más de 10.000 colaboradores (máximo: 12.921) y se compone de por lo menos 10% cooperadores (máximo: 13,4%), es decir, al menos el 10% de las parejas CP acordó en más aspectos que los pares de SP. En comparación, 2001-2010 realizó menos de 1.500 cooperadores (min: 181) con menos de 1,5% (min: 0,2%) de los pares de CP que actúan como cooperadores (Tabla 1). Longitudinalmente, el partidismo / falta de cooperación ha aumentado a una tasa anual de alrededor del 5% en los últimos 60 años. El número medio de desacuerdos sobre votos nominales entre pares CP está aumentando de manera exponencial (Figura 3A), como se ilustra con un modelo exponencial de crecimiento en forma de y = c0eγt que exhibe un ajuste (F31 = 236,22, α = 0.05, R2 = 0,88 , p <0,0001). Esta curva se ajusta el aumento exponencial del número de votos en bruto en desacuerdo sobre por sesión. Cuando desacuerdos voto se normalizan posibles votos nominales, la tendencia muestra altas tasas de desacuerdo en las décadas de 1950 y 1960 tempranos (S1) Fig. Los períodos de la cooperación y la falta de cooperación se alinean con los resultados de [24].


Figura 3.- tasas de cooperación del Congreso a través del tiempo.
Cuatro parcelas de la falta de cooperación del Congreso a través del tiempo se muestra como: (a) Número medio de desacuerdos votación nominal entre pares como una función del tiempo de todos los partidos (CP). (B) El número de pares cooperadores como una función del tiempo (por ejemplo, parejas que están de acuerdo con más frecuencia que una (SP) par del mismo partido al azar de todos los partidos (CP)). (C) El número de representantes que participan en al menos un par cooperador como una función del tiempo. (D) El número de apariciones de cada cooperador hace en relación a todos los CPs más evidencias de tiempo super-cooperadores desde finales de 1990 hasta la actualidad.
doi: 10.1371 / journal.pone.0123507.g003

Super cooperadores

Aunque pares cooperadores son relativamente poco frecuentes hoy (figura 3B) los pares que existen, son impulsados ​​por muy pocos individuos (Figura 3C y 3D). Definimos un super-cooperador como un legislador que se encuentra en al menos un 5% de las parejas cooperadores durante un Congreso dado. Grandes cooperadores como Rep. Ralph Hall (D-TX) guía de 48% de todos los pares de cooperadores (ver Tabla S1 para cada uno de 86 súper-cooperadores). Rep. Hall, un demócrata de mayor rango de las zonas rurales del Norte de Texas (la ciudad más grande: Sherman), condujo sin ayuda casi la mitad de todas las asociaciones transfronterizas pasillo acordando pasado el umbral con 220 de los 230 republicanos en el Congreso 108 (tabla 2). Del mismo modo, el representante Dan Boren (D-OK), cuya distrito Oklahoma (ciudad más grande: Muskogee).. Comparte una frontera con Rep Hall, contribuyó con el 42% de todos los pares de cooperadores en la sesión número 109, mediante la asociación con 119 diferentes republicanos (Tabla 2). Grandes cooperadores Rep. Dan Boren (D-OK) y Rep. Robert Cramer (D-IL) en conjunto representaron el 71.4% de todos los pares de cooperadores en el 109 Congreso. En conjunto, los siete miembros representaron el 98,3% de todos los pares de cooperadores en el Congreso 110 (Fig 3D y S1 Tabla). Acumulando cooperación en manos de muy pocos legisladores es un fenómeno nuevo. Antes de 1990, la participación máxima para cualquier legislador en un par cooperador fue de menos de 5%, y a menudo menos de 1%.


Tabla 2. Principales Grandes Cooperadores, que comprende al menos el 15% de todos los pares de Cooperadores en un Congreso específico
doi: 10.1371 / journal.pone.0123507.t002

La mayoría de los super-cooperadores son demócratas que provienen de Texas (12 apariciones), Mississippi (7), Alabama (5), Louisiana, Texas (4 apariciones cada uno), Georgia, Kentucky, Oklahoma, Ohio, Pensilvania y Virginia (3 cada uno). El 104º Congreso (1995-1996) tenía los super-cooperadores la mayoría (13), todos los cuales eran demócratas, la mayoría de los estados del sur. Republicanos apariencias super-cooperadores se limitan sobre todo a Nueva York (10), Nueva Jersey (5) y Maryland (4), en gran parte, en las zonas suburbanas fuera de la ciudad de Nueva York y Washington, DC Esta tendencia puede estar cambiando, ya que los resultados preliminares de la 113ª Congreso muestran que la mayoría de los super-cooperadores son representantes republicanos de Nueva York y Nueva Jersey.

Los pocos súper cooperadores, que negocia legislación mano a mano y cooperan con los miembros de cada partido, a pesar de la amenaza de alienación de su partido [28], [29], pueden ser ejemplo del grado actual de representar cuidadosamente una circunscripción. Estos super-cooperadores pueden ganar reputación de gran alcance a través de búsqueda de alimento por sí solo los lazos cada vez más escasos en todos los partidos que dividen.

Comparación con métodos estadísticos prevalecientes

Comparamos las tasas de cooperación par CP, producidas por el método de cooperador, a "puntuación polarización" del método de escalamiento multidimensional designado DW, (la diferencia en el partido de los medios de la primera dimensión), así como la "superposición", (el superposición ideológica entre los partidos Demócrata y Republicano) [25] (Figura S2).

Los congresos donde pares CP cooperan, (es decir, aparecerá por encima del umbral), es decir, desde 1949 hasta 1983, tiene una amplia gama de valores cooperador y un dominio puntuación polarización estrecho. Estos Congresos caen en el 50% de todas las probabilidades par CP apariencia, (6,5 a 13,5% de toda la gama: 0,02 a 13,5%), pero sólo en el 20% del rango "puntuación de polarización" (0,43 a 0,57 de 0,43 a 1,09), lo que indica que estos más de 30 años serían difíciles de distinguir cuando se define por el índice de puntuación de polarización (S2A figura). Lo contrario es cierto para algunos Congresos entre 1993-2011, que publicar probabilidades de aparecer por encima del umbral en un rango relativamente estrecho entre 0,02% y 2,0%, de la gama anterior, mientras que la puntuación polarización oscila libremente entre 0,73 y 1,09, demarcando así estos años con más variabilidad político que el método cooperador. En esencia, el método cooperador presenta aquí y la puntuación polarización DW nominarse es más sensible a los últimos años, aunque los valores se correlacionan (r 2: 0,73). Además, el método de DW-DESIGNAR encuentra que los Congresos iniciados en 1951 y 1953 presentan el menor número de polarización (índices. 435 y 433., Respectivamente), mientras que el método cooperador muestra que los Congresos iniciados en 1973 y 1979 fueron los más cooperativo, donde cada representante tenido la oportunidad de 13% de los que aparecen por encima del umbral con un miembro del partido contrario.

Una comparación entre la estadística de "superposición" del DW nominarse presenta una mejor correlación con la CP-par probabilidades de aparecer por encima del umbral de acuerdo votación nominal, es decir, que son cooperadores (r2 :. 83) (Fig S2B). Aún así, sin embargo, 1995-2011 valores del método cooperador tienen un alcance considerable, mientras que el método de superposición produce valores con pocos dígitos significativos: 1995-1999 medido a 0.009, de 2011 a 0.007 y 0.000 en 2003-2011, lo que indica la precisión menos visible. Estos valores son difíciles de diferenciar con el tiempo, mientras que el método cooperador asigna más una amplia gama de valores a Congresos en este rango (S2B figura).

La comparación de las dos estadísticas DW-nominar con las estadísticas más recientes cooperadores no indica que sea resultado es más correcto. El método cooperador puede añadir más dimensión a la caracterización de ciertos marcos de tiempo, y las estadísticas DW-nominar a producir más fidelidad en otros marcos de tiempo. Sin embargo, creemos que los valores producidos por el método cooperador son probabilidades sencillas que son fáciles de explicar con la siguiente pregunta: ¿Cuáles son las probabilidades de que cualquier representante dado será un "cooperador"? Esta probabilidad es más simple, pero más transparente que DW-designar, que requiere conocimientos de espacio de características y el análisis de componentes de interpretar estos índices. En cambio, el método cooperador ofrece una visión general rápida que se puede utilizar a través de los gobiernos representativos y otros cuerpos de votación en todo el mundo. El DW nominarse debe ser un complemento al método cooperador, ya que sigue siendo beneficioso para el examen de múltiples facetas de cada Congreso. Por ejemplo, ofrece múltiples estadísticas descriptivas mientras que el método cooperador ofrece pocos.

El consenso y la opinión pública

No es sorprendente que el partidismo se correlaciona con el fracaso de introducir y aprobar leyes. El número de proyectos presentados (figura 4A), proyectos de ley aprobados (figura 4B), y el porcentaje de proyectos presentados que pasan (figura 4C) caen exponencialmente con el tiempo, de acuerdo con un menor número de pares cooperadores [30]. El número de proyectos de ley presentados parece estar afectado más negativamente por la falta de cooperación. Esta tendencia es problemático, ya que la falta de cooperación aumento se correlaciona significativamente con una disminución en la productividad del Congreso (Fig 4). Por otra parte, una disminución en la eficiencia también es impulsado por una disminución significativa en el número de billetes introducido [30], lo que sugiere que el aumento de la falta de cooperación sofoca la motivación del Congreso para innovar. Este estancamiento se ha traducido en hiperpartidismo y crítica popular actual que el Congreso ha registrado su mínimo año productivo en 2013 [31].


Figura 4. La productividad del Congreso como una función de las tasas de cooperación.
Tres gráficos de la productividad del Congreso en función de la cooperación del Congreso muestran una correlación con: (a) El número de proyectos de ley presentados durante una sesión. (B) El número de proyectos de ley pasó. (C) La relación de facturas que se pasan a los introducidos. Las líneas continuas indican ajustes exponenciales. Los datos de [30].
doi: 10.1371 / journal.pone.0123507.g004

Por otra parte, la opinión pública del Congreso ha disminuido de forma simultánea desde el 60% de opiniones favorables en la década de 1960 a una calificación de 10% favorables de hoy [30] también se correlaciona con más de bifurcación en el Congreso sobre este período de tiempo. Se discuten estos puntos más adelante.

Discusión

Nuestro análisis muestra que el partidismo del Congreso ha ido aumentando de manera exponencial durante más de 60 años, y ha tenido efectos negativos en la productividad del Congreso. Esto es particularmente evidente en la reducción constante del número de proyectos de ley presentados en el suelo, lo que sugiere que el efecto negativo principal de aumentar el partidismo es una pérdida de la innovación del Congreso.

Pero ¿por qué es este patrón de creciente partidismo surgiendo con tanta fuerza? Existen complejas interacciones que conducen a la toma de decisiones y relaciones de par en la Cámara de Representantes. Aunque nuestros datos no apoyan una atribución clara de mecanismo distinto de asociaciones de correlación con covariables, nos encontramos con que la polarización es parte de una tendencia exponencial a largo plazo lo que implica que la falta de cooperación engendra multiplicativamente falta de cooperación. En otras palabras, la atmósfera partidista de hoy no puede ser un producto de la fragmentación política reciente (como los demócratas del Sur [32] o el grupo republicano del Tea Party). Por otra parte, estos grupos pueden haber surgido de un cambio creciente de la cooperación, a la vez que contribuye al cambio. Por lo tanto, si bien es incorrecto decir que las figuras políticas divisivas últimos son responsables de aumentar el partidismo, han contribuido activamente a ella, porque estos son los tipos de figuras que no cooperan y facciones que el sistema multiplicativo selecciona. El aumento exponencial de la falta de cooperación no muestra indicios de desaceleración, o invertir, y así mientras el Congreso se ha vuelto cada vez más no cooperativo durante la segunda mitad del siglo 20, esta tendencia parece probable que continúe en el futuro.

Este aumento de la falta de cooperación conduce a una interesante paradoja electoral. Mientras que los votantes estadounidenses han estado seleccionando representantes partidistas cada vez durante 40 años, la opinión pública del Congreso de Estados Unidos ha ido disminuyendo de manera constante. Esta disminución [30] sugiere que los votantes emiten su voto a nivel local para que los representantes partidistas cada vez más los que ven como la mejor representación de sus preocupaciones cada vez más partidistas, dejando muy pocos o ninguno los legisladores moderados para conectar partes de un Congreso más cohesionada. Los representantes elegidos son cada vez más incapaces de cooperar a nivel del Congreso nacional, pero son reelegidos al menos el 90% de las veces, lo que refleja una evasión de la responsabilidad colectiva. Los votantes pueden creer que los candidatos altamente partidistas se "inclinar la balanza" en favor de una de las partes. Sin embargo, sobre la base de correlaciones que se muestran aquí, un candidato partidista puede carecer de la cooperación necesaria para aprobar la legislación. Más legisladores moderados pueden tener una ventaja competitiva en la negociación para la legislación de su partido.

Una inversión fundamental de aumentar la falta de cooperación, con el tiempo, pueden hacer necesario un cambio de perspectivas ideológicas locales (lo que resulta en un cambio selectivo a menos representantes partidistas), o un cambio fundamental en la forma en el electorado vota (de preocupación se centró en cuestiones del partido para preocupaciones se centraron en la eficacia global). Ciertamente actualidad no parecen dividir cooperadores potenciales, como las relaciones entre los partidos alcanzaron un máximo en posiblemente el período más turbulento de la historia reciente de Estados Unidos, marcados con numerosos asesinatos políticos y la guerra de Vietnam y la renuncia del presidente Nixon, como se ilustra por otros, tales como [23-25]. Puede ser que la disminución de la interacción social del Congreso en Washington, DC, en combinación con el aumento de las telecomunicaciones y los desplazamientos a uno de distrito, puede obstaculizar la capacidad representantes de cooperar.

Los Estados Unidos se compone de 435 distritos electorales únicos, cada uno con distintas geografías físicas, economía, comunidades, culturas e ideologías políticas. En un tiempo, estas circunscripciones únicas parecían estar representado por una combinación distinta de las ideologías de los partidos Demócrata y el Partido Republicano. Anteriormente, los legisladores presentaron una mezcla de ideales que resonaban a través de plataformas de partidos, permitiendo que cada uno forjar una huella digital de votación personal que refleja la visión del mundo distinta de su distrito único y circunscripción.

Hoy en día, los distritos puede permanecer como socio-económica y geográficamente única como en el pasado, sin embargo, los representantes tienen todo pero perdió sus registros de votación personales para complementar sus circunscripciones individualizados. En lugar de ello, los estadounidenses de hoy están representados por figuras políticas cuyas ideológica rollo llamada votación récord en la Cámara de Representantes en general se asemeja a uno de los dos tipos: o bien un republicano o un demócrata de plataforma, con muy poca combinación. Lo que este hiper partidismo sin precedentes producirá para el futuro de la política exterior y nacional de los Estados Unidos aún no se ha visto. Este trabajo se llevó a cabo principalmente en el Instituto de Santa Fe.


Información de Soporte



Esta figura normaliza el número de desacuerdos par voto entre los partidos sobre el total de votos posibles en el Congreso en particular.


Por el Congreso, la probabilidad de que un legislador está en un par CP encima del umbral (es decir, un cooperador) se correlaciona con dos estadísticas DW-nominar: partidismo político y la superposición, con diferentes dinámicas en el tiempo. Los datos de [24].


Esta cifra se normaliza el número de desacuerdos par voto entre los partidos sobre el total de votos posibles en el Congreso en particular.
doi: 10.1371 / journal.pone.0123507.s001


Referencias

1. Snowe O. The effect of modern partisanship on legislative effectiveness in the 112th Congress. Harv J on Legis. 2013; 50: 21–40.
View Article
PubMed/NCBI
Google Scholar
2. McCarty N, Poole KT, Rosenthal H. Polarized America: The dance of ideology and unequal riches. Cambridge, MA: MIT Press; 2006.
3. Carson J, Crespin M, Finocchiaro C, Rohde D. Redistricting and party polarization in the U.S. House of Representatives. Am Polit Res. 2007; 35: 878–904. doi: 10.1177/1532673x07304263
View Article
PubMed/NCBI
Google Scholar
4. Rosenstone SJ, Hansen JM. Mobilization, participation, and democracy in America. New York: Macmillan; 1993.
5. Theriault S. Party polarization in Congress. New York: Cambridge University; 2008.
6. Roberts J, Smith S. Procedural contexts, party strategy and conditional party voting in the U.S. House of Representatives 1971–2000. Am J Pol Sci. 2003; 47: 305–317. doi: 10.1111/1540-5907.00021
View Article
PubMed/NCBI
Google Scholar
7. Jenkins J. Examining the bonding effects of party: A comparative analysis of roll-call voting in the U.S. and Confederate Houses. Am J Pol Sci. 1999; 43: 1144–1165. doi: 10.2307/2991821
View Article
PubMed/NCBI
Google Scholar
8. Theriault S. Party polarization in the US Congress: Member replacement and member adaptation. Party Pol. 2006; 12: 483–503. doi: 10.1177/1354068806064730
View Article
PubMed/NCBI
Google Scholar
9. Iyengar S, Hahn KS. Red media blue media: Evidence of ideological selectivity in media use. J Commun. 2009; 59: 19–39. doi: 10.1111/j.1460-2466.2008.01402.x
View Article
PubMed/NCBI
Google Scholar
10. Snyder J, Groseclose T. Estimating party influence in Congressional roll-call voting. Am J Pol Sci. 2000; 44: 193–211. doi: 10.2307/2669305
View Article
PubMed/NCBI
Google Scholar
11. Cohen GL. Party over policy: The dominating impact of group influence on political beliefs. J Pers Soc Psychol. 2003; 85: 808–822. pmid:14599246 doi: 10.1037/0022-3514.85.5.808
View Article
PubMed/NCBI
Google Scholar
12. Nokken T. Dynamics of Congressional loyalty: party defection and roll call behavior 1947–1997. Legis Stud Quart. 2000; 25: 417–444. doi: 10.2307/440414
View Article
PubMed/NCBI
Google Scholar
13. Fleisher R, Bond J. The shrinking middle in the U.S. Congress. Brit J Pol Sci. 2004; 34: 429–451. doi: 10.1017/s0007123404000122
View Article
PubMed/NCBI
Google Scholar
14. Lee FE. Geographic politics in the U.S. House of Representatives: Coalition building and distribution of benefits. Am J Pol Sci. 2003; 47: 714–728. doi: 10.1111/1540-5907.00050
View Article
PubMed/NCBI
Google Scholar
15. Carrubba C, Volden C. Coalitional politics and logrolling in legislative institutions. Am J Pol Sci. 2000; 44: 261–267. doi: 10.2307/2669309
View Article
PubMed/NCBI
Google Scholar
16. Porter M, Muchab P, Newman M, Warmbrand C. A network analysis of committees in the U.S. House of Representatives. Proc Nat Acad Sci USA. 2005; 102: 7057–7062. pmid:15897470 doi: 10.1073/pnas.0500191102
View Article
PubMed/NCBI
Google Scholar
17. Fowler J. Connecting the Congress: a study of co-sponsorship networks. Pol Anal. 2006; 14: 456–487. doi: 10.1093/pan/mpl002
View Article
PubMed/NCBI
Google Scholar
18. Zhang Y, Friend A, Traud A, Porter M, Fowler J, Mucha P. Community structure in Congressional co-sponsorship networks. Physica A. 2008; 387: 1705–1712. doi: 10.1016/j.physa.2007.11.004
View Article
PubMed/NCBI
Google Scholar
19. Cho W, Fowler J. Legislative success in a small world: Social network analysis and the dynamics of Congressional legislation. J Pol. 2010; 72: 124–135. doi: 10.1017/s002238160999051x
View Article
PubMed/NCBI
Google Scholar
20. Porter M, Mucha P, Newman M, Friend A. Community structure in the United States House of Representatives. Physica A. 2007; 386: 414–438. doi: 10.1016/j.physa.2007.07.039
View Article
PubMed/NCBI
Google Scholar
21. Waugh AS, Pei L, Fowler JH, Mucha P, Porter MA. Party polarization in Congress: A network science approach; 2011. Preprint. Available: http://arxiv.org/abs/0907.3509. Accessed July 15 2012.
22.Poole KT, Rosenthal H. The polarization of American politics. J Pol. 1984; 24: 1061–1079. doi: 10.2307/2131242
View Article
PubMed/NCBI
Google Scholar
23. Cox G, Poole KT. On measuring partisanship in roll call voting: the U.S. House of Representatives 1877–1999. Am J Pol Sci. 2002; 46: 477–489. doi: 10.2307/3088393
View Article
PubMed/NCBI
Google Scholar
24. Poole KT, Rosenthal H. Congress: A political-economic history of roll call voting. Oxford: Oxford University Press; 1997. See also:http://voteview.com/political_polarizati​on.asp
25. Carroll R, Lewis JB, Lo J, Poole KT, Rosenthal H. Measuring bias and uncertainty in DW-NOMINATE ideal point estimates via the parametric bootstrap. Polit Anal. 2009; 17: 261–278. doi: 10.1093/pan/mpp005
View Article
PubMed/NCBI
Google Scholar
26. Office of the Clerk of the U.S. House of Representatives, Roll Call Votes; 2014. Accessed through Govtrak by Civic Impulse, LLC. Available:https://www.govtrack.us/congress/votes.
27.Clinton J, Jackman S, Rivers D. The statistical analysis of roll call data. Am Pol Sci Rev. 2004; 98: 355–370. doi: 10.1017/s0003055404001194
View Article
PubMed/NCBI
Google Scholar
28. Cox G, McCubbins M. Setting the agenda: Responsible party government in the U.S. House of Representatives. Cambridge, UK: Cambridge University Press; 2005.
29. Harbridge L, Malhotra N. Electoral incentives and partisan conflict in Congress: Evidence from survey experiments. Am J Pol Sci. 2011; 55: 494–510. doi: 10.1111/j.1540-5907.2011.00517.x
View Article
PubMed/NCBI
Google Scholar
30. Ornstein N, Mann T, Malbin M, Rugg A. Vital Statistics on Congress. The Brookings Institution. July 2013. Available: http://www.brookings.edu/research/report​s/2013/07/vital-statistics-congress-mann​-ornstein. Accessed: 15 November 2013.
31. Viser, M. This Congress Going Down as Least Productive: Hyperpartisan Climate Gums Up Bulk of Laws. The Boston Globe. December 2013. Available:http://www.bostonglobe.com/news/politics​/2013/12/04/congress-course-make-history​-least-productive/kGAVEBskUeqCB0htOUG9GI​/story.html. Accessed 10 December 2013.
32. Theriault S, Rohde D. The Gingrich Senators and party polarization in the U.S. Senate. J Pol. 2011; 73: 1011–1024. doi: 10.1017/s0022381611000752
View Article
PubMed/NCBI
Google Scholar
33. Barnes J, Hut P. SA hierarchical O(N log N) force calculation algorithm. Nature. 1986; 324: 4. doi: 10.1038/324446a0
View Article
PubMed/NCBI
Google Scholar
34. Krackhardt D, Stern RN. Informal networks and organizational crises: An experimental simulation. Soc Psychol Q. 1988; 15: 123–140 doi: 10.2307/2786835
View Article
PubMed/NCBI
Google Scholar


sábado, 25 de abril de 2015

Las redes de idiomas estructuralmente similares a las redes ecológicas

Las redes de contacto entre lenguas son estructuralmente análogas a las redes ecológicas

Medio Departamento de Comunicación


Mapa de Europa con la red de contactos entre lenguas; los puntos (nodos) representan las regiones donde se habla cada lengua y las líneas (enlaces) unen todas las lenguas que están en contacto entre sí. (CSIC)

Investigadores del Consejo Superior de Investigaciones Científicas (CSIC) han participado en un estudio internacional sobre la diversidad lingüística a escala global. Se trata, según los científicos, del primer trabajo sobre biogeografía humana mundial basado en redes de contacto entre lenguas. En este trabajo, que se ha publicado en la revista Proceedings of the Royal Society B, se ha demostrado que dichas redes tienen una estructura similar a las del tipo depredador-presa de los ecosistemas naturales.

Mientras que en ecología estas redes especifican qué animal es depredador y cuál es la presa, en el caso de los grupos lingüísticos es el área de cada región la que determina los contactos entre grupos vecinos. Además, el estudio demuestra que los grupos lingüísticos interaccionan a lo largo de direcciones espaciales específicas. “Este patrón es universal, es decir, lo observamos en diferentes regiones del mundo”, explica José Ángel Capitán, investigador del CSIC en el Centro de Estudios Avanzados de Blanes. Y añade: “Es muy probable que los condicionantes geográficos del paisaje sean determinantes a la hora de explicar los patrones observados. Por ejemplo, los valles y los ríos facilitan la comunicación mientras que las montañas suponen una limitación”.

Para este trabajo se ha utilizado Ethnologue, según los científicos la base de datos de lenguas más completa que existe en la actualidad, que contempla 6.900 lenguas y proporciona información sobre la distribución geográfica de cada una de ellas. Como señala Capitán: “Hemos tenido en cuenta las analogías evolutivas que existen entre grupos de especies en biología y grupos humanos caracterizados por compartir una misma lengua. Entre esas analogías se encuentran desde la existencia de ancestros comunes, las familias de lenguas o la mayor diversidad tanto biológica como lingüística en torno al Ecuador del planeta”.

Una red de contactos entre lenguas

Para estudiar los patrones de manera global, los científicos han creado una red de contactos entre lenguas sobre el mapamundi. En la red, los puntos (nodos) representan las áreas donde se habla cada lengua (áreas que aparecen marcadas en escala de grises en la figura), mientras que las líneas (enlaces) unen todas las lenguas que están en contacto entre sí. Así, dos lenguas están enlazadas sobre la red si las regiones en las que se hablan comparten fronteras o bien si en las cercanías de la frontera se encuentran hablantes de ambas lenguas. “Mediante las propiedades matemáticas que tengan las redes de contacto entre sus lenguas –explica Capitán-, podemos deducir propiedades de la distribución geográfica de los grupos humanos”.

“Las implicaciones de nuestro trabajo en biodiversidad pueden ser relevantes por su novedad porque hasta ahora no se habían realizado estudios sobre diversidad lingüística a gran escala y con tanto nivel de detalle en nuestro planeta. Nuestra intención es lograr una caracterización biogeográfica no solo del ser humano sino también de distintas especies biológicas, para las que esperamos recuperar patrones similares”, apunta el investigador.

J.A. Capitán, J. B. Axelsen y S. Manrubia. New patterns in human biogeography revealed by networks of contacts between linguistic groups. Proceedings of the Royal Society B. DOI: 10.1098/rspb.2014.2947

miércoles, 22 de abril de 2015

La Ley de Benford ayuda a detectar cuentas sospechosas en Twitter

Cómo la Ley de Benford revela actividad sospechosa en Twitter

La distribución contraintuitiva de dígitos en determinados conjuntos de datos resulta ser una poderosa herramienta para la detección de comportamiento extraño en las redes sociales.

MIT Technology Review




De vuelta en la década de 1880, el astrónomo estadounidense Simon Newcomb notó algo extraño en el libro de tablas logarítmicas en su biblioteca las páginas iniciales estaban mucho más fuertemente manoseadas que los posteriores lo que implicaba que la gente miraba hacia arriba logaritmos comenzando con "1" mucho más a menudo que los " 9. "

Después de algunas investigaciones, su conclusión de que en cualquier lista de los datos, los números comienzan con el dígito "1" debe ser mucho más comunes que los números que comienzan con otras cifras. Luego pasó a formular lógica matemática detrás de este fenómeno, que más tarde se conoció como la ley de Benford, en honor del físico Frank Benford que lo descubrió independientemente unos 50 años más tarde.

La ley de Benford es muy contradictoria. Después de todo, no es claro por qué los números que comienzan con "1" deberían ser más comunes que otros. De hecho, la ley prevé que en los datos que se ajustan a esta regla, los números con el primer dígito "1" debe ocurrir alrededor del 30 por ciento del tiempo, mientras que los números que comienzan con el dígito "9" debe representar menos del 5 por ciento del total.

Eso resulta ser cierto en general para una amplia gama de conjuntos de datos y, de hecho, casi cualquier conjunto de datos que se extiende por varios órdenes de magnitud. Eso incluye a las poblaciones de las ciudades, los precios del mercado de valores, constantes físicas, números en un problema de resumen del lector, y así sucesivamente.

Aunque extraño, la ley de Benford resulta ser enormemente útil para detectar el fraude financiero. La idea es que si la gente inventa cifras, los primeros dígitos de los datos deben ser distribuidos de manera bastante uniforme. De hecho, cada vez que hay una influencia externa sobre el comportamiento de la gente, se plantea la posibilidad de una desviación de la ley de Benford.

Por supuesto, un conjunto de datos que se desvía de la ley de Benford no es a prueba de fraude, sólo una indicación de que se requiere una mayor investigación.

Pero mientras que los estadísticos han buscado la ley de Benford en muchos conjuntos de datos, nunca han aplicado al mundo de las redes sociales. Hoy que cambia gracias al trabajo de Jennifer Golbeck en la Universidad de Maryland en College Park. Ella muestra que no sólo la ley de Benford se aplica a muchos conjuntos de datos asociados con las redes sociales, pero que las desviaciones de esta ley están claramente vinculados a la actividad sospechosa en línea.

Golbeck comienza con los datos sobre los usuarios de los cinco principales redes sociales: Facebook (18.000 usuarios), Twitter (78.000 usuarios), Google Plus (20.000 usuarios), Pinterest (40 millones de usuarios) y LiveJournal (45.000 usuarios). Su método era sencillo. Miró el número de amigos y seguidores asociados a cada usuario en estos conjuntos de datos y contó la distribución de los primeros dígitos en las figuras.

Los resultados son una lectura interesante. En cada serie, excepto uno de datos, la distribución estadística de primeros dígitos sigue de cerca la ley de Benford.

Eso no es realmente una sorpresa. No hay ninguna razón por qué estos conjuntos de datos, que abarcan varios órdenes de magnitud, no deben seguir la ley de Benford. Pero un conjunto de datos no siguió la ley de Benford. Esto ocurrió en el número de la siguiente manera en Pinterest. Golbeck señala que esto por sí mismo no indica actividad fraudulenta, pero ciertamente sugiere que se necesita más investigación.

No pasó mucho tiempo para que Golbeck para identificar la causa. Resulta que cuando la gente se une Pinterest, están obligados a seguir cinco o más "intereses" antes de que puedan continuar con el proceso de registro. Esto crea al menos cinco inicial sigue para cada usuario. "Aunque los usuarios pueden entrar y después eliminar los sigue, pocos lo hacen, y este proceso de iniciación afecta a toda la distribución de los DCF", dice ella.

Eso es un ejemplo interesante de cómo una influencia externa provoca un conjunto de datos a desviarse de la ley de Benford. Contadores forenses buscan desviaciones similares en los datos financieros, pero estas desviaciones no siempre son indicativas de fraude. Por ejemplo, el número 03 de mayo surgir con más frecuencia de lo esperado en los libros de una empresa si con frecuencia compra los productos que cuestan £ 39.99.

Golbeck ha ido más allá para ver si la ley de Benford sugiere actividades sospechosas en las redes sociales. En particular, ella no era justo en el número de cada uno de los amigos, pero en las redes de sus amigos, las llamadas redes egocéntricas.

Luego mide la correlación entre la red egocéntrica de un individuo y la ley de Benford y encontró que para la gran mayoría de la gente, esta correlación es superior a 0,9. "En general, la gran mayoría de las redes egocéntricas se ajustaba a lo que la Ley de Benford predicho", dice ella.

En el caso de Twitter, sólo 170 personas de las 21.000 que ella investigó tenían una correlación inferior a 0,5. Golbeck investigó cada uno de ellos con resultados curiosos.

"Casi cada una de las cuentas de 170 parecían estar comprometido en actividades sospechosas", dice ella.

Algunas de las cuentas eran claramente el spam, pero la mayoría eran parte de una red de bots rusos que publican fragmentos aleatorios de obras literarias o citas. "Todas las cuentas rusas se comportaban de la misma manera, después de otras cuentas de su tipo, exactamente una imagen de fotos de la publicación, con una imagen de la foto diferente como foto de perfil", dice ella.

Sólo por qué existen estas cuentas, y con qué propósito, no está claro. Pero su comportamiento es muy inusual. De hecho, sólo dos de las 170 cuentas con una baja correlación con la ley de Benford parecen pertenecer a los usuarios legítimos, dice Golbeck.

Eso es un trabajo interesante que tiene implicaciones importantes para la red social forense. En los últimos años, se ha vuelto cada vez más difícil de detectar cuentas en las redes sociales que se dedican a actividades sospechosas. La comparación de un gran número de ellos en contra de la ley de Benford es una manera rápida y sencilla de encontrar los que requieren mayor investigación.

Por supuesto, este proceso no va a encontrar todas las cuentas sospechosas. Cualquier cuenta que crece en la misma forma que uno convencional permanecería oculto y es posible que los usuarios maléficos podrían emplear técnicas simples para hacer sus cuentas menos identificables ahora que este método ha sido revelado.

Pero por el momento, la ley de Benford parece ser una herramienta valiosa en la guerra contra el fraude y las actividades sospechosas en las redes sociales. "La aplicabilidad de la Ley de Benford a los medios de comunicación social es una nueva herramienta para analizar el comportamiento del usuario, la comprensión de cuándo y por qué se pueden producir desviaciones naturales, y en última instancia detectar cuando las fuerzas anormales en el trabajo", concluye Golbeck.

Ref: arxiv.org/abs/1504.04387 : Benford’s Law Applies to Online Social Networks