lunes, 10 de octubre de 2016

La complejidad de la propiedad de las redes financieras off-shore

El análisis de redes muestra las finanzas off-shore como una compleja red de vínculos de propiedad
Las finanzas offshore se ha convertido en un elemento crucial de la economía política internacional, escribe Ene Fichtner
LSE Business Review



La UE hizo un movimiento en agosto para forzar a Apple a pagar € 13 mil millones en impuestos no pagados. El episodio se ha convertido rápidamente emblemático de la lucha de la UE contra la evasión fiscal corporativa, una disputa que se intensificó a raíz de la crisis financiera de 2009. A medida que los europeos lo ven, se trata de la necesidad de proporcionar una igualdad de condiciones entre las empresas estadounidenses y europeas. Si un minorista con sede en Reino Unido presta mucha más impuestos que Amazon sede en Estados Unidos, que nunca será capaz de competir de forma justa. La OCDE, "la organización encargada por el G8 y el G20, más recientemente, el desarrollo de normas internacionales como parte de la lucha contra la evasión y el fraude" vio sus ambiciones aguadas después de una intensa presión política. En este artículo, el análisis de red de la red corporativa nos permite visualizar cómo las corporaciones multinacionales estructuran sus vínculos de propiedad, un elemento clave en la evasión de impuestos.

...

Las finanzas offshore ya no es el fenómeno pequeños y periféricos lo era antes. Durante las últimas cuatro décadas, se ha convertido en un elemento crucial de la economía política internacional contemporánea. Hoy en día, los centros financieros offshore (que también pueden ser llamados paraísos fiscales o paraísos regulatorios) constituyen nodos centrales dentro de los mercados financieros globales.

Gabriel Zucman ha estimado recientemente que la riqueza financiera por una suma de casi US $ 8 billones representan a cabo en alta mar - una suma que asciende a casi el 50 por ciento del PIB de la UE o los EE.UU.. Esto provoca una pérdida de ingresos fiscales mundial de aproximadamente US $ 200 mil millones. Las estimaciones de la riqueza en alta mar por la Red de Justicia Fiscal incluso oscilan entre los US $ 21 billones de dólares y US $ 32 billones de dólares. Podría decirse que los individuos de alto valor neto (HNWI) y grandes corporaciones multinacionales (CMN) sostienen que la gran mayoría de esta riqueza en alta mar, lo que conduce directamente a las preguntas de la creciente desigualdad económica.

El impacto de las finanzas en alta mar no sólo se refiere a la desigualdad económica, sino también a las cuestiones de responsabilidad corporativa y la transparencia - ambos de los cuales son fundamentales para el buen funcionamiento de cualquier economía de mercado. Por esta razón, la Red de Justicia Fiscal no utiliza el término centros financieros offshore o paraísos fiscales, sino que los llama jurisdicciones secretas, porque el secreto y la opacidad son las principales razones por las cuales los agentes económicos extranjeros usan estos países y territorios.

Con este secreto y la falta de rendición de cuentas vienen grandes riesgos. Los escándalos corporativos de Enron, Parmalat y Olympus, así como el casi colapso del gran fondo de cobertura LTCM todas las filiales participantes en paraísos fiscales. Además, estas jurisdicciones secretas han funcionado como domicilios legales para la creación de productos financieros estructurados complejos, como las obligaciones de deuda garantizadas (CDO) y otros valores respaldados por activos (ABS). De acuerdo con Photis Lysandrou y Anastasia Nesvetailova, estos productos financieros opacos han contribuido al desarrollo de la crisis financiera global, o al menos se han agravado considerablemente.

A pesar de estos riesgos significativos, los servicios financieros extraterritoriales recibe muy poca atención por parte de los reguladores. Por supuesto, los G-20 han tomado algunas medidas modestas) (después de la crisis financiera mundial para aumentar la regulación de los centros financieros offshore. Niels Johannesen y Gabriel Zucman han encontrado que estas medidas sólo han provocado una reubicación de los activos entre los centros offshore, pero no una disminución general de los activos contabilizados en estas jurisdicciones secretas.

Pero el calor está encendido. En 2014, el Consorcio Internacional de Periodistas de Investigación (ICIJ) publicó un informe en el que ganó la atención mundial de los medios: ". Fugas de Luxemburgo" los El informe ICIJ reveló que el Gran Ducado de Luxemburgo ayudó a más de 300 grandes corporaciones multinacionales para reducir sus facturas de impuestos globales drásticamente , Amazon, McDonalds y IKEA por ejemplo. Estas grandes empresas han canalizado cientos de miles de millones de dólares a través de esta pequeña jurisdicción y como resultado ahorrado miles de millones de dólares en impuestos en otro lugar.

Otro ejemplo que ha llamado mucho la atención es un impuesto de construcción conocido como el "doble irlandés con un sándwich holandés" que reduce los impuestos para las grandes multinacionales, como Apple, desplazando las ganancias internacionales de una filial irlandesa a los Países Bajos luego de vuelta a Irlanda y, posteriormente, en otro lugar, por ejemplo, a los paraísos fiscales del Caribe.

A mediados de 2016, la Unión Europea dictaminó que el impuesto de construcción especial que Irlanda ha ofrecido de Apple constituye un importe ilegal e injusto subsidio a más de US $ 13 mil millones, el cual tiene que ser reembolsado. Por último, la fuga masiva de datos confidenciales relativas a sociedades pantalla y fideicomisos conocidos como los "Documentos de Panamá", que incluye datos sobre más de 200.000 entidades offshore, causó una gran atención por los medios y por la academia por igual.

La identificación de los centros financieros extraterritoriales

Una serie de organizaciones internacionales, como el FMI, la OCDE y otros, comenzó a publicar listas de países que se consideran centros offshore. Por supuesto, dichas listas - incluso si inicialmente sobre la base de criterios relevantes - rápidamente se politizan y por lo tanto a menudo pierden su valor.

Una de las definiciones de los centros financieros offshore que es muy adecuado para la investigación empírica es de Ahmed Zoromé: "un OFC es un país o jurisdicción que ofrece servicios financieros a no residentes en una escala que es inconmensurable con el tamaño y la financiación de su economía doméstica ". Esta definición tiene la ventaja de que se basa exclusivamente en los datos.

El Índice de Secreto Financiero, así la relación de intensidad alta mar siguen este enfoque metodológico. El Índice de Secreto Financiero combina una puntuación secreto con un peso de escala global para producir una FSI-valor para cada jurisdicción. La relación en alta mar intensidad fija la cantidad agregada de capital extranjero reservado en una jurisdicción (depósitos bancarios externa, la inversión extranjera de cartera, y la inversión extranjera directa) en relación con el tamaño de su economía doméstica. El resultado es una relación que expresa la fuerza con la que la jurisdicción particular, ha actuado como un imán para el capital extranjero.

La figura 1 muestra las relaciones financieras bilaterales entre los mayores de 34 jurisdicciones de las finanzas globales transfronteriza. Estos lazos financieros transnacionales representan casi el millón de millones de $ 82 - un poco más que el PIB mundial. Puede leer la figura de la siguiente manera: gris son los menos probables de ser un centro financiero offshore. Amarillo son los CFE potenciales, tales como Suiza y el Reino Unido. Por último, los países rojos tienen altas relaciones de alta mar intensidad, entre ellos Irlanda, Luxemburgo y los Países Bajos. La magnitud de las esferas en la visualización es equivalente a la suma de todas sus relaciones bilaterales en el campo de las finanzas globales transfronteriza. Los mayores jurisdicciones están en el centro de la visualización, los más pequeños se muestran en la periferia.

Figura 1: Los mayores centros financieros offshore en las finanzas globales transfronteriza en el año 2012


Fuente: Jan Fichtner (2015): El Índice de Intensidad-Marina, Documento de trabajo CITYPERC, City University de Londres.


Cadenas de propiedad globales

Tanto el Índice de Secreto Financiero, así como la relación en alta mar intensidad se basan en datos agregados, es decir, la combinación de todos extranjera de cartera o de inversión directa que se ha informado a las organizaciones internacionales. De hecho, los datos agregados son utilizados por la gran mayoría de los estudios existentes sobre los centros financieros offshore. Sin embargo, es en la naturaleza misma de los datos agregados que se confunden muchos detalles interesantes y relevantes. Esto se opone a la aplicación de muchas preguntas de investigación y métodos innovadores. Por lo tanto, un enfoque prometedor para el análisis de las finanzas offshore es utilizar los datos granulares, desglosados.

El grupo de investigación de la red corporativa utiliza la base de datos de Orbis por Bureau van Dijk, que contiene 200 millones de empresas, 70 millones de las relaciones de propiedad corporativa, y 10 millones de cadenas de propiedad transnacionales. Granular, datos basados ​​en la empresa permite el estudio de nuevas preguntas de investigación relativa a los centros financieros extraterritoriales y la forma en que son utilizados por las empresas multinacionales para reducir al mínimo (y lo más probable es que también evaden) los impuestos y crear estructuras de propiedad corporativa transnacionales secretos y opacos (véase este artículo de Alex Cobham y Simon Loretz para la investigación innovadora a partir de datos de Orbis).

En el siguiente paso, CorpNet se va a centrar en lo que llamamos "cadenas de propiedad global" (GOCS), que son las relaciones corporativas de propiedad (a menudo a través de subsidiarias) que se extienden a través de múltiples jurisdicciones, presumiblemente con el fin de minimizar y evadir impuestos, y para crear el secreto y la opacidad. Aquí, nos inspira y basarse en la investigación sobre las "cadenas de valor mundiales" y "Cadenas riqueza global".

las investigaciones existentes sobre las cadenas de propiedad corporativa es escasa. La Conferencia de las Naciones Unidas sobre Comercio y Desarrollo (UNCTAD) ha publicado una investigación innovadora en las cadenas de propiedad en su Informe Mundial de Inversiones 2016, entre otras cosas, la introducción de un "inversor índice de nacionalidad desajuste" (también confiar en los datos de Orbis). Vamos a complementar y ampliar esta literatura emergente mediante la identificación de las jurisdicciones (offshore) que juegan el papel más importante en las cadenas de propiedad globales.

Los resultados preliminares indican que sólo un pequeño número de jurisdicciones dominan Comités Organizadores de Juegos - principalmente los Países Bajos, sino también de Luxemburgo, el Reino Unido, Bermudas (BM), las Islas Caimán (KY), y las Islas Vírgenes Británicas (VG) (véase la Figura 2) . De este modo, la red corporativa va a avanzar en la investigación sobre las finanzas en alta mar mediante el análisis como una compleja red de vínculos de propiedad transnacionales.

Figura 2: La red de vínculos de propiedad transnacionales por valor de ir a través de cadenas en 2015


El análisis CorpNet por Javier García-Bernardo basado en los datos de Orbis: Fuente

sábado, 8 de octubre de 2016

ARS ayudando a los estudios de salud pública

Big Data, redes y enfermedades
La Red Social de Salud - Cómo Instagram y Twitter están aportando nuevos conocimientos

Luis Rocha, Director del Programa de Sistemas Complejos en la Escuela de Información y Computación de la Universidad de Indiana en Bloomington, explica el nuevo enfoque de software dirigido a la investigación médica. Grandes volúmenes de datos generados a través de las redes sociales como Twitter y Instragram ofrece un examen más profundo y más completo de los efectos de los medicamentos y enfermedades, lo que lleva a mayores conocimientos útiles para mejorar la eficacia de la prevención y el tratamiento.


jueves, 6 de octubre de 2016

Visualización: Polarización en las votaciones en Zurich

Estructura de polarización social y económica en votaciones en el cantón de Zurich

Kanton Zürich
Direktion der Justiz und des Innern

Los hechos 


Las declaraciones se basan en un análisis de datos agregados de los resultados de la comuna de Zurich.


  • Iniciativa "Economía Verde" (TIO): La votación fue ideológicamente en especial altamente el acuerdo estaba en comunidades que abogan por un estado fuerte, profundamente entrar en los preferencia del mercado soluciones. En las comunidades progresistas de la aprobación fue más alta que en la conservadora, pero la polarización a lo largo de este eje baja (Figura 1, 2). Enlaces votantes (SP, verde) es probable que hayan dado su consentimiento a la plantilla encima de la media, para los votantes de la SVP y el FDP se aplica a la inversa (gráfico 3). Los factores sociales juegan ningún papel (gráfico 4).
  • Iniciativa AHVplus: Como era de esperar, la aprobación de la iniciativa con los partidarios de un estado fuerte fue mayor que con los representantes de las soluciones basadas en el mercado - el eje económico, así que tenía una cierta importancia (Figura 1, 2). Sin embargo, hay indicios de una gran importancia relativa del contexto social (gráfico 4): municipios profundidad de estado con una población de menores recursos tienen la plantilla en lugar de estado de aprobado alto, rico. Incluso en las zonas urbanas, el acuerdo fue mayor que en las zonas rurales (Figura 4). Las razones exactas de esto puede ser un análisis de datos agregados a nivel comunitario, pero no declaraciones siempre seguros. Las encuestas son para el instrumento apropiado.
  • Ley de Agencias de Inteligencia (NDG): Apoyo a la Ley de Agencias de Inteligencia muestra exclusivamente de las relaciones de contraste estado-mercado (Figura 1, 2). En el mercado de las comunidades de afinidad consentimiento (todavía) fue mayor que en los que más apoyo del gobierno general. lo que parece a primera vista extraña - y no menos evidente que el alto grado de abstracción de la etiqueta del eje, aunque la gran mayoría, pero no es capaz de cubrir todos los casos. Los corresponde por el estado de eje mercado, pero a nivel de grupo de contraste entre los partidos de izquierda (SP, verde) y el FDP (gráfico 3). Y si hay un punto en el que el electorado de la izquierda es el estado escépticos (palabra clave Fichenaffäre) y los de la FDP lo contrario, por lo que este es probablemente el (estado) Pregunta de seguridad.
  • Iniciativa cantonal "cuidado de niños asequible": El patrón ideológico fue similar a la de la IGW, sin embargo, fue la importancia de los factores ideológicos equilibrado (Figura 1, 2). Además, muestra una relativamente pronunciada sociodemográfico del campo a la zanja que probablemente refleja la diferente afectada (gráfico 4). Debido a que en las zonas rurales predominan las estructuras familiares más tradicionales, mientras que los aumentos de la población lleva en las localidades de la ayuda exterior.

Estructuras de polarización ideológicas y sociales de las plantillas - cuatro gráficos


La información básica empotrada en la motivación, la base de datos y la base metodológica de las siguientes gráficas da statistik.info 04/2016.

El gráfico 1 muestra la aceptación de las cuatro plantillas en el mapa político del cantón de Zurich. Se permite una clasificación de voto con respecto a las preferencias ideológicas de la población. Por un lado puede ser comunidades conservadoras de diferir (eje vertical) progresiva, por la otra mano en lugar de declaración más favorable al mercado a (eje horizontal). Los gráficos también están disponibles de forma interactiva.

Figura 1: La aprobación de los referendos en el mapa político del Cantón de Zúrich

 estructuras de polarización y los partidos

La figura 2 resume el modelo de la figura 1 junto con dos indicadores. La dirección y la fuerza de la relación del acuerdo a una plantilla con los dos ejes es que ven a simple vista y comparable a otras plantillas. Se muestra todas las plantillas son federales y cantonales la década actual.

Fue la aprobación en las comunidades conservadoras altos, por lo que es la plantilla por encima del centro, que era alta en el progresiva, a continuación. Lo mismo se aplica para el mercado de estado de eje horizontal. Cuanto más lejos de una plantilla se elimina del centro, el más fuerte de los resultados de la comunidad fueron marcados por las actitudes ideológicas. Una versión interactiva se puede encontrar aquí. La regla de oro: Si una imagen no está incluido en el área sombreada de color gris localiza en el medio, puede por un efecto relevante al menos una dimensión se consideran.

Gráfico 2: Estructura de la polarización ideológica de los referendos de contexto

 estructura de la polarización ideológica de la venida referendos sobre 25/09/2016 en contexto

En la figura 3 se hace la referencia a los votantes del Partido acciones que son "localiza" de la misma manera que los votos. En principio, cuanto más cerca de una plantilla a nombre del partido, más fuerte será la conexión (positivo) de votos proporcional a la participación correspondiente de los votos.

Gráfico 3: Partidos y patrón de polarización 


La Figura 4 se puede leer como análoga a la figura 2, excepto que aquí la polarización socio-espacial reconocible. Plantillas por encima del centro encontraron en las comunidades rurales y tradicionales calificaciones relativamente altas de aprobación, los de abajo y no en ciudades izquierda del centro en el estado bajo comunidades ("pobres"), la derecha del centro en el estado alto ( "rico"). Cuanto más lejos del centro, más fuerte es la relación - y el más seguro, también es cierto que el contexto social influyó en el comportamiento de los votantes. Una vez más: Si una imagen no está incluido en el área sombreada de color gris se localiza en el centro, por lo que puede un efecto relevante al menos una dimensión se consideran.

Gráfico 4: Estructura de la polarización socio-demográfico de las próximas referendos sobre 25/09/2016 en contexto

 estructura de la polarización socio-demográfico de las próximas referendos sobre 25/09/2016 en contexto


Vista del patrón ideológico y socio-demográfico de polarización voto en Zúrich -  010-2016
mapa político de forma interactiva


Estructuras de polarización ideológicas y sociales de forma interactiva


lunes, 3 de octubre de 2016

ARS 101: Bi-componentes conectados o vértices de corte

Bicomponentes conectados o vértice de corte
Wikipedia


Un grafo de ejemplo con el vértice de corte marcado. Cada color corresponde a un vértice de corte. vértices multicolores se cortan vértices, y por lo tanto pertenecen a varios vértice de corte.

En la teoría de grafos, un vértice de corte (también conocido como un bloque o componente 2-conectado) es un subgrafo máximo biconexas. Cualquier grafo conexo se descompone en un árbol del vértice de corte llamado el árbol de corte de bloque del grafo. Los bloques están unidos entre sí en los vértices compartidos llamados vértices de corte o puntos de articulación. Específicamente, un vértice de corte es cualquier vértice cuya eliminación aumenta el número de componentes conectados.


Algoritmos

El tiempo lineal profundidad primera búsqueda

El algoritmo secuencial clásica para el cálculo de vértice de corte en un grafo no dirigido conectada se debe a John Hopcroft y Robert Tarjan (1973). [1] Se ejecuta en tiempo lineal, y se basa en la búsqueda en profundidad. Este algoritmo también se perfila como un Problem 22-2 de su Introduction to Algorithms (tanto 2ª y 3ª ediciones).

La idea es ejecutar una búsqueda en profundidad mientras se mantiene la siguiente información:
  • la profundidad de cada vértice en el árbol de profundidad-primero-búsqueda (una vez que se visitó), y
  • para cada vértice v, la profundidad más baja de los vecinos de todos los descendientes de v en el árbol de profundidad primera búsqueda, llamado el punto más bajo.

La profundidad es estándar para mantener durante una búsqueda en profundidad. El punto más bajo de v puede calcularse después de visitar todos los descendientes de v (es decir, justo antes de v se apareció de la pila profundidad-primero-búsqueda) como el mínimo de la profundidad de v, la profundidad de todos los vecinos de v (aparte de la padre de v en el árbol de la profundidad de primera búsqueda) y el punto más bajo de todos los hijos de v en el árbol de la profundidad de primera búsqueda.

La clave es que un vértice no raíz v es un vértice de corte (o punto de articulación) que separa dos vértice de corte si y sólo si hay un niño y de v tal que si profundidad  ≥ punto más bajo (y) (v). Esta propiedad puede ser probado una vez que la búsqueda en profundidad regresó de cada hijo de v (es decir, justo antes de v se hizo estallar de la pila de profundidad primera búsqueda), y si es verdad, v separa el grafo en diferentes vértice de corte. Esto se puede representar mediante el cálculo de un vértice de corte de cada uno de estos y (un componente que contiene y contendrá el subárbol de y, además v) y, a continuación, borrar el subárbol de y del árbol.

El vértice de la raíz debe ser manejado por separado: es un vértice de corte si y sólo si tiene al menos dos hijos. Por lo tanto, basta con simplemente construir un componente de cada subárbol hijo de la raíz (incluyendo la raíz).

Pseudocódigo

GetArticulationPoints(i, d)
    visited[i] = true
    depth[i] = d
    low[i] = d
    childCount = 0
    isArticulation = false
    for each ni in adj[i]
        if not visited[ni]
            parent[ni] = i
            GetArticulationPoints(ni, d + 1)
            childCount = childCount + 1
            if low[ni] >= depth[i]
                isArticulation = true
            low[i] = Min(low[i], low[ni])
        else if ni <> parent[i]
            low[i] = Min(low[i], depth[ni])
    if (parent[i] <> null and isArticulation) or (parent[i] == null and childCount > 1)
        Output i as articulation point

Otros algoritmos

Una alternativa simple al algoritmo anterior utiliza descomposiciones de la cadena, que son descomposiciones especiales para los oídos en función de árboles DFS. [2] Las descomposiciones de cadena se pueden calcular en tiempo lineal por esta regla de desplazamiento. Sea C una descomposición de la cadena de G. Entonces se conecta-2-vértice G si y sólo si G tiene grado mínimo 2 y C1 es el único ciclo en C. Esto da inmediatamente una prueba de 2-conectividad en tiempo lineal y se puede ampliar listar todos los vértices de corte de G en el tiempo lineal utilizando la siguiente instrucción: un vértice v en un grafo conexo G (con grado mínimo 2) es un vértice de corte si y sólo si v es incidente a un puente o v es el primer vértice de un ciclo en C - C1. La lista de los vértices de corte se puede utilizar para crear el árbol de bloque de corte de G en el tiempo lineal.

En la versión en línea del problema, se añaden vértices y aristas (pero no eliminado) de forma dinámica, y una estructura de datos deben mantener las vértice de corte. Jeffery Westbrook y Robert Tarjan (1992) [3] desarrollaron una estructura de datos eficiente para este problema sobre la base de estructuras de datos disjuntos-set. En concreto, se procesa n vértices adiciones y adiciones m de borde en O (m α (m, n)) tiempo total, donde α es la función inversa Ackermann. Esta vez unida se demostró ser óptima.

Uzi Vishkin y Robert Tarjan (1985) [4] diseñaron un algoritmo paralelo en CRCW PRAM que se ejecuta en O (log n) tiempo con n + m procesadores. Guojing Cong y David A. Bader (2005) [5] desarrollaron un algoritmo que logra una aceleración de 5 con 12 procesadores en SMP. Aceleraciones superiores a 30 basado en el algoritmo original Tarjan-Vishkin fueron reportados por James A. Edwards y Uzi Vishkin (2012). [6]

Estructuras relacionadas

Relación de equivalencia

Uno puede definir una relación binaria en los bordes de un grafo no dirigido arbitraria, según la cual dos bordes E y F están relacionadas si y sólo si, ya sea e = f o el grafo contiene un ciclo simple tanto a través de e y f. Cada borde está relacionada a sí mismo, y un borde e está relacionado con otro borde f si y sólo si f está relacionado de la misma manera a E, menos evidente, esta es una relación transitiva: si existe un ciclo simple que contiene bordes e y f, y otro ciclo simple que contiene bordes F y g, entonces se pueden combinar estos dos ciclos de encontrar un ciclo simple a través de e y g. Por lo tanto, esta es una relación de equivalencia, y que puede ser utilizado para dividir los bordes en clases de equivalencia, los subconjuntos de los bordes con la propiedad de que dos bordes están relacionados entre sí, si y sólo si pertenecen a la misma clase de equivalencia. Los subgraphs formados por los bordes de cada clase de equivalencia son los vértice de corte de la grafo dada. Por lo tanto, los vértice de corte partición de los bordes de la grafo; sin embargo, pueden compartir vértices entre sí. [7]

Grafo de bloque 

El grafo de bloques de un grafo dado G es el grafo intersección de sus bloques. Por lo tanto, tiene un vértice para cada bloque de G, y un borde entre dos vértices siempre que las correspondientes dos bloques comparten un vértice. Un grafo H es el grafo de bloques de otro grafo G exactamente cuando todos los bloques de H son subgrafos completos. Los grafo H con esta propiedad son conocidos como los grafos de bloque. [8]

Árbol de bloque de corte

Un punto de un grafo de G punto de corte, el vértice de corte, o la articulación es un vértice que es compartida por dos o más bloques. La estructura de los bloques y los puntos de corte de un grafo conectado puede ser descrita por un árbol llamado el árbol de bloque de corte o árbol de BC. Este árbol tiene un vértice para cada bloque y para cada punto del grafo dada la articulación. Hay una ventaja en el árbol de bloque de corte para cada par de un bloque y un punto de articulación que pertenece a ese bloque. [9]


Notas

  1. Hopcroft, J.; Tarjan, R. (1973). "Algorithm 447: efficient algorithms for graph manipulation". Communications of the ACM. 16 (6): 372–378. doi:10.1145/362248.362272.
  2. Schmidt, Jens M. (2013), "A Simple Test on 2-Vertex- and 2-Edge-Connectivity", Information Processing Letters, 113 (7): 241–244, doi:10.1016/j.ipl.2013.01.016.
  3. Westbrook, J.; Tarjan, R. E. (1992). "Maintaining bridge-connected and biconnected components on-line". Algorithmica. 7: 433–464. doi:10.1007/BF01758773.
  4. Tarjan, R.; Vishkin, U. (1985). "An Efficient Parallel Biconnectivity Algorithm". SIAM J. Comput. 14 (4): 862–874. doi:10.1137/0214061.
  5. Guojing Cong and David A. Bader, (2005). "An Experimental Study of Parallel Biconnected Components Algorithms on Symmetric Multiprocessors (SMPs)". Proceedings of the 19th IEEE International Conference on Parallel and Distributed Processing Symposium. pp. 45b. doi:10.1109/IPDPS.2005.100.
  6. Edwards, J. A.; Vishkin, U. (2012). "Better speedups using simpler parallel programming for graph connectivity and biconnectivity". Proceedings of the 2012 International Workshop on Programming Models and Applications for Multicores and Manycores - PMAM '12. p. 103. doi:10.1145/2141702.2141714. ISBN 9781450312110.
  7. Tarjan & Vishkin (1985) credit the definition of this equivalence relation to Harary (1969); however, Harary does not appear to describe it in explicit terms.
  8. Harary, Frank (1969), Graph Theory, Addison-Wesley, p. 29.
  9. Harary (1969), p. 36.

Redes de agrupamiento de palabras claves con Gephi

La agrupación de palabras clave: un ejemplo con Gephi
 semántica
Blog de SEO / Semantic


El concepto de agregación se discutió de nuevo en el blog, pero desde otro ángulo. De hecho, decidí explorar la funcionalidad de Gephi para generar la cartografía de un universo semántico. El objetivo es visualizar tanto el valor de una palabra clave (volumen de búsqueda) y cómo está conectado a otras palabras clave (similitud semántica)

En el post anterior he presentado un método basado en el algoritmo K-means para particionar un corpus de palabras clave. Aunque es muy fácil acceso, este método tiene la desventaja de tener que saber de antemano el número de grupos que desea crear. Sin superior.

Así que continué mi investigación: La primera vez que compré el libro Massih-Reza Amini y Eric Gaussuier, Búsqueda de Información - Aplicaciones, modelos y algoritmos. minería de datos, y la toma de datos grande, que dedica un capítulo muy interesante a la partición de datos, y en paralelo, yo estaba interesado en Gephi más cerca. Saqué una metodología concreta para la visualización de un conjunto de palabras clave, con base en el coeficiente de Dice y en Gephi y algoritmos de agrupamiento embebidos.

Paso 1: recuperar palabras clave y su volumen de búsquedas

El primer paso será, por supuesto, para recuperar el máximo de palabras clave en el tema que desea estudiar. Por esto, no voy a entrar en detalles, uso Palabras clave Planner, SEMrush o cualquier otra herramienta que le puede dar una coincidencia entre una palabra clave y un volumen de búsquedas mensuales.

Formatear el archivo de la siguiente manera: una primera columna titulada "Id", una segunda columna "Etiqueta" y una columna pasada "Peso". En la primera columna se incluyen las palabras clave en la segunda columna, las palabras clave de nuevo (copia simple / pegar) y en la tercera columna de los volúmenes de búsqueda. Guarde el archivo CSV con el nombre nodes.csv. El archivo de "nodos" está listo para ser importado en Gephi. Vamos a volver ahora.

Paso 2: Se calcula la similitud entre cada palabra clave
Normalizar palabra clave
Antes de pasar al cálculo de la similitud, vamos a proceder en primer lugar a un conjunto de pre-tratamiento, Ruby, que nos permitirá consolidar mejor nuestras palabras clave. Utilizando los mismos conjunto de datos como en el artículo anterior, vamos a almacenar en una matriz.

keywords = ["consultant seo","référencement naturel","expert seo","referencement naturel","consultant referencement","consultant référencement","agence de référencement","agence seo","consultant en référencement","expert referencement","agence référencement","consultant référencement naturel","agence referencement","consultant en referencement","agence de referencement","référencement seo","experts referencement","référenceur freelance","consultant référencement internet","expert référencement","consultant referencement naturel","consultant en référencement naturel","conseil seo","referenceur freelance","spécialiste référencement naturel","search engine optimization for dummies","seo referencement","consultant en referencement naturel","devis referencement","top seo company","expert référencement naturel"]
El primer paso es transformar cada frase de palabras clave en fichas. Esta es la manera de proceder: corté cada cuerda tan pronto como encuentre un espacio.


def get_tokens_from(string)
  tokens = string.split(' ')
  tokens
end
Una vez que la tokenización se ha hecho, voy a conseguir en una base de datos lema (ver mi artículo sobre el análisis semántico), la correspondencia entre cada símbolo y lema. También utilizo el marco Tratar de determinar la categoría morfosintáctica de cada palabra y de este modo eliminar la ambigüedad cuando son posibles varios lemas para una sola ficha.

El siguiente método se encuentra en la base de datos por cada ficha, el lema asociado con él, entonces todas las tiendas en una tabla y elimina los acentos y palabras vacías (dos funciones simples se utilizan para estas operaciones, y remove_accents_from delete_stop_words_from, no voy a detallar aquí).
.
def get_lemmatised_words_from(tokens)
  keywords = Array.new(0)
  tokens.each do |w|
    begin
      word_str = $client.escape(w)
      rows     = $client.query("SELECT lemma,word,category
                                FROM lemmas
                                WHERE word   = '#{word_str}' COLLATE utf8_bin
                                AND category = '#{w.category}'
                                LIMIT 1")
      if rows.size > 0
        keywords << remove_accents_from(rows.map{ |row| row["lemma"] }.first)
      else
        keywords << remove_accents_from(word_str)
      end
    rescue => e
      puts "#{w} => #{e}"
      next
    end
  end
  delete_stop_words_from(keywords)
end

Calcular el coeficiente de Dice

Ahora podemos pasar a la primera etapa de la partición. Como se explica en el libro Massih-Reza Amini y Eric Gaussuier, cuando se trabaja de partición, el primer paso es elegir "una medida de similitud" entre los documentos. Varias medidas de similitud se presentan en este libro, incluyendo el coeficiente de dados, que utilicé para mi análisis. Es lo suficientemente cerca del índice de Jaccard y se calcula dividiendo el doble de la intersección de dos conjuntos, la unión de estos dos conjuntos.

El método a continuación examina cada palabra clave, calcula su similitud uno por uno a través del coeficiente de Dice y almacena los resultados en una tabla.
.
def get_results_from(data)
  results = Array.new(0)
  data.each do |k, v|
    data.dup.each do |kb, vb|
      dice = 2 * (v & vb).count.to_f / (v.count + vb.count)
      dice = dice.round(2)
      results << [k, kb, dice]
    end
  end
  results
end 

Ya sólo queda crear el archivo edges.csv, que indican el grado en Gephi "atracción" entre cada nodo.

def make_edges_csv_file_from(array)
  CSV.open("./edges.csv", "wb", {:col_sep => ";"}) do |csv|
    csv << ["source", "target", "weight"]
    array.each do |row|
      csv << [row[0], row[1], row[2]]
    end
  end
end
Y aquí, ahora tenemos todos los datos necesarios, van a la utilización de Gephi! Para los interesados, el código completo aquí: https://gist.github.com/ABrisset/661a87fb11a16807cf4ae984e7df8c13.

Paso 3: Ver datos en Gephi

Importación de datos

Abra Gephi, haga clic en "Archivo> Nuevo proyecto" y luego ir a "Laboratorio de datos" y haga clic en "Importar hoja de cálculo".

Ir a buscar a su archivo edges.csv. Es él quien le dirá Gephi qué grado de atracción entre cada par de palabras. Seleccione "Como una mesa de enlace", seleccionar el separador de la derecha, y luego haga clic en Siguiente. En la siguiente ventana, seleccione "Crear nodos que falta" y haga clic en "Finalizar".


Bordes - Gephi

A continuación, repita la misma operación, pero esta vez para los nodos. Debe seleccionar "A medida que los nodos de la tabla", a continuación, a la siguiente ventana, llenar "Entero" como el tipo de datos para el campo "Peso" y asegúrese de desactivar "Forzar a los nodos importados para ser nuevos nodos" .

Gracias a la columna "ID" de los nodos de archivos, Gephi es capaz de identificar qué nodos de la conexión "Fuente" y "destino".




Jugar con los parámetros de Gephi

El último paso es personalizar los nodos y enlaces de acuerdo con nuestro objetivo de la agrupación. Vaya a "Información general".

En primer lugar, ejecute el algoritmo de "modularidad" a través del panel de la derecha. Esto ayuda a identificar las comunidades en una estructura gráfica. Más información aquí. A continuación, en el panel izquierdo, haga clic en "partición" y "nudos" y seleccione "La modularidad de clase". Se encontraron tres grupos diferentes: los nodos son de color de acuerdo a su "comunidad" de unión.


Cambiar a la pestaña "Orden", seleccione "nudos" y "Altura / Peso", seleccione "Peso": los nodos son ahora el tamaño proporcional del volumen de búsquedas. Puede hacer lo mismo para el tamaño de las etiquetas.


Sólo queda por añadir un poco de espacio. Para ello, utilice la fuerza Atlas 2, con los siguientes parámetros.



Exportación de la visualización 

Deje Atlas Force girar unos momentos. Ahora pestaña Dirección "Vista". Debe obtener la visualización más adelante, con 3 grupos:

  • palabras clave de todo de referencia + todo 
  • palabras clave de todo "SEO"
  • palabras clave de todo "SEO" + "agencia" + "natural", etc.

Consejo: abra la imagen en una nueva pestaña y descargar la extensión de Chrome SVG Navegador para hacer un zoom;)



¿Qué opinas de este punto de vista? En lo personal, creo que es una buena manera de un lado temática e identificar rápidamente los sitios prioritarios de SEO, es decir, los territorios semánticos en los que centrar sus esfuerzos.

Creo, sin embargo, que podríamos obtener una mejor granularidad comparación de n-gramas ellos, no sólo palabras. A seguir ;)

sábado, 1 de octubre de 2016

Interconexiones financieras globales

Interconectividad en el Mercado Financiero Global
Interconnectedness in the Global Financial Market
Matthias Raddant y Dror Y. Kenett

Kiel Institute for the World Economy, Kiellinie 66, 24105 Kiel, Germany
Kiel University, Department of Economics, Olshausenstraße 40, 24118 Kiel, Germany
U.S. Department of the Treasury, O ce of Financial Research




El sistema financiero global es altamente complejo, con interconexiones e interdependencias transfronterizas. En este entorno altamente interconectado, perturbaciones financieras y eventos locales pueden ser fácilmente amplificados convirtiéndose en acontecimientos mundiales. Se necesitan nuevos modelos para captar la estructura del pueblo financiera global y descubrir los canales de desbordamiento y contagio. Este artículo analiza las dependencias entre casi 4.000 poblaciones de 15 países. Los rendimientos se normalizaron por la volatilidad estimada mediante un modelo GARCH y un proceso de regresión robusta estima relaciones estadísticas por parejas entre las poblaciones de los mercados diferentes. Los resultados de las estimaciones se utilizan como una medida de la interconexión estadística, y para derivar las representaciones de la red, tanto por país y por sector. Los resultados muestran que países como Estados Unidos y Alemania están en el núcleo de la bolsa mundial. La energía, los materiales y los sectores financieros desempeñan un papel importante en los mercados de conexión, y este papel se ha incrementado con el tiempo para los sectores de energía y materiales. El marco proporciona los medios para supervisar la interconexión en el sistema financiero global sobre los niveles de agregación diferentes, y para mostrar cómo evolucionan en el tiempo.

miércoles, 28 de septiembre de 2016

Capital social: Tener menos amigos puede ser mejor

CALIDAD NO CANTIDAD
Por qué estamos mejor con menos amigos


Tres son multitud. (Reuters)


Tony Crabbe - Quartz

Algo notable ha sucedido en la última década. Por primera vez en la historia que hemos adquirido los poderes para establecer relaciones con personas de todo el mundo, y para mantener esas relaciones con casi ningún contacto. Nunca tenemos que perder el contacto con nadie, nunca más, ya que nuestros amigos de Facebook y seguidores de Twitter crecen día a día. Hay algo maravilloso de volver a conectar con un viejo amigo de la escuela con un empuje y un mensaje; mucho más fácil que tener que hablar con ellos (lo que iba a decir que después de todos estos años?). ¿Quién no ha sentido la emoción como su número de amigos cruza la barrera de 1.000 o 10.000?
Esto debe ser una buena cosa. Seguramente a más amigos que es igual a más felicidad?
No es verdad. El crecimiento en el número de nuestros amigos en realidad ha estado acompañado de un aumento en el aislamiento social, como se describe Sherry Turkle. Estamos más conectados, aún más solo. Resulta que existe una correlación entre el uso de Facebook y la soledad. Los más ávidos usuarios de Facebook tienden a sentirse menos satisfechos con la vida y son menos felices. Un estudio encontró que el uso de Facebook empeora el estado de ánimo, mientras que el uso de Internet para el mismo período de tiempo que no lo hacía. Debo enfatizar que la investigación sobre Facebook y otras formas de medios de comunicación social no es universalmente negativo; que puede servir de manera útil como una forma de reforzar las relaciones del mundo real. Además, parece ser que no es Facebook, que te hace solo, sino que las personas solitarias usan Facebook más. Sin embargo, lo que es sorprendente es que la investigación en nuestra conexión a más gente que nunca y no es universalmente positivo que no es ni de lejos. Esto está en marcado contraste con la investigación general sobre el valor crítico de las relaciones en todos los aspectos de bienestar.
Aceptar, por lo que más amigos en Facebook no parece ser una gran cosa; ¿qué pasa con más amigos en el mundo real? ¿Hay que tratar de ganar más amigos cara a cara?
En una pieza fascinante de la investigación llevada a cabo en todo el mundo, Tim Kasser miraba a los valores de las personas, y sus efectos sobre el bienestar. Estudió cómo lo que nos esforzamos en las relaciones afecta a nuestra salud y felicidad. Se encuentran dos valores distintos relacionados con la relación-: popularidad (la unidad para tener más amigos y ser querido por un círculo más amplio de personas) y la afinidad (la unidad para profundizar y construir relaciones cercanas). Aquellos para los que su popularidad era más importante, eran menos felices, menos saludable, más deprimido, y se usa más drogas. Los que se esforzó por afinidad eran todo lo contrario. Nosotros asumimos erróneamente más es mejor para la mayoría de cosas en la vida. Simplemente no es el caso con las relaciones.

Menos y verdaderos amigos

Por desgracia, en los EE.UU. y en otros lugares parece que vamos por el camino de la popularidad, en lugar de construir relaciones cercanas. En 1985, una encuesta preguntó a la gente acerca de la cantidad de amigos que habían discutido cuestiones importantes con. La respuesta más común fue de tres, con un 59% de las personas que tienen tres o más confidentes. En 2004, la respuesta más común a esta pregunta era cero. Sin embargo, los amigos cercanos y confidentes son enormemente valioso. Un estudio sugirió el beneficio, desde el punto de vista de la salud y la felicidad, de tener un buen amigo que se ve todos los días es equivalente a un extra de $ 100.000 en sus ingresos!

Me gusta vincular el trabajo de Kasser con la investigación en primates brillante de Robin Dunbar donde se calcula el tamaño máximo de los grupos sociales en los simios, así como los seres humanos, en función del tamaño de su cerebro. Resulta que el número máximo de relaciones humanos pueden manejar es 150. Esto se conoce como el número de Dunbar. Lo que es menos conocido es que su investigación mostró otros números también. Por ejemplo, se encontró que las personas tienden a tener cinco personas más cercanas a ellos, entonces el siguiente nivel de cercanía involucra a 15 personas, luego 50, luego 150. Casi todo el bienestar se beneficia de las relaciones no provienen de los 500 amigos de Facebook, o incluso el 150 o el 50. vienen desde el momento 15. Calidad pasado con sus 15 amigos más cercanos y la familia tendrá un impacto directo sobre su felicidad, la salud y la longevidad (y el suyo también). Como Ed Diener y Martin Seligman encuentran a partir de un análisis de gente muy feliz, lo que los unía era lazos fuertes a los amigos cercanos y la familia y el compromiso de pasar el tiempo verdadera cara con ellos.

Es una cuestión de prioridades

Ahora, no estoy sugiriendo medios de comunicación social es una mala cosa, ni te estoy animando a dejar de ser popular. Es sólo que tenemos que ser claros en lo más importante. Definitivamente, hay alegría que pueden obtenerse de lanzar una gran fiesta con un montón de gente y siguiendo las vidas de nuestros amigos de lo contrario perdido hace mucho tiempo. Es que, desde una perspectiva de bienestar, estos deben ser considerados como lo que los psicólogos sociales Wendi Gardner y Cindy Pickett llaman aperitivos sociales, no alimentación adecuada. Más que eso, en la batalla de las prioridades en nuestra vida más agobiados, tenemos que tener cuidado de que la gestión de más "amigos", no viene a expensas de nuestras pocas relaciones reales. Es crucial que asegurarse de que las transacciones de goma de mascar con los muchos, y el ego-mejora de crecer una red cada vez más grande, no nos tiente lejos de las cosas realmente importantes; el crecimiento de la profundidad de nuestras relaciones más cercanas. Hay que evitar la distracción lista de los cientos, robar nuestra atención de los momentos privados con los que comparten nuestro viaje.
Si descuidamos nuestra pocos, a favor de los muchos, vamos a dejar de crecer.

Entonces, ¿quiénes son sus 15?