sábado, 8 de agosto de 2015

Aprendiendo ARS con el caso Enron

El uso de medidas de análisis de redes sociales
Para diseccionar el corpus Enron

KeyLines

Trabajar como pasante para Cambridge Intelligence durante el verano, no podía esperar para entrar en KeyLines y ver lo que podía hacer. Decidí que me gustaría escribir un blog para compartir una de mis experiencias con el uso de algunas de las funciones más avanzadas en KeyLines.

Presentación del Corpus de Correo de Enron 

En 2003, la Comisión de Regulación de Energía Federal publicó 1,6 millones de correos electrónicos enviados y recibidos por la dirección de Enron entre científicos de Investigación 2000 y 2002. en el MIT y luego compró el conjunto de datos y se dedicó a poner en orden, reformatear y de-duplicación para uso público.

Tomamos estos datos y cargamos en KeyLines. Hoy voy a utilizar la demo Enron para tratar de ingeniería inversa algunos de la investigación y de comprender la estructura de gestión de la organización usando análisis de redes sociales.

Póngase en contacto con nosotros para obtener acceso a nuestro SDK para tratar de usted mismo.

Visualización de la topología de red

Al abrir la demo, puedo ver que los nodos representan las personas dentro del corpus de Enron y los vínculos entre ellos son los correos electrónicos entrantes y salientes.



Puedo ver la estructura superpuesta de comunicación de la organización y que hay un grupo muy unido enredado en la parte superior izquierda. Vamos a cambiar "el volumen de correo electrónico" en:



Mostrando volúmenes de correo electrónico realmente destaca el área fuertemente conectada a la izquierda de la red. Pero también parece que hay algunas comunidades más pequeñas en los bordes del mapa de la red. Por ejemplo, Bill Williams en el extremo derecho:



Podemos asumir que Bill es una especie de jefe de equipo. Pero parece extraño que sólo tiene un único flujo de la comunicación procedente de la red más grande y sólo se comunica con nodos que están aislados de la red principal. Esto parece un buen lugar para empezar.

Encontrar un punto de partida

Una rápida búsqueda en Google revela que Bill estaba directamente involucrado con la manipulación de la producción de energía para beneficiar de manera fraudulenta los ejecutivos de Enron. Él fue escuchado en la corte a través de una grabación de instruir a un miembro de alto nivel del personal de una central eléctrica de retener deliberadamente poder y inventar una excusa para hacerlo, causando apagones para miles de hogares a través de California.

El uso de enlaces de red para rastrear conexiones

Puedo explotar ese conocimiento en un esfuerzo por encontrar más a través de las relaciones de Bill. Si hago clic en el nodo, puedo destacar sus conexiones inmediatas desde el resto de la red.



Esto demuestra que Bill está conectado a la red más amplia a través de una sola persona; Timothy Belden. Los informes nos dicen que Bill era un operador senior - en el supuesto de que no estaba actuando solo, su conexión a Timothy Belden parece bastante sospechoso y los correos electrónicos entre ellos ha sido de importancia para la investigación, ya que pueden ofrecer una ventaja a los asociados potenciales de Bill.

La importancia de las conexiones

Parece KeyLines ya ha puesto de manifiesto la supuesta "cerebro" detrás de escándalo californiana de Enron. La conexión entre Bill y Timoteo se convierte ahora de aún más importancia -, mientras que Red Visualización sí sola no puede probar o refutar la culpa, guarda lo que podría haber llevado semanas tamizado a través de mensajes de correo electrónico para identificar que estaba hablando con quién, y permite a los investigadores detectar estructuras ocultas de la comunicación dentro de la red.

Ahora vamos a probar algo un poco más avanzado ...

Utilizando ARS para identificar diferentes posiciones en una jerarquía

Voy a ver si puedo utilizar KeyLines para localizar personas importantes en la empresa (o por lo menos a la persona en la parte superior de la jerarquía dentro de la red).

Centralidad de Grado

La centralidad de grado es puramente una medida de la cantidad de conexiones directas a una persona / nodo tiene. En esta demo, mayor centralidad de grado se asocia con mayor tamaño de los ganglios y el color más oscuro. Alguien en la parte superior de la cadena de mando es probablemente propensos a tener una feria pocas conexiones, pero no la mayoría. Sólo deben estar hablando directamente con los 'jefes de departamento "o equivalente.

Vamos a echar un vistazo a la red con centralidad grado encendido:



A primera vista, Mark Taylor y Tana Jones parecen a gente importante, pero el volumen de conexiones que tienen sugieren que en realidad ocupan roles de distribuir la información, tales como las comunicaciones internas. Creo que nuestros principales sospechosos para la alta dirección son ahora Michael Grigsby, John Lavorato, Louise Kitcher y Elizabeth Sager. Los otros del mismo tamaño parecen demasiado estrechamente relacionados con el grupo a la derecha del mapa.



Centralidad de cercanía 

La centralidad de cercanía es una medida de cuán cerca un nodo es a cualquier otro nodo en la red. El uso de esta característica en la demo KeyLines, un nodo es de tamaño y de color basado en la cantidad acumulada de grados que está lejos de todos los demás nodos. Echemos un vistazo a nuestra red ahora:



Ok, eso es un poco abrumador. Nos atenemos a los nombres que desenterraron de la filtración centralidad de grado y ver cómo se ven aquí.



He destacado los nombres que he seleccionado previamente. Todos ellos muestran un alto nivel de proximidad central - algo que podríamos esperar para ver de un director, que, en teoría, sus conexiones deben fluir de manera eficiente en la jerarquía. Hay, sin embargo, un factor de diferenciación entre los cuatro - la cercanía de las personas en sus redes inmediatas.



Como se puede ver arriba, la gente en la red inmediata de John Lavorato tienen una proximidad central más alta que cualquiera de los otros directores potenciales. Tiene sentido que los jefes y gerentes de departamento conectados bien igualmente rodearían el director.

Vamos a ver si podemos hacer una conjetura sobre el nombre de la Directora sobre la base de la tercera medida centralidad ofrecido en KeyLines ...

Centralidad de intermediación

Intermediación mide lo bien que un nodo conecta comunidades separadas dentro de la red. Yo esperaría a ver un mayor nivel de centralidad de intermediación en un director, como en teoría deberían tener los gerentes de las diferentes áreas de la empresa informaron a ellos y, por tanto, debe formar un enlace entre los diferentes departamentos. Vamos a ver si alguno de nuestros directores potenciales coincide este perfil:





De nuestros cuatro original, John Lavorato parece tener el mayor centralidad de intermediación y por lo tanto mejor nuestro perfil partidos para el director, sobre todo dada la mayor proximidad central de su red inmediata. Vamos a ver cómo lo hice ...

¡Éxito! El uso de medidas de ARS para detectar estructuras dentro de las redes

Los informes confirman que Lavorato era de hecho el presidente ejecutivo de Enron Américas. Hay maneras sin duda más eficientes de identificar el CEO de una empresa, pero este ejercicio muestra como social, análisis de red y visualización de datos se puede utilizar para llevar a cabo las estructuras ocultas en los datos conectados complejos, en los que la jerarquía no es tan evidente - por ejemplo, cuando la disección de una red de fraude o de la localización de donde el liderazgo pone en una célula terrorista.

Puramente mediante el uso de medidas KeyLines SNA, tuve la oportunidad de seleccionar los dos de los jugadores clave en el escándalo de Enron y aislar la parte superior de la jerarquía. Si este ejercicio demuestra algo, es el poder de investigación de la visualización y análisis de redes.

No hay comentarios:

Publicar un comentario en la entrada