domingo, 25 de marzo de 2018

Redes de actores en la base de datos IMDB


Dataset de IMDB: Análisis de red de actores


Katie Truong

Después de explorar y limpiar los datos aquí, podemos recopilar un conjunto de datos que consta de 640 colaboraciones en películas altamente calificadas, y 653 colaboraciones en películas de baja calificación.

Ahora lo que tenemos que hacer es importar los archivos csv a Gephi. Hay algunas otras herramientas para mapeo de red, como igraph en R o networkx en Python. Sin embargo, en este proyecto, elijo usar Gephi debido a su usabilidad y diseño diversos.

Red de actores en películas altamente calificadas:

La red de actores en películas altamente calificadas tiene forma de celda, con colaboraciones de actores no tan famosos en los bordes, y una red de colaboraciones entre los nombres familiares de Hollywood en el centro.



Hay 178 clases de modularidad (subcomunidades) en el conjunto de datos. La mayoría de las subcomunidades tienen menos de 5 nodos, sin embargo, podemos ver un puñado de subcomunidades con más de 15 nodos, que giran en torno a grandes nombres de la casa como Tom Hanks, Leonardo DiCaprio, Robert De Niro, etc. o tipos de películas (superhéroes, Western, etc.).



Red de las principales estrellas de Hollywood. ¿Puedes nombrar las películas que colaboran entre sí?



La red de superhéroes Batman, Black Widow y Wolverine probablemente estén vinculados por The Prestige, una película sobre magos. Tiene sentido, porque no son superhéroes mágicos?

Los tamaños de los nodos representan sus influencias en la red (centralidad eigenvector). El líder es Tom Hanks (EC = 1), seguido de cerca por Leonardo DiCaprio y Robert De Niro en el rango de 0.9. Brad Pitt, Johnny Depp, Christian Bale y Morgan Freeman también se encuentran entre los nodos más grandes de la red.

Sin embargo, eso lleva a la pregunta: ¿Dónde están las mujeres?

La actriz que tiene la mayor influencia en la red es Kate Winslet con un EC de 0.45079, que es menos de la mitad de Tom Hanks. Meryl Streep, la actriz favorita de los Oscar, es segunda con un EC de 0.376124. Jennifer Lawrence, a pesar de su impresionante trayectoria ganadora de premios a temprana edad, tiene un mero EC de 0.291412.

Aquí hay una foto del nodo de Kate junto a otras actrices (¡y actores!) Igualmente influyentes:



Y aquí está el nodo de Kate en comparación con los nodos más grandes de actores (masculinos).



¿El CE bajo general de las actrices solo existe en las películas altamente calificadas? ¿Qué hay de los humildes? ¡Nos encontraremos pronto!

Red de actores en películas de baja calificación:

Al igual que en la red de las películas mejor calificadas, la red de películas de baja calificación también tiene forma de celda.



Aquí hay una vista general de la red.



Muy disperso, lo sé. Aquí hay una mirada más cercana para capturar los nodos más grandes:



Podemos notar algunos puntos interesantes.

En primer lugar, algunos actores que aparecen en las listas de películas altamente calificadas también aparecen aquí. Tenemos a Johnny Depp, Matthew McConaughey, Brad Pitt, Morgan Freeman, Anthony Hopkins y, por supuesto, a Robert De Niro, por nombrar algunos. Robert De Niro con un CE de 1 también es el actor con mayor influencia en la lista de películas de baja calificación.

En segundo lugar, la aparición de las actrices con grandes nodos en la lista.



Angelina Jolie Pitt tiene un EC de 0.59355, lo que hace que su nodo sea el tercero más grande en la lista (después de Robert De Niro y Dwayne Johnson). Mila Jovovich sigue con un EC de 0.5738. Ambos son más altos en comparación con el EC de Kate Winslet en la lista de películas altamente calificadas.

Conclusión:


  • Podemos decir que Tom Hanks y Leo DiCaprio tienen muy buen gusto en las películas. Si bien son los nodos más grandes en la lista de películas altamente calificadas, no existen o tienen una influencia muy baja en la lista de bajas calificaciones.
  • Johnny Depp, Matthew McConaughey, Brad Pitt, Morgan Freeman, Anthony Hopkins, etc. tienen un buen gusto al elegir películas. Algunas de sus elecciones son realmente buenas; algunos son muy malos También podrían estar en esas malas películas por el bien de ganar dinero, quién sabe.
  • Robert De Niro tiene un gusto extremo al elegir películas. Sin embargo, todavía me gusta él.
  • Las actrices tienden a tener menos influencia en películas altamente calificadas, y más influencia en las de baja calificación. ¿Por qué? Todavía no me he enterado.
  • Solo cuando comencé a escribir la conclusión me di cuenta de que no pesaba en la posición de las películas en las listas ni en las puntuaciones reales de IMDB de las películas mientras mapeaba la red. Una mejora de este análisis debe pesar esas características en el algoritmo.
  • Los Premios de la Academia 2017 se anunciarán mañana (26/02/2017). ¿Están el ganador del Oscar y el puntaje de IMDB correlacionado? Tal vez tal vez no.

¡Gracias por leer hasta el final!

No hay comentarios:

Publicar un comentario