Mostrando entradas con la etiqueta Gephi. Mostrar todas las entradas

miércoles, 22 de febrero de 2023

Infografía: Twitter Streaming Importer v2

domingo, 27 de marzo de 2022

Redes etimológicas medievales

¿Qué tan innovadores son los primeros manuscritos medievales de las Etymologiae?

Cuando comencé mi proyecto de Conocimiento Innovador hace más de cuatro años, una de mis intenciones era mapear cómo los manuscritos de las Etymologiae atraían interpolaciones y otras 'ediciones' a principios de la Edad Media. Siendo las Etimologías una enciclopedia, y además una que su autor nunca completó, no sorprende que actuara como un andamiaje para la acumulación de nueva información 'útil'. Al principio del proyecto, por lo tanto, me decidí por un sistema de registro de lo que denominé características innovadoras (o innovaciones para abreviar) que luego me permitirían proyectarlas como una red. Para el propósito de mi proyecto, definí una característica innovadora como:

una interpolación textual (por ejemplo de otros textos como el propio De natura rerum de Isidoro );
interpolación gráfica (por ejemplo, adición de diagramas y mapas);
un elemento estructural (como la división de las Etymologiae en 17 en lugar de 20 libros);
un cambio sustancial en el diseño (por ejemplo, presentación de información incluida originalmente por Isidore como un texto continuo en forma de tabla o lista);
transmisión del material de las Etymologiae como una entidad novedosa (por ejemplo, los primeros manuscritos medievales conservan varias colecciones catequísticas producidas por parches a partir de extractos de las Etymologiae ); o
la presencia de versiones peculiares del texto o la omisión de pasajes particulares de las Etymologiae .

En esta red, los manuscritos que transmiten las Etymologiaerepresentan nodos y las innovaciones que contienen representan bordes que conectan manuscritos que comparten una característica particular. Al trazar la red, esperaba no solo ver qué características innovadoras estaban extendidas (y cuáles no) y qué manuscritos combinaban muchas características diferentes, sino también si los patrones de compartir pueden brindarnos una imagen significativa sobre la difusión de ciertas innovaciones. Desde temprano me quedó claro que mientras algunos de los rasgos que me interesaban se difundían genealógicamente, es decir copiando de un ejemplar como los textos, otros, quizás la mayoría, circulaban por otros procesos. Como resultado, razoné, es poco probable que la presencia o ausencia de ciertas características innovadoras pueda usarse para reconstruir un stemma de la tradición textual temprana de las Etymologiae.(pero algunos surgirían como altamente significativos y confiables en este sentido). Por lo tanto, una red podría construirse como una alternativa más ligera a un stemma y podría servir como el primer paso para discernir aquellas características innovadoras que son indicativas de una relación genealógica de aquellas que no lo son.

A medida que avanzaba el proyecto y se completaba mi hoja de datos, me quedó claro que mi idea inicial de una red de innovaciones era algo ingenua y que mis datos presentan problemas típicos que hacen que el trazado de una red sea problemático y sesgado. En particular, tenía miedo de terminar con el grafo de bola de pelo habitual que tiene un valor agregado limitado. También entendí que probablemente me estoy perdiendo muchas innovaciones y muchos testigos de innovaciones identificadas. Sin embargo, pensé que aunque no podía usar la visualización de la red que imaginé como había previsto originalmente, al menos podría intentar construir la red que tenía en mente como una especie de experimento exploratorio.

El siguiente grafo de red se trazó en Gephi utilizando el algoritmo de Fruchterman-Reingold. Realicé algunos ajustes manuales adicionales para minimizar la superposición de grupos no relacionados y darle una apariencia más limpia.

Fig. 1: Una red no dirigida de manuscritos que transmiten las Etymologiae (nodos) que contienen características innovadoras compartidas con al menos otro manuscrito (bordes). La coloración de los grupos corresponde a innovaciones específicas.

El grafo de red que ve aquí incluye 279 manuscritos (nodos) que transmiten las Etymologiae que comparten una innovación con al menos otro manuscrito conocido. Este no es un número pequeño dado que he podido identificar 485 manuscritos medievales tempranos que transmiten las Etymologiae . Aunque los manuscritos mostrados en la red anterior también incluyen 81 manuscritos posteriores al 1000 incluidos debido a su relevancia para la imagen, esto aún significa que 198 manuscritos que son parte de mi corpus medieval temprano, o más del 40% de los manuscritos anteriores al 1000 identificados los códices que transmiten las Etymologiae incluyen al menos una característica innovadora que también aparece en otro manuscrito conocido. ¡Esa es una proporción útil para empezar! Es importante destacar que estos no son todos (o todos los primeros medievales) manuscritos de las Etymologiae que presentan innovaciones, ya que este recuento no incluye manuscritos que transmiten innovaciones confinadas a un solo códice, o que hasta ahora se han identificado en un solo manuscrito, aunque función en más. Por lo tanto, deberíamos suponer razonablemente que la mayoría de las primeras copias medievales de las Etymologiae , parciales y completas, contienen algunas innovaciones.

El grafo de red anterior muestra un total de 1042 innovaciones compartidas (bordes). Como se puede deducir del grafo, está constituido por muchos componentes aislados que no están conectados con otras partes del grafo. Estos son ejemplos de una característica innovadora particular que aparece en varios manuscritos, mientras que estos manuscritos no contienen otras características innovadoras identificadas durante mi proyecto. En total, el grafo que tracé usando mis datos imperfectos consta de 40 de esos componentes. De estos, 19 componentes, o casi la mitad de todos los componentes en el grafo, consisten en solo dos manuscritos, es decir, pude identificar solo dos manuscritos que tienen una característica innovadora notable específica. Siete componentes más consisten en tres o cuatro manuscritos. Estos componentes se dejan sin colorear en el grafo.

Más del 40% de los códices anteriores al año 1000 identificados que transmiten las Etymologiae incluyen al menos una característica innovadora que también aparece en otro manuscrito conocido.

Muchos de los 14 componentes más grandes también están aislados. Por lo tanto, podemos decir que los datos recopilados sugieren que los primeros manuscritos medievales que transmiten las Etymologiae tienden a contener una sola innovación (en lugar de, digamos, dos, cuatro o seis). Hay una buena explicación para este patrón. Después de todo, la mayoría de los manuscritos del grafo anterior no transmiten la enciclopedia completa en 20 libros, sino que son testigos parciales en forma de manuales, misceláneas y colecciones que transmiten una selección específica de las Etymologiae en una configuración no enciclopédica. Por ejemplo, el componente azul relativamente grande en la parte inferior izquierda del grafo corresponde a los 15 manuscritos conocidos que transmiten por separado partes del tercer libro de Etymologiae .que trata de la música ( Etym . III 15-23), conocido también como el Ars musica Isidori . El componente naranja en la parte inferior derecha del grafo incluye los nueve testigos identificados de la versión más corta de la llamada Collectio Unde , una colección de fragmentos de los libros VI, VII, VIII y IX.

Fig. 2: El mismo graf de red con dos componentes aislados correspondientes a grupos (15 manuscritos que contienen el Ars musica Isidori y 9 manuscritos que contienen la versión corta de la Collectio Unde ).

Dado que las dos entidades textuales no se superponen en absoluto en su selección de Etymologiae , se puede esperar que aparezcan aisladas entre sí en el grafo. En teoría, si un solo manuscrito transmitiera tanto el Ars musica Isidori como la Collectio Unde , formaría un puente entre los dos grupos. De hecho, este es el caso de dos manuscritos que conectan tres grupos en el segundo componente más grande del grafo que consta de 27 manuscritos.

Fig. 3: El segundo componente más grande de la red (27 manuscritos) que consta de tres grupos (8, 8 y 13 manuscritos respectivamente).

Los tres grupos en cuestión corresponden a manuscritos que transmiten un mosaico de extractos de las Etymologiae que tratan de la Iglesia, sus oficios y el bautismo conocido como De catholica ecclesia et eius ministris et de bautatis officio (marrón), los que transmiten otra colección similar conocida como el Collectio Sangermanensis (rosa), y los que transmiten una colección de extractos sobre el parentesco llamado en algunos manuscritos Dicta Isidori (verde). Estos también son ejemplos de manuscritos en los que solo circuló una selección de todas las Etymologiae .

Con mucho, el componente más intrigante de la red es el gran componente de las partes central y superior del grafo, que suma 102 manuscritos (es decir, alrededor del 36,5 % de todos los manuscritos incluidos en el grafo). Este componente no destaca solo por su gran tamaño, sino también porque es el único componente en el que se puede observar una superposición significativa de conglomerados. De hecho, este componente se ensambla a partir de 14 grupos de diferentes colores (es decir, grupos que consisten en al menos 5 manuscritos). El manuscrito más conectado que pertenece a este gran componente es miembro de cuatro grupos, es decir, contiene cuatro innovaciones ampliamente compartidas. El componente más grande también incorpora el grupo más grande del grafo (púrpura) que consta de treinta manuscritos en los que dos segmentos de De natura rerumse interpolan en las secciones astronómicas de las Etymologiae ( Etym . III 51 y 53).

Fig. 4: El componente más grande de la red que consta de 102 manuscritos y 14 grupos principales.

Lo especial de este componente, aparte de su tamaño, es que, a diferencia de muchos de los componentes más pequeños, no consta de testigos parciales de las Etymologiae , sino de copias enciclopédicas que presentan los veinte libros de la obra (o originalmente diseñadas para incluir todos los libros). ). La importante fusión y desenfoque de grupos es una señal de que estos códices tendieron a adquirir múltiples innovaciones. Por ejemplo, tres de los ocho manuscritos, en cuyo libro I faltan los capítulos 30-31 (azul en el centro del grafo), también dividen las Etymologiae en 17 en lugar de 20 libros (púrpura oscuro en el centro del grafo). Todos menos dos manuscritos que dividieron originalmente la primera mitad de las Etymologiaeen tres libros (rojo en el centro del componente) tienen al menos otra innovación importante. Cinco de los ocho manuscritos, en los que el tratado heresiológico anónimo Indiculus de haeresibus fue interpolado en el libro VIII de las Etymologiae (verde más brillante en la parte inferior izquierda del componente más grande) también tienen los dos segmentos de De natura rerum interpolados en el libro III (púrpura ). Los manuscritos que contienen una serie de epigramas conocidos como Anthologia Isidoriana (verde brillante en la parte inferior derecha del componente más grande) también tienden a transmitir un tratado informático anónimo sobre el cálculo de la Pascua (amarillo más oscuro en la parte inferior derecha del componente más grande).

Todas estas superposiciones plantean preguntas. Por ejemplo, podemos preguntarnos cómo se proyectaría una relación en gran medida o puramente genealógica en un grafo de red como este y si vemos tal proyección. Podemos comenzar imaginando un stemma hipotético en el que una rama particular de testigos caracterizada por una innovación específica (p. ej., una interpolación textual) engendra otra rama, que se caracteriza por otra innovación (p. ej., una omisión específica). En este escenario, todos los manuscritos que tuvieran la última innovación también tendrían la primera. En una proyección de red siguiendo las reglas descritas anteriormente, este escenario hipotético se manifestaría como dos grupos. Todos los manuscritos que son miembros de un grupo más pequeño (omisión específica) también deben ser miembros de un grupo más grande (interpolación textual).

De hecho, podemos notar un grupo en el grafo de red construido a partir de mis datos sobre las Etymologiae que muestra un alto grado de superposición que sugiere una relación genealógica entre dos innovaciones. Este es el grupo de color amarillo pálido en el lado superior izquierdo del componente más grande que está fusionado casi por completo con el gran grupo de color púrpura correspondiente a los manuscritos con pasajes interpolados del De natura rerum en el libro III. Algunos, pero no la mayoría, de estos manuscritos también recibieron un conjunto de diagramas astronómicos con paralelos en el De natura rerum . Los números impares pueden sugerir que los diagramas representan una expansión de la versión interpolada más antigua que no presenta diagramas.

Fig. 5: Una superposición significativa entre el grupo de manuscritos que contienen diagramas de los capítulos astronómicos del libro III (amarillo) y aquellos que contienen interpolaciones de De natura rerum en el mismo libro (púrpura).

Planeo expandir el grafo de red esbozado anteriormente en el futuro a medida que se examinen más manuscritos en detalle y se describan y tomen en cuenta las innovaciones que contienen. Dos de las novedades más difundidas, las interpolaciones del tratado anónimo sobre figuras retóricas De virtutibus et vitiis del libro I y la inclusión de un diagrama TO en el libro XIV , además, no se incluyen actualmente. Una vez que el diagrama se vuelve más completo, el siguiente paso lógico es investigar sus propiedades de red, por ejemplo, la propensión a las innovaciones entre las copias enciclopédicas de las Etymologiae .(a diferencia de los testigos no enciclopédicos) o el grado de superposición entre ciertos grupos (es decir, el grado de co-ocurrencia de ciertas características innovadoras). Estos podrían proporcionar pistas adicionales sobre una de las cuestiones más intrigantes de la difusión de innovaciones en las copias de las Etymologiae : ¿era probable que se transmitieran verticalmente (copiando de un padre a su descendencia), o era más común que viajado horizontalmente (por ejemplo, como resultado de contactos entre centros intelectuales vecinos y movimiento de personas)?

Me detengo aquí por ahora, pero prometo que habrá más sobre la difusión de innovaciones y el uso de visualizaciones y análisis de redes en el futuro.

PD: Es posible que haya notado que los enlaces de esta publicación de blog conducen a EtymoWiki en el sitio web Innovating Knowledge , que aún está vacío. Espero comenzar pronto a agregar entradas que describan algunas de las notables características innovadoras de principios de la Edad Media en los manuscritos de las Etymologiae .

jueves, 31 de diciembre de 2020

Visualización de interacciones en blogs científicos

¡Feliz Navidad! Con datos - Blog de ciencia Red social

¡Feliz Navidad!

¿Qué mejor regalo de Navidad que datos frescos? (dice el nerd de doctorado en ciencia y comunicación).

En las últimas semanas, he estado recopilando respuestas a encuestas de blogueros científicos sobre sus decisiones de contenido y otras prácticas de blogs. Cerré la encuesta #MySciBlog la semana pasada, después de recopilar más de 600 respuestas válidas a encuestas de blogueros científicos. ¡Ahora comienza el análisis de datos!

En una sección particularmente exploratoria de mi encuesta, se pidió a los participantes que enumeraran hasta los tres blogs de ciencia principales, además del suyo, que leían con regularidad. Con estos datos, estoy buscando explorar posibles comunidades de práctica y relaciones entre blogueros científicos que puedan llevar a reglas de decisión de contenido compartido o enfoques de blogs.

Después de extraer los datos en Excel y limpiarlos bastante tediosamente (buscando blogs enumerados en nombres alternativos o incorrectos, etc.), mapeé el conjunto de datos resultante en Gephi, un software de mapeo de redes sociales abierto y gratuito. Luego diseñé la red (que consta de nodos de blogs de participantes de la encuesta conectados a través de hasta tres bordes para apuntar a blogs de ciencia 'leídos regularmente') según un algoritmo ForceAtlas 2.

"ForceAtlas2 es un diseño dirigido por fuerzas: simula un sistema físico para espacializar una red. Los nodos se repelen entre sí como partículas cargadas, mientras que los bordes atraen sus nodos, como resortes. Estas fuerzas crean un movimiento que converge a un estado equilibrado. Esto Se espera que la configuración final ayude a la interpretación de los datos ". - Plos One

Cada nodo de la red representa un blog de ciencia, ya sea el blog de un participante de la encuesta o un blog enumerado por un participante. Las comunidades (representadas por nodos codificados por colores) se detectaron automáticamente en Gephi (función de clase de modularidad) con una resolución de 3.0. Los nodos y las etiquetas de los nodos tienen un tamaño de acuerdo con el grado, o cuántas veces el blog (nodo) fue incluido por otros blogueros como leído regularmente.

Full resolution figure (PDF) available at Figshare.com. Cite as Brown, Paige (2014): MySciBlog Survey - Top Read SciBlogs by SciBloggers. figshare. http://dx.doi.org/10.6084/m9.figshare.1278974

Puede consultar un PDF de resolución completa de estos datos aquí. Mientras lo hace, avíseme si ve algún blog representado como más de un nodo, por ejemplo, con nombres mal escritos. Sus comentarios pueden ayudarme a consolidar los datos redundantes. Además, me encantaría conocer su opinión sobre cualquier tendencia o relación que pueda ver surgir de estos datos. Será muy interesante si los resultados de mi encuesta revelan prácticas de blogs comunes entre blogueros que comparten vecinos en esta red. Mis entrevistas en profundidad con blogueros de ciencia revelan que los blogueros a menudo obtienen lecciones sobre enfoques, estilos, "hacer" y "no hacer" de blogs de otros blogs de ciencia que suelen leer.

¡Feliz exploración de datos!

jueves, 24 de diciembre de 2020

Navidad: Las redes de los evangelios

Visualización de datos: mapeo de la red de caracteres de los cuatro evangelios

¿Cómo están estructurados los textos bíblicos? Más allá de la obvia centralidad de Cristo en los Evangelios, ¿encontramos siempre los mismos grupos de personajes, organizados de la misma manera? Este breve estudio plantea la cuestión de la contribución potencial del análisis de redes a los estudios literarios y, en particular aquí, a las ciencias bíblicas.

Martin Grandjean

Los cuatro evangelios cuentan una historia muy similar, pero tienen estructuras ligeramente diferentes: su constitución ha sido uno de los temas más estudiados durante siglos. Sin revolucionar un campo de investigación que consiste en el estudio cuidadoso de estos textos, el análisis de redes permite una visualización relativamente simple de las principales características estructurales de las redes de caracteres de los Evangelios.

En 2013, un colega teólogo sugirió que usara las herramientas del análisis de redes para visualizar estos textos. Después de haberlos comunicado, no había pensado en publicar estos resultados en línea, debido a su naturaleza poco convencional para este campo de estudio bastante tradicional. Pero desde entonces, el análisis de redes de personajes se ha desarrollado (Rochat trabaja en Rousseau en 2014, mis redes de las tragedias de Shakespeare en 2015, o esta interfaz para visualizar obras de teatro como redes interactivas con colegas de UNIL en 2016, y un número creciente de publicaciones en 2019. y 2020, consulte DraCor de Frank Fischer et al., o esta encuesta de Labatut y Bost, por ejemplo), por lo que tiene más sentido desenterrar esas cosas viejas hoy.

Trabajo
GRANDJEAN Martin (2013). “Comparing the Relational Structure of the Gospels: Network Analysis as a Tool for Biblical Sciences“, Society of Biblical Literature (SBL), University of St. Andrews.

Lea el artículo completo (PDF)

Tenga en cuenta que este documento de la conferencia intenta un enfoque muy experimental, en particular dado el estado del campo del análisis de redes de personajes en 2013 y la rareza del uso de estos métodos en las ciencias bíblicas.

Cómo leer estos grafos

Dos personajes (círculos) tienen un enlace (línea) entre ellos si aparecen al mismo tiempo. Cuanto más a menudo aparezcan juntos, más denso formarán un grupo. Esto es lo que les sucede, por ejemplo, a los 12 discípulos que invariablemente forman un grupo muy denso a la derecha de estos cuatro gráficos. Sin embargo, esto no significa que los discípulos formen un grupo homogéneo (esto es particularmente visible en el Evangelio de Juan). Técnicamente hablando, se considera que dos personajes están conectados si aparecen en la misma escena o sección ("perícopas", para ser exactos en el lenguaje bíblico). Estas secciones son unidades temáticas, temporales y espaciales coherentes. Obtenga más información en el periódico.

LAS REDES DEL EVANGELIO

Evangelio según Marcos

Evangelio según Lucas

Evangelio según Juan

Evangelio según Mateo

jueves, 4 de junio de 2020

Cómo pasar de redes de un modo a dos modos en Gephi desde un archivo de Pajek

Conversión de redes de 2 modos a redes de 1 modo

Electric Archaeology

Ahora hay un complemento para Gephi que se convertirá de redes multimodales a redes de 1 modo: https://gephi.org/plugins/multimode-networks-transformations/

Supongamos que le interesan los patrones de comunicación entre individuos que son miembros de múltiples organizaciones (como, por ejemplo, sociedades históricas) o tipos de artefactos en múltiples sitios. Es posible que desee mapear la red entre estos individuos y esas organizaciones para comprender cómo fluye la información en ese mundo, cómo penetran las normas sociales, o las ideologías de consumo o el mapa de visualización en el espacio (como lo hace Tom Brughmans aquí y lo he hecho en otros lugares).

Necesitarás Gephi y Sci2. Descargue e instale estos. Se requiere registro para Sci2. Cualquier trabajo que haga con estas herramientas, si se publica, requiere la cita de la herramienta. No lo olvides!

1. Haz una lista. Cada vez que te encuentres con un individuo mencionado como miembro de un grupo, escríbelo. Dos columnas: fuente, objetivo. Shawn Graham, Universidad de Carleton. Puede incluir una tercera columna llamada 'peso' que da alguna medida de la importancia de esa conexión. ¿Por qué 'fuente', por qué 'objetivo'? Porque vamos a importar esa lista a Gephi, y así es como Gephi requiere la información. Sin embargo, cuando hacemos cualquier tipo de métrica, siempre trataremos esta red como no dirigida; es decir, no pretendemos saber nada sobre la dirección de la relación (en una red dirigida, la conexión de Alicia con Bob es diferente de la conexión de Bob con Alicia). Guarde esa lista como un archivo .csv. Si graficaste esto ahora, tendrías una red donde hay dos tipos de nodos; de ahí una red de dos modos. Las estadísticas de red visualizan una red donde los modos son todos del mismo tipo, por lo que estamos haciendo este tutorial.

2. Importa la lista a Gephi. Abre Gephi, comienza un nuevo proyecto. Haga clic en el laboratorio 'laboratorio de datos'. Debajo de 'tabla de datos', haga clic en 'bordes' (esto es importante, si hace clic en 'nodos', esto no funciona correctamente). Haga clic en 'importar hoja de cálculo'. Seleccione su archivo csv y asegúrese de que 'como tabla' esté configurado en 'tabla de bordes'. Haga clic en Siguiente. Haga clic en Finalizar.

3. Vaya a Archivo - >> exportar - >> archivo de gráficos. Guardar como tipo de archivo .net (Pajek).

4. Abre Sci2; haga clic en Archivo >> Cargar y seleccione su archivo .net.

5. Haga clic en 'preparación de datos' >> extracción de la red de co-ocurrencia de referencia (acoplamiento bibliográfico). (ver también 5.b, abajo bajo 'variaciones')

6. Haga clic en 'preprocesamiento' >> redes >> eliminar aislamientos. Ahora ha colapsado su red de dos modos en una red de modo único donde sus nodos bajo 'objetivo' ahora están conectados entre sí. Si su fuente, el objetivo era 'sitio', 'ware', tiene una red de un modo donde las mercancías están conectadas entre sí en virtud de estar enumeradas en el mismo sitio, es decir, el enlace implica el sitio. (Si ha realizado el paso 5.b, su única red de modo sería sitios conectados entre sí en virtud de compartir los mismos productos, el enlace implica la mercancía).

7. En este punto, vaya a archivo >> vista y su aplicación de bloc de notas se abrirá, mostrando una tabla donde cada nodo en su red tiene su propia identificación única, y 'etiqueta * cadena', que es su etiqueta original. Guardará esto del bloc de notas como un archivo txt. Puede llamarlo 'ware to ware index' (siguiendo nuestro ejemplo en 6).

8. Aquí es donde las cosas se ponen un poco complicadas. Haga clic en 'Archivo' >> 'guardar'. Seleccione 'pajek .net' como su tipo de archivo. (Consulte también 8.b a continuación, en 'variaciones')

9. Luego puede volver a Gephi, iniciar un nuevo proyecto, hacer clic en 'abrir' y seleccionar el archivo .net que acaba de crear. Su red de modo único se cargará. SIN EMBARGO, Gephi ya no reconocerá las etiquetas del nodo original. Es por esto que necesita el índice que guardó en el paso 7, de modo que cuando ejecute las métricas en esta red de un modo, sabrá que 'el nodo 342 en realidad está sellado en Brick CIL XV.1 841.d (por ejemplo). (ver también 9.b a continuación, en 'variaciones')

Variaciones

5.b En el paso 5, creó una red de modo único basada en su columna 'objetivo'. Para crear una red de modo único basada en su columna 'fuente', haga clic en 'preparación de datos' >> extraiga la red de co-citas de documentos. Reanudar en el paso 6.

8.b Si desea conservar las etiquetas de nodo en Gephi, en lugar del paso 8.a, haga clic en Visualization >> Networks >> GUESS. Esta es una pequeña herramienta de visualización (que le permite hacer algunas métricas de red, pero si su red es v. Grande,> 1000 nodos, esta podría no ser una buena idea). En GUESS, haga clic en Archivo >> exportar gráfico. Dale un nombre de archivo que tenga sentido, y no te olvides de escribir la extensión .gdf; de lo contrario, no se exportará. Vaya al paso 9b.

9.b Vaya a Gephi, comience un nuevo proyecto, haga clic en 'abrir' y seleccione el archivo .gdf que acaba de crear. Las etiquetas de su nodo ahora estarán presentes en el gráfico, por lo que no necesita ese archivo de índice que ha creado. Tal vez un error: en mis experimentos, las etiquetas de nodo no parecen aparecer en el panel 'Descripción general del gráfico' cuando se trabaja con el archivo gdf. Tu experiencia puede ser diferente. Sin embargo, aparecen cuando exporto una imagen de la n

jueves, 14 de mayo de 2020

22 paquetes de software gratuitos para ARS

22 herramientas gratuitas de análisis de redes sociales

Por Varun Kumar || RankRed

Las herramientas de análisis de redes sociales facilitan el análisis cualitativo o cuantitativo de las redes sociales al describir las características de la red mediante representación visual o numérica. Generalmente usa la teoría de redes o gráficas para examinar las estructuras sociales. Los componentes principales son los nodos (personas) y los bordes que los conectan. Algunos de ellos también realizan análisis predictivos. A continuación, hemos enumerado algunos de los software de análisis de redes sociales más efectivos que están disponibles de forma gratuita.

22. AllegroGraph

AllegroGraph es una base de datos de gráficos desarrollada para almacenar triples RDF. Es una base de datos OLTP totalmente transaccional, que almacena datos estructurados en gráficos en lugar de en tablas. Incluye una biblioteca de análisis de redes sociales y un componente de almacenamiento para el proyecto TwitLogic que tiene como objetivo llevar la web semántica a los datos de Twitter.

21. Commetrix

Commetrix es un software dinámico de visualización y análisis de redes que proporciona un acceso exploratorio fácil y completo a los datos de la red. Crea un rico mapa de red experto, sistemas de recomendación a partir de registros de comunicación, y se enfoca en analizar patrones evolutivos de comunicación electrónica como correo electrónico, voz sobre IP y mensajería instantánea.

20. Socilab

Socilab es una herramienta en línea que le permite visualizar y analizar la red de LinkedIn utilizando métodos derivados de la investigación científico-social. Muestra una serie de medidas de red extraídas de la investigación sociológica en redes profesionales, y barras de percentiles que comparan sus medidas de red agregadas con usuarios anteriores. Además, hay una función de mensajería que le permite escribir y enviar un mensaje a los contactos seleccionados de LinkedIn.

19. Cuttlefish

Cuttlefish es una aplicación de banco de trabajo de red que permite la visualización de datos de red, edición de gráficos, manipulación interactiva del diseño y visualización de procesos.

Para representar los datos de la red, la herramienta utiliza el formato extendido Cuttlefish que define los datos de la red en términos de bordes, vértices, pesos e información visual como formas, colores y etiquetas. El otro formato de archivo es el formato Cuttlefish Evolution que define los cambios que ocurren en una red. También es compatible con formatos de archivo más antiguos, incluidos GraphML y Pajek.

18. Social Network Visualizer

Esta es una herramienta fácil de usar multiplataforma que le permite dibujar redes sociales con unos pocos clics en un lienzo virtual. Cargue datos de campo de un archivo (en formato compatible) o rastree Internet para crear una red social de páginas web conectadas.

Social Network Visualizer calcula grafos estándar y métricas de cohesión de la red (como densidad, excentricidad, coeficiente de agrupamiento, etc.), rutinas matriciales e índices de centralidad y prestigio. Además, admite algoritmos rápidos para la detección comunitaria, el análisis de equivalencia estructural, la carga y edición de redes multirrelacionales y la creación aleatoria de redes utilizando varios modelos de generación de redes aleatorias.

17. JUNG

JUNG significa Java Universal Network / Graph Framework. Esta aplicación Java proporciona un lenguaje extensible para el análisis, modelado y visualización de datos que podrían representarse como un gráfico o una red. JUNG admite numerosos tipos de gráficos (incluidas las hipergrafías) con cualquier propiedad.

Permite visualizaciones personalizables e incluye algoritmos de teoría de gráficos, análisis de redes sociales y minería de datos. Sin embargo, está limitado por la cantidad de memoria asignada a Java.

16. Tulip

Tulip se dedica al análisis y visualización de datos relacionales. Permite el desarrollo de algoritmos, técnicas de interacción, visualización específica de dominio, codificaciones visuales y modelos de datos. También permite la reutilización de componentes, lo que hace que el marco sea eficiente para la creación de prototipos de investigación y el desarrollo de aplicaciones para el usuario final.

15. Statnet

Statnet es un conjunto de paquetes R que realizan una amplia gama de tareas de gestión de datos, visualización y análisis estadístico de redes. Este marco analítico se basa en el modelo de gráfico aleatorio de familia exponencial y proporciona herramientas para la estimación, evaluación, simulación y visualización de redes del modelo.

Además, el modelado estadístico incluye modelos dinámicos y de sección transversal, espacio latente y modelos de clúster latente.

14. Netlytic

Netlytic es un analizador de texto basado en la nube y visualizador de redes sociales que puede resumir automáticamente grandes conjuntos de datos de texto y visualizar redes sociales a partir de conversaciones en sitios de redes sociales como Twitter, YouTube, foros en línea y comentarios de blogs. La herramienta está desarrollada principalmente para que los investigadores identifiquen componentes clave e influyentes y descubran cómo fluye la información en una red.

13. NetworkX

NetworkX es un paquete de Python para crear, manipular y estudiar la estructura de la dinámica y las funciones de redes complejas. Incluye muchos algoritmos, métricas y generadores de gráficos. La herramienta es capaz de construir gráficos aleatorios de forma incremental y es capaz de encontrar camarillas, subgráficos y núcleos k. Además, puede explorar adyacencia, grado, diámetro, centro, radio y dibujar redes en 3 dimensiones.

12. Cytoscape

Cytoscape se utiliza para visualizar redes complejas e integrarlas con cualquier tipo de datos de atributos. La herramienta es muy amplia en funciones: le permite personalizar la visualización de datos de la red, filtrar la red para seleccionar subconjuntos de nodos, buscar nodos y bordes de destino, y diseñar la red en dos dimensiones a partir de diferentes algoritmos de diseño de red que incluyen cíclico, árbol, borde- peso, fuerza dirigida y más.

11. Subdue

Subdue descubre patrones estructurales y relacionales en datos que representan entidades y relaciones. Utiliza la metodología de longitud de descripción mínima para identificar patrones que disminuyen el número de bits necesarios para describir el gráfico de entrada después de ser comprimido por el patrón.

Subdue también puede realizar numerosas tareas de aprendizaje, como aprendizaje supervisado y no supervisado, agrupamiento y aprendizaje de gramática gráfica. Además del análisis de redes sociales, se ha aplicado con éxito en Bioinformática, lucha contra el terrorismo, aviación y minería de estructuras web.

10. Graphviz

Este software de visualización de gráficos representa información estructural como un diagrama de gráficos abstractos y redes. Graphviz tiene muchos programas de diseño gráfico adecuados para la visualización de redes sociales. Toma la descripción de gráficos en un lenguaje de texto simple y crea diagramas en formatos útiles, como PDF para incluir en otros documentos, mostrar en un navegador de gráficos interactivo o SVG para páginas web.

Además, tiene diferentes características útiles para diagramas concretos, por ejemplo, opciones para fuentes, color, estilos de línea, diseño de nodo tabular, formas personalizadas e hipervínculos.

9. NetMiner

NetMiner viene con un período de prueba de 14 días. Se utiliza para el análisis y la visualización de vastos datos de red basados en el análisis de redes sociales. Las características como transformación de datos, visualización de datos de red, gráficos y lenguaje de script Python lo ayudan a detectar patrones y estructuras subyacentes de la red.

8. SocioViz

SocioViz es una plataforma de análisis de redes sociales para periodistas digitales, investigadores sociales y especialistas en marketing de medios. Le permite analizar cualquier tema, término o hashtag, identificar personas influyentes clave, opiniones y contenidos y exportar los datos en formato Gephi para su posterior análisis.

7. UNISoN

UNISoN es una aplicación Java que puede analizar mensajes para guardarlos en un archivo en formato Pajek para el análisis de redes sociales. Genera redes utilizando el autor de cada publicación. Si alguien interactúa con una publicación, se crea un enlace unidireccional del autor de la publicación al autor del mensaje al que está respondiendo. Además, hay un panel de vista previa que muestra la red visualmente.

6. NetworKit

NetworKit es una plataforma en crecimiento para el análisis de redes a gran escala, desde miles hasta miles de millones de bordes. Implementa un algoritmo gráfico eficiente, la mayoría de ellos son paralelos para utilizar la arquitectura multinúcleo. Se supone que deben calcular medidas estándar de análisis de red, como coeficientes de agrupación, secuencias de grados y medidas de centralidad. Además, su objetivo es admitir una variedad de formatos de entrada y salida.

5. GraphStream

GraphStream está diseñado para el modelado y análisis de gráficos dinámicos. Le permite crearlos, importarlos, exportarlos, darles forma y visualizarlos. En lugar de solo un conjunto de aristas y nodos, los gráficos se definen como un "flujo de eventos gráficos". Los eventos indican cuándo cambia un borde, nodo o componente asociado. Por lo tanto, un gráfico no se describe como una representación fija, sino por toda la historia en evolución de los elementos del gráfico.

4. NodeXL

NodeXL es una plantilla de código abierto para Microsoft Excel para análisis y visualización de redes. Le permite ingresar una lista de borde de red en una hoja de trabajo, hacer clic en un botón y visualizar su gráfico, todo en el entorno familiar de la ventana de Excel.

La herramienta admite la extracción de correo electrónico, YouTube, Facebook. Red social Twitter, WWW y Flickr. Puede manipular y filtrar fácilmente los datos subyacentes en formato de hoja de cálculo.

3. R

El lenguaje de programación R está repleto de numerosos paquetes relevantes para el análisis de redes sociales: igraph para análisis de red genérico, red para manipular y mostrar objetos de red, sna para realizar análisis sociométrico, tnet para realizar análisis de red ponderada o longitudinal, Bergm para análisis bayesiano para exponencial modelos de gráficos aleatorios, redes para simular redes bipartitas con marginales fijos y muchos más.

2. Gephi

Gephi suele ser un software de exploración y manipulación de gráficos escrito en Java. Proporciona una manera fácil de crear conectores de datos sociales para mapear organizaciones comunitarias y redes de mundo pequeño. Junto con el análisis de redes sociales, realiza análisis exploratorios de datos y enlaces, y análisis de redes biológicas. Quizás la herramienta de análisis gratuita más avanzada.

El software te ayuda a explorar y comprender gráficos. Puede interactuar con las figuras, manipular las estructuras, el color y la forma para revelar propiedades ocultas. La arquitectura flexible y de tareas múltiples le permite trabajar con datos complejos y producir resultados visuales valiosos. Además, hay un motor de renderizado 3D capaz de mostrar grandes redes en tiempo real, solo para acelerar la exploración.

1. Pajek

Pajek se utiliza para el análisis y visualización de grandes redes que contienen hasta mil millones de vértices. El programa realiza esto utilizando seis tipos de datos: gráficos, vértices, vectores (propiedades de vértices), clúster (subconjunto de vértices), permutación (reordenamiento de vértices) y jerarquía (estructura de árbol general en vértices).

domingo, 10 de mayo de 2020

Cómo se viralizó el meme Harlem Shake

The Harlem Shake: Anatomía de un meme viral

The Huffington Post

Si aún no has oído hablar del Harlem Shake, debes estar viviendo en una cueva. Mucho se ha escrito sobre la rápida y global propagación de este pegadizo meme de Internet, pero poco se entiende sobre cómo se propagó. En la siguiente publicación, observamos la aparición del meme a través de los datos de Twitter. Una serie de videos remezclados junto con una serie de comunidades clave en todo el mundo desencadenaron una escalada rápida, dando al meme una visibilidad global generalizada. ¿Qué podemos aprender de los datos? ¿Quiénes fueron las comunidades iniciales detrás de esta megatendencia? ¿Quiénes fueron algunos de los creadores de tendencias y qué tuvo que ver la escena techno-DJ de Jamaica con esto?

= - = - =

El Harlem Shake es un estilo de baile nacido en la ciudad de Nueva York hace más de 30 años: “Durante el medio tiempo en los juegos de pelota callejeros celebrados en Rucker Park, un hombre delgado conocido en el vecindario como Al. B. entretendría a la multitud con suxxx propia marca de movimientos, un baile que alrededor de Harlem se hizo conocido como ‘The Al. B. "" Aunque comenzó en 1981, el Harlem shake se convirtió en la corriente principal en 2001 cuando G. Dep presentó el baile en su video musical "Let’s Get It".

Al extraer datos de Twitter, las referencias a Harlem Shake (el baile original) se vieron con bastante frecuencia antes de que se convirtiera en un meme popular. Por ejemplo, los usuarios escribirían Tweets que hacen referencia al baile de la siguiente manera:

Finally back in LA. I have almost 2 weeks of prepping and me time! *harlem shakes*
— Brian Puspos (@BrianPuspos) February 5, 2013

Existen numerosos ejemplos de Tweets con esta frase en este contexto (aquí hay algunos ejemplos), muchos de ellos utilizando el carácter * como énfasis. Kimberly Ellis, Académica de Estudios Americanos y Africanos, afirma que este tipo de lenguaje simplemente está siendo referenciado a través de la memoria cultural. Y los usuarios son muy dramáticos, por lo tanto, colocan "elementos de acción" en los tweets:

Cuando alguien tuitea: “¡Acabo de aprobar mis exámenes finales! * harlem shakes * ", es el equivalente a decir" ¡Acabo de aprobar mis exámenes finales! ¡Mírame bailar! Como puede ver, el Harlem Shake de la memoria cultural es tan enérgico, que recordar lo visual en un tweet lo hace aún más histérico y otro momento cultural compartido para los afroamericanos en Twitter.

= - = - =

Si bien la canción ahora infame de Bauuer se lanzó en el sello Mad Decent de Diplo en agosto de 2012 (publicado en YouTube el 23 de agosto de 2012), solo acumuló una visibilidad menor durante los primeros meses. Luego llegó febrero y algo cambió.

La línea de tiempo a continuación resalta los primeros días cuando el meme despegaba. En azul, vemos referencias al baile de los años 80 * harlem shakes *. Tenga en cuenta el patrón diurno, que sube y baja constantemente a diario. En contraste, la curva verde representa Tweets que usan la frase "The Harlem Shake", muchos de ellos vinculados a una de las tres primeras versiones del meme en YouTube.

El 2 de febrero, el grupo The Sunny Coast Skate (TSCS) estableció la forma del meme en un video de YouTube que subieron. El 5, PHL_On_NAN publica un remix (v2), ganando 300,000 visitas en 24 horas y provocando más parodias poco después. El 7 de febrero, YouTuber hiimrawn subió una versión titulada "Harlem Shake v3 (edición de oficina)" con el personal de la compañía de producción de videos en línea Maker Studios. El video se convierte en un éxito, acumulando más de 7,4 millones de visitas durante la semana siguiente e inspirando una serie de contribuciones de compañías de Internet conocidas, incluidas BuzzFeed, CollegeHumor, Vimeo y Facebook.

En una entrevista en video, Vernon Shaw, coordinador de desarrollo de canales en Maker Studios (producido v3), afirma que vio las dos primeras versiones en Reddit. Era evidente que estaba surgiendo una forma, y después de que v2 acumuló 100k vistas, le quedó claro que esta era la etapa "pre-viral". Vernon atribuye a Reddit el hecho de ser el primero en resaltar los remixes, alegando que "se puede saber cuándo una tendencia está por comenzar al detectarla en Reddit primero ... uno o dos días antes que Facebook".

= - = - =

Aquí hay un grafo que muestra retuits durante la primera semana, a medida que se establecía el meme. Podemos identificar perfiles dominantes que ayudaron a hacer visibles los videos en Twitter, corredores de información clave. Cada nodo representa un usuario de Twitter, y cuanto más grande es un nodo, más Retweets genera ese usuario al publicar en el meme. El color más claro participó anteriormente, por lo tanto, vemos a @baauer, @dipio y @maddecent muy temprano, publicando en Twitter y acumulando Retweets. En la región inferior derecha, identificamos YouTubers influyentes que fueron clave para transmitir el meme, como @kingsleyyy, @KSIOlajidebt, @ConnorFranta y @Jenna_Marbles. Tenga en cuenta el tamaño general de estos perfiles frente a @StephenAtHome (Colbert) o incluso @YouTube. Estos influyentes YouTubers claramente desempeñaron un papel destacado en la generación de rumores en Twitter, mucho más que cuentas significativamente más grandes, como las de Stephen Colbert o YouTube.

= - = - =

Luego, en lugar de mapear Retweets, observamos las conexiones sociales entre los usuarios que publicaron en el meme. Esto nos da la capacidad de identificar las comunidades subyacentes que participan en el meme en una etapa muy temprana. En el siguiente gráfico, cada nodo representa un usuario que estaba publicando activamente y haciendo referencia al meme de Harlem Shake el 7 u 8 de febrero en Twitter. Las conexiones entre usuarios reflejan relaciones de seguimiento / amistad. El gráfico se organiza utilizando un algoritmo de fuerza dirigida y se colorea según la modularidad, destacando los grupos dominantes, regiones en el gráfico que están mucho más interconectadas. Estos grupos representan grupos de usuarios que tienden a tener algún atributo en común.

Uno de los grupos más densos incluye @baauer, @diplo, @maddecent y otros DJs y músicos. Claramente son una comunidad central que publicaron el meme desde el principio. Identificamos esto claramente en el gráfico Retweet anterior. En rojo y verde (arriba, derecha) vemos regiones del gráfico que destacan varias comunidades de YouTube. Estos son usuarios cuya identidad web dominante es su página de YouTube. Si bien muchos de ellos tienen identificadores de Twitter, todos se vinculan a su página de YouTube como una identidad principal, mientras que muchos se describen a sí mismos como 'YouTubers'. Vemos una densa comunidad de usuarios brasileños (derecha), raperos jamaiquinos (arriba a la izquierda). ciudad (abajo) y usuarios de París, Francia (abajo, centro-izquierda). En el centro, hay cuentas como BroBible y theBERRY / theCHIVE que fueron uno de los primeros medios de comunicación nuevos en identificar el meme como interesante.

La región púrpura en el gráfico (lado izquierdo) representa a los usuarios afroamericanos de Twitter que hacen referencia a Harlem Shake en su contexto original. Hay muy poca densidad allí, ya que no es realmente una comunidad muy unida, sino más bien un segmento de usuarios que están culturalmente alineados y claramente están mucho más interconectados entre sí que con otros grupos.

Si ejecutamos un análisis similar en los dos días siguientes (9 y 10 de febrero), vemos surgir diferentes comunidades y una estructura gráfica mucho más unida:

Si bien todavía existe el mismo grupo de músicos y DJ (en turquesa), hay muchos más YouTubers autoidentificados tanto en los EE. UU. como en el Reino Unido. Al mismo tiempo, hay un importante grupo de jugadores / machinima que también participa, así como un contingente jamaicano en crecimiento y bastantes perfiles holandeses (púrpura - izquierda). Además, vemos varias cuentas de celebridades y medios que captaron el meme: @jimmyfallon, @mashable y @huffingtonpost.

Al capturar las dos instantáneas, también podemos dar sentido a la evolución del meme a medida que se hace más y más visible. Al principio, las comunidades conectadas sin apretar por separado por los videos. En cuestión de días, vemos a los principales medios de comunicación saltar a bordo, y un paisaje mucho más entrelazado. Vemos cómo se iluminan diferentes regiones del mundo e identificamos comunidades de entusiastas importantes de YouTube que efectivamente hacen que este contenido se difunda.

= - = - = - =

En este caso, vemos una red clara de YouTubers influyentes en los EE. UU. Y el Reino Unido combinados con un denso grupo de músicos y DJ que ayudaron a que este meme sea increíblemente visible. También vemos cómo se extendió rápidamente por todo el mundo, con densos contingentes en Jamaica, Sudáfrica, Brasil, Francia y los Países Bajos. Al comparar dos instantáneas en el tiempo, vemos literalmente la diferencia entre una tendencia emergente entre las comunidades basadas en intereses libremente conectadas, a un grupo denso más conectado donde los medios digitales amplifican significativamente.

Los memes se han convertido en una especie de espectáculo de masas distribuido. La cultura se está creando, remezclando y reforzando dentro de las redes sociales, y los memes se están convirtiendo en un mecanismo que capta la atención de las personas y define lo que es "genial" o "moderno". Vemos que más y más compañías y marcas intentan asociarse con ciertos memes, como una forma de mantener una conexión con su audiencia, ganar el factor genial. Pepsi hizo esto con el Harlem Shake y vio una respuesta increíblemente positiva. A medida que mejoramos en la identificación de estas tendencias y las comunidades que marcan tendencias desde el principio, aumentará la presión para participar.

A medida que las redes sociales se entrelazan a nivel mundial, estamos presenciando un número creciente de memes conquistando el mundo en general. Estos momentos son puntos críticos en el tiempo, donde hay niveles significativos de atención hacia una entidad específica, ya sea una broma, un video divertido o un tema político. La recopilación de datos de las redes sociales puede ayudarnos a identificar puntos críticos en el tiempo, así como las comunidades subyacentes y los creadores de tendencias para los memes basados en el humor, o los creadores de la agenda para los políticos.

sábado, 9 de mayo de 2020

La vida de un hashtag en 24 horas retratada en Gephi

martes, 18 de junio de 2019

Cómo, con qué, para qué: Herramientas para investigar datos de Twitter

Uso de Twitter como fuente de datos: una visión general de las herramientas de investigación en redes sociales (2019)

LSE Impact Blog

Twitter y otras plataformas de redes sociales representan un recurso grande y en gran parte sin explotar para datos y pruebas sociales. En esta publicación, Wasim Ahmed actualiza su serie recurrente en el Blog de Impacto, para ofrecerle los últimos desarrollos en métodos y metodologías digitales para investigar Twitter y otras plataformas de medios sociales.

Esta publicación se basa en las ediciones de 2015 y 2017 de esta publicación, captura tendencias y eventos clave que están configurando la investigación en redes sociales para los científicos sociales y proporciona una colección de métodos y herramientas de investigación para el análisis de datos de redes sociales.

Desde la edición de 2017 de esta publicación de blog, he visto usos aún más únicos e interesantes de los datos de las redes sociales en una amplia variedad de disciplinas de investigación, como sociología, informática, medios y comunicación, ciencia política e ingeniería, solo por mencionar pocos. Las plataformas de medios sociales generan una gran cantidad de datos diariamente sobre una variedad de temas y, en consecuencia, representan una fuente clave de información para cualquiera que busque estudiar la sociedad del siglo XXI.

Twitter sigue siendo la plataforma más popular para la investigación académica, ya que aún proporciona sus datos a través de una serie de interfaces de programación de aplicaciones (API). En contraste, las consecuencias de la "violación de datos" de Cambridge analytica han llevado a ciertas plataformas de redes sociales a limitar los datos proporcionados a través de sus interfaces de programación de aplicaciones. Sin embargo, aunque puede que no sea posible obtener datos de todas las plataformas de redes sociales, aún es posible realizar una investigación cualitativa y cuantitativa, como entrevistas y encuestas, con miembros de comunidades en línea.

Los estudios en redes sociales se pueden encuadrar a partir de una amplia variedad de teorías, construcciones y marcos conceptuales de una amplia variedad de disciplinas y recomendaría echar un vistazo a este documento: Social media research: Theories, constructs, and conceptual frameworks, que resume muy bien algunos de estos enfoques.

También hay una serie de enfoques de investigación que se pueden utilizar como Netnography y Digital Ethnography, que proporcionan marcos para realizar investigaciones en el mundo en línea. La netnografía, por ejemplo, puede basarse en la descarga de datos directamente desde una plataforma de redes sociales, anotando observaciones personales de una comunidad en línea y entrevistando a usuarios de redes sociales. Además, también hay una serie de métodos específicos para el análisis de datos de redes sociales que se resumen en la Tabla 1 a continuación.

Tabla 1: Resumen de los métodos de investigación

Método	Descripción
Análisis de contenido	El análisis de contenido se puede utilizar para etiquetar sistemáticamente texto, audio y / o comunicación visual de las redes sociales, y puede proporcionar un resultado numérico. Un estudio de ejemplo que utiliza el análisis de contenido en tweets se puede acceder aquí. Una descripción útil del método se puede encontrar aquí. Está bien tomar una muestra aleatoria sistemática de entre el 1% y el 10% del conjunto de datos en función del volumen de datos recuperados.
Análisis temático	El análisis temático implica un proceso riguroso para ubicar patrones dentro de los datos a través de la familiarización, la codificación y el desarrollo y revisión de temas. Un ejemplo de un estudio que utiliza el análisis de redes sociales se puede encontrar aquí. Una guía útil para aplicar el análisis temático se puede encontrar aquí. El análisis temático también puede ser conocido como análisis del discurso. De manera similar al análisis de contenido, está bien tomar una muestra aleatoria sistemática de entre el 1% y el 10% del conjunto de datos, según el volumen de datos recuperados.
Análisis de redes sociales	El análisis de redes sociales se puede utilizar para medir y mapear las relaciones entre individuos, organizaciones, páginas web y entidades de información y / o conocimiento. Consulte este artículo y el material complementario para conocer cómo incorporar el análisis de redes sociales en un estudio. Aquí se puede acceder a un recurso útil para analizar datos de redes sociales utilizando el análisis de redes sociales.
Machine Learning	El aprendizaje automático o machine learning es un tipo de inteligencia artificial que permite que las computadoras aprendan sin ser programadas. También puede involucrar a personas que etiquetan un subconjunto de datos y permite que la computadora aprenda y codifique el resto de los datos. Aquí se puede acceder a un estudio que utiliza el aprendizaje automático para analizar los perfiles de los usuarios de Twitter.
Análisis semántico (Lingüistica)	El análisis semántico puede examinar el significado del lenguaje utilizado y también la relación entre los casos de palabras, frases y cláusulas. Aquí se puede acceder a una presentación útil que utiliza análisis semántico para examinar Twitter. Describe un estudio realizado por el Dr. Mark McGlashan.
Análisis de series de tiempo	El análisis de series de tiempo rara vez se utiliza un método en sí mismo y generalmente se combina con otros métodos. Traza la frecuencia de las redes sociales a través del tiempo. A menudo se utiliza para complementar otros tipos de análisis. Mi tesis doctoral proporciona un ejemplo de la utilización del análisis de series de tiempo junto con otros métodos de investigación, como el contenido y el análisis temático. Se puede acceder aquí.

La Tabla 2 a continuación proporciona una descripción general de las herramientas para recuperar datos de redes sociales

Tabla 2: Una revisión de las herramientas para 2019

Herramienta	SO	Se descarga/accede desde	Plataformas*
Audiense	Basado en la Web	https://audiense.com/	Twitter
Brand24	Basado en la Web	https://brand24.com/features/#4	Twitter, Facebook, Instagram, Blogs, Forums, Videp
Brandwatch	Basado en la Web	https://www.brandwatch.com/	Twitter, Facebook, YouTube, Instagram, Sina Weibo, VK, QQ, Google+, Pinterest, blogs en línea
Chorus (gratis)	Windows (Desktop advisable)	http://chorusanalytics.co.uk/chorus/request_download.php	Twitter
COSMOS Project (gratis)	Windows & MAC OS X	http://socialdatalab.net/software	Twitter
Echosec	Basado en la Web	https://www.echosec.net	Twitter, Instagram, Foursquare, Panoramio, AIS Shipping, Sina Weibo, Flickr, YouTube, VK
Followthehashtag	Basado en la Web	http://www.followthehashtag.com	Twitter
IBM Bluemix	Basado en la Web	https://www.ibm.com/cloud-computing/bluemix	Twitter
Keyhole	Basado en la Web	https://keyhole.co/	Twitter, Instagram, Facebook
Mozdeh (gratis)	Windows (se recomienda pc)	http://mozdeh.wlv.ac.uk/installation.html	Twitter
Netlytic	Basado en la Web	https://netlytic.org	Twitter, Facebook, YouTube, RSS Feed
NodeXL	Windows	http://nodexl.codeplex.com	Twitter, YouTube, Flickr, Wikipedia
NVivo	Windows y MAC	http://www.qsrinternational.com/product	Twitter, capacidad de importar
Pulsar Social	Basado en la Web	http://www.pulsarplatform.com	Twitter, Facebook topic data, blogs en línea
Social Elephants	Basado en la Web	https://socialelephants.com/en/	Twitter, Facebook, Instagram, YouTube
Symplur (Healthcare focus)	Basado en la Web	https://www.symplur.com/	Twitter
SocioViz	Basado en la Web	http://socioviz.net	Twitter
Trendsmap	Basado en la Web	https://www.trendsmap.com	Twitter
Trackmyhashtag		https://www.trackmyhashtag.com/	Twitter
Twitonomy	Basado en la Web	http://www.twitonomy.com	Twitter
Twitter Arching Google Spreadsheet (TAGS) (gratis)	Basado en la Web	https://tags.hawksey.info	Twitter
Visibrain	Basado en la Web	http://www.visibrain.com	Twitter
Webometric Analyst (gratis)	Windows	http://lexiurl.wlv.ac.uk	Twitter (con capacidad de extracción de imágenes), YouTube, Flickr, Mendeley, Other web resources

*Algunas herramientas pueden permitir el acceso a otras plataformas y la capacidad de importar sus propios datos.

Recientemente, también se ha vuelto cada vez más difícil para los académicos acceder a datos históricos de Twitter con una serie de servicios para académicos que están llegando a su fin. Esto ha dado lugar a servicios como los proporcionados por ScrapeHero, que permiten a los usuarios obtener datos históricos de Twitter de forma gratuita mediante el uso de web scraping. Sin embargo, esta forma de recuperar Twitter no es recomendable.

Para investigar otras plataformas en Internet, como foros web, blogs y otras plataformas de medios sociales, existen herramientas como Scrape Storm, que es un raspador de web visual basado en la inteligencia artificial y pretende poder recuperar datos de casi cualquier plataforma.

También hay una serie de aplicaciones avanzadas de análisis de datos y estadísticas que se pueden usar para analizar datos de redes sociales, como:

Estos paquetes deben investigarse al decidir qué aplicación se utilizará para un proyecto. También me gustaría mencionar la lista de herramientas de Iniciativas de Métodos Digitales, y la lista de herramientas de la Universidad Ryerson de su Laboratorio de Medios Sociales. Para recuperar datos de Twitter también vale la pena revisar el DMI-TCAT (gratis). SAGE Ocean publicó recientemente una revisión adicional de 100 herramientas de redes sociales.

Para el análisis de imágenes, recomendaría revisar la visión de Google Cloud AI y también existen herramientas como Instaloader que le permiten descargar fotos de Instagram de cuentas públicas. Se realizó un estudio realmente interesante en Instagram y se analizó el hashtag #CheatMeal utilizando el análisis de contenido temático y se puede acceder aquí.

Otro campo en rápido desarrollo de la investigación en redes sociales se centra en la ética. Es importante realizar una investigación ética en redes sociales y recientemente publiqué un capítulo de libro de acceso abierto, que examina el uso de Twitter como fuente de datos y brinda una descripción general de los desafíos éticos, legales y metodológicos. Se puede acceder al capítulo aquí.

Debido a una serie de solicitudes, también he empezado a realizar eventos de capacitación regulares (consulte la lista aquí) con la posibilidad de asistencia virtual. El primero de estos eventos se llevó a cabo en la Escuela de Economía y Ciencias Políticas de Londres el 17 de mayo de 2019 y nuestro hashtag # SMRM19 contiene una gran cantidad de material informativo, ya que el evento fue tweeteado en vivo.

Páginas