martes, 13 de noviembre de 2018

ERGM: Definición


Modelos de grafos aleatorios exponenciales (ERGM)




Los modelos de grafos aleatorios exponenciales (ERGM) son una familia de modelos estadísticos para analizar datos sobre redes sociales y otras redes.

Introducción

Existen muchas métricas para describir las características estructurales de una red observada, como la densidad, la centralidad o la asortatividad. [1] [2] Sin embargo, estas métricas describen la red observada, que es solo una instancia de un gran número de redes alternativas posibles. Este conjunto de redes alternativas puede tener características estructurales similares o diferentes. Para respaldar la inferencia estadística sobre los procesos que influyen en la formación de la estructura de la red, un modelo estadístico debe considerar el conjunto de todas las redes alternativas posibles ponderadas por su similitud con una red observada. Sin embargo, como los datos de la red son inherentemente relacionales, violan los supuestos de independencia y la distribución idéntica de modelos estadísticos estándar como la regresión lineal. [3] Modelos estadísticos alternativos deben reflejar la incertidumbre asociada con una observación dada, permitir la inferencia sobre la frecuencia relativa de las subestructuras de red de interés teórico, desambiguar la influencia de los procesos relacionados, representan estructuras complejas y vinculan los procesos de nivel local con las propiedades de nivel global. [4] La aleatorización que preserva el grado, por ejemplo, es una forma específica en la cual una red observada podría considerarse en términos de múltiples redes alternativas.


Definición

La familia Exponential es una amplia familia de modelos para cubrir muchos tipos de datos, no solo redes. Un ERGM es un modelo de esta familia que describe redes.

Formalmente, un grafo aleatorio  consiste de un conjunto de  nodos y díadas (enlaces) donde si los nodos se encuentran conectadosy de lo contrario.

El supuesto básico de estos modelos es que la estructura en un grafo observado y puede explicarse por cualquier estadística  dependiendo de la red observada y atributos nodales. De esta manera, es posible describir cualquier tipo de dependencia entre las variables no díadicas:



donde es un vector de parámetros de modelo asociados con  y es una constante de normalización.

Estos modelos representan una distribución de probabilidad en cada red posible en n nodos. Sin embargo, el tamaño del conjunto de redes posibles para una red no dirigida (grafo simple) de tamaño is . Debido a que el número de redes posibles en el conjunto supera ampliamente al número de parámetros que pueden restringir el modelo, la distribución de probabilidad ideal es la que maximiza la entropía de Gibbs. [5]


Referencias

  1. Wasserman, Stanley; Faust, Katherine (1994). Social Network Analysis: Methods and Applications. ISBN 978-0-521-38707-1.
  2. Newman, M.E.J. "The Structure and Function of Complex Networks". SIAM Review. 45 (2): 167–256. arXiv:cond-mat/0303516. Bibcode:2003SIAMR..45..167N. doi:10.1137/S003614450342480
  3. Contractor, Noshir; Wasserman, Stanley; Faust, Katherine. "Testing Multitheoretical, Multilevel Hypotheses About Organizational Networks: An Analytic Framework and Empirical Example". Academy of Management Review. 31 (3): 681–703. doi:10.5465/AMR.2006.21318925
  4. Robins, G.; Pattison, P.; Kalish, Y.; Lusher, D. (2007). "An introduction to exponential random graph models for social networks". Social Networks. 29: 173–191. doi:10.1016/j.socnet.2006.08.002.
  5. Newman, M.E.J. "Other Network Models". Networks. pp. 565–585. ISBN 978-0-19-920665-0.

 Wikipedia

No hay comentarios:

Publicar un comentario