Prediciendo temas centrales en un Blog Corpus desde una Perspectiva de Redes
Srayan Datta
http://arxiv.org/abs/1405.2386
En centrado en el contenido de Internet de hoy en día, los blogs se están convirtiendo cada vez más popular e importante desde una perspectiva de análisis de datos. De acuerdo a Wikipedia, había más de 156 millones los blogs públicos en Internet a partir de febrero de 2011. Los blogs son un reflejo de nuestra sociedad contemporánea. Los contenidos de las diferentes entradas del blog son importantes desde las perspectivas sociales, psicológicos, económicos y políticos. El descubrimiento de los temas importantes en la blogosfera es un área que todavía necesita mucho explorar. Tratamos de llegar a un procedimiento utilizando medidas probabilístico modelado tema y centralidad de red, que identifica los temas centrales en un corpus blog.
No hay comentarios:
Publicar un comentario