jueves, 12 de septiembre de 2013

El (confuso) algoritmo EdgeRank de Facebook

Dejen de llamar ‘EdgeRank’ al algoritmo de alimentación de noticias de Facebook News 
por JD Rucker



Hace poco más de un año, dejé de usar el término "EdgeRank" cuando me refiero al algoritmo que Facebook utiliza para determinar cuándo y en qué parte del servicio de noticias que aparecen los mensajes. Alguien en Facebook me había dicho que ya no se usa, así que dejé de hablar de ello.

Con el tiempo, se deslizó de nuevo en mi lengua vernácula. No es que nada haya cambiado - el nuevo sistema, más complejo aún estaba bien en su lugar - pero se hizo confundir a los clientes y prospectos cuando llamé "el algoritmo de clasificación de noticias RSS Facebook". Era aún más confuso cuando se trata de hablar con los que estaban lo suficientemente informados para preguntar sobre EdgeRank. En esas situaciones, yo solía pasar varios minutos explicando que EdgeRank ya no existía en su forma original, pero que los tres factores que influyen en la primaria todavía formaban parte de la ecuación.

Como resultado de ello, empecé simplemente llamándolo EdgeRank nuevo. Ahora, es el momento de corregir oficialmente que por supuesto y lo llaman lo que es, un algoritmo de clasificación sin nombre y excepcionalmente compleja que juega dentro de sí mismo, a veces para determinar si y cuando un envío hecho por un individuo o una página puede aparecer en las noticias de un individuo alimentarse. Los factores de edad todavía están allí... junto con un rumoreado 100,000 otros factores.

Es bueno empezar a utilizar la terminología correcta de nuevo. Siempre me sentí un encogerse interno cada vez que lo dije, pero pasé.

Hay algo en el algoritmo que me ha intrigado desde que empecé a jugar con él más de 2 años. Mi carrera de marketing comenzó en búsqueda y el todopoderoso algoritmo de ranking de búsqueda de Google siempre ha sido una batalla constante para los que estamos persiguiendo dominarlo completamente. Sin embargo, tan complejo como el algoritmo de Google es, no tiene nada en el algoritmo de Facebook. Las complejidades son intensas y los efectos que tiene sobre la visibilidad de los mensajes hace que sea mucho más difícil que cualquier otra cosa en la tierra de esta categoría.

Cualquiera que juegue en la búsqueda y social en el mundo es probable que en el temor de las formas cambiantes que ambos algoritmos juegan con nuestras emociones, pero al final del día es el algoritmo de Facebook que es más de una obra de arte. Sin ánimo de ofender, Google.

sábado, 7 de septiembre de 2013

Los 100 libros más vendidos por Amazon visualizados como una red

Top 100 Social Network Analysis bestsellers book visualized as a graph


Amazon es una empresa de comercio electrónico con sede en EE.UU. en Seattle, Washington. Lanzado en 1994 como una librería en línea, ha ampliado la gama de productos que se venden en DVD, CDs de música, software, videojuegos, sino también ropa, juguetes y mucho más.
Amazon ofrece interfaces de programación para acceder al catálogo de productos, entre ellos los de publicidad de productos API. Esta API se puede consultar para extraer los libros más vendidos para determinadas categorías (por ejemplo, biología o tecnología) o de búsqueda, incluyendo títulos y descripciones, textos que contengan determinadas palabras clave.
A continuación, puede extraer el éxito de ventas de un determinado tema y comprender categorías o dominios de conocimiento se catalogan los diferentes libros. Por ejemplo, buscar a través de la prueba de que contienen en su título o descripción de los términos "análisis de redes sociales" se puede obtener los campos de aplicación de la SNA, al menos los más populares en términos de libros comprados en el catálogo de Amazon.
Las siguientes figuras muestran las categorías más comunes para los 100 más vendidos, en Inglés, sobre el Análisis de Redes Sociales. Cada nodo representa una categoría, los nodos están conectados por un arco si un libro se le asigna a más de uno (por ejemplo, Ciencias Sociales y Sociología). El tamaño de los nodos es proporcional al número de ocurrencias, así como el espesor de los arcos.

Science & Nature, Computing & Internet, Education, Social Sciences las categorías más representadas, tenga en cuenta también las categorías micro que dan testimonio de una aplicación particular nicho.


Otro análisis interesante se puede hacer con respecto a las editoriales, y los relaciona con el tipo de contenido publicado.
La siguiente figura es un zoom en el editor principal (nodos azules) y las categorías (nodos azules) que son libros de anuncios que se propagan, la lógica es siempre para dar énfasis (más grande) a los que publican en varias categorías (outdegree - grado de salida ) ya la más representada (indegree - grado de entrada).

Sólo un vistazo para ver lo que los editores están más presentes, los que publican en múltiples categorías y los que están más especializados en un nicho particular. Descargue la resolución de la imagen completa aquí.
Y tú, ¿qué se puede hacer con estos datos?

Disclaimer
Este blog está destinado exclusivamente a la investigación y el estudio personal. Pido a la cortesía de informar cualquier error, voy a estar seguro de integrar y modificar el contenido de esta página.
Credits, recursos on line:

viernes, 30 de agosto de 2013

Como activar el aporte de Granovetter en la realidad

Cómo hacer saber a su red que usted está buscando un trabajo
Alison Green - Business Insider 


Si estás buscando trabajo, usted probablemente ha oído que una de las cosas más efectivas que puede hacer es utilizar la red de conexiones para encontrar pistas de trabajo y hacer conexiones con los directores de recursos humanos . Pero, ¿cómo realmente llegar a su red , y qué me dices? He aquí cinco claves para hacer las cosas bien .

1 . Póngase en contacto con las personas de forma individual , no en masa. Puede ser tentador para enviar un correo electrónico masivo , para que todos sepan de una vez que usted está buscando . Y siendo realistas, si esa es la única forma en que vamos a lograr que se haga , a continuación, hacer eso, porque es mejor que no ponerse en contacto con la gente en todos. Pero será mucho más eficaz si envía mensajes de correo electrónico individuales a las personas en lugar de un grupo de correo electrónico - porque la gente es generalmente mucho más dispuestos a ayudar cuando se sienten como si llegar a ellos directamente .

Después de todo , piensa en cómo te sientes en la piel similares : Si usted recibe un correo electrónico masivo a un amigo pedir a un grupo de personas que , por ejemplo, donar a una organización benéfica que está apoyando , que puede o no puede pasar mucho tiempo pensando acerca de su petición. Pero si ese amigo y no llega a usted personalmente , usted probablemente se sentirá más responsable para pensar realmente sobre la solicitud y tal vez actuar sobre ella. Cuando la gente ve que son uno de los muchos que se pide , hay una difusión de la responsabilidad , la sensación de que los demás van a tomar cuidado de esta , por lo que la urgencia se reduce. Así que si usted puede , haga correos electrónicos individuales - la gente se sentirá más invierten .

2 . Sea claro sobre exactamente lo que estás buscando. Con demasiada frecuencia , los solicitantes de empleo piden ayuda para buscar empleo sin estar claro acerca de lo que están buscando. No dejar nada abierto a la interpretación - Dices que estás buscando trabajo de forma explícita , y tener claro qué tipos de funciones usted está interesado.

3. Pregunte directamente qué tipo de ayuda desea. Cuando pide ayuda, no digas algo vago como " que me haga saber si usted oye hablar de nada " porque mucha gente no presta atención a ofertas de trabajo a su alrededor. En cambio, ser más específicos , las personas son mucho más propensos a ayudar si se les da algo concreto que pueden hacer. Por ejemplo , usted puede preguntar a su vecino si se puede conectar con un encargado que emplea en su anterior empresa , o puede pedirle a su antiguo jefe si le había asesorar sobre las compañías que está considerando. También puede pedir a la gente a pensar sobre si conocen a alguien que sería útil para que usted pueda hablar con , y decirles que usted estaría interesado en conectar con la gente , incluso si no hay una abertura adecuada en estos momentos.

4 . Póngase en contacto con todo el mundo en la red, incluso si usted no piensa que ellos saben de ofertas de trabajo adecuadas. Con demasiada frecuencia , los solicitantes de empleo no se atreven a llegar a la gente en su red a menos que sean de un director de recursos humanos o conectados a una empresa en particular con aberturas . Pero vale la pena llegar a la red completa, porque nunca se sabe quién puede ser capaz de decirle a usted acerca de una apertura para la que usted sería perfecto. (Y sus posibilidades de ser considerado para un puesto de trabajo a subir cuando tienes a alguien conectado con el trabajo diciendo: " Hey, realmente debería considerar Jane, porque ___ . ")

5 . No se olvide de incluir su currículum. A veces las personas piensan que es demasiado hacia delante o presuntuoso incluir su derecho currículum del palo y que deben esperar a ser preguntado ... pero en realidad, adjuntando su currículum se almacenan los contactos de tener que escribir de nuevo y solicitarlo. No sea tímido sobre el envío de la primera vez.


jueves, 29 de agosto de 2013

Grafo de enriedo en Oriente Medio

Grafo increíblemente convulsionado muestra justo como el Oriente Medio realmente es
Michael Kelley

The Big Pharaoh, el preeminente blogger egipcio, tweetió un grafo que intenta mapear las relaciones entre los diferentes grupos en el Oriente Medio.
Como se puede ver, es un lío complicado. Las líneas rojas muestran que odia a los cuales, las líneas azules muestran que apoya a quién, y las líneas verdes muestran que no tiene ni idea acerca de un grupo.



Hay algunos temas con este grafo, alguno de los cuales fueron puntualizados por los lectores de Washington Post.
  • Israel podría estar técnicamente en guerra con Siria pero "no siente que pueda confiar en las fuerzas rebeldes dominadas por la minoría Sunni mucho más que lo confía en el regimen actual". Por lo que los enlaces de Odio/Apoyo para Israel representan una sobre simplificación.
  • Debe haber un enlace de Odio que vaya desde Israel a Irán, e Irán, Hezbollah aliado libanés debe estar en la tabla.
  • No hay flechas de odio que vayan hacia los EE.UU., que es probablemente un descuido.
  • La facción de al-Qaeda vinculados a los rebeldes sirios también odia a los EE.UU., los chiítas del Líbano, Irán, Turquía, entre otros.
  • Es engañoso decir que al-Qaeda odia a Arabia Saudita y los estados del Golfo dado que esos países, especialmente Qatar y Kuwait, han estado directa e indirectamente armando grupos radicales.
Teniendo en cuenta esas calificaciones sólo acentúa lo complicado que el Medio Oriente se ha convertido.

Business Insider

miércoles, 28 de agosto de 2013

La densidad de una red es independiente de su tamaño


The Density of a Network is Independent of its Size

I spent the last three years writing my PhD thesis.  Since my thesis is about networks, I have used network datasets for research.  Experimental results are more significant when done using multiple datasets and therefore I started collected network datasets.  At first, I collected bipartite rating graphs such as MovieLens, Epinions and Netflix.  Later I added social networks such as the Slashdot Zoo, Facebook and Flickr, hyperlink networks from Google, Wikipedia and TREC.  Before my thesis was done, I noticed that I had collectedover a hundred network datasets!
My PhD thesis is about the spectral evolution model, but such a large collection of network datasets is much too interesting to use it just for that.  Therefore, I decided to perform some statistics with the collection of network datasets, trying to reproduce well-known results about networks.  One such result is that the density of networks is increasing over time.
Let me explain that:  A network such as Facebook consist of nodes and links.  In the case of Facebook, the nodes are users and the links are friendship links. We cannot know the complete Facebook network, but a part of it is available for research. What’s great about this dataset:  Not only do we know the friends of each users, we also know the date at which each friendship link was added.  This allows us to look at the changes in the network over time.  For instance, one important statistic in a network is the average number of links connected to each node.  This number is called the network density. A well known result about networks that change over time is that their density is increasing.  In other words, the average number of friends people have on Facebook gets larger over time.  This is not a trivial property:  When a new user account is created, the average number of friends goes down, because new users don’t have any friends.
In other words, the larger the number of nodes in a network, the larger the density.  This result was shown to be valid for individual networks, for instance in Jure Leskovec‘s dissertation.  Given a large collection of datasets, we may now ask the related question:  Is the number of nodes in a network correlated to the density, when comparing different networks?  This question can only be answered with a large collection of datasets. Using the network datasets I have available, the result looks like this:
Network size vs density for all networks
The result is:  Network size and density do not correlate!  In other words, the growing density is a feature of individual networks, not of networks as a whole.
This kind of result is kind of straightforward taken individually, but is only made possible when using a large collection of datasets!  Therefore, me and my colleagues at theInstitute for Web Science and Technologies (WeST) at the University of Koblenz have decided to make the collection of datasets available in a form that makes it easy to do these kinds of studies.  We will call the collection of datasets KONECT, short for Koblenz Network Collection.  You can look at a poster of KONECT that we presented at the Web Science Conference that WeST organized in Koblenz a few weeks ago. We will also announce the KONECT web site soon—So stay tuned to this blog for more information!
NEW:  All network datasets are available at KONECT – The Koblenz Network Collection
Here’s my PhD thesis:
On the Spectral Evolution of Large Networks, Jérôme Kunegis, PhD thesis, University of Koblenz–Landau, 2011.