sábado, 7 de septiembre de 2013

Los 100 libros más vendidos por Amazon visualizados como una red

Top 100 Social Network Analysis bestsellers book visualized as a graph


Amazon es una empresa de comercio electrónico con sede en EE.UU. en Seattle, Washington. Lanzado en 1994 como una librería en línea, ha ampliado la gama de productos que se venden en DVD, CDs de música, software, videojuegos, sino también ropa, juguetes y mucho más.
Amazon ofrece interfaces de programación para acceder al catálogo de productos, entre ellos los de publicidad de productos API. Esta API se puede consultar para extraer los libros más vendidos para determinadas categorías (por ejemplo, biología o tecnología) o de búsqueda, incluyendo títulos y descripciones, textos que contengan determinadas palabras clave.
A continuación, puede extraer el éxito de ventas de un determinado tema y comprender categorías o dominios de conocimiento se catalogan los diferentes libros. Por ejemplo, buscar a través de la prueba de que contienen en su título o descripción de los términos "análisis de redes sociales" se puede obtener los campos de aplicación de la SNA, al menos los más populares en términos de libros comprados en el catálogo de Amazon.
Las siguientes figuras muestran las categorías más comunes para los 100 más vendidos, en Inglés, sobre el Análisis de Redes Sociales. Cada nodo representa una categoría, los nodos están conectados por un arco si un libro se le asigna a más de uno (por ejemplo, Ciencias Sociales y Sociología). El tamaño de los nodos es proporcional al número de ocurrencias, así como el espesor de los arcos.

Science & Nature, Computing & Internet, Education, Social Sciences las categorías más representadas, tenga en cuenta también las categorías micro que dan testimonio de una aplicación particular nicho.


Otro análisis interesante se puede hacer con respecto a las editoriales, y los relaciona con el tipo de contenido publicado.
La siguiente figura es un zoom en el editor principal (nodos azules) y las categorías (nodos azules) que son libros de anuncios que se propagan, la lógica es siempre para dar énfasis (más grande) a los que publican en varias categorías (outdegree - grado de salida ) ya la más representada (indegree - grado de entrada).

Sólo un vistazo para ver lo que los editores están más presentes, los que publican en múltiples categorías y los que están más especializados en un nicho particular. Descargue la resolución de la imagen completa aquí.
Y tú, ¿qué se puede hacer con estos datos?

Disclaimer
Este blog está destinado exclusivamente a la investigación y el estudio personal. Pido a la cortesía de informar cualquier error, voy a estar seguro de integrar y modificar el contenido de esta página.
Credits, recursos on line:

viernes, 30 de agosto de 2013

Como activar el aporte de Granovetter en la realidad

Cómo hacer saber a su red que usted está buscando un trabajo
Alison Green - Business Insider 


Si estás buscando trabajo, usted probablemente ha oído que una de las cosas más efectivas que puede hacer es utilizar la red de conexiones para encontrar pistas de trabajo y hacer conexiones con los directores de recursos humanos . Pero, ¿cómo realmente llegar a su red , y qué me dices? He aquí cinco claves para hacer las cosas bien .

1 . Póngase en contacto con las personas de forma individual , no en masa. Puede ser tentador para enviar un correo electrónico masivo , para que todos sepan de una vez que usted está buscando . Y siendo realistas, si esa es la única forma en que vamos a lograr que se haga , a continuación, hacer eso, porque es mejor que no ponerse en contacto con la gente en todos. Pero será mucho más eficaz si envía mensajes de correo electrónico individuales a las personas en lugar de un grupo de correo electrónico - porque la gente es generalmente mucho más dispuestos a ayudar cuando se sienten como si llegar a ellos directamente .

Después de todo , piensa en cómo te sientes en la piel similares : Si usted recibe un correo electrónico masivo a un amigo pedir a un grupo de personas que , por ejemplo, donar a una organización benéfica que está apoyando , que puede o no puede pasar mucho tiempo pensando acerca de su petición. Pero si ese amigo y no llega a usted personalmente , usted probablemente se sentirá más responsable para pensar realmente sobre la solicitud y tal vez actuar sobre ella. Cuando la gente ve que son uno de los muchos que se pide , hay una difusión de la responsabilidad , la sensación de que los demás van a tomar cuidado de esta , por lo que la urgencia se reduce. Así que si usted puede , haga correos electrónicos individuales - la gente se sentirá más invierten .

2 . Sea claro sobre exactamente lo que estás buscando. Con demasiada frecuencia , los solicitantes de empleo piden ayuda para buscar empleo sin estar claro acerca de lo que están buscando. No dejar nada abierto a la interpretación - Dices que estás buscando trabajo de forma explícita , y tener claro qué tipos de funciones usted está interesado.

3. Pregunte directamente qué tipo de ayuda desea. Cuando pide ayuda, no digas algo vago como " que me haga saber si usted oye hablar de nada " porque mucha gente no presta atención a ofertas de trabajo a su alrededor. En cambio, ser más específicos , las personas son mucho más propensos a ayudar si se les da algo concreto que pueden hacer. Por ejemplo , usted puede preguntar a su vecino si se puede conectar con un encargado que emplea en su anterior empresa , o puede pedirle a su antiguo jefe si le había asesorar sobre las compañías que está considerando. También puede pedir a la gente a pensar sobre si conocen a alguien que sería útil para que usted pueda hablar con , y decirles que usted estaría interesado en conectar con la gente , incluso si no hay una abertura adecuada en estos momentos.

4 . Póngase en contacto con todo el mundo en la red, incluso si usted no piensa que ellos saben de ofertas de trabajo adecuadas. Con demasiada frecuencia , los solicitantes de empleo no se atreven a llegar a la gente en su red a menos que sean de un director de recursos humanos o conectados a una empresa en particular con aberturas . Pero vale la pena llegar a la red completa, porque nunca se sabe quién puede ser capaz de decirle a usted acerca de una apertura para la que usted sería perfecto. (Y sus posibilidades de ser considerado para un puesto de trabajo a subir cuando tienes a alguien conectado con el trabajo diciendo: " Hey, realmente debería considerar Jane, porque ___ . ")

5 . No se olvide de incluir su currículum. A veces las personas piensan que es demasiado hacia delante o presuntuoso incluir su derecho currículum del palo y que deben esperar a ser preguntado ... pero en realidad, adjuntando su currículum se almacenan los contactos de tener que escribir de nuevo y solicitarlo. No sea tímido sobre el envío de la primera vez.


jueves, 29 de agosto de 2013

Grafo de enriedo en Oriente Medio

Grafo increíblemente convulsionado muestra justo como el Oriente Medio realmente es
Michael Kelley

The Big Pharaoh, el preeminente blogger egipcio, tweetió un grafo que intenta mapear las relaciones entre los diferentes grupos en el Oriente Medio.
Como se puede ver, es un lío complicado. Las líneas rojas muestran que odia a los cuales, las líneas azules muestran que apoya a quién, y las líneas verdes muestran que no tiene ni idea acerca de un grupo.



Hay algunos temas con este grafo, alguno de los cuales fueron puntualizados por los lectores de Washington Post.
  • Israel podría estar técnicamente en guerra con Siria pero "no siente que pueda confiar en las fuerzas rebeldes dominadas por la minoría Sunni mucho más que lo confía en el regimen actual". Por lo que los enlaces de Odio/Apoyo para Israel representan una sobre simplificación.
  • Debe haber un enlace de Odio que vaya desde Israel a Irán, e Irán, Hezbollah aliado libanés debe estar en la tabla.
  • No hay flechas de odio que vayan hacia los EE.UU., que es probablemente un descuido.
  • La facción de al-Qaeda vinculados a los rebeldes sirios también odia a los EE.UU., los chiítas del Líbano, Irán, Turquía, entre otros.
  • Es engañoso decir que al-Qaeda odia a Arabia Saudita y los estados del Golfo dado que esos países, especialmente Qatar y Kuwait, han estado directa e indirectamente armando grupos radicales.
Teniendo en cuenta esas calificaciones sólo acentúa lo complicado que el Medio Oriente se ha convertido.

Business Insider

miércoles, 28 de agosto de 2013

La densidad de una red es independiente de su tamaño


The Density of a Network is Independent of its Size

I spent the last three years writing my PhD thesis.  Since my thesis is about networks, I have used network datasets for research.  Experimental results are more significant when done using multiple datasets and therefore I started collected network datasets.  At first, I collected bipartite rating graphs such as MovieLens, Epinions and Netflix.  Later I added social networks such as the Slashdot Zoo, Facebook and Flickr, hyperlink networks from Google, Wikipedia and TREC.  Before my thesis was done, I noticed that I had collectedover a hundred network datasets!
My PhD thesis is about the spectral evolution model, but such a large collection of network datasets is much too interesting to use it just for that.  Therefore, I decided to perform some statistics with the collection of network datasets, trying to reproduce well-known results about networks.  One such result is that the density of networks is increasing over time.
Let me explain that:  A network such as Facebook consist of nodes and links.  In the case of Facebook, the nodes are users and the links are friendship links. We cannot know the complete Facebook network, but a part of it is available for research. What’s great about this dataset:  Not only do we know the friends of each users, we also know the date at which each friendship link was added.  This allows us to look at the changes in the network over time.  For instance, one important statistic in a network is the average number of links connected to each node.  This number is called the network density. A well known result about networks that change over time is that their density is increasing.  In other words, the average number of friends people have on Facebook gets larger over time.  This is not a trivial property:  When a new user account is created, the average number of friends goes down, because new users don’t have any friends.
In other words, the larger the number of nodes in a network, the larger the density.  This result was shown to be valid for individual networks, for instance in Jure Leskovec‘s dissertation.  Given a large collection of datasets, we may now ask the related question:  Is the number of nodes in a network correlated to the density, when comparing different networks?  This question can only be answered with a large collection of datasets. Using the network datasets I have available, the result looks like this:
Network size vs density for all networks
The result is:  Network size and density do not correlate!  In other words, the growing density is a feature of individual networks, not of networks as a whole.
This kind of result is kind of straightforward taken individually, but is only made possible when using a large collection of datasets!  Therefore, me and my colleagues at theInstitute for Web Science and Technologies (WeST) at the University of Koblenz have decided to make the collection of datasets available in a form that makes it easy to do these kinds of studies.  We will call the collection of datasets KONECT, short for Koblenz Network Collection.  You can look at a poster of KONECT that we presented at the Web Science Conference that WeST organized in Koblenz a few weeks ago. We will also announce the KONECT web site soon—So stay tuned to this blog for more information!
NEW:  All network datasets are available at KONECT – The Koblenz Network Collection
Here’s my PhD thesis:
On the Spectral Evolution of Large Networks, Jérôme Kunegis, PhD thesis, University of Koblenz–Landau, 2011.

martes, 27 de agosto de 2013

Grafo de intereses

The Interest Graph

My boys will grow up to a world where work is radically different than what I’ve experienced in my life. The way they’ll coordinate their jobs with others will be much looser and “networky” than in our current organization-centric economy. One of the causes of this shift are changes in the way we find people who share our interests, so this article looks at the technology infrastructure for doing that.

Mapping Our Interests

Thanks to Facebook, most of us already know what a “social graph” is. It’s basically a map of the people you know. Build an Internet service around that graph and you get a social network like Facebook or Google+.
An “interest graph” is also a map, but instead of connecting us to people, it connects us to ideas. For example, among other things, I happen to be interested in business, networks, myth, and music by Michael Franti and Dead Can Dance. We can also look at some of my interests by mapping them on a simple interest graph:
Those lines illustrate my interest in these ideas – not my real-world connections to actual objects and people. The line between me and Thomas Jefferson, for example, shows my interest in what he represents, but (obviously) not the personal relationship you’d see in a social graph. Also, that connection to The Matrix says I’m interested in the movie, but nothing about whether I own a physical copy of it (we’ll leave that to the Internet of Things).
Software engineers are developing lots of different ways to build an interest graph. The most obvious is to simply ask people by allowing them to “like” and “plus” things online. There are also ways to infer our interests that are just as powerful, if a bit more tricky. For example, Google might interpret my search for “Thomas Jefferson” as a sign of potential interest in him; and that signal would get a lot stronger the more frequently I do it.
All this commenting, liking, searching and foraging for information on the web leaves our own unique little “pheromone trails” - while capturing of our interest graphs in the software of today’s Internet giants.

Mapping Our Meaning

When it comes to the interest graph, we really are talking about an interest in concepts – representations of people and things, rather than actual people and things. It’s this distinction that will connect our interests to the emerging semantic web, the next big evolution of the web, aimed at infusing meaning into text and other objects as a way to more easily automate connections between ideas.
There are lots of ways that these connections between ideas are formed, but one of the most promising centers on the way we humans interact with search technologies. When I search for “Benjamin Franklin,” “Monticello” and “Thomas Jefferson” around the same time, it suggests a meaningful connection between these terms, and the more people search for these terms together, the stronger that signal becomes.
Google tracks these semantic connections between ideas in what it calls the knowledge graph - and surfaces them through the “people also search for” section of that box you sometimes see in your search results (see picture). The company is essentially using our searches to connect ideas and build its knowledge graph. That’s not the only way they’re doing it, but it’s a great strategy for them because it will be quite difficult for others to replicate.
By connecting ideas together in this way, Google will soon be able to help us discover interests we didn’t even know we had. I might not know I’m interested in Thomas Paine’s writings, simply because I don’t know about them, but Google knows I’m interested in Jefferson and that he’s semantically connected to Paine.
From a more commercial perspective, how about a search engine that knows that when I search for a nearby park, one of the activities people generally do in parks is have picnics? Given that kind of automated understanding, the search engine might show me ads of nearby delis and bakeries with ads tempting me to buy my picnic supplies. Revolutionary marketing? Not really. Any semi-creative marketer would have thought of that, except that, this wasn’t a marketer. It was a machine, and we’re now headed into a world where more and more of that creative insight will be automated by the semantic web.
Where this all gets really interesting though is when it gets connected to our interest graph.

Mapping Our Shared Interests

Some technology observers stretch the term “interest graph” to include other people who share our interests. I think this muddies the picture though. Just mapping people to their interests is a rich enough problem in its own right. We’ve barely scratched the surface here.
So, to get at this connection with others who share our interests, I like the term shared interest graph” because it clearly states what it is: a map of people who share your interests.
At the most basic level, you use a shared interest graph in two ways: 1) finding new interests; and 2) finding new people
When it comes to using the shared interest graph to find new interests, Facebook’s new Graph Search is a slick example. I’m still assessing how relevant my friends’ tastes in music, shows, and books really are to my own tastes. But it’s worth noting that one of my favorite musicians is Michael Franti, and he is at the top of my friends’ collective music list on Facebook.
As for using the interest graph to find new people, Facebook Groups and Google+ Communities are good, concrete examples. I run a “Good Business” community on Google+,  which has helped me meet lots of people who share my interest in “business as a force for good in the world.”
With a shared interest graph, you can also combine finding new people and finding new interests. Music sites like Pandora show you lists of strangers who share your tastes in music. You can then visit their profiles to find new music that you also might like.

Opening Up the Shared Interest Graph

If none of this sounds particularly new or eye-opening to you, it’s because we’ve been working with aspects of the shared interest graph for a decade or more, even if most of us haven’t  known quite what to call it.
Online retailers like Amazon were actually the pioneers in shared interest graph technologies. These companies used the shared interest graph as a kind of crowd-sourced personal shopper for suggesting products we might like based on what they knew of our tastes, and this gave them a powerful edge over traditional retailers.
These earlier pushes into the interest graph and the shared interest graph were all based on proprietary data standards. Amazon, for example, has very detailed data schemas for describing all kinds of products, which they have painstakingly built over the course of many years. I know a little bit about the difficulties here, having years ago run a product team at Microsoft that annually standardized vehicle specifications for all automobile makes and models available in the United States. It was a massive and messy job, and a source of considerable competitive advantage for our car buying service.
But this world of proprietary data schema is changing, thanks to the rise of the semantic web. Take a look at Schema.org, the collaboration between Google, Microsoft and Yahoo to standardize semantic descriptions of things like products,local businesses and many other things. These are fierce competitors, but they collaborate on this problem because they know that the semantic web and standardized schemas will greatly strengthen search operators at the expense of proprietary data masters like Amazon. It’s usually not a good idea to bet against Amazon, but if the semantic web builds sufficient momentum, it may well be forced to open up its product databases to future semantic search engines – or perhaps drastically shift strategies in order to become the semantic search engine itself.
What this means is that our interest graphs could become much more portable. Today, the music I’ve liked on Facebook can’t easily move with me to Google+ or Amazon. If the semantic web unfolds the way many believe it will, that could well change. It’s hard to imagine all this data commoditizing in ways that would enable that kind of portability – especially when you consider the power these players have today. But the history of industry shows that over time, businesses do commoditize – and the semantic web is likely to be a powerful force for that.
Remember too that the semantic web won’t just free our interest graphs from the proprietary data standards of online retailers, it will also help us build links between our interests and other ideas. Today, much of the way we use the shared interest graph is to connect to new interests – usually in the form of finding new products and services to buy. That’s understandable; shopping is where the money is, and software development efforts have flowed accordingly.
But this same infrastructure – the technology of the shared interest graph – has the potential to help us be much more than just better consumers. It has the potential to connect us with other people who share an interest and a stake in what we care about. And I’m betting that from these same seeds will grow something bigger, something that will affect the very nature of the way we work together.