My favorites | Sign in
Project Home Downloads Wiki Issues Source
Search
for
Taller_pajek  
Updated Nov 2, 2010 by mariluz....@gmail.com

#Taller de Pajek

Introducción

Pajek (Pajek significa araña en esloveno) es un programa para visualizar y analizar grandes redes. Fue desarrollado por Vladimir Batagelj (matématico) y Andrej Mrvar (sociólogo). Se empezó a desarrollar en noviembre 1996 y se implementó en Delphi (Pascal).

Tiene una documentación extensa y un libro titulado Exploratory Social Network Analysis with Pajek (Structural Analysis in the Social Sciences

Funciona sobre plataformas Windows y es muy usado dentro del entorno de análisis de redes sociales. Se puede descargar el en su página de downloads

Características

  • Permite seleccionar la forma y tamaño del nodo
  • El color se utiliza en función del formato de exportación del gráfico
  • Tiene un conjunto de atributos configurables como el font, el color de y tamaño del font, etc.. La información se encuentra en el manual de pajek en punto 5.3 Exporting pictures to EPS/SVG – defining parameters in input file (page 72).
  • Es posible generar grafos en el tiempo.

Data Set

Desde los Tweets obtenidos del pasado mundial de Baloncesto se han creado un conjunto de relaciones basadas en la mención, es decir los nombres de usuarios Twitter que aparecen en el texto del tweet. Dado que el tamaño de la red podría ser demasiado grande para la práctica se han seleccionado los nodos más mencionados y los nodos más activos. De estos dos conjuntos solo hay un elemento que está en ambos y que es @turkey2010, el community manager de la web del campeonato

Visualización

Datos de entrada

Los datos de entrada están en formato aquí

Se han generado automáticamente desde los tweets seleccionados del Turkey2010 de la manera más sencilla posible. Se ha tratado de aplicar los atributos más necesarios para mejorar la visualización de la red.

Se ha adoptado un convenio de color, tamaño de los nodos, tamaño de las fechas y timestamp:

  • Los nodos rojos son los más mencionados y los verdes los más activos twiteando.
  • El tamaño de los nodos depende del número de enlaces entrantes y salientes.
  • El tamaño de los arcos depende del número de menciones entre los dos nodos.
  • A cada nodo se le asocia el timestamp de su primera aparición en la red
  • Al conjunto de menciones entre cada par de nodos se le asocia el timestamp de su primera aparición.
  • Se han eliminado los nodos que no tenían ninguna mención

Layouts

  • Circular Estructura circular de los nodos con enlaces entre ellos.
  • Energy Kamada-Kawai es un layout spring model que busca la mínima energía entre nodos.
  • Energy Fruchterman-Reingold es un layout spring nodel que utiliza springs solo en los nodos conectados con un flecha y fuerzas repulsivas con el resto de los nodos.

Formatos Salida

No exporta a los clásicos formatos de imágenes como jpg, png y gif, solo al formato bmp.

  • Exportación en 2D:
    • EPS/PS
    • SVG (las imágenes SVG pueden ser abiertas con el programa InkScape para mejorar su presentación)
    • bmp
  • Exportación en 3D:
    • 3XD
    • VRML

Práctica

Bajar el fichero .NET y arrancar programa

  1. Bajar el fichero NET: turkey2010_top_mentions.net
  2. Abrir el programa pajek.exe
  3. Leer la red (File >Network > Read > Abrir fichero turkey2010_mentions.net )
  4. Seleccionar opción de menú Draw > Draw
  5. Ajustar Opciones de Visualización
    • Seleccionar Options > Size > Of Vertices Defined in Input File
    • Seleccionar Options > Color > Vertices > As Defined in Input File
  6. En la ventana de Draw seleccionar Layout > circular > original (se verán muchos nodos que no tienen conexión, aunque no estaban en el fichero de entrada)

Seleccionar solo los nodos que tiene conexión

Los nodos que no tienen relaciones con otros no son relevantes. Para eliminar las entidades que pudieran estar aisladas y mejorar los resultados del análisis, se ejecutan los comandos:

  • Net > Partitions > Degree > All
  • Operations > Extract from Network > Partition > 1-*
  • Seleccionar opción de menú Draw > Draw
  • En la ventana de Draw seleccionar Layout > circular > original (Se verán solo los nodos que tienen conexión).

Visualizar los distintos layouts

En la ventana de Draw, seleccionar los distintos layouts y observar las diferencias entre las visualizaciones.

  • Energy Kamada-Kawai

  • Energy Fruchterman-Reingold

Visualizar en 3D

Visualización realizada por Victor Caballero, asistente al curso. El detalle de esta visualización los podéis encontrar en su blog.

También ha realizado una interesantísima visualización de las líneas del metro de Madrid que explica con todo detalle

Visualizar en el tiempo

Volver a la ventana principal y ejecutar el comando

  • Net > Transform > Generate in Time > all
    • Primer timestamp: 1
    • Ultimo timestamp: 17
    • pasos: 1
  • Seleccionar la red de time 1 (desplegable de networks)
  • Ir a la ventana de Draw y observar como la red va creciendo con el tiempo con la opción de next

Exportar

Exportar a los distintos formatos de salida desde la ventana de Draw

  • Exportar a SVG la la serie temporal del grafo
    • Situarse en a red de tiempo 1
    • Seleccionar layout circular
    • Activar la opción Export > 2D > SVG > Current and All subsequent
    • Exportar a SVG Export > 2D > SVG > General

Debe generar un conjunto de páginas html que llevarán incrustado la imagen SVG, en la que se podrá navegar hacia adelante y hacia atrás, como en esta página

Guardar el trabajo realizado

  • File Pajek Project File > Save

Sign in to add a comment
Powered by Google Project Hosting