Cualquier ciclo hamiltoniano puede ser convertido en un camino hamiltoniano si se elimina cualquiera de sus aristas, pero un camino hamiltoniano puede ser extendido en ciclo sólo si los vértices de los extremos son adyacentes.
Como todos los grafos completos son hamiltonianos, todos los grafos cuya cerradura sea completa son hamiltonianos. Este resultado se basa en los teoremas de Dirac y Ore.
Sin embargo, existe un resultado anterior a todos estos teoremas.
Como puede verse, este teorema pide más hipótesis que los anteriores ya que la propiedad de los grados debe cumplirse para todo vértice en el grafo.
La centralidad no es un atributo intrínseco de los nodos o actores de una red, como podrían serlo la autoestima, la temperatura, el ingreso monetario, etc. sino un atributo estructural, es decir, un valor asignado que depende estrictamente de su localización en la red. La centralidad mide según un cierto criterio la contribución de un nodo según su ubicación en la red, independientemente de si se esté evaluando su importancia, influencia, relevancia o prominencia.
Ejemplos de un mismo grafo donde se visualizan distintas medidas de centralidad:
A) intermediación
B) cercanía
C) valor propio
D) grado
E) centralidad armónica
F) centralidad de Katz.
Las tonalidades van del rojo (más centrales) al azul (más periféricos).
Medidas de centralidad
Las medidas de centralidad se pueden agrupar en dos categorías:
medidas radiales («radial measures») y
mediales («medial measures»).
6 Las primeras toman como punto de referencia un nodo dado que inicia o termina recorridos por la red, mientras que las segundas toman como referencia los recorridos que pasan a través de un nodo dado.
7 Las medidas radiales a su vez se pueden clasificar en
medidas de volumen y
de longitud, según el tipo de recorridos que consideran. Las primeras miden el volumen (o el número) de recorridos limitados a dicha longitud prefijada, en tanto que las segundas miden la longitud de los recorridos necesarios para alcanzar un volumen prefijado.
7
Desde la formulación realizada por Bavelas,
2 se han propuesto diversas medidas de centralidad de un nodo. Existen cuatro de estas medidas que son ampliamente usadas en análisis de redes:
- La centralidad de grado («degree centrality»)
- La cercanía («closeness»)
- La intermediación («betweenness»)
- La centralidad de vector propio («eigenvector centrality»).
La primera y la última son medidas radiales de volumen. La segunda es una medida radial de longitud, y la tercera una medida medial.
7 Para algunas de estas medidas existen a su vez versiones más generales o bien generalizaciones para las redes con pesos.
8
Adicionalmente, se puede distinguir entre las medidas «absolutas» de centralidad, que indican un valor no comparable y aquellas que están normalizadas, denominadas medidas «relativas» de centralidad.
Centralidad de grado
La
centralidad de grado («degree centrality») es la primera y más simple de las medidas de centralidad.
7 Corresponde al número de
enlaces que posee un nodo con los demás.
Formalmente, dado un
grafo , donde
es su conjunto de
vértices y
su conjunto de
aristas, entonces para cada nodo
su centralidad de grado
se define como:
7
Si se tiene la
matriz de adyacencia del grafo, donde cada posición
asume el valor 1, si existe la arista
y el valor 0, si no existe, entonces la centralidad de grado de cada nodo
se puede definir como:
Para
grafos dirigidos, se pueden definir dos medidas de centralidad de grado diferentes, correspondientes al
grado de entrada o el de
salida. En el sentido de relaciones interpersonales, el primero puede interpretarse como una medida de popularidad, mientras que el segundo como una de sociabilidad.
Dos criterios para normalizar esta medida pueden ser dividir el grado de cada nodo por el máximo grado obtenido de la red, o bien dividirlo por el número total de nodos de la red.
Las interpretaciones de esta medida pueden ser múltiples. En una
red social, puede ser el número de amistades o conexiones que posee cada persona, en cuyo caso cuantifica la conectividad o popularidad en la red. En una red de infección puede medir el
grado de riesgo de ser contagiado o el índice de exposición. En la propagación de un rumor, puede medir la probabilidad de obtener la información a través de un rumor.
Centralidad de camino-K
El grado de un nodo puede verse como el número de
caminos de longitud 1 que lo conectan con otros nodos. Una generalización natural a la centralidad de grado, es la
centralidad de camino-K («K-path centrality») que para cada nodo mide el número de caminos de largo
a lo más que lo conectan otros nodos.
7
Centralidades de Katz y Bonacich
Otra generalización de la centralidad de grado es la
centralidad de Katz,
9 que para un nodo cuenta el número de todos los otros nodos que están conectados con él a través de un
camino, al mismo tiempo que se penalizan las conexiones con nodos más distantes por medio de un factor
.
Formalmente, sea
la
matriz de adyacencia del grafo, y
el número total de nodos, la centralidad de Katz
de un nodo
se define como:
7
donde
es un vector fila cuyo
-ésimo elemento es 1 y el resto son 0, y
1 es un vector de puros unos. Como se verá más adelante, esta medida está relacionada con la
centralidad de vector propio.
7
Una pequeña variación de la centralidad de Katz está dada por la
centralidad de Bonacich,
10 la cual permite valores negativos para el factor
:
De este modo el peso negativo permite restar los caminos de número par de los de número impar, lo cual es interpretable en redes de intercambio.
7 6
Centralidad de Hubbell
Una generalización que incluye a las centralidades de Katz y Bonacich es la
centralidad de Hubbell,
11 definida formalmente como:
donde
es una matriz e
un vector. Si
y
se obtiene la centralidad de Katz, y si
y
, se obtiene la centralidad de Bonacich.
7
Cercanía
La medida de
cercanía, definida por el matemático Murray Beauchamp en 1965
12 y luego popularizada por Freeman en 1979,
3 es la más conocida y utilizada de las medidas radiales de longitud. Se basa en calcular la suma o bien el promedio de las
distancias más cortas desde un nodo hacia todos los demás.
7
Formalmente, la cercanía
de un nodo
se define como:
donde
es la
matriz de distancias de la red, es decir, aquella
matriz cuyos elementos
corresponden a la
distancia más corta desde el nodo
hasta el nodo
. Mientras menor sea el valor anterior, se puede decir que el nodo está más «cercano» al centro de la red. En tal caso definido así corresponde en realidad a una medida de
lejanía. Por la misma razón, a veces la cercanía se define más bien como el
valor recíproco de lo anterior, no cambiando por ello la idea del concepto.
13
En una
red de flujo esta medida se puede interpretar como el tiempo de llegada a destino de algo que fluye a través de la red.
1 También puede interpretarse como la rapidez que tomará la propagación de la información desde un nodo a todos los demás.
14 La cercanía mide de alguna forma la accesibilidad de un nodo en la red. Este concepto es utilizado también de manera similar en
topología (donde se define como un
espacio métrico) y en
teoría de grafos, donde se aplica entre otros campos al
análisis de redes.
Variantes de cercanía
La medida tradicional de cercanía asume que la propagación de información siempre se da en la red a través del camino más corto. Este modelo puede no ser el más realista para algunos tipos de escenarios de comunicación. Por ello han surgido algunas variantes de esta medida.
Una de ellas es la denominada
cercanía por camino aleatorio («random-walk closeness centrality») introducida por Noh y Rieger en 2003 y que considera recorridos aleatorios para acceder de un nodo a los demás, en lugar de escoger siempre el camino más corto.
15
Varios años antes, en 1989, Stephenson y Zelen definieron una variante de medida de centralidad enfocada en el traspaso de
información («information centrality») en una red. Esta medida determina la longitud
media armónica de los
caminos que acaban en un nodo
, la que será pequeña si
se conecta con muchos otros nodos a través de caminos cortos.
16
En 2006, Dangalchev modifica la definición de cercanía para medir la vulnerabilidad en las redes, permitiendo analizar grafos desconectados (en la definición original, los nodos aislados del grafo tendrían una cercanía igual a cero):
17
En 2010 Opsahl propuso otra extensión de la medida para redes con componentes desconectadas.
18
Intermediación
Las tonalidades que van desde el rojo (valor 0) hasta el azul (valor máximo) indican la intermediación de los nodos en el grafo.
La
intermediación («betweenness centrality») es una medida que cuantifica la frecuencia o el número de veces que un nodo actúa como un
puente a lo largo del camino más corto entre otros dos nodos.
7
La medida fue introducida por Linton Freeman en 1977, como forma de cuantificar el control de un humano en la comunicación existente con otros humanos en una
red social. La idea intuitiva es que si se eligen dos nodos al azar, y luego también al azar uno de los eventuales posibles caminos más cortos entre ellos, entonces los nodos con mayor intermediación serán aquellos que aparezcan con mayor probabilidad dentro de este camino.
19
Formalmente, la intermediación
de un nodo
en una red se define como:
7
donde
es el número de
caminos más cortos desde el nodo
hasta el nodo
, y
el número de caminos más cortos desde
hasta
que pasan a través del nodo
.
Los nodos con una alta intermediación, al igual que las aristas con una alta intermediación en los
lazos interpersonales (tema que no tiene que ver directamente con centralidad y que no abordaremos aquí), suelen jugar un rol crítico en la estructura de la red, cuando hay grandes flujos de información que son transportados por nodos pertenecientes a grupos compactos. En una
red social están relacionados con los
agujeros estructurales («structural holes»), es decir, con aquellos nodos de los que depende la integración de algunas componentes de la red.
7 Los nodos que poseen una posición de intermediarios de alguna manera son también controladores o reguladores del flujo de información. Así, en un
proceso de difusión, si el valor de intermediación de un nodo es alto entonces puede actuar como un
broker; y si es suficientemente alto como para controlar el flujo de información, entonces puede actuar como un
guardián.
Intermediación de Newman
Newman propuso en 2005
14 una versión alternativa de la medida de intermediación, basada en considerar caminos aleatorios del grafo, y no exclusivamente los más cortos. La idea es tomar en cuenta todos los caminos posibles, y calcular la medida de acuerdo a los elegidos aleatoriamente. Formalmente se define como:
7
donde
es la matriz cuyos elementos
contienen la
probabilidad de ocurrencia de un camino al azar desde
hasta
y que contiene al nodo
como nodo intermediario.
Centralidad de vector propio
La
centralidad de vector propio mide la influencia de un nodo en una red. Fue propuesta por Phillip Bonacich en 1972,
21 y corresponde al principal
vector propio de la
matriz de adyacencia del grafo analizado.
7
Intuitivamente, los nodos que poseen un valor alto de esta medida de centralidad están conectados a muchos nodos que a su vez están bien conectados, también en este sentido; por lo tanto, son buenos candidatos para difundir información, divulgar rumores o enfermedades, etc. Los nodos más centrales en este sentido corresponden a centros de grandes grupos
cohesivos. Mientras que en el caso de la centralidad de grado, cada nodo
pesa lo mismo dentro de la red, en este caso la conexión de los nodos pesa de forma diferente.
El cálculo del
PageRank de
Google, utilizado para medir la relevancia de
páginas web en
Internet, es una variante de esta medida.
22 Otra medida muy relacionada con esta es la
centralidad de Katz, debido a que la centralidad de vector propio es el
límite de la centralidad de Katz cuando el factor
se aproxima a
por debajo,
7 6donde
es el
valor propio obtenido de la ecuación
.
En general habrá varios valores propios para los cuales existe una solución de vector propio. Sin embargo, el requerimiento adicional de que las entradas de los vectores propios sean positivos implica (por el
Teorema de Perron-Frobenius) que sólo los mayores valores propios conduzcan a la medida de centralidad deseada.
23 El
método de las potencias es uno de los muchos
algoritmos existentes para calcular el valor propio que puede ser utilizado para encontrar el vector propio dominante.
22 Además, este puede generalizarse tal que las entradas en la matriz de adyacencia
puedan ser números reales representrando fuerzas de conexión, como en una
matriz estocástica.
Centralidad de Contribución (o basada en disimilaridades)
Esta es una metodología relacionada con el uso de medidas de disimilaridad (propias de la teoría de clasificación y de la minería de datos) a fin de retro-alimentar medidas de centralidad ya existentes en redes complejas. En
24 se ilustra la metodología usando autocentralidad (o centralidad de vector propio), calculando la centralidad de cada nodo a través de la solución del problema de autovectores:
donde
(producto coordenada a coordenada) y
es una matriz de disimilaridades arbitraria, definida a través de una medida de disimilaridad, e.g. la disimilaridad de Jaccard:
donde esta medida nos permite cuantificar la contribución topológica de cada nodo (que es la razón por la que estas medidas son llamadas centralidades de contribución) en una red dada, teniendo más peso/relevancia aquellos nodos con mayor disimilaridad, puesto que estos permiten a un nodo dado acceder a aquellos nodos a los que no pueden acceder directamente.
Cabe destacar que
es no-negativa puesto que
y
son no-negativas, de manera que podemos aplicar el teorema de Perron Frobenius para asegurar que el problema de autovectores anterior tiene una única solución no-negativa para
, permitiéndonos inferir la centralidad de cada nodo en la red. Por lo tanto, la centralidad del i-ésimo nodo estará dada por
donde
es el número de nodos en la red. Varias redes y medidas de disimilaridad han sido probadas
25 , obteniéndose en todos los casos excelentes resultados.
Centralidad alfa
La
centralidad alfa es una variante de la centralidad de vector propio en que los nodos están sujetos a distinta importancia dependiendo de factores externos. Esta medida fue definida por Bonacich y Lloyd en 2001.
26
Esta medida está implementada en la
biblioteca de un
software de análisis de redes sociales denominado «igraph», y se utiliza para especificar la importancia relativa de factores endógenos vs. exógenos en una determinación de centralidad al momento de analizar o visualizar una red.
No hay comentarios:
Publicar un comentario