Las redes complejas son representaciones de conjuntos importantes de datos. Estas redes están conformadas por cientos de miles e incluso millones de datos contenidos en poderosas herramientas de representación de información, es decir, están representadas en grafos.
A continuación, conoceremos un poco más sobre como sacar el máximo provecho a algunos algoritmos que nos permitirán entender los datos contenidos en redes complejas mediante la detección de comunidades..
Redes complejas
Como ya se ha mencionado, las redes complejas suelen ser representadas como grafos que contienen nodos y aristas que los conectan. En estos grafos pueden existir conjuntos de diversos tamaños, pero con datos en común que conforman comunidades de datos. Normalmente estas comunidades de datos no son simples de determinar, pues como sabemos, la información que pueden contener los grafos es gigantesca y mientras más datos analizamos más difícil es su análisis.
Las comunidades dentro de las redes complejas dentro de los grafos pueden ser definidas como vectores a los cuales se le asigna un valor que nos permite desarrollar los cálculos para estimar el tamaño. En una comunidad debemos encontrar que los vértices de la misma están más relacionados entre si, que con el resto de los vértices que conforman el grafo.
Existen diferentes criterios cuantitativos de evaluación para concluir que es una comunidad. Estos pueden ser criterios de definiciones locales que toman en cuenta la estructura interna de la comunidad en si, dejando de lado el resto del grafo o definiciones globales, donde se evalua la totalidad de la estructura.
Métodos para evaluar y detectar comunidades en redes complejas
Métodos de modularidad
Los métodos de modularidad se basan en la implementación de un algoritmo conocido como Newman – Girvan. Este se basa en la idea de que una distribución en cluster no es lo que se espera de forma aleatoria en una red, y por tanto, se trata de cuantificar la intensidad de esta estructura de comunidades comparando la densidad que existe en el grafo sobre cada vértice y fuera de cada comunidad, con la densidad que se esperaría que estuviera distribuido de forma aleatoria dentro de la red.
Este modelo de análisis estadístico debe ser alimentado de un modelo nulo que especifique lo que se espera por azar en modo de hipótesis. Esto debido a que su planteamiento parte de la base de que la distribución de grados de los nodos de un grafo son una propiedad intrínseca de la red y proponen un modelo nulo siguiendo este principio.
La modularidad posee una característica muy útil que no solamente indica qué tan buena es una partición mediante valores positivos, sino que también puede describir qué tan malo puede ser el agrupamiento de datos mediante valores negativos.
Información Mutua Normalizada
Este método conocido como Información Mutua Normalizada o NMI, mide los resultados en relación a los que deberían haber sido. Dentro de los grafos existe una categoría conocida como grafos sintéticos que permite manejar como debería estar organizada y distribuida la red. Podemos determinar cantidad de vértices y aristas, lo que nos permite conocer bien las estructuras de las comunidades.
El método NMI mide esta información contrastando los resultados de algoritmo versus los resultados que deberían haber sido según la configuración del grafo sintético.
Redes complejas solapadas
Una red o comunidad solapada es aquella donde dentro de un grafo, cualquier nodo puede pertenecer a varias comunidades o grupos de comunidades dependiendo de sus características. Un ejemplo perfecto para entender este tipo de comunidades son las redes sociales. Un usuario podría ser un nodo dentro de un grafo y según sus intereses o características puede pertenecer a diferentes bloques o comunidades.
Este tipo de redes complejas posee métodos similares para calcular y detectar sus comunidades. Entre el que se destaca una aplicación de extensión de modularidad. En este caso las comunidades sufren una superposición. La fuerza de apego de un nodo por una de las comunidades a las que pertenece puede ser más alta que en el resto. Por eso con la aplicación de un algoritmo similar al de modularidad Newman – Girvan podemos entender en cual de todas las comunidades a las que pertenece un nodo, es más influyente.
Esperamos que esta información sea de utilidad para comprender un poco más sobre las redes complejas.
Visita más de Grapheverywhere para conocer todo lo que debes saber sobre la detección de comunidades.