Caso de estudio | Novartis

Novartis es uno de los exponentes más reconocidos de la industria farmacéutica a nivel mundial. Proveen cientos de miles de soluciones de investigación y desarrollo de medicamentos para atender diferentes tipos de enfermedades. En el caso que conocerás a continuación, exploraremos la necesidad detectada por Novartis que los llevo a querer ayudar a sus equipos de investigación a plantear hipótesis relevantes para el desarrollo de nuevas investigaciones y obtener las respuestas necesarias lo más rápido posible.

Descubrirás cómo el equipo de investigación biomédica de Novartis saca provecho a los grafos y sus propiedades para organizar de forma fácil y rápida grandes volúmenes de datos biológicos para sustentar el proceso de desarrollo de nuevos medicamentos.

Novartis

Novartis es una de las empresas farmacéuticas internacionales más reconocidas del mercado. Su sede central se encuentra en Basilea, Suiza. Esta empresa ofrece soluciones importantes para las necesidades de los pacientes. Además de contar con una de las carteras de productos más importantes del mercado, poseen diversos institutos de investigación Biomédica, que son el brazo necesario para el desarrollo de innovaciones farmacéuticas. En la actualidad estos institutos están conformados por más de 6000 investigadores.

Novartis tiene décadas realizando recopilaciones de información sobre el efecto de diversos compuestos en ciertos tipos de proteínas (como las enzimas) y dispone aproximadamente de mil millones de datos. Aunque la importancia de esa información es más que clara, su envergadura es ínfima en comparación con la asombrosa granularidad de los datos que son recopilados actualmente. En la actualidad, Novartis, utiliza un proceso automatizado que logra capturar datos de imágenes de alto contenido que muestran cómo un compuesto en concreto ha cambiado, afectado o modificado a un cultivo celular completo. Este proceso genera terabytes de datos fenotípicos que deben ser estudiados e interpretados por el personal científico.

En este caso Novartis se enfrentó al reto de combinar sus almacenes de datos históricos y estos nuevos datos en expansión. Adicionalmente tenía que ubicar todos esos datos dentro del contexto  más amplio de investigaciones médicas activas de la actualidad.

El equipo de  Novartis quería hacer de forma eficiente una combinación de todos los datos que integran las bibliotecas médicas PubMed de los institutos de nacionales de Salud de Estados Unidos, que están compuestos por más de 25 millones de sinopsis de al rededor de 5600 publicaciones científicas.

Junto a esta aspiración, también se sumaba el objetivo de capacitar de forma efectiva a los investigadores para realizar las consultas necesarias para conectar todos estos datos en el contexto de las necesidades investigativas del mundo de la salud. La respuesta a estos retos fue posible de alcanzar gracias a los grafos y a Neo4j.

Grafos para conectar datos

La captura y conexión de datos sobre enfermedades, genes y compuestos, así como la identificación de la naturaleza de las relaciones entre esos elementos, para Novartis representa una importante oportunidad para desarrollar más y mejores fármacos. El equipo encargado de este importante reto pretendía vincular genes, enfermedades y compuestos dentro de un patrón triangular que les permitiera evaluar diferentes fármacos y así saber cuál utilizar.

Para llevar a cabo su desarrollo, decidieron crear un Knowledge Graph dentro de Neo4j e idearon un flujo de procesamiento que les permitiera tomar en consideración las investigaciones médicas más recientes. En un inicio la captura de datos es necesario utilizar extracciones de texto para obtener datos relevantes dentro de PubMed.Neo4j toma estos datos junto con los datos históricos de Novartis para ser incluidos en un flujo de procesamiento. En él se rellenan los 15 tipos de nodos establecidos para realizar la codificación de datos.

En una fase siguiente se rellena la información correspondiente a las relaciones entre los nodos. Gracias a este proceso, el equipo de desarrollo logró identificar más de 90 relaciones diferentes.  Esto le permite a Novartis utilizar algoritmos de grafos desarrollados en Neo4j e identificar patrones que correspondan al modelo triangular deseados entre los tipos de datos.

Además el equipo de analistas implementa una métrica que permite identificar cuan estrecha es la relación entre los nodos que componen una de las relaciones triangulares. Usando esta función, también lograron idear consultas que permitieran encontrar datos vinculados por el patrón de nodos deseado, con una magnitud de asociación determinada, y luego ordenar los  triángulos de acuerdo con esta métrica.  Cuando los investigadores consultan el grafo de conocimiento, los resultados muestran  la magnitud de la correlación entre elementos.

Al detectar una correlación estrecha, pueden optar por investigar otras similares, permitiendo así abrir nuevas vías de trabajo de forma rápida.

Avances gracias a los grafos

Neo4j permite a Novartis navegar de manera flexible por todas sus fuentes de datos, lo que  constituye una valiosa ayuda para los procesos de desarrollo e investigación sobre nuevos fármacos. Esto permite adicionalmente la creación de un grafo gigante que aporte elementos científicos sólidos para entender mejor la biología y desarrollar herramientas farmacéuticas más potentes.

El grafo de conocimiento de Neo4j permite captar nuevos elementos necesarios para un sistema de comprensión biológica que crece al mismo ritmo de la expansión de la ciencia médica. Actualmente existen más de 500 millones de relaciones en este grafo y el equipo de Novartis estima que podría llegar a triplicarse en el corto plazo.

Visita más de Grapheverywhere para descubrir todo lo que necesitas saber sobre los grafos.

Share This