Casos de estudio | AirBnB y los grafos

Airbnb es una de las plataformas más conocidas en el mundo. El crecimiento de esta plataforma ha sido muy interesante, pero como puede esperarse a menudo, el crecimiento trae consigo algunos retos importantes. Esta plataforma experimento algunas dificultades dentro de la gestión de sus datos y utilizando las bondades de los grafos a través de Neo4j pudieron desarrollar un sistema de gestión de datos maestros muy sencillo y rápido.

A continuación, descubrirás más sobre como Airbnb logró aprovechar sus datos para crear mejores procesos.

Airbnb en crecimiento

Airbnb es una plataforma que ofrece soluciones inteligentes para el mercado de turístico. Gracias a esta plataforma podemos conectar con millones de arrendadores que ofrecen experiencias diferentes al sector hotelero. Además, podemos realizar reservaciones y contratar alojamientos de corto plazo. En Airbnb podemos configurar los filtros de búsqueda para encontrar inmuebles de diferentes características en más de 65.000 ciudades en 191 países.

Gracias a la innovación, flexibilidad y prestación eficiente de servicios, Airbnb ha crecido de forma muy rápida, en el año 2018 se estimaba que el valor de la empresa ascendía a más de 31.000 millones de dólares. Pocas Startup logran establecerse en tan corto tiempo. Actualmente cuentan con más de 20 oficinas internacionales y más de 3500 empleados directos. Como era de esperarse, el crecimiento financiero, de personal y de alcance de la marca no viene solo.

airbnb

Los recursos de datos internos y externos también incrementan de forma exponencial; lo que en algún punto puede volverse un aspecto restrictivo e inmanejable, especialmente si están diseminados entre varias plataformas. En cierta medida, fue una de las conclusiones de uno de los ingenieros de software de Airbnb. Un estudio interno de la empresa desarrollado por John Bodley determino que los datos de Airbnb estaban siendo almacenados en ubicaciones restringidas y que carecían de un contexto adecuado para su análisis.

El problema de Airbnb

La enorme cantidad de datos que estaban recibiendo sin poder analizar correctamente, disminuía la ventaja operativa de la empresa. Al poseer 200.000 tablas agrupadas en un almacén de datos principal, 10.000 gráficos y  Dashboards Superset;  6.000 experimentos en métricas, más de 6.000 libros de trabajo y gráficos Tableau y más de 1.500 puntos de conocimientos. Era muy díficil encontrar respuestas. En el estudio que realizaron pudieron detectar que había un alto nivel de dependencia entre los empleados a la hora de encontrar respuestas a las consultas que realizaban, afectando dramáticamente la productividad.

Por más capacitación que tuviera algún empleado de la empresa, los datos no estaban democratizados y se hacia casi imposible contar con resultados totalmente confiables y fiables. Para eso, nació el proyecto de creación de dataportal. Bodley y su equipo ideo un espacio de autoservicio de datos integrado que ofrece una visión contextual y global de los datos de Airbnb para que los empleados puedan navegar de forma rápida y fácil al momento de solucionar consultas de trabajo.

El equipo de desarrollo liderado por Bodley determino que la herramienta  requería cuatro características principales: búsqueda, contexto y metadatos, datos centrados en la plantilla y datos centrados en los equipos.  Adicionalmente entendieron que las conexiones de las relaciones entre cada recurso de datos y sus metatipos correspondientes serían de gran utilidad para proporcionar valor a los usuarios a través de datos funcionales y disponibles siempre que fuesen requeridos.

Airbnb

Dataportal

La solución desarrollada a través de dataportal permite aprovechar diversidad de recursos (tablas de datos, dashboards, informes, usuarios, equipos, resultados empresariales, etc.), cada uno con sus propios niveles de contexto y conexión. El quipo de Bodley en Airbnb entendieron de forma rápida que el ecosistema de datos que tenían bajo sus manos era ideal para ser presentado de forma visual a través de grafos.

Al entender esto, la decisión de trabajar con Neo4j fue realmente fácil. Bodley tomo en cuenta la agilidad de los sistemas de Neo4j y su gran capacidad de integración para desarrollar una solución que cambiaria para bien el rendimiento de la administración de datos de airbnb. Dataportal ha sido pensado para ser un motor de búsqueda de recursos de datos, donde las interacciones rápidas, detalladas y precisas contribuyen a fomentar la exploración. Neo4j, ayuda en este caso a buscar relaciones y conexiones en cuestiones de segundos dentro de los millones de datos que integran las bases de datos de Airbnb.

Un detalle realmente interesante es que la flexibilidad de Neo4j le permitió adaptarse a la tecnología ya existente. Airbnb poseía una infraestructura tecnológica basada en Elasticsearch y Python. Gracias a la utilización de Flask, como un marco web ligero en Python se pudo alimentar la API, que es coherente con varias de las herramientas de datos de Airbnb. En este caso Dataportal también utiliza React y Redux.

Gracias a este desarrollo basado en Neo4j, Airbnb logró unificar todo su ecosistema de datos y hacerlo apto para  búsquedas, relevantes y fiables, incluso para empleados recién llegados e inexpertos. Lograron evitar la dependencia interna a nivel de consultas, elevaron el nivel de productividad de los empleados y sobre todo tienen la garantía de escalamiento de Dataportal gracias a su funcionamiento basado en grafos.

Para conocer más casos de estudios sobre grafos, visita más de Grapheverywhere.

Share This