Y cada vez más se adopta soluciones nativas en la nube que utilizan microservicios y funciones desagregadas del hardware. La necesidad de evolucionar hacia esa arquitectura es para poder disponer del potencial de las nuevas tecnologías (5G, SDN, AI/ML, Data, Cloud, slicing, etc), y así permitir gestionar la complejidad de los Servicios del futuro, proporcionar una experiencia de cliente personalizada y optimizada en tiempo real, y construir el futuro de la red como servicio.
En ese sentido, en el ámbito de las operaciones de la red y servicios, es importante evolucionar también en el sentido de anticiparse a los problemas y resolverlos automáticamente. Aumentar la agilidad en todos los procesos y gestionar de forma autónoma todo el proceso operativo es una condición “sine qua non” para sobrevivir en el futuro próximo.
En ese contexto, evolucionar del Monitoreo de las redes hacia la Observabilidad de redes y servicios es el camino para plantar cara a ese nuevo desafío.
¿Cuál es la diferencia entre la observabilidad y el monitoreo?
La Observabilidad no reemplaza el monitoreo, sino que aprovecha lo que ya hace el monitoreo, incorpora otras fuentes de datos y los correlaciona de una forma que esas entradas expliquen ciertos comportamientos y estados de la red.
Todo ese entorno que conforma el concepto de la Observabilidad es respaldado por diversas capacidades y herramientas que agrupan una gran cantidad de fuentes de datos muy diversas, incluidas aquellas que provienen de fuera de la red. Ese entorno debe tener la capacidad de seleccionar y mantener un control óptimo sobre un sistema complejo, cambiante y dinámico.
Los entornos de Observabilidad descubren, juntan y agregan información al integrarse con fuentes existentes de monitoreo y otras fuentes, y proporcionan agregación de estos componentes. Fundamentalmente, la Observabilidad se centra en cuatro tipos principales de fuentes de datos:
Una manera más completa para comprender las principales características del Monitoreo y la Observabilidad es comparando aspectos claves que as diferencian. En la tabla comparativa se destacan las características principales que permiten entender las principales diferencias de ambas formas de gestionar redes, sistemas y servicios.
¿Qué es necesario hacer para evolucionar hacia la Observabilidad?
Evolucionar desde el Monitoreo hacia la Observabilidad implica adoptar nuevas herramientas, nuevos desarrollos y principalmente prácticas que proporcionen una visibilidad más completa. Implica una nueva forma de ejecutar el proceso.
Para alcanzar esta evolución, las plataformas de Observabilidad deben integrarse con las herramientas actuales de Monitoreo de Alarmas (Fault Management), y de Rendimiento (Performance Management), además de otras plataformas existentes en los componentes de las aplicaciones y de la infraestructura. A su vez, la compilación de los datos de rendimiento y de fallas tienen que ser de manera continua y en tiempo real. Una vez recopilados los datos, las plataformas de Observabilidad explotan a fondo los datos e informaciones y los correlacionan en tiempo real, permitiendo en ese momento que los equipos entiendan el qué, dónde, el cómo y por qué de cualquier evento o anormalidad que pueda indicar o causar una posible anormalidad.
Los entornos de Observabilidad también incluyen capacidades de AIOps (IA para Operaciones – que comentamos más en detalle a seguir) que adicionan inteligencia en la depuración y ayudan a separar informaciones irrelevantes y ruido del problema real que se quiere solventar, es decir, filtran datos que no están relacionados con la causa-raíz y los excluyen de la solución del problema. Sumado a eso, poder contar con una automatización en los procesos que permitirá la reparación automatizada de la infraestructura y de las aplicaciones, completando de esta manera el ciclo de identificación, diagnóstico y solución de la incidencia. Hay que hacer hincapié que es muy importante contar con un registro fiable, rico en contexto y totalmente correlacionado, ya que esto proporciona una base sólida para una análisis y resolución automática de los problemas.
Finalmente, la transición hacia la Observabilidad requiere un cambio en la cultura organizacional, donde los equipos deben estar capacitados y tener la cultura para utilizar las herramientas y el enfoque que nos ofrece la Observabilidad.
AIOps, un camino que hay que recorrer para tener una Observabilidad consistente
AIOps (Inteligencia Artificial para Operaciones de Redes y Sistemas) es el término que se utiliza para referirse al uso de tecnologías de inteligencia artificial (IA) para automatizar, optimizar y dar inteligencia a la gestión de servicios y flujos de trabajo en operaciones.
AIOps surge como el principal artilugio para capacitar a nuestras áreas de operaciones para gestionar grandes cantidades de datos y centenares de componentes provenientes de múltiples entornos y sistemas.
Como punto de partida, en los contextos de AIOps hay una capacidad impresionante para filtrar la información relevante y de enfocarse en utilizar los datos necesarios que tienen sentido para determinados análisis. Incluso los algoritmos apoyados en la IA son capaces de descubrir problemas ocultos que no son posibles de saber sin el apoyo de ese tipo de técnica.
También están diseñados para ir más allá de la recolección de datos. Su capacidad de correlacionar múltiples fuentes de información en tiempo real, diagnosticar problemas rápidamente y proporcionar una causa raíz para fallos y situaciones de baja performance es inmensa. De hecho, este proceso de diagnóstico y descubrimiento de la causa-raíz es una de las mayores ventajas que se puede sacar del AIOps para agilizar soluciones.
El AIOps también va más allá. Estas herramientas tienen la capacidad de resolver automáticamente los problemas sin la interferencia humana. Cerrando así el ciclo completo de identificación, evaluación y solución. Este enfoque, conocido como “closed-loop”, representa un avance muy significativo en la automatización y la inteligencia operativa de nuestras operaciones.
En definitiva, la aplicación de los conceptos de AIOps no solo mejora la gestión de datos, sino que también garantiza una mayor eficiencia y una resolución de problemas más rápida y precisa, transformando definitivamente la forma que operamos y observamos redes y sistemas.
La gente, el mayor activo para la nueva dinámica de la Observabilidad
Esa senda hasta la Observabilidad nos lleva a pensar que los procesos operativos pasan a ser cada vez más autónomos e inteligentes y, debido a esto, es menor la necesidad que los técnicos toquen la red.
Aquí, también nos vamos acercando al concepto del zero-touch. En esa nueva mentalidad de trabajar cada vez más auxiliado por la inteligencia transforma la forma de trabajar. En ese sentido el cometido principal de las capacidades de las personas en este nuevo ámbito de la Observabilidad es:
- Obtener ventaja en el nuevo mundo de IA para anticiparse al problema y solucionarlo antes que ocurra
- Orientación al servicio y al cliente
- Más rutinas proactivas
- Acercarse al Zero-touch (sistema auxiliado por el humano, y no al revés)
- Busca por perfeccionar continuamente los algoritmos de operaciones
- Cultura DevOps y de aprendizaje continuo