Buenas prácticas en Grafana

28/09/2022 Rodrigo Alonso Aviles

Grafana es la G del stack EFG (Elasticsearch-Fluentd-Grafana). Una vez que un artefacto envía trazas de logs a Fluentd, quien filtra y transforma dichos datos, los mismos son indexados en Elasticsearch. Grafana se encarga de consumir las trazas de Elasticsearch para monitorizar en un entorno gráfico muy avanzado y con múltiples posibilidades.

Configuración avanzada de Fluentd

La configuración básica de Grafana en Kubernetes se puede encontrar en el artículo sobre Configuración en Kubernetes que escribimos previamente.

Configuración en Kubernetes

En esta entrada vamos a hablar de algunas de las posibilidades básicas que ofrece Grafana. En todo momento se describen escenarios reales que se han dado durante el trabajo llevado a cabo en 2020Q3-4.

Escenario de estudio

Se asume que Grafana está correctamente instalado y corriendo en un servidor. En esta documentación se explica cómo hacerlo correr en Kubernetes.

Se asume un escenario en el que se han indexado en Elasticsearch, previo paso por Fluentd, logs estructurados en formato JSON. El trabajo realizado para que los logs queden correctamente indexados y parseados en Elasticsearch se asume como conocido. Los artículos que explican las configuraciones en las que dicho flujo llega a Elasticsearch son:

Configuración Avanzada de Fluentd.

Configuración Avanzada de Elasticsearch.

Cada uno de los campos de la estructura JSON representan una clave en la traza básica indexada en Elasticsearch. Veámoslo en un ejemplo básico desgranando el input y output.

Input

En este ejemplo se supone que hemos enviado desde un artefacto Springboot vía Fluentd a Elasticsearch la siguiente traza:

Output

En Grafana, el ejemplo de la traza anterior se visualizaría de la siguiente forma:

Podemos observar tres partes:

Metainformación: información de control e identificación indexada por Fluentd y Elasticsearch.

Mensaje original: es el texto en JSON que se genera en el artefacto Java y que se conserva hasta el final. Cabe mencionar que Fluentd puede hacer que el mensaje en el formato original no se indexe en Elasticsearch.

Campos parseados: como hemos dicho, cada campo del mensaje original es parseado y almacenado independientemente en la traza de Elasticsearch. Esto es lo que luego nos permitirá hacer búsquedas, mostrar resultados, agrupar, etc.

Datasource

Como es lógico, a nuestro aplicativo Grafana debemos decirle dónde debe buscar el origen de los datos. Grafana permite multitud de Datasources, pero nosotros nos centramos en Elasticsearch, como elemento básico de nuestro stack EFG.

Para configurar el datasource, debemos seguir estos pasos:

Configuración > Data Sources.

Click en botón «Add Datasource».

Seleccionamos Elasticsearch.

Rellenamos los datos de nuestro servidor Elasticsearch. Los más importantes son:
1. HTTP: por defecto: http://elasticsearch-host:9200
2. Auth: credenciales de seguridad, si las tuviese.
3. Elastic details: en este cuadro es muy importante especificar correctamente la versión de Elasticsearch a la que va a atacar Grafana.

Una vez rellenos todos los datos básicos, click en «Save & Test».

Dashboards

Un Dashboard es un conjunto de paneles visuales que muestran diferentes juegos de la información de forma gráfica. En Grafana los dashboards gráficos son muy versátiles, permitiendo crearlos y agruparlos de diferentes formas, así como añadir varios gráficos a los mismos.

Como extensión de la sección «Explore», que veremos después, es una de las características más potentes de la herramienta, ya que te permite crear configuraciones fijas de gráficos que proporcionan la información deseada en un simple vistazo, además la posibilidad de crear «playlists» (paneles que van rotando automáticamente) o «snapshots».

El manejo visual de los dashboards es lo suficientemente intuitivo como para no necesitar una explicación adicional. Como decíamos, esa versatilidad es uno de sus fuertes, pero la verdadera potencia reside en el motor que tiene por debajo, el generador de queries, que es de donde salen los datos que se muestran en los dashboards. Esto es lo que vamos a ver extensamente en la siguiente sección.

Exportación

Los dashboards son especialmente útiles cuando queremos exportar los datos a Excel, CSV, etc.

Para hacerlo, hay que seguir los siguientes pasos:

Pulsar sobre el título del panel que representa los datos a exportar.

Seleccionar Inspect  > Data.

En el panel que aparece a la derecha, seleccionar el formato en el que se quiere exportar y pulsaremos en «Download CSV».

Explore

Como decimos, la potencia de Grafana reside en el generador de queries, que se encuentra en la sección Explore. Cabe aclarar que lo mismo que encontramos en Explore lo encontraremos también en la parte de los dashboards, pero podemos considerar Explore como un «campo de entrenamiento» con el que generar queries que luego llevaremos al dashboard para montar las representaciones visuales deseadas.

Por defecto, la herramienta Explore se carga con una búsqueda general que muestra los resultados en los formatos Histograma y Tabla para las muestras de la última hora.

Analizamos las diferentes partes de la imagen:

En la esquina superior derecha está el rango de tiempo para el que se configura la búsqueda. El mismo se puede seleccionar a través del propio selector de la parte superior de la pantalla o bien seleccionando con el ratón un rango en el histograma.

A la izquierda del selector de rango temporal, hay un botón que permite dividir la pantalla en dos, lo que es útil para comparar dos queries.

El área rotulada con un «1» representa el generador de queries como tal. Un poco más adelante entramos en su detalle.
El área rotulada con un «2*» es la representación gráfica en histograma de la muestra solicitada. En este caso inicial, es una simple cuenta de trazas por unidad de tiempo.
El área rotulada con un «3*» es la representación en forma de tabla del mismo resultado. Cada fila representa en este caso las trazas cada 20 centésimas.
Los paneles de resultados (2 y 3) cambian su formato y layout en función de qué información sea solicitada en el generador de queries. No se representa de igual forma las trazas de logs, que un panel de tiempos que un histograma. Lo veremos un poco más en detalle cuando hablemos del generador de queries.

* Nótese que la imagen representa una búsqueda que no ha obtenido resultados.

Generador de queries

El generador de queries es la parte superior de la pantalla. En él se configuran las búsquedas como tal. El mismo está compuesto por:

Query: permite introducir queries sobre los campos indexados en Elasticsearch. La sintaxis es la descrita por el proyecto Apache Lucene (Query Parser Syntax).

Volvamos al ejemplo en el que tenemos los siguientes campos mapeados:

Una posible query a introducir en el campo Query, que obtendría la traza de la imagen, entre posiblemente muchas otras es:

launchId:PREG100516294948 AND startTime:[1608114410000 TO 1681608114420000]

Metric: en este campo se selecciona la métrica que queremos representar, a aplicar sobre los datos que se obtengan de la query. Los diferentes valores son los de la siguiente imagen. A continuación, detallamos los más utilizados:

Aquellos que se aplican sobre campos numéricos requieren la selección adicional del campo sobre el que se quiere aplicar la métrica. Por ejemplo, si se selecciona Average, se habilitará un campo a la derecha de este en el que se da a elegir entre los diferentes campos numéricos que se encuentran en la traza indexada.

Una excepción es el valor Count (el primero de la lista), que no requiere seleccionar el campo adicional, ya que se trata de contabilizar por unidad de tiempo el número de trazas encontradas según la query especificada en Query.

Otro de los valores relevantes que se pueden escoger en el campo Metric es «Logs». Este es el valor que hay que seleccionar si queremos entrar en el contenido completo de las trazas. Por aclararlo, en este artículo hay una imagen recurrente a la que acudimos frecuentemente. Pues bien, dicha imagen es el detalle de una traza completa, y se obtiene poniendo el mencionado valor «Logs» en el campo Metric. Como se ve en la imagen a continuación, se obtiene un listado estructurado de todas* las trazas que cumplen una determinada query y, al pulsar sobre una de ellas, se despliega el detalle de la misma:

* Quede claro que esta visualización en formato «Logs» tiene un límite establecido. Para ver cualquier traza, hay que encontrarla acotando correctamente la búsqueda en el campo Query.

Group by: la mayoría de las métricas que se pueden seleccionar según lo explicado en el punto anterior, por defecto tienen un output en forma de histograma (puntos por unidad de tiempo):

El campo Group by permite agrupar esos valores obtenidos en base a un criterio de agrupación.

En la imagen anterior podemos ver cómo los valores obtenidos para la media (average) del campo executionTime ya no están plasmados en un histograma, sino que en su lugar se muestra una tabla. Cada fila representa un valor distinto del campo seleccionado para agrupar (methodName.keyword), estableciendo para cada uno de ellos cuál es la media de executionTime.

Tanto executionTime como methodName son dos claves existentes en cada traza indexada en Elasticsearch.

El generador de queries tiene muchas posibles configuraciones más, como la visualización del histórico de queries, el inspector y numerosas opciones según las métricas y agrupaciones escogidas. También permite crear varias queries (+ Add query), que mostrarían sucesivamente varios paneles de resultados (uno por cada query configurada).

Imagen de cabecera: Grafana.

✍🏻 Author(s)

Rodrigo Alonso Aviles

See author's posts

Cookie	Duración	Descripción
__cfruid	session	Cloudflare sets this cookie to identify trusted web traffic.
connect.sid	1 day	This cookie is used for authentication and for secure log-in. It registers the log-in information.
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent	1 year	Records the default button state of the corresponding category & the status of CCPA. It works only in coordination with the primary cookie.
JSESSIONID	session	The JSESSIONID cookie is used by New Relic to store a session identifier so that New Relic can monitor session counts for an application.
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Cookie	Duración	Descripción
pll_language	1 year	The pll _language cookie is used by Polylang to remember the language selected by the user when returning to the website, and also to get the language information when not available in another way.
ugid	1 year	This cookie is set by the provider Unsplash. This cookie is used for enabling the video content on the website.

Cookie	Duración	Descripción
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gat_gtag_UA_127650363_5	1 minute	Set by Google to distinguish users.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.
CONSENT	2 years	YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.

Cookie	Duración	Descripción
VISITOR_INFO1_LIVE	5 months 27 days	A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC	session	YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.

Cookie	Duración	Descripción
atlassian.account.ffs.id	1 year	No description available.
atlassian.account.xsrf.token	session	No description available.
cloud.session.token	past	No description
pvc_visits[0]	1 hour	This cookie is created by post-views-counter. This cookie is used to count the number of visits to a post. It also helps in preventing repeat views of a post by a visitor.
SESSION	session	No description

Escenario de estudio

Input

Output

Datasource

Dashboards

Exportación

Explore

Generador de queries

✍🏻 Author(s)

Rodrigo Alonso Aviles

También te puede gustar

Ejecutar una aplicación Spark con StreamSets

IoT de estar por casa: Conectando un sensor con la Onesait Platform (parte 1)

IoT de estar por casa; conectando un sensor con la Onesait Platform (parte 3)

Deja una respuesta Cancelar la respuesta