Métricas

Únete a una sesión de seminario web de habilitación

Explora y regístrate para las sesiones de habilitación de Foundation para métricas personalizadas. Aprende cómo las métricas personalizadas te ayudan a rastrear los KPI de tu aplicación, como el número de visitantes, el tamaño promedio del carrito de compras, la latencia de las solicitudes o la distribución del rendimiento para un algoritmo personalizado.

REGÍSTRATE

Esta es una introducción a las métricas en Datadog y por qué son útiles. Esta sección incluye los siguientes temas:




Descripción general

¿Qué son las métricas?

Las métricas son valores numéricos que pueden rastrear cualquier aspecto de tu entorno a lo largo del tiempo, desde la latencia hasta las tasas de error y los registros de usuarios.

En Datadog, los datos de métricas se ingieren y almacenan como puntos de datos con un valor y una marca de tiempo:

[ 17.82,  22:11:01 ]

Una secuencia de puntos de datos se almacena como una serie temporal:

[ 17.82,  22:11:01 ]
[  6.38,  22:11:12 ]
[  2.87,  22:11:38 ]
[  7.06,  22:12:00 ]

Cualquier métrica con marcas de tiempo en fracciones de segundo se redondea al segundo más cercano. Si hay puntos con la misma marca de tiempo, el punto más reciente sobrescribe los anteriores.

¿Por qué son útiles las métricas?

Las métricas proporcionan una visión general de tu sistema. Puedes utilizarlas para evaluar la salud de tu entorno de un vistazo. Visualiza cuán rápido los usuarios están cargando tu sitio web, o el consumo promedio de memoria de tus servidores, por ejemplo. Una vez que identifique un problema, puede utilizar registros y seguimiento para investigar más a fondo.

Las métricas que rastrean la salud del sistema llegan automáticamente a través de las integraciones de Datadog con más de 1,000 servicios. También puede rastrear métricas que son específicas de su negocio, también conocidas como métricas personalizadas. Puede rastrear cosas como el número de inicios de sesión de usuarios o los tamaños de carrito de usuarios hasta la frecuencia de los commits de código de su equipo.

Además, las métricas pueden ayudarle a ajustar la escala de su entorno para satisfacer la demanda de sus clientes. Saber exactamente cuánto necesita consumir en recursos puede ayudarle a ahorrar dinero o mejorar el rendimiento.

Enviando métricas a Datadog

Las métricas se pueden enviar a Datadog desde varios lugares.

  • Integraciones soportadas por Datadog: las integraciones de Datadog 1,000+ incluyen métricas listas para usar. Para acceder a estas métricas, navega a la página de integración específica para tu servicio y sigue las instrucciones de instalación allí. Si necesita hacer seguimiento de una instancia de EC2, por ejemplo, debe ir a la documentación de integración de Amazon EC2.

  • Puedes generar métricas directamente dentro de la plataforma de Datadog. Por ejemplo, puedes contar los códigos de estado de error que aparecen en tus registros y almacenarlo como una nueva métrica en Datadog.

  • A menudo, necesitarás rastrear métricas relacionadas con tu negocio (por ejemplo, el número de inicios de sesión de usuarios o registros). En estos casos, puedes crear métricas personalizadas. Las métricas personalizadas se pueden enviar a través del Agente, DogStatsD o la API HTTP.

  • Además, el Agente de Datadog envía automáticamente varias métricas estándar (como el uso de CPU y disco).

Para un resumen de todas las fuentes y métodos de envío de métricas, lee la documentación de Tipos de Métricas.

Tipos de métricas y visibilidad de métricas en tiempo real

Tipos de métricas

Datadog soporta varios tipos de métricas diferentes que sirven para distintos casos de uso: count, gauge, rate, histograma y distribución. Los tipos de métricas determinan qué gráficos y funciones están disponibles para usar con la métrica en la aplicación.

El Agente de Datadog no realiza una solicitud separada a los servidores de Datadog por cada punto de datos que envías. En su lugar, informa los valores recopilados durante un intervalo de tiempo de flush. El tipo de métrica determina cómo se agregan los valores recopilados de tu host durante este intervalo para su envío.

Un tipo de conteo suma todos los valores enviados en un intervalo de tiempo. Esto sería adecuado para una métrica que rastree el número de visitas al sitio web, por ejemplo.

El tipo tasa toma el conteo y lo divide por la longitud del intervalo de tiempo. Esto es útil si le interesa el número de visitas por segundo.

Un tipo de gauge toma el último valor reportado durante el intervalo. Este tipo tendría sentido para rastrear el uso de RAM o CPU, donde tomar el último valor proporciona una imagen representativa del comportamiento del host durante el intervalo de tiempo. En este caso, usar un tipo diferente como conteo probablemente llevaría a valores inexactos y extremos. Elegir el tipo de métrica correcto asegura datos precisos.

Un histograma reporta cinco valores diferentes que resumen los valores enviados: el promedio, conteo, mediana, percentil 95 y máximo. Esto produce cinco series temporales diferentes. Este tipo de métrica es adecuado para cosas como la latencia, para las cuales no es suficiente conocer el valor promedio. Los histogramas le permiten entender cómo se distribuyeron sus datos sin registrar cada punto de datos individual.

Una distribución es similar a un histograma, pero resume los valores enviados durante un intervalo de tiempo a través de todos los hosts en su entorno. También puede elegir reportar múltiples percentiles: p50, p75, p90, p95 y p99. Puede aprender más sobre esta poderosa característica en la documentación de Distribuciones.

Consulte la documentación de tipos de métricas para obtener ejemplos más detallados de cada tipo de métrica e instrucciones de envío.

Consultando métricas

Puede visualizar sus métricas y crear gráficos en Datadog: en Explorador de Métricas, Tableros o Cuadernos.

Consejo: Para abrir la página de Resumen de Métricas desde la búsqueda global de Datadog, presione Cmd/Ctrl + K y busque metrics.

Aquí hay un ejemplo de una visualización de series temporales:

Un gráfico de series temporales muestra una métrica de latencia representada por una sola línea azul con varios picos.

Este gráfico de líneas traza la latencia (en milisegundos) experimentada por los usuarios en el eje y contra el tiempo en el eje x.

Visualizaciones adicionales

Datadog ofrece una variedad de opciones de visualización para ayudar a los usuarios a graficar y mostrar fácilmente sus métricas.

Una consulta métrica consiste en los mismos dos pasos de evaluación para comenzar: desglose temporal y desglose espacial. Consulte la anatomía de una consulta métrica para más información.


Además, Datadog tiene muchos otros tipos de gráficos y widgets para visualizaciones. Puede aprender más sobre ellos en la serie de blogs de Datadog sobre gráficos métricos.

La experiencia de graficar es consistente, ya sea que uses tableros, notebook o monitors. Puede crear gráficos utilizando la interfaz del editor de gráficos o modificando directamente la cadena de consulta sin procesar. Para editar la cadena de consulta, use el </> botón en el extremo derecho.

Anatomía de una consulta métrica

Una consulta métrica en Datadog se ve así:

Consulta de ejemplo con secciones codificadas por color

Puede descomponer esta consulta en algunos pasos:

Nombre de la métrica

Primero, elija la métrica específica que le gustaría graficar buscando o seleccionándola del menú desplegable junto a Metric. Si no está seguro de qué métrica usar, comienza con Metrics Explorer o un notebook. También puedes ver una lista de métricas reportadas a Datadog en la página de Metrics Summary.

Filtra tu métrica

Después de seleccionar una métrica, puedes filtrar tu consulta según las etiquetas. Por ejemplo, puedes usar account:prod para delimitar el contexto de tu consulta e incluir solo las métricas de tus servidores de producción. Para más información, lee la documentación de etiquetado.

Configura la agregación temporal

A continuación, elige la granularidad de tus datos utilizando la agregación temporal. En este ejemplo, has definido que hay un punto de datos por cada hora (3600 segundos). Puedes elegir cómo deseas agregar los datos en cada intervalo de tiempo. Por defecto, se aplica avg, pero otras opciones disponibles son sum, min, max y count. También puedes personalizar cómo se agregan y agrupan los datos de tus métricas con funciones o modificadores en la aplicación. Por ejemplo, si deseas aplicar max y personalizar cómo se agrupan y agregan tus datos de métricas en el tiempo con consultas alineadas al calendario, usarías .rollup(max, 60). Para más información, consulta la documentación de Functions, Rollup y In-application modifiers.

Configura la agregación de espacio

En Datadog, “espacio” se refiere a la forma en que se distribuyen las métricas entre diferentes servidores y etiquetas. Hay dos aspectos diferentes del espacio que puedes controlar: agregador y agrupamiento.

Agregador define cómo se combinan las métricas en cada grupo. Hay cuatro agregaciones disponibles: sum, min, max y avg.

Agrupamiento define qué constituye una línea en el gráfico. Por ejemplo, si tienes cientos de servidores distribuidos en cuatro regiones, agrupar por región te permite graficar una línea para cada región. Esto reduciría el número de series temporales a cuatro.

Aplicar funciones (opcional)

Puedes modificar los valores de tu gráfico con funciones. Esto puede significar realizar operaciones aritméticas entre un entero y una métrica (por ejemplo, multiplicar una métrica por 2). O realizar operaciones aritméticas entre dos métricas (por ejemplo, crear una nueva serie temporal para la tasa de utilización de memoria así: jvm.heap_memory / jvm.heap_memory_max).

Agregación de tiempo y espacio

Agregación de tiempo y agregación de espacio son dos componentes importantes de cualquier consulta. Porque entender cómo funcionan estas agregaciones te ayuda a evitar malinterpretar tus gráficos, estos conceptos se explican con más detalle a continuación.

Agregación de tiempo

Datadog almacena un gran volumen de puntos, y en la mayoría de los casos no es posible mostrar todos ellos en un gráfico. Habría más puntos de datos que píxeles. Datadog utiliza la agregación de tiempo para resolver este problema combinando puntos de datos en intervalos de tiempo. Por ejemplo, al examinar cuatro horas, los puntos de datos se combinan en intervalos de dos minutos. Esto se llama un rollup. A medida que el intervalo de tiempo que has definido para tu consulta aumenta, la granularidad de tus datos disminuye.

Hay cinco agregaciones que puedes aplicar para combinar tus datos en cada intervalo de tiempo: sum, min, max, avg y count.

Es importante recordar que la agregación de tiempo se aplica siempre en cada consulta que realices.

Agregación de espacio

La agregación de espacio divide una métrica única en múltiples series temporales por etiquetas como servidor, contenedor y región. Por ejemplo, si quisieras ver la latencia de tus instancias de EC2 por región, necesitarías usar la funcionalidad de agrupamiento de la agregación de espacio para combinar los servidores de cada región.

Hay cuatro agregadores que se pueden aplicar al usar la agregación de espacio: sum, min, max y avg. Usando el ejemplo anterior, supongamos que tus servidores están distribuidos en cuatro regiones: us-east-1, us-east-2, us-west-1 y us-west-2. Los servidores en cada región necesitan ser combinados utilizando una función agregadora. Usar el agregador max resultaría en la latencia máxima experimentada entre los servidores en cada región, mientras que el agregador avg daría como resultado la latencia promedio por región.

Consultas anidadas

Agregue capas adicionales de agregación sobre los resultados de consultas existentes en tiempo y espacio con consultas anidadas en la interfaz de usuario o a través de la API. Para más información, consulta la documentación de Nested Queries.

Vea información en tiempo real sobre métricas

La Metrics Summary page muestra una lista de las métricas reportadas a Datadog en un intervalo de tiempo especificado: la última hora, día o semana. Las métricas pueden ser filtradas por nombre de métrica o etiqueta.

Haz clic en cualquier nombre de métrica para mostrar un panel lateral de detalles con información más detallada. El panel lateral de detalles muestra información clave para una métrica dada, incluyendo sus metadatos (tipo, unidad, intervalo), el número de métricas distintas, el número de servidores reportando, el número de etiquetas enviadas y una tabla que contiene todas las etiquetas enviadas sobre una métrica. Ver qué etiquetas se están enviando sobre una métrica te ayuda a entender el número de métricas distintas que se reportan desde ella, ya que ese número depende de las combinaciones de los valores de sus etiquetas.

Nota: El número de métricas distintas reportadas en el panel lateral de detalles en Metrics Summary no define tu factura. Consulta tus usage details para un cálculo preciso de tu uso durante el último mes.

Consulta la documentación de Metrics Summary 22 para más detalles.

Lectura adicional