May 24, 2026 2 min Libros

Systems Performance: aprender a mirar antes de optimizar

El libro de Brendan Gregg importa porque cambia la pregunta: antes de tocar configuracion, pide evidencia del sistema que esta sufriendo.

Hay una escena que cualquier persona de infraestructura reconoce. Una aplicacion va lenta y, antes de mirar nada, empiezan las soluciones: subamos CPU, aumentemos memoria, reiniciemos el pod, cambiemos el limite. A veces funciona durante unas horas. Lo peligroso es que creemos haber entendido el problema solo porque dejo de doler.

Systems Performance, de Brendan Gregg, es el libro que pone freno a ese reflejo. No se lee para memorizar herramientas. Se lee para construir un orden mental: demanda, utilizacion, saturacion, latencia y errores; CPU, memoria, filesystem, disco, red. El sistema deja de ser una caja negra y se convierte en un conjunto de pistas.

Por que vale para este sitio

Este libro tiene una afinidad especial con Linux, contenedores e infraestructura para IA porque todos esos mundos comparten una trampa: miramos demasiado arriba. En Kubernetes vemos un Pod reiniciando, pero debajo puede haber presion de memoria o espera de I/O. En un servidor de inferencia vemos GPUs caras, pero el cuello puede estar en datos que no llegan, en la red o en la cola de peticiones.

Gregg insiste en una costumbre sana: antes de culpar a un componente, formula una hipotesis que puedas observar. Si sospechas CPU, no basta con un porcentaje promedio; necesitas entender run queues, off-CPU time y por que el trabajo espera. Si sospechas red, una grafica de throughput no te cuenta por si sola donde se acumula la latencia.

Como lo leeria

No intentaria leerlo de portada a portada como una novela. Empezaria por el modelo de analisis y luego llevaria cada capitulo a una maquina real. Abrir un servidor Linux, ejecutar las herramientas que describe y provocar una carga pequena enseña mas que subrayar veinte paginas. Un buen ejercicio es observar primero un sistema sano; sin una linea base, todo grafico parece sospechoso cuando estas nervioso.

Tambien es un libro para volver. El capitulo que hoy parece lejano se vuelve imprescindible el dia que un nodo pierde rendimiento o una aplicacion empieza a esperar sin explicar por que. Esa es la diferencia entre un manual desechable y una lectura que te acompaña durante años.

La leccion que yo guardaria no es un comando. Es una disciplina: mirar evidencia antes de hacer cambios. En un campo lleno de capas y automatizacion, esa costumbre sigue siendo una ventaja enorme.

Ficha oficial: Brendan Gregg mantiene la informacion de la segunda edicion y material complementario en Systems Performance, 2nd Edition.

Conversacion

Se el primero en comentar