El titulo puede engañar. Parece un libro para quien diseña bases de datos o servicios de backend, no para quien pasa el dia entre Linux, redes, Kubernetes o plataformas. Sin embargo, muchas de las decisiones que una persona de infraestructura opera cada dia ya estaban tomadas por alguien que eligio como guardar, replicar, ordenar y recuperar datos.
Cuando una aplicacion distribuida se comporta de una forma extraña, casi siempre hay una historia de tiempo y de verdad por debajo. Un nodo sabe algo que otro aun no sabe. Una escritura fue confirmada en un lugar y todavia no en otro. Un reintento convierte una accion aparentemente inocente en una operacion duplicada. Designing Data-Intensive Applications, de Martin Kleppmann, da lenguaje a esas escenas.
Lo que cambia al operarlo
En Kubernetes es facil pensar que si los pods vuelven a arrancar, la aplicacion ya esta recuperada. DDIA obliga a hacer preguntas menos comodas: ¿que estado necesitan?, ¿que consistencia esperan?, ¿que ocurre cuando la red parte el sistema en dos y ambos lados siguen vivos? La alta disponibilidad no es tener mas replicas; es saber que promesa se mantiene cuando una replica se queda atras.
En infraestructura para IA el libro vuelve a aparecer por otra puerta. Datasets, checkpoints, feature stores y resultados no son un decorado alrededor de la GPU. Son datos voluminosos que deben moverse, versionarse y recuperarse. Una plataforma de calculo espectacular puede quedarse esperando si el dato llega tarde o si nadie puede explicar cual version produjo un resultado.
Una lectura con paciencia
Este no es un libro de recetas. Se disfruta cuando uno se detiene en una idea y la relaciona con una operacion vivida: una migracion, una cola bloqueada, un backup que nunca se restauro, una inconsistencia que aparecio solo bajo carga. Yo lo leeria con un cuaderno al lado, anotando no definiciones sino preguntas para los sistemas que ya administras.
DDIA enseña algo que combina muy bien con la infraestructura explicada desde dentro: las abstracciones son utiles, pero un dia fallan y entonces conviene saber que contrato intentaban ocultar.
Ficha oficial: informacion de la edicion publicada por O’Reilly en Designing Data-Intensive Applications.
Conversacion
Se el primero en comentar