El siguiente podcast fue generado por IA.
Introducción
En la moderna manufactura industrial, el mantenimiento predictivo o Predictive Maintenance (PM) se ha convertido en un factor competitivo decisivo.
Gracias a los vertiginosos avances en el campo de la Inteligencia Artificial (IA), las empresas pueden no solo supervisar el estado de sus instalaciones, sino también predecir con precisión su comportamiento futuro de fallos.
Esta revolución tecnológica se basa en tres pilares inseparables. En primer lugar están los datos, que sirven como materia prima. En un segundo paso, mediante la detección de anomalías y el entrenamiento de modelos, se transforman en conocimientos valiosos. Por último, la inteligencia artificial utiliza estos conocimientos para realizar predicciones fiables. Comprender estas conexiones es el primer y más importante paso hacia un mantenimiento inteligente.
El mantenimiento predictivo no es posible únicamente con datos de series temporales, sino que se beneficia enormemente de la combinación de diferentes categorías de datos para obtener una visión completa de la salud de la máquina.
Campos de aplicación de la Inteligencia Artificial en el servicio de TI y en el mantenimiento predictivo
La Inteligencia Artificial se ha convertido en los últimos años de un tema de investigación en una herramienta de uso práctico.
Especialmente en el servicio de TI y en el mantenimiento predictivo, abre nuevas posibilidades para hacer los procesos más eficientes, precisos y proactivos.
En lugar de reaccionar solo ante las fallas, las empresas pueden con IA detectar anomalías tempranamente, procesar tickets automáticamente, proporcionar conocimiento de forma dinámica y pronosticar con precisión el estado de las máquinas o sistemas de TI.
Los siguientes ejemplos muestran cómo se puede emplear IA en diversas áreas, desde el monitoreo, pasando por el servicio de TI y la gestión del conocimiento, hasta el mantenimiento predictivo.
Muestran las ventajas que surgen cuando se combinan de forma inteligente los datos, el reconocimiento de patrones y la automatización.

Monitoreo
Análisis de causa raíz
Ejemplo: Varios servidores fallan simultáneamente. La IA detecta que no es una coincidencia que fallen todos al mismo tiempo, sino que están conectados al mismo switch.
Cómo: La IA correlaciona datos de topología, p. ej. Configuration Management Database (CMDB) o planos de red, con eventos. Detecta patrones en los que siempre está implicado un dispositivo superior, p. ej. un switch, y lo propone como causa.
Gestión predictiva de la capacidad
Ejemplo: La IA predice que la carga de almacenamiento de un servidor de archivos alcanzará el 95 % en 3 semanas.
Cómo: Modelos de series temporales, p. ej. AutoRegressive Integrated Moving Average (ARIMA) o Long Short-Term Memory (LSTM), extrapolan las tendencias de uso hacia el futuro.
Correlación de alarmas con aprendizaje automático
Ejemplo: En lugar de 500 alarmas por VMs caídas, la IA informa una alarma agrupada „Host de virtualización caído“.
Cómo: El reconocimiento de patrones agrupa alarmas simultáneas y aprende cuáles suelen ocurrir juntas para consolidarlas.
Fusión de sensores
Ejemplo: Un robot de producción envía datos de temperatura, vibraciones y consumo de energía. La IA detecta un sobrecalentamiento inminente del motor.
Cómo: Un modelo combina los datos de los sensores y aprende qué combinaciones de valores provocan fallos.
Ciclos de mantenimiento adaptativos
Ejemplo: En lugar de cambiar el filtro de aceite cada 6 meses de forma fija, la IA detecta que en la máquina A es necesario un cambio solo cada 9 meses.
Cómo: La IA enlaza datos reales de uso con estadísticas de fallos y ajusta dinámicamente los intervalos de mantenimiento.
Gestión de servicios de TI
Priorización automática de tickets según el impacto en el negocio
Ejemplo: Una caída en la tienda online se clasifica inmediatamente como „crítico“.
Cómo: La IA evalúa las dependencias entre sistemas en la Configuration Management Database (CMDB) y las funciones empresariales, y asigna automáticamente la prioridad adecuada.
Predicción del volumen de tickets
Ejemplo: Después de una actualización de software, la IA predice un 40 % más de tickets.
Cómo: La IA analiza volúmenes históricos de tickets en relación con actualizaciones o versiones y crea un modelo de pronóstico.
Bots de asistencia para agentes
Ejemplo: Mientras un usuario o cliente habla por teléfono sobre problemas de la impresora, la IA propone soluciones adecuadas al agente de soporte.
Cómo: La IA convierte voz a texto, busca soluciones adecuadas en bases de conocimiento y las muestra en la herramienta de soporte.
Interfaz de voz y chat
Ejemplo: Un empleado dice: „Mi portátil ya no arranca“. Un voicebot crea automáticamente un ticket.
Cómo: Speech-to-Text + reconocimiento de intenciones (NLP). La IA entiende la expresión, la clasifica en un tipo de ticket y completa los campos.
Evaluación de riesgos de cambios asistida por IA
Ejemplo: Antes de una actualización de la base de datos, la IA advierte que en casos similares se produjeron problemas de rendimiento.
Cómo: La IA compara los cambios planificados con cambios históricos y sus impactos, y a partir de ello calcula un perfil de riesgo.
Gestión del conocimiento
Generación automática de conocimiento
Ejemplo: Tras resolver un problema de red, la IA crea un artículo.
Cómo: La IA (NLP) extrae los pasos de solución del ticket y los formatea como documento de conocimiento.
Búsqueda semántica
Ejemplo: Un agente de soporte pregunta: „¿Cómo soluciono problemas de impresora tras una actualización de Windows?“ La IA encuentra artículos con „Windows Patch“ y „Printer Error“.
Cómo: Embeddings convierten preguntas y documentos en vectores, de modo que se aprovecha la cercanía semántica en lugar de términos exactos.
Recomendaciones contextuales
Ejemplo: Un usuario informa repetidamente de problemas de WLAN. La IA muestra automáticamente todas las soluciones relevantes de WLAN.
Cómo: El sistema vincula el historial del usuario y el contenido de los tickets con casos similares.
Soporte multilingüe
Ejemplo: Un usuario francés busca „Erreur de connexion VPN“. La IA proporciona la solución en alemán en francés.
Cómo: Se integra la traducción automática en la búsqueda de conocimiento.
Análisis de vídeo
Ejemplo: Un usuario sube un vídeo que muestra un funcionamiento irregular de una máquina. La IA detecta un desequilibrio.
Cómo: Computer Vision analiza los patrones de movimiento en el vídeo y los compara con datos de entrenamiento de fallos conocidos.
Mantenimiento predictivo
Detección de desgaste mediante acústica
Ejemplo: La IA detecta un daño incipiente en un cojinete a partir de los ruidos de la turbina.
Cómo: Las señales de audio se transforman en espectros de frecuencia. Modelos de ML detectan desviaciones de los patrones de sonido normales.
Análisis de vibraciones
Ejemplo: La IA predice que un cojinete del motor fallará en 50 horas de funcionamiento.
Cómo: Se comparan datos de sensores con patrones de fallo conocidos y los modelos estiman la vida útil restante.
Supervisión del estado basada en imágenes
Ejemplo: Una cámara detecta pequeñas grietas en la cinta transportadora.
Cómo: Computer Vision compara imágenes en tiempo real con imágenes de referencia y detecta desviaciones
Pronóstico de vida útil restante (RUL)
Ejemplo: La IA calcula que una batería todavía soporta 120 ciclos de carga.
Cómo: Modelos de regresión relacionan ciclos de carga históricos y valores de sensores actuales con perfiles de envejecimiento conocidos.
Optimización de la eficiencia energética
Ejemplo: La IA sugiere usar el compresor B en lugar del A, porque A consume más energía en carga parcial.
Cómo: Reinforcement Learning o algoritmos de optimización comparan patrones de consumo de energía y simulan alternativas.
Visión general de categorías de datos
Para entender la relevancia de los datos y sus diferencias, es útil clasificarlos en categorías individuales y analizar su aplicación directamente en una planta industrial.
Series temporales
Los datos de series temporales son una secuencia de mediciones recogidas en orden cronológico durante un período de tiempo determinado.
Son la categoría de datos más importante en el mantenimiento predictivo, ya que reflejan la evolución dinámica de una instalación y muestran cómo cambia un estado a lo largo del tiempo.
En la industria, los sensores de una máquina de producción miden de forma continua vibraciones, temperaturas y presiones.
Estos flujos de datos conforman una serie temporal.
Así, un aumento repentino de las vibraciones puede indicar un tornillo suelto, mientras que un lento y constante aumento de la temperatura podría señalar desgaste en el cojinete.
Datos operativos
Los datos operativos proporcionan el contexto para los datos de series temporales.
Describen las condiciones de operación, es decir las circunstancias específicas bajo las cuales la máquina está funcionando.
Datos como el tiempo de funcionamiento, la cantidad de producción o la carga actual de una máquina son ejemplos típicos de datos operativos.
Ayudan a interpretar correctamente las mediciones de los sensores.
Un valor alto de vibración es normal bajo plena carga, pero en vacío es una señal de alarma.
Un modelo de mantenimiento predictivo debe contar con esta información para tomar decisiones fundamentadas.
Datos estáticos
Los datos estáticos son información que no cambia con el tiempo.
Proporcionan el contexto básico para los datos dinámicos.
En la industria, se trata de datos como el número de serie, el año de fabricación o las especificaciones técnicas de una máquina.
Estos datos permiten afinar el modelo de IA para distintos tipos de máquinas.
Una predicción para una instalación antigua y muy utilizada difiere de la de una nueva.
Historial de mantenimiento y fallos
El historial de mantenimiento y fallos abarca información sobre eventos pasados como reparaciones, cambio de piezas y averías documentadas.
Es esencial para el entrenamiento de modelos de IA.
Un registro de mantenimiento que documenta cuándo se cambió un cojinete y qué tipo de defecto presentaba es una fecha histórica importante.
Este conocimiento es fundamental para identificar los patrones en los datos de series temporales que preceden a una falla.
A través de la combinación de todas estas categorías de datos, los sistemas de mantenimiento predictivo basados en IA pueden no solo detectar cuándo algo va mal, sino también por qué.
La capacidad de comprender estas relaciones es el primer y más importante paso hacia un mantenimiento inteligente.
Detección de anomalías: la búsqueda de lo inusual
Una vez recopilados los datos, el primer y más importante paso es identificar comportamientos atípicos.
Una anomalía (también llamada valor atípico o desviación) describe un patrón o un punto de datos que difiere significativamente de la mayoría.
Dicha desviación puede ser un indicio de un evento inusual y potencialmente crítico.
No es simplemente una medición errónea, sino una señal que puede señalar un cambio inminente, un defecto o una falla próxima.
Para una IA, comprender las anomalías es esencial.
En lugar de basarse únicamente en umbrales predefinidos, un sistema inteligente aprende el comportamiento “normal” de la máquina.
De este modo, se pueden detectar tempranamente desviaciones sutiles pero críticas que estén por debajo de los umbrales de alarma habituales.
Un aumento repentino de las vibraciones o una caída inesperada de la temperatura son ejemplos de tales anomalías que pueden indicar desgaste incipiente o un defecto inminente.
Para ello, resultan adecuados procedimientos especiales de Machine Learning.
Un modelo de Isolation Forest, por ejemplo, aísla anomalías en un conjunto de datos tratándolas como valores atípicos que requieren pocas “preguntas” para separarse del resto de datos.
En cambio, un autoencoder es una red neuronal que se entrena para reconstruir datos normales.
Cuando se enfrenta a una anomalía, no puede reconstruirla correctamente, lo que produce un alto error de reconstrucción y, por tanto, una señal clara de desviación.
Ingeniería de características: preparar los datos para la IA
Los datos sin procesar de los sensores suelen ser demasiado complejos para que un modelo de IA los procese directamente.
Aquí entra en juego la ingeniería de características.
Es el proceso mediante el cual, a partir de los datos de series temporales en bruto, se extraen características (Features) significativas que el modelo de IA pueda comprender mejor.
Un ejemplo son los datos de temperatura horaria.
Un modelo de IA que solo vea estos valores en bruto puede no ser capaz de reconocer patrones.
Un analista de datos experimentado podría, en cambio, derivar de estos datos nuevas features más relevantes, como por ejemplo la desviación estándar de la temperatura en las últimas 24 horas, que indica la fluctuación, la temperatura máxima o mínima del día anterior o la pendiente de la tendencia de temperatura en la última semana para identificar un aumento lento.
Estas características derivadas son mucho más significativas para la IA que los valores en bruto.
Al incorporar el conocimiento sobre la máquina y su funcionamiento en estos rasgos, se sienta la base para un modelo de predicción potente y preciso.
En resumen, la transición de los datos de sensores en bruto a una comprensión profunda de la máquina es un proceso de dos etapas: primero se detectan anomalías que indican un potencial peligro.
Después, los datos se preparan mediante ingeniería de características para que la IA pueda utilizarlos de forma efectiva.
Solo con estos pasos el tesoro de datos recopilado se vuelve aprovechable para el cerebro del sistema, el modelo de IA.
¿Cómo funciona la ingeniería de características?
La ingeniería de características es el proceso mediante el cual se derivan nuevos rasgos relevantes de los datos de sensores en bruto.
Un modelo de IA que solo vea valores de temperatura horarios puede no reconocer patrones porque carece de contexto.
Un analista de datos experimentado, en cambio, puede extraer nueva información de estos datos.
Algunos de los métodos más importantes para la extracción de features de datos de sensores incluyen características estadísticas.
Para ello, se calculan valores estadísticos simples durante una ventana temporal específica, por ejemplo la media, la desviación estándar o los valores mínimo y máximo.
Por ejemplo, la desviación estándar de los datos de vibraciones en los últimos 10 segundos puede mostrar las fluctuaciones del sistema.
También hay características basadas en el tiempo, donde se extraen rasgos que reflejan la dinámica temporal.
Esto incluye medias móviles, la tasa de cambio o el tiempo que un valor ha estado por encima de un umbral determinado.
Un método avanzado son las características basadas en frecuencia, especialmente utilizadas en datos de vibraciones.
Mediante la Transformada Rápida de Fourier (FFT), los datos de series temporales se convierten al dominio de la frecuencia.
Esto permite identificar frecuencias específicas que indican determinados defectos.
Un pico elevado en una frecuencia determinada puede, por ejemplo, señalar un daño en un cojinete mucho antes de que las vibraciones sean evidentes en el dominio temporal.
Humano contra máquina: ¿quién hace la ingeniería de características?
La ingeniería de características es una mezcla de arte y ciencia.
La pregunta de si la realizan las personas o la IA no se contesta con un simple “o una cosa u otra”.
Tradicionalmente, la ingeniería de características la realizan manualmente científicos de datos y expertos en el dominio, como ingenieros mecánicos.
Estos expertos conocen las leyes físicas de la máquina y saben qué parámetros indican un defecto.
Su conocimiento especializado es indispensable para identificar las características más relevantes, lo que a menudo conduce a los mejores modelos de predicción.
En los últimos años, sin embargo, también han surgido métodos en los que la IA extrae por sí misma las características.
Los modelos de Deep Learning, en especial redes neuronales como autoencoders o LSTMs, pueden aprender directamente de los datos sin procesar qué rasgos son relevantes para la predicción.
Este enfoque reduce el esfuerzo manual y es especialmente útil con datos muy complejos, donde la intuición humana llega a sus límites.
El enfoque más efectivo suele ser híbrido: la experiencia humana señala la dirección e identifica características básicas, mientras la IA aprende automáticamente los patrones más finos y complejos.
Alimentación al modelo
Stündlich werden die Sensordaten gesammelt und daraus die relevanten Features extrahiert. Diese Merkmale werden dann in einer Tabelle zusammengefasst.
| Intervalo de tiempo | Temperatura media (°C) | Desviación estándar de vibración | Pico de frecuencia a 50Hz (amplitud) | Estado (etiqueta) |
|---|---|---|---|---|
| 10:00 | 45.2 | 0.8 | 0.12 | OK |
| 11:00 | 46.1 | 0.9 | 0.15 | OK |
| 12:00 | 46.5 | 1.1 | 0.18 | OK |
| 13:00 | 47.9 | 2.5 | 0.72 | Defecto |
Cómo funciona esta tabla:
- Cada fila es una “observación”, es decir un intervalo de tiempo durante el cual se recopilaron los datos de los sensores.
- Cada columna es un “feature” o característica derivada de los datos en bruto. Son la información procesada que el modelo de IA necesita.
- La columna “Estado” o “etiqueta” es lo que el modelo debe aprender. En los datos de entrenamiento indicamos al modelo en qué valores de los features la máquina estaba “OK” y en cuáles se producía un “defecto”.
El cerebro del sistema: estructura y entrenamiento del modelo de IA
Tras recopilar, preparar y enriquecer los datos cuidadosamente con features, entra en acción el corazón de un sistema de mantenimiento predictivo: el modelo de Machine Learning.
En este punto, el “cerebro” del sistema asume el papel central de aprender de los datos preparados para reconocer patrones ocultos y predecir fallos futuros.
La elección del modelo adecuado es crucial, y el proceso de entrenamiento requiere precisión.
La elección del algoritmo adecuado
Existe una gran variedad de algoritmos de Machine Learning adecuados para el mantenimiento predictivo, pero algunos han demostrado ser especialmente efectivos.
La elección depende en gran medida del tipo de datos y de la complejidad del problema.
Los algoritmos de clasificación son ideales cuando el objetivo es clasificar una máquina como “buena” o “defectuosa”.
Random Forest o Gradient Boosting son una buena elección aquí, ya que son robustos y trabajan bien con features tabulares.
Para datos muy complejos y dinámicos, como los de las series temporales, los algoritmos de Deep Learning suelen ser superiores.
Las redes Long Short-Term Memory (LSTM) son ideales porque pueden entender las dependencias temporales de los datos.
Ellas “recuerdan” patrones que se desarrollan a lo largo de largos periodos, como un aumento gradual de la vibración.
Los autoencoders también son excelentes porque aprenden un modelo del “estado normal” y detectan cada desviación como anomalía.
El proceso de entrenamiento: aprender de datos históricos
El entrenamiento de un modelo de IA es un proceso sistemático en el que el modelo analiza una gran cantidad de datos históricos.
El objetivo es aprender las relaciones ocultas entre los features de entrada y el resultado deseado.
En la práctica se emplean varios enfoques principales.
Aprendizaje supervisado: aprender con etiquetas
Este enfoque se utiliza cuando los datos históricos llevan una etiqueta clara, como “OK” para operación normal o “Defecto” para una avería.
El modelo se entrena con estos datos etiquetados y aprende a distinguir los rasgos de un estado “bueno” de los de uno “malo”.
Los datos preparados se dividen primero en tres partes: datos de entrenamiento, datos de validación y datos de prueba.
La mayor parte de los datos se emplea para entrenar el modelo.
Los datos de validación ayudan durante el entrenamiento a evitar el sobreajuste (overfitting), donde el modelo aprende demasiado bien los datos de entrenamiento y falla con datos nuevos.
Los datos de prueba se usan solo al final para evaluar el rendimiento definitivo del modelo completamente entrenado.
Aprendizaje no supervisado: aprender sin etiquetas
Este enfoque es especialmente relevante para la detección de anomalías, ya que los datos de fallos suelen ser extremadamente escasos.
El modelo se entrena exclusivamente con datos del “estado normal”.
Aprende cómo funciona la máquina en condiciones normales, sin haber visto nunca un fallo.
Un autoencoder es un ejemplo de este tipo de modelo.
Aprende a reconstruir los datos de entrada tan fielmente como sea posible.
Si más adelante se enfrenta a una anomalía que nunca antes ha visto, no puede reconstruirla correctamente.
El alto error de reconstrucción es entonces una señal clara de desviación y, por tanto, un indicio de un posible defecto.
Enfoques híbridos
En la práctica a menudo se utilizan también enfoques híbridos.
El aprendizaje semi-supervisado es especialmente relevante, ya que refleja las condiciones reales en la industria: existe una gran cantidad de datos normales no etiquetados (“OK”), pero muy pocos datos etiquetados de fallos reales (“Defecto”).
El aprendizaje semi-supervisado utiliza la gran cantidad de datos no etiquetados para entrenar un modelo que entiende la estructura y distribución de los datos normales.
A continuación, se emplean los pocos datos etiquetados para perfeccionar la capacidad de predicción de fallos del modelo.
De este modo, el sistema se vuelve más robusto y preciso.
Otro enfoque híbrido es el Reinforcement Learning, que permite al modelo aprender por ensayo y error cómo optimizar las condiciones de operación de una máquina para minimizar el desgaste y alargar su vida útil.
Preentrenamiento vs. ajuste fino
Zero-Shot Learning: aplicar sin entrenamiento
El Zero-Shot Learning es el procedimiento más simple y de menor esfuerzo.
No es un entrenamiento en el sentido tradicional.
En su lugar, se aplica directamente un modelo preentrenado a una tarea, sin necesidad de afinarlo con datos nuevos.
El modelo usa su conocimiento general para realizar una predicción.
Este es el camino más rápido y sencillo.
No requiere datos propios para entrenar, pero suele ser menos preciso que los modelos finamente ajustados.
Ejemplo: Un proveedor ofrece un modelo de series temporales preentrenado para la detección de anomalías en bombas. Una empresa de fabricación puede aplicar inmediatamente este modelo a sus datos de bombas para detectar desviaciones sin necesidad de recopilar primero sus propios datos de fallos ni ajustar el modelo. La aplicabilidad inmediata es la mayor ventaja.
Ajuste fino parcial: la afinación eficiente
El Partial Fine Tuning es un método eficiente para adaptar un modelo preentrenado.
Aquí se congelan las capas de la red neuronal que contienen el conocimiento general del dominio (p. ej. maquinaria industrial).
Solo se entrenan con nuevos datos las capas específicas de la tarea.
A diferencia del Full Fine Tuning, este método requiere significativamente menos potencia de cálculo y datos.
Es un compromiso entre aplicación inmediata y ajuste completo.
Ejemplo: Una empresa utiliza un modelo base entrenado con datos de vibraciones generales de motores. En lugar de ajustar todo el modelo, solo entrena las capas con los datos de una línea de producción específica. Esto permite una adaptación rápida y rentable a nuevas instalaciones.
Ajuste fino completo: la adaptación total
El Full Fine Tuning es una forma costosa de ajuste fino.
En este caso, se toma un modelo preentrenado y se entrena toda la red neuronal con un nuevo conjunto de datos específico de la máquina.
Se ajustan todos los parámetros del modelo, lo que requiere gran potencia de cálculo.
A diferencia del preentrenamiento, no se parte de cero.
En su lugar, se aprovecha el conocimiento general ya aprendido por el modelo base y se refina para una aplicación específica.
En comparación con el Partial Fine Tuning, aquí se ajustan todas las capas del modelo.
Ejemplo: Una empresa energética utiliza un Time Series Foundation Model preentrenado basado en datos de aerogeneradores. Con full fine tuning, adapta el modelo a las condiciones específicas, al clima y al historial de mantenimiento de sus propios parques eólicos para maximizar la precisión de las predicciones.
Preentrenamiento (entrenamiento desde cero)
El preentrenamiento es el método más complejo y que más recursos de computación requiere.
Se entrena un modelo de IA completamente nuevo desde cero con un conjunto de datos muy grande y específico.
El modelo parte sin ningún conocimiento previo y debe aprender por sí mismo todos los patrones y relaciones de los datos en bruto.
Es el enfoque más básico y se diferencia de los demás porque no utiliza modelos existentes como base.
Es lo opuesto al ajuste fino.
Ejemplo: Un gran fabricante de maquinaria con décadas de datos históricos de miles de sus turbinas entrena un modelo propio. El objetivo es crear un modelo que tenga una comprensión profunda y específica del sector sobre el comportamiento de estas turbinas, sin depender del conocimiento general de proveedores externos.
Conclusión
El mantenimiento predictivo y la IA en el servicio de TI están solo al comienzo de su potencial.
Los ejemplos muestran que las empresas ya pueden obtener ventajas claras mediante el uso de técnicas inteligentes.
Desde la detección temprana de anomalías, la automatización de procesos de servicio y hasta predicciones precisas de la vida útil restante de las máquinas, el papel de la IA se vuelve cada vez más crítico para el negocio.
Lo clave es utilizar las fuentes de datos adecuadas, mejorar continuamente los modelos y fomentar la colaboración efectiva entre humanos y máquinas.
De este modo, el mantenimiento reactivo se convierte en una herramienta proactiva y estratégica que reduce costes, evita fallos y asegura ventajas competitivas.
