Calculadora MTBF, MTTR y OEE: el trio que define la disponibilidad real
En manufactura — automotriz del Bajío mexicano, alimentos y bebidas en Guadalajara, farma en Toluca, maquila en Juárez y Tijuana, cementeras regiomontanas — el área de mantenimiento dejó de medirse por órdenes de trabajo cerradas y ahora se mide por tres indicadores duros: MTBF, MTTR y OEE. El reliability engineer que no puede responder en minutos cuántos paros no planeados sufrió su línea de envasado el trimestre pasado, cuál fue el tiempo medio entre fallas de la máquina crítica y qué proporción de la capacidad instalada se convirtió en producto vendible, es un reliability engineer que no tiene silla en la mesa de planeación de CapEx ni en el comité de operaciones.
Esta calculadora integra los tres KPIs en una sola pantalla y ejecuta la matemática estándar que Fluke Reliability (eMaint), MaintainX, Fracttal, Tractian y UpKeep tienen en sus plataformas — pero sin lock-in, sin licencia mensual por activo y sin pasar por un demo agendado.
Fórmulas base
MTBF (Mean Time Between Failures) = Tiempo operativo total ÷ Número de fallas MTTR (Mean Time To Repair) = Tiempo total de reparación ÷ Número de incidentes Disponibilidad = MTBF ÷ (MTBF + MTTR) OEE = Disponibilidad × Rendimiento × Calidad
Ejemplo numérico — planta automotriz Tier 1 en Querétaro. Línea de soldadura robotizada, 12 celdas trabajando 7,200 horas/año. 40 fallas registradas, 168 horas totales de paro correctivo. MTBF = 7,200 ÷ 40 = 180 h. MTTR = 168 ÷ 40 = 4.2 h. Disponibilidad = 180 ÷ 184.2 = 97.7%. Rendimiento (velocidad real vs velocidad de placa) = 94%. Calidad (piezas OK vs piezas producidas) = 99.2%. OEE = 0.977 × 0.94 × 0.992 = 91.1%. Está por encima del umbral world-class de 85% que SMRP y Nakajima fijan para manufactura discreta. Si esa misma línea sube su MTTR a 7 h por falta de refacciones, la disponibilidad cae a 96.3% y el OEE a 89.8% — un punto y medio que en automotriz Tier 1 se traduce en 150-300 mil USD anuales de penalización por entrega tardía y horas extra absorbidas.
PM vs CM vs PdM: la regla 80/20 de SMRP
El estándar de la Society for Maintenance & Reliability Professionals (SMRP) y del Plant Engineering Reliability Survey es un ratio PM:CM de 80:20 o mejor. Es decir, al menos 80% de las horas-hombre de mantenimiento deben consumirse en actividades planeadas — preventivas (PM), basadas en condición (PdM, CBM) o predictivas con sensores IIoT — y máximo 20% en correctivas de emergencia (CM).
Las plantas que operan en régimen reactivo puro (70-80% CM) tienen un costo de mantenimiento por unidad producida 3 a 5 veces mayor que las plantas best-in-class, según benchmarks de ARC Advisory y Reliabilityweb. No es opinión: es la aritmética del paro no planeado contra el paro planeado. Un paro preventivo de 2 horas programado en cambio de turno cuesta insumos + mano de obra interna. Un paro correctivo de 2 horas a media línea de producción cuesta eso, más producción perdida, más horas extra del equipo de respuesta, más refacciones expedited por aéreo, más calidad en riesgo en el retake, más penalización si afecta entrega OEM.
Frecuencia óptima de PM — age-based vs condition-based
El modelo clásico age-based PM programa una intervención cada N horas de operación, basándose en la distribución Weibull de fallas del activo. Si el parámetro de forma β es mayor que 1 (desgaste acumulativo típico en rodamientos, fajas, engranes), existe un tiempo óptimo de reemplazo que minimiza el costo total (preventivo + esperanza de correctivo residual). La calculadora estima ese óptimo con la fórmula clásica:
*T ≈ η × [ (β − 1) × Cp ÷ Cf ]^(1/β)**
donde η es el parámetro de escala (MTBF ajustado), Cp el costo de preventivo y Cf el costo de correctivo. Si Cf es 5× Cp y β = 2.3, el óptimo cae cerca del 60-70% del MTBF — no hasta el 100% como muchos planes de PM conservadores asumen, ni al 40% como los planes sobre-cauteloso que desperdician horas-hombre.
El modelo condition-based (CBM) desplaza la lógica: la intervención se dispara cuando un parámetro medido (vibración ISO 10816, temperatura, ultrasonido, análisis de aceite espectrométrico) cruza un umbral. Reduce intervenciones innecesarias hasta 30-50% contra age-based según el Reliability Engineering Handbook y el estándar ISO 13374. Requiere sensores IIoT y un CMMS que los integre — Tractian, MaintainX, Fracttal y Fiix son los proveedores dominantes en LatAm; eMaint, UpKeep y IBM Maximo en NorteAmérica.
Costo del downtime por hora — el puente al lenguaje del CFO
La palanca política del área de mantenimiento es traducir una hora de paro a pesos. La fórmula sanciona lo que el sentido común sabe:
Costo/hora paro = (Costo mano de obra directa + Costo mano de obra indirecta + Producción perdida × margen de contribución + Penalizaciones por contrato + Costo de calidad en arranque)
En automotriz Tier 1 el costo/hora de paro ronda 4,000–12,000 USD/hora según benchmarks de ARC Advisory 2024. En farma cGMP pasa de 30,000 USD/hora por validación de lote y riesgo regulatorio. En alimentos y bebidas de alto throughput (cervecería, refresco, lácteos) oscila entre 8,000 y 25,000 USD/hora. Multiplicar ese número por las horas anuales de downtime evitadas con un programa de PM maduro suele devolver un ROI de 3:1 a 8:1 en el primer año, sin contar extensión de vida útil de los activos ni reducción de inventario de refacciones de emergencia.
Criticidad de activos y priorización
Una planta típica tiene 200–2,000 activos registrados en el CMMS. No todos ameritan el mismo régimen de mantenimiento. La matriz de criticidad cruza frecuencia de falla × severidad del impacto (producción, seguridad, medio ambiente, calidad) y clasifica cada activo en A (crítico), B (importante) o C (no crítico). Los activos A absorben 70-80% del presupuesto de PdM con sensores IIoT y monitoreo continuo; los B siguen un PM por calendario; los C operan run-to-failure si la sustitución es barata y segura. Esta segmentación, alineada a ISO 55000 y SAE JA1011 (RCM), es el otro gran multiplicador de eficiencia que la hoja de Excel aislada no captura.
Diferenciación contra vendor blogs
Los blogs de Tractian, MaintainX, eMaint, Fracttal y UpKeep explican las fórmulas con rigor pero no ofrecen una herramienta interactiva pública; su funnel termina en demo agendado con SDR. World-Class Manufacturing y otros calculadores aislados resuelven un solo KPI. Este simulador cruza los cinco: MTBF, MTTR, disponibilidad, OEE y frecuencia óptima de PM, con costo del downtime y ratio PM:CM como outputs derivados, y entrega la interpretación en el lenguaje que el director de planta lleva al comité financiero.
Conclusión
Para el reliability engineer y el gerente de mantenimiento en planta LatAm, la diferencia entre reportar '40 órdenes de trabajo cerradas este mes' y reportar 'MTBF 180 h, MTTR 4.2 h, OEE 91.1% con costo de downtime evitado de 1.4 MDP en el trimestre' es la diferencia entre un área de gasto y un área de resultados. Esa segunda conversación es la que sostiene presupuesto de CMMS, de sensores IIoT y de capacitación certificada — y la que alinea mantenimiento con el tablero financiero que el consejo realmente mira cada trimestre.