ROI por etapas: cómo evaluar innovación sin matar la exploración desde el inicio#
Hay organizaciones que dicen querer innovar, pero en la práctica exigen a cualquier idea naciente el mismo nivel de certeza que le pedirían a una inversión madura. Quieren números cerrados, retorno detallado, riesgos cuantificados, costos operativos completos y proyecciones de escala antes de que la iniciativa siquiera haya probado si resuelve un problema valioso.
Ese enfoque no es prudencia. Es una forma elegante de matar la exploración.
En servicios financieros, esta tensión se vuelve más delicada. Nadie serio propone innovar sin controles, sin disciplina ni sin un caso de negocio. Pero tampoco tiene sentido pedir la misma profundidad financiera en una etapa exploratoria que en una decisión de escalamiento. La medición de innovación, de hecho, distingue entre actividades, esfuerzos y resultados, y la OECD ha insistido en que medir innovación exige marcos y metodologías capaces de capturar distintas dimensiones del proceso, no solo resultados finales.
Por eso, una organización madura no pregunta solo “¿cuál es el ROI?” como si se tratara de una cifra estática. La pregunta correcta es otra: ¿qué tipo de evidencia de valor corresponde exigir en cada etapa?
¿Cómo evaluar el ROI de la innovación sin matar la exploración?#
El ROI de la innovación debería evaluarse por etapas. En exploración temprana no corresponde exigir el mismo nivel de certeza financiera que en un piloto o en una decisión de escala.
Una práctica más madura consiste en medir distinto según la etapa: primero, evidencia de problema y señal de valor; después, evidencia de impacto y viabilidad; y finalmente, evidencia de escalabilidad, sostenibilidad operativa, control de riesgo y retorno económico más completo. La OECD, en el Oslo Manual 2018, distingue entre actividades de innovación y resultados de innovación, mientras NIST, en su AI RMF Playbook, plantea incluso que debe determinarse si un sistema cumple su propósito y si su desarrollo o despliegue debería continuar.
El error más común: tratar toda innovación como si ya estuviera lista para escalar#
Una iniciativa en etapa exploratoria no tiene la misma información que una capacidad probada en producción. Parece obvio, pero muchas organizaciones siguen comportándose como si no lo fuera.
La OECD, a través del Oslo Manual 2018, separa con claridad la medición de actividades de innovación de la medición de innovaciones como resultados. Eso importa mucho porque muestra que innovación no es solo “lo que ya generó resultado económico observable”, sino también el conjunto de actividades de desarrollo, diseño, software, entrenamiento, ingeniería, gestión y aprendizaje destinadas a producir una innovación.
Traducido al lenguaje ejecutivo de una institución financiera: no todo lo que recibe presupuesto de innovación está en la misma etapa, y por lo tanto no todo debe ser medido con la misma vara financiera.
Pedir a una exploración temprana un business case equivalente al de una iniciativa lista para producción suele generar dos efectos tóxicos. El primero es que solo sobreviven ideas conservadoras, cercanas a lo ya conocido. El segundo es que las iniciativas realmente transformadoras se disfrazan con cifras artificialmente precisas para poder pasar por los filtros formales. En ambos casos, la organización pierde.
Medir por etapas no debilita el control; lo vuelve más inteligente#
A veces se piensa que flexibilizar la medición al inicio implica relajar la disciplina. Yo creo exactamente lo contrario.
Medir por etapas no significa renunciar al control. Significa hacer proporcional la exigencia de evidencia al nivel de madurez, inversión, riesgo e impacto potencial. Ese principio de proporcionalidad es coherente con enfoques de gestión de riesgo y supervisión en servicios financieros, donde el BIS, en Digitalisation of finance, ha venido señalando que la digitalización amplía servicios, introduce nuevos actores y acelera el uso de innovaciones digitales también para gestionar riesgos, lo que obliga a considerar nuevas guías o estándares cuando sea necesario.
Además, NIST, en el AI RMF Playbook, plantea una idea muy poderosa incluso fuera del uso exclusivo de IA: debe determinarse si el sistema o iniciativa cumple su propósito y objetivos declarados y si su desarrollo o despliegue debería proceder. Ese lenguaje es útil porque rompe con la falsa dicotomía entre “aprobar todo” o “frenar todo”. Lo correcto es avanzar en ciclos donde la evidencia acumulada justifique la siguiente liberación de esfuerzo, presupuesto o riesgo.
Una forma práctica de pensar el ROI por etapas#
Yo lo estructuraría en cuatro etapas.
1. Exploración: ¿hay un problema valioso y una hipótesis razonable?#
Aquí todavía no corresponde pedir retorno financiero detallado. Lo que sí corresponde pedir es claridad sobre el problema, una hipótesis de valor, el tipo de cliente o proceso impactado, la magnitud potencial del dolor actual y una justificación de por qué vale la pena explorar.
La OECD sostiene que la medición de innovación y transformación digital debe capturar tanto actividades como resultados, y reconoce la necesidad de metodologías comunes para medir impacto, precisamente porque no todo valor aparece con la misma velocidad ni con la misma forma.
En esta etapa, el “ROI” todavía es más estratégico que financiero. Lo que estás financiando no es una capacidad terminada, sino aprendizaje estructurado.
2. Validación: ¿apareció señal de valor real?#
En esta fase ya debería existir evidencia más concreta: reducción de fricción, mejora en tiempo, ahorro parcial, señal de adopción, disminución de abandono, precisión incremental o cualquier métrica intermedia que muestre que la hipótesis inicial tenía fundamento.
Aquí ya no basta el entusiasmo del sponsor. Debe aparecer una señal observable.
NIST, en los recursos de su AI RMF, enfatiza que los propósitos previstos, usos beneficiosos, contexto de despliegue y criterios de medición deben ser entendidos y documentados; además, las métricas y enfoques de medición evolucionan conforme evoluciona el sistema y sus riesgos. Esa lógica de propósito, medición y decisión incremental encaja muy bien con la idea de validar antes de escalar.
3. Piloto: ¿el valor se sostiene bajo condiciones más reales?#
Aquí la exigencia debe subir. Ya no estás evaluando solo una idea, sino una solución en un contexto más cercano a la operación.
En un piloto serio, el análisis debe incluir fricción de integración, costos operativos iniciales, impacto en seguridad, requerimientos de trazabilidad, necesidades de monitoreo, cambios en procesos, entrenamiento, soporte y restricciones regulatorias o contractuales.
El FFIEC, en su IT Examination Handbook – Management Booklet, subraya que la planeación de TI debe identificar, medir y monitorear riesgos y rendimientos de nuevas inversiones, y que el proceso debe considerar costos y beneficios directos e indirectos, incluyendo el costo total de propiedad. Esa mirada es especialmente valiosa en esta etapa, porque el piloto ya no puede evaluarse solo como un experimento simpático: debe empezar a mostrar si el valor sobrevive cuando aparece la realidad operacional.
4. Escalamiento: ¿el retorno sigue existiendo cuando agregas complejidad real?#
Esta es la etapa donde sí tiene sentido exigir un análisis económico más completo. Ya deberías poder modelar beneficios, costos de operación, soporte, licenciamiento, ciberseguridad, integración, gobierno del dato, continuidad, terceros y control de riesgo.
Aquí aparece una pregunta que muchas organizaciones hacen demasiado tarde: ¿el beneficio sigue siendo atractivo cuando incorporas la complejidad estructural que vas a comprar?
El BIS viene advirtiendo que la digitalización financiera trae nuevos proveedores, nuevos canales, nuevas dependencias y nuevas exigencias para la gestión de riesgos y vulnerabilidades. Por eso, una innovación que parecía rentable en PowerPoint puede dejar de serlo cuando toca legacy, procesos operativos, controles y resiliencia.
Un ejemplo realista: una iniciativa de IA en atención al cliente#
Imaginemos una institución financiera que quiere usar IA generativa para asistir a sus agentes de atención.
Si la organización exige desde el primer día un ROI anual exacto, ahorro neto consolidado, proyección cerrada de escalabilidad y matriz completa de costos, probablemente la conversación se va a deformar. O el equipo presentará cifras artificialmente optimistas, o la iniciativa morirá antes de aprender algo útil.
Una aproximación más madura sería distinta.
En exploración, la pregunta sería si hay suficiente fricción en atención como para justificar la prueba y si existe una hipótesis razonable de mejora en productividad o calidad.
En validación, la pregunta sería si realmente se observa reducción de tiempos, consistencia de respuestas o menor carga cognitiva en tareas específicas.
En piloto, la pregunta sería si esa mejora se sostiene con controles, supervisión, privacidad, trazabilidad, gestión de errores y experiencia real del agente.
Y solo al escalar tendría sentido construir un ROI más robusto, incorporando soporte, seguridad, licencias, monitoreo, gobierno y costos de integración.
NIST, en su AI RMF 1.0, deja claro que la gestión de riesgos de IA no es una actividad aislada al final, sino algo que debe gobernarse, mapearse, medirse y gestionarse a lo largo del ciclo de vida. Eso refuerza exactamente esta idea: una decisión madura no exige el mismo tipo de evidencia en todos los momentos.
Lo que suele olvidarse: el ROI no es solo ingreso inmediato#
En organizaciones reguladas, el valor de una innovación no siempre aparece primero como ingreso. A veces aparece como reducción de fricción, menos tiempo de ciclo, mejor calidad de decisión, disminución de errores, menor exposición operativa, mayor capacidad de monitoreo o aprendizaje organizacional reutilizable.
La OECD, en su trabajo sobre medición de la transformación digital, insiste en que el reto no es solo decidir qué medir, sino también cómo medirlo de manera coordinada, porque los impactos digitales son multidimensionales. Esa idea es clave: si solo buscas un ingreso inmediato visible, puedes terminar descartando iniciativas que fortalecen capacidades estratégicas necesarias para competir mejor después.
Esto no significa inflar artificialmente beneficios intangibles. Significa reconocer que, en ciertas etapas, el valor relevante todavía no es monetización neta consolidada, sino reducción de incertidumbre con utilidad estratégica.
Reflexión de Arquitectura#
La peor forma de evaluar innovación es mirar solo el beneficio potencial sin mirar la complejidad estructural que la organización está comprando. Una arquitectura madura no pregunta solo cuánto valor promete una idea. Pregunta también qué dependencias crea, qué excepciones introduce y qué tan sostenible será cuando deje de ser experimento y se convierta en capacidad.
Lo que un CTO debería leer detrás de esta conversación#
Un CTO serio no debería defender innovación sin disciplina financiera. Pero tampoco debería aceptar que todas las iniciativas sean juzgadas con la misma lógica, porque eso suele destruir la opcionalidad estratégica.
Desde la dirección tecnológica, lo importante es diseñar una gobernanza donde el capital se libere por evidencia, no por entusiasmo, pero tampoco por una falsa exigencia de certeza absoluta.
Eso implica tres responsabilidades.
La primera es distinguir exploración, validación, piloto y escalamiento como estados distintos de decisión.
La segunda es acordar métricas adecuadas para cada etapa.
La tercera es impedir que el sistema financiero de aprobación empuje a los equipos a fabricar precisión ficticia para sobrevivir.
NIST incluso lo formula de manera operativa: una organización debe determinar si el sistema cumple su propósito y si debe proceder. Esa forma de pensar es muy útil para el liderazgo tecnológico, porque convierte el ROI en una conversación de gobierno dinámico, no en una cifra rígida usada para matar opciones demasiado pronto.
Reflexión CTO#
La disciplina financiera madura no consiste en exigir certeza total antes de aprender. Consiste en liberar recursos de manera escalonada conforme la organización reduce incertidumbre y demuestra valor. Eso no debilita el gobierno. Lo vuelve más inteligente.
Mi opinión: pedir precisión temprana suele producir ficción, no control#
Aquí vale la pena decirlo sin rodeos.
Muchas veces, cuando una organización exige ROI “completo” demasiado pronto, no obtiene mejor gobierno. Obtiene mejores presentaciones. Obtiene Excel más bonitos. Obtiene números con más decimales y menos verdad.
Y eso es peligroso, porque convierte la conversación de innovación en un teatro financiero donde sobrevive quien mejor sabe vender certeza, no quien mejor sabe construir capacidad real.
Prefiero un modelo donde una iniciativa temprana diga con honestidad: “todavía no puedo prometer retorno consolidado, pero sí puedo comprometer esta hipótesis, estas métricas, este costo acotado de aprendizaje y este criterio explícito para decidir si seguimos o paramos”.
Eso me parece mucho más serio.
Conclusión#
Evaluar el ROI de la innovación no debería significar exigir certeza total antes de aprender nada. Eso no protege a la organización. Solo la vuelve menos capaz de explorar con inteligencia.
En servicios financieros, una aproximación más madura consiste en medir por etapas: primero problema e hipótesis, después señal de valor, luego viabilidad en contexto real y finalmente retorno económico completo bajo condiciones de escala.
La disciplina financiera sigue siendo indispensable. Lo que cambia es la calidad de la pregunta.
Porque en 2026, innovar con criterio no significa financiar ideas por fe. Pero tampoco significa matar opciones valiosas por exigirles, desde el primer día, un nivel de evidencia que solo podría existir después de haber aprendido.
Glosario breve#
ROI (Return on Investment)
Retorno sobre la inversión. En términos simples, compara el beneficio obtenido frente al costo realizado. En innovación, no siempre conviene usar una sola fórmula fija desde el inicio, porque las etapas tempranas todavía están reduciendo incertidumbre.
OECD (Organisation for Economic Co-operation and Development)
Organización para la Cooperación y el Desarrollo Económicos. Publica marcos y estudios de referencia sobre innovación, transformación digital, medición e impacto.
Oslo Manual
Guía de la OECD y Eurostat para medir y entender la innovación. Es especialmente útil porque distingue entre actividades de innovación y resultados de innovación.
BIS (Bank for International Settlements)
Banco de Pagos Internacionales. Aloja, entre otros, documentos del Comité de Basilea y análisis relevantes sobre digitalización financiera y sus implicaciones regulatorias.
NIST (National Institute of Standards and Technology)
Instituto Nacional de Estándares y Tecnología de Estados Unidos. Sus marcos y guías son ampliamente utilizados para gestión de riesgos, ciberseguridad e IA.
FFIEC (Federal Financial Institutions Examination Council)
Consejo Federal de Examinación de Instituciones Financieras de Estados Unidos. Publica guías para supervisión y gestión tecnológica en instituciones financieras.
Referencias#
OECD/Eurostat, Oslo Manual 2018: Guidelines for Collecting, Reporting and Using Data on Innovation
https://www.oecd.org/en/publications/oslo-manual-2018_9789264304604-en.htmlOECD/Eurostat, Oslo Manual 2018 (PDF)
https://www.oecd.org/content/dam/oecd/en/publications/reports/2018/10/oslo-manual-2018_g1g9373b/9789264304604-en.pdfOECD, The OECD Going Digital Measurement Roadmap 2026
https://www.oecd.org/en/publications/the-oecd-going-digital-measurement-roadmap-2026_b455e132-en/full-report/component-3.htmlBIS / Basel Committee on Banking Supervision, Digitalisation of finance
https://www.bis.org/bcbs/publ/d575.pdfNIST, Artificial Intelligence Risk Management Framework (AI RMF 1.0)
https://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdfNIST, AI RMF Playbook
https://airc.nist.gov/docs/AI_RMF_Playbook.pdfFFIEC, IT Examination Handbook – Management Booklet
https://www.ffiec.gov/sites/default/files/media/press-releases/2015/2015-it-examination-handbook-management-booklet.pdf
