Skip to main content
Key Takeaways

Brecha organizacional: La principal barrera para el despliegue de IA no es técnica, sino la falta de infraestructura organizativa.

Cambio en el juicio: Las organizaciones deben pasar del juicio individual al colectivo para mejorar la toma de decisiones de los sistemas de IA.

Importancia de la gobernanza: Implementar propiedad y auditoría claras para que los sistemas de IA sean responsables y los errores se aborden adecuadamente.

Redefinición de valor: Reformular las métricas de valor de la velocidad hacia la precisión y la calidad en la toma de decisiones, mejorando la integración de la IA.

Factores de éxito en pilotos: Resultados claros, propiedad definida y objetivos de TI-negocio alineados son críticos para el éxito de pilotos de IA.

Según el estudio de Tendencias Tecnológicas Emergentes 2025 de Deloitte, el 30% de las organizaciones están explorando la IA agentiva y el 38% están pilotando soluciones. Pero solo el 11% están usando estos sistemas en producción.

La brecha no es de preparación técnica. Los modelos funcionan. Los datos existen. Las herramientas son accesibles. Lo que falta es la infraestructura organizacional: la gobernanza, la asignación de responsabilidades y los sistemas de incentivos que hacen seguro delegar decisiones a la IA.

Los equipos que logran pasar de la fase piloto a producción realizan tres cambios específicos. Ninguno es principalmente técnico.

Keep Reading—and Keep Leading Smarter

Create a free account to finish this piece and join a community of forward-thinking leaders unlocking tools, playbooks, and insights for thriving in the age of AI.

Paso 1 de 3

Name*
Este campo está oculto cuando se visualiza el formulario

Cambio uno: redefinir el juicio como capacidad organizacional

La mayoría de las organizaciones trata el juicio como una habilidad personal que reside en la mente de los empleados sénior. Dos personas pueden manejar el mismo caso de manera distinta y nadie puede explicar por qué. No existe una manera de mejorar el proceso de forma sistemática porque la responsabilidad de las decisiones de IA permanece indefinida.

Ahmed Zaidi, CEO de Accelirate, se encontró con este patrón mientras trabajaba con un gran sistema hospitalario. El equipo de 15 enfermeras encargado de redactar cartas de apelación de denegación de reclamaciones para las compañías de seguros parecía seguir un proceso sencillo. A primera vista, el trabajo parecía fácil de codificar.

Lo que rápidamente se volvió conflictivo fue que en realidad no existía 'un' proceso,” dice Zaidi. “Cada enfermera había desarrollado su propia estrategia a lo largo de años de experiencia.

Cuando el equipo de Zaidi intentó escribir "cómo lo hacemos realmente", las enfermeras no se pusieron de acuerdo en cuestiones fundamentales: 

  • ¿Qué constituía una justificación clínica sólida? 
  • ¿Qué documentación debía enfatizarse? 
  • ¿A qué tono o lenguaje respondían compañías aseguradoras específicas? 
  • ¿Cuándo escalar frente a replantear la apelación?

Las dependencias ocultas eran aún más profundas. Las decisiones no solo se basaban en el código de denegación. Dependían de notas de médicos en un sistema, datos de autorizaciones previas en otro y frases clínicas matizadas en documentación de texto libre. Algunas estrategias dependían de los hábitos de documentación de médicos específicos que no estaban estandarizados.

"Lo que parecía simple—'automatizar apelaciones'—se convirtió en un ejercicio organizacional de hacer explícito el juicio implícito", dice Zaidi.

El avance llegó cuando el equipo dejó de intentar elegir el enfoque de la "mejor" enfermera y optó por agregar el conocimiento tribal de las 15 enfermeras. Facilitaron sesiones estructuradas en las que debatieron estrategias, expusieron casos límite y se alinearon sobre lo que históricamente llevaba a recuperaciones exitosas. Luego superpusieron datos reales de resultados—qué plantillas ganaban más apelaciones, qué combinaciones de documentación mejoraban los índices de reversión.

En lugar de codificar opiniones, codificaron patrones validados.

Esta externalización crea algo que las organizaciones rara vez tienen, que es la capacidad de observar y mejorar el juicio a escala. Cada acción se registra. Cada excepción se vuelve visible. Cada anulación muestra dónde las reglas no se ajustan a la realidad. Los equipos pueden detectar patrones, refinar umbrales y mejorar el rendimiento con el tiempo.

El resultado fue medible: mayor precisión en las apelaciones, menor tiempo de ciclo, mayores índices de recuperación y menor riesgo de incumplimiento porque las decisiones ahora estaban estandarizadas, documentadas y eran auditables. 

La gobernanza no ralentizó el sistema, le dio a la organización una manera de aprender sistemáticamente de sus propias decisiones.

Join the People Managing People community for access to exclusive content, practical templates, member-only events, and weekly leadership insights—it’s free to join.

Join the People Managing People community for access to exclusive content, practical templates, member-only events, and weekly leadership insights—it’s free to join.

Name*

Cambio dos: asignar una responsabilidad clara para el comportamiento del agente

La restricción principal para pasar a producción es la confianza organizacional de que las acciones de la IA están limitadas, pueden auditarse, revertirse y supervisarse.

Los equipos que avanzan asignan un único responsable operativo que se hace explícitamente responsable por el comportamiento del agente, incluidos sus errores. El primer error significativo es la prueba de si esta infraestructura realmente funciona.

En la implementación de apelaciones hospitalarias, Zaidi contaba con un agente que asistía con la redacción y priorización de apelaciones a denegaciones, diseñado para clasificar casos y recomendar la escalada cuando se superaban ciertos umbrales de riesgo.

La primera falla significativa se produjo cuando el agente clasificó erróneamente como rutinario un caso de denegación de alto valor y con límite de tiempo, y no lo escaló. La lógica interpretó correctamente el código de denegación pero no consideró un factor contextual secundario—la ventana de apelación que estaba por vencer conforme al contrato con ese pagador.

El error se contuvo pero fue financieramente relevante. Se descubrió mediante una auditoría diaria de excepciones que el equipo había integrado en el flujo de trabajo—una capa de revisión humana que muestrea casos de alto valor.

Lo que ese momento reveló no fue que el agente fuera imprudente, sino que nuestros criterios de escalamiento eran incompletos,” dice Zaidi. “Habíamos codificado la lógica clínica y de denegación pero no habíamos integrado completamente los metadatos contractuales en el marco de priorización.

La estructura de gobernanza ayudó de dos maneras: 

  1. El registro y la trazabilidad mostraron exactamente por qué el agente tomó la decisión, y la auditoría humana en el proceso detectó los casos de alto riesgo. 
  2. Expuso una brecha. La definición de "riesgo" era demasiado limitada.

El equipo respondió ampliando las reglas de escalamiento para incluir variables de riesgo financiero y de tiempo, implementando umbrales dinámicos basados en contratos, aumentando la supervisión sobre apelaciones por vencer y agregando vías de anulación más claras.

En los sistemas agentivos, los errores rara vez provienen de una mala decisión, sino de una modelización de contexto incompleta. La responsabilidad en el liderazgo de la IA significa diseñar para la detección temprana, no asumir la perfección.

Headshot of Ahmed Zaidi, CEO of Accelirate
Ahmed ZaidiOpens new window

CEO de Accelirate

La forma en que el liderazgo afronta ese primer error lo determina todo. Si lo tratan como una oportunidad de aprendizaje y ajustan el sistema, los equipos ganan confianza. Si se echan para atrás o culpan a un individuo, el piloto muere.

Las organizaciones que tienen éxito no evitan los errores. Construyen sistemas que revelan errores rápidamente, los tratan como datos y mejoran a partir de ellos.

El punto ciego de la gobernanza

Una de las fallas de gobernanza más comunes que Zaidi observa es lo que él llama gobernanza pasiva de IA, o la creencia de que registrar equivale a controlar.

"Las organizaciones dirán con confianza: 'Cada decisión que toma el agente queda registrada. Tenemos completa trazabilidad'", dice Zaidi. "Eso suena tranquilizador, especialmente en un entorno regulado. Pero el registro, por sí mismo, no reduce el riesgo. Simplemente lo documenta."

En el sector sanitario, las decisiones de los agentes y los usos de la IA suelen involucrar gestión de contratos y matices, lenguaje clínico, interpretación de los pagadores y restricciones de tiempo. Incluso si cada resultado es técnicamente rastreable, el riesgo se acumula en casos límite que quedan justo fuera de los umbrales predefinidos, cambios en los patrones de documentación o comportamiento de respuesta de los pagadores, y escalaciones que deberían haber ocurrido pero que técnicamente no violaron ninguna regla.

Muchas organizaciones asumen que, porque nada se rompió, el sistema es conforme. Pero la ausencia de fallos inmediatos no es prueba de seguridad. Puede simplemente significar que nadie está revisando con suficiente profundidad.

La verdadera madurez en gobernanza de IA incluye cadencias de revisión definidas para la toma de muestras de decisiones, umbrales cuantitativos de riesgo que disparan automáticamente una revisión humana, propiedad clara de la supervisión a nivel operativo y bucles de retroalimentación donde los patrones recurrentes de excepción llevan al perfeccionamiento de las reglas.

A menudo les hago a los líderes una pregunta simple: '¿Quién se despierta por la mañana siendo responsable de lo que el agente decidió ayer?'" dice Zaidi. "Si no hay una respuesta clara, el modelo de gobernanza no está terminado.

Cambio tres: Cambia lo que se valora

En la mayoría de las organizaciones, la experiencia ha estado muy ligada al estatus, la seguridad laboral y el poder informal. Ser "la persona que sabe" es la forma en que se construye y protege la influencia. Hacer explícito el juicio puede sentirse como ceder la única ventaja que el sistema ha enseñado a la gente a usar.

En el sistema hospitalario, históricamente se evaluaba al equipo de enfermería por el volumen: cuántas cartas de apelación podían preparar al día.

Una vez que se introdujo la redacción asistida por el agente, esa métrica se volvió contraproducente. Si la IA generaba los primeros borradores, el volumen por sí solo ya no reflejaba el valor.

La medición del rendimiento pasó a centrarse en la precisión de la revisión clínica, la efectividad de las modificaciones a las cartas generadas por IA, los dólares recuperados influenciados y la contribución a la mejora de plantillas y la lógica de escalamiento.

En particular, una enfermera emergió como líder. Tenía una habilidad excepcional para articular por qué cierto lenguaje funcionaba mejor con aseguradoras específicas. En lugar de ser medida por la velocidad de producción, se volvió fundamental en externalizar su criterio en reglas y plantillas reutilizables para el sistema.

Su influencia se expandió porque sabía traducir la intuición en lógica estructurada", dice Zaidi. "Ese es un conjunto de habilidades muy diferente que, en entornos agentivos, es sumamente valioso.

El cambio fue cultural: de "¿Qué tan rápido puedes producir?" a "¿Qué tan bien puedes moldear los sistemas de decisión?"

Cuando las organizaciones recompensan el heroísmo, la velocidad o la intuición—pero no premian la documentación, la supervisión ni la mejora de sistemas—la experiencia permanece atrapada en individuos. Los equipos que hacen la transición promueven a personas que pueden enseñar su criterio a un sistema, mejorarlo con el tiempo y hacer que otros crezcan a través de ello.

Una vez que la experiencia se enmarca como algo que potencia las capacidades organizativas y no como una cuestión de indispensableidad personal, la resistencia a la IA se desvanece. Delegar en agentes se convierte en una señal de antigüedad y no en una amenaza para ella.

Las primeras señales de alerta del fracaso

En los primeros 30 a 60 días de un piloto, el fracaso casi siempre es predecible.

La mayor señal de alarma es la ausencia de un resultado claramente definido. Si un equipo no puede articular, en términos operativos, cómo se ve el éxito—menor tiempo de ciclo, mayor recuperación, menor tasa de errores—entonces el piloto probablemente solo es experimentación sin rumbo.

Otras señales de advertencia incluyen la falta de un responsable operativo claramente nombrado, desacuerdo entre el negocio y TI respecto al compromiso de tiempo y la complejidad, incapacidad de articular el proceso de toma de decisiones que se va a automatizar, y tratar la iniciativa como "exploración de IA" en vez de un rediseño operativo.

Los pilotos se estancan cuando los responsables del negocio subestiman el esfuerzo necesario para convertir el criterio en lógica estructurada, mientras que TI subestima la variabilidad y los casos atípicos en los procesos empresariales.

Los pilotos exitosos hacen tres cosas en los primeros 30 días:

  • Definir un alcance limitado con resultados medibles
  • Asignar un responsable del negocio dedicado y expertos temáticos comprometidos
  • Ofrecer respaldo ejecutivo para experimentar y eliminar bloqueos procedimentales.

"La IA agentiva no es un problema de implantación tecnológica, sino de arquitectura de decisiones", dice Zaidi. "Si eso no se aborda pronto, se convierte en una prueba de costes".

Cómo se ve la preparación

Cuando una organización afirma que está lista para escalar una solución agentiva, Zaidi busca madurez estructural en personas, procesos y tecnología. Esto significa:

  • Un responsable de negocio claramente identificado y responsable de los resultados
  • Un árbol de excepciones y escalamiento claramente definido
  • Capacidad de observar decisiones y resultados
  • Economía unitaria que justifique la escala
  • Un marco de gobernanza de referencia ya en funcionamiento.

La mayoría de los equipos subestima dos cosas: el coste del análisis y el tiempo necesario para externalizar correctamente la lógica de decisión.

Un indicador de madurez en el que Zaidi confía:

Si pregunto, '¿Cómo decide el agente cuando tiene incertidumbre?' y pueden responder claramente—incluyendo umbrales de escalamiento y responsabilidades—probablemente estén listos. Si la respuesta es vaga o remiten a 'el modelo lo resolverá', todavía son optimistas, no están preparados.

La capacidad que importa ahora se sitúa en el límite entre el juicio y los sistemas. Personas capaces de explicar por qué se tomó una decisión, no solo qué decidieron. Que pueden desglosar la intuición en señales, umbrales y excepciones. Que sienten curiosidad por saber dónde falla su propio criterio.

En el día a día, dedican menos tiempo a ejecutar tareas y más tiempo a supervisar, corregir y perfeccionar cómo se hace el trabajo, ya sea por humanos o por agentes.

Las organizaciones que dominan este cambio obtienen algo que los competidores atascados en modo piloto no tienen: la capacidad de mejorar el criterio a escala. Pueden poner a prueba suposiciones, medir resultados e iterar en la calidad de las decisiones de formas que eran imposibles cuando la experiencia solo residía en la mente de las personas.

La ventaja competitiva no es tener una mejor IA. Es contar con una infraestructura organizativa que haga posible la propiedad de la IA. Esa infraestructura—gobernanza que permite velocidad, propiedad que crea responsabilidad e incentivos que valoran la experiencia transferible—es lo que diferencia al 11% en producción del 38% atrapado en pilotos.