Si alguna vez has pasado por una prueba de personalidad durante un proceso de selección y has pensado, “Esto se siente un poco como astrología corporativa”, no te equivocas. En este episodio, converso con Jason Hreha, fundador y CEO de Persona, sobre por qué tantas evaluaciones en el lugar de trabajo se basan en teorías obsoletas y ciencia cuestionable, y cómo distinguir los trucos de las herramientas que realmente ayudan a mejorar la selección de personal. Profundizamos en qué significan realmente la fiabilidad y la validez predictiva, por qué son innegociables para cualquier prueba creíble y en qué fallan la mayoría de los equipos de RRHH al aplicar la ciencia del comportamiento en la toma de decisiones sobre talento.
Jason también comparte su trabajo en una nueva evaluación centrada en liderazgo que busca medir dos arquetipos de liderazgo muy diferentes, pero igualmente valiosos: transformacional y operacional. Desde estructurar entrevistas hasta convertir los datos de personalidad en una parte significativa (pero no exagerada) del proceso de selección, esta conversación es un curso exprés sobre evaluación de talento basada en la evidencia.
Lo que aprenderás
- Las dos métricas clave que determinan si una prueba de personalidad es científicamente válida.
- Por qué muchas evaluaciones populares (hola, Myers-Briggs) no predicen el desempeño laboral.
- Cómo utilizar herramientas psicométricas de manera estratégica en la selección, sin depender excesivamente de ellas.
- La diferencia entre los estilos de liderazgo transformacional y operacional.
- Por qué tener absoluta claridad sobre los comportamientos es clave para evaluar el talento de forma efectiva.
Puntos clave
- Empieza por la ciencia, no por intuiciones. Si una prueba no puede demostrar una fiabilidad sólida y validez predictiva, no debería guiar decisiones de selección.
- La estructura vence a la intuición. Preguntas de entrevista consistentes y evaluaciones estandarizadas hacen que la comparación entre candidatos sea mucho más precisa.
- Usa los datos de personalidad como una parte del todo. Aproximadamente un 25% de peso en la toma de decisiones es razonable: la capacidad cognitiva y el ajuste interpersonal siguen siendo más importantes.
- Ajusta el estilo de liderazgo al desafío. Los líderes operacionales prosperan escalando y perfeccionando sistemas; los líderes transformacionales destacan creando algo completamente nuevo.
- Define el trabajo en términos conductuales. Enumera las acciones exactas que debe realizar una nueva contratación antes de decidir qué medir y cómo medirlo.
Capítulos
- [00:00] Por qué tantas evaluaciones en el trabajo fallan en lo más básico de la ciencia
- [02:45] Diferencias entre fiabilidad y validez predictiva
- [06:40] Cuánto peso deben tener las pruebas de personalidad en la selección
- [08:33] Utilizar evaluaciones para comparar candidatos de forma justa
- [11:51] Pruebas de liderazgo: líderes transformacionales vs. operacionales
- [17:21] ¿Puede la IA reemplazar las evaluaciones psicométricas?
- [18:44] El error más común al aplicar la ciencia del comportamiento en la selección
- [22:21] Dónde encontrar el trabajo e investigaciones de Jason
- [23:35] Perspectiva de David sobre las pruebas de personalidad
Conoce a nuestro invitado

Jason Hreha es el cofundador y director ejecutivo de Persona, una empresa de talento como servicio que aprovecha la ciencia del comportamiento —basándose en sus casi 15 años de experiencia— para revolucionar la forma en que se selecciona y despliega talento de asistentes remotos. Anteriormente fue Director Global de Ciencia del Comportamiento en Walmart, donde lideró iniciativas de estrategia conductual y también fundó startups como Kite.io y Dopamine. Graduado de Stanford en Biología Humana (neurociencia), Jason sigue siendo un destacado referente en ciencia del comportamiento aplicada, asesorando habitualmente a empresas y dando conferencias sobre la intersección entre la psicología y el diseño de productos.
Enlaces relacionados:
- Únete a la comunidad de People Managing People
- Suscríbete al boletín para recibir nuestros últimos artículos y pódcasts
- Conecta con Jason en LinkedIn
- Descubre Persona y el sitio web de Jason
Artículos y pódcasts relacionados:
Leer la transcripción:
Estamos probando la transcripción de nuestros podcasts utilizando un programa de software. Por favor, disculpa cualquier error tipográfico, ya que el bot no es preciso al 100%.
Jason Hreha: El problema es que muchas de estas pruebas están muy mal construidas desde el punto de vista psicométrico, y también se basan en mala ciencia desde el principio. Ese es el problema con muchas de estas evaluaciones: tienen problemas de fiabilidad y también de validez predictiva. Algunas de estas evaluaciones pueden ser bastante fiables, pero si estás midiendo de manera fiable algo que no importa o que no predice nada útil, ¿a quién le importa?
David Rice: Bienvenidos al podcast People Managing People. Nuestra misión es construir un mundo laboral mejor y ayudarte a crear lugares de trabajo felices, saludables y productivos. Soy tu anfitrión, David Rice. Mi invitado de hoy es Jason Hreha. Él es fundador y CEO de Persona. Hoy vamos a hablar sobre evaluaciones de personalidad y la ciencia del comportamiento en la contratación.
¡Jason, bienvenido!
Jason Hreha: Gracias. Sí, gracias por invitarme.
David Rice: Empecemos de manera general aquí. Quiero conocer tu perspectiva sobre por qué se utilizan estas herramientas y dónde tienden a fallar o tener éxito. Entonces, ¿cuál es el problema real que intentamos resolver con las evaluaciones de personalidad en el lugar de trabajo y en los procesos de selección?
Jason Hreha: Sí, diría que en el entorno laboral y en el proceso de selección, son dos dominios diferentes o dos problemas distintos. En el proceso de selección, intentamos obtener una evaluación honesta o precisa de cómo se comportará alguien y cómo actuará a lo largo del tiempo. El gran problema es que muchos métodos de contratación no son tan fiables.
Por ejemplo, si simplemente te sientas e entrevistas a alguien, al tener una conversación general es muy difícil lograr una visión integral de esa persona y cómo reaccionará o se comportará en diferentes circunstancias, ya que solo puedes hablar con ella durante 30 minutos o una hora y media.
Y en general, las entrevistas no tienen estructura, tienden a ser solo una charla general. Si ese es el caso, también es difícil comparar porque si preguntas un conjunto de preguntas a una persona y un conjunto diferente a otra, mentalmente es difícil decidir quién es mejor.
¿Quién respondió mejor estas preguntas? Lo que realmente hacen las evaluaciones de personalidad es darte una visión integral de la persona en el proceso de selección, y permiten cruzar comparaciones de manera muy efectiva. En el lugar de trabajo, diría que el propósito es similar en el sentido de que quieres un entendimiento preciso o completo de una persona, pero el caso de uso es diferente, ¿verdad?
Esto puede servir para ayudar a una persona a tener mejor autoconocimiento, para que pueda trabajar en sus debilidades o potenciar sus fortalezas, etc. O si estás creando un nuevo equipo en tu organización y quieres una mezcla de diferentes personalidades para lograr un equipo equilibrado, podrías usar evaluaciones de personalidad para ese propósito también.
Así que, diferentes casos de uso, diferentes necesidades, pero el objetivo global de las evaluaciones de personalidad es obtener una comprensión precisa del conjunto integral de predisposiciones conductuales y emocionales de esa persona.
David Rice: Cuando charlamos antes de esto, mencioné una frase que a veces me gusta, no sé por qué, pero la gente la usa y me hace sonreír.
Cuando las personas describen estas evaluaciones, a menudo las llaman astrología corporativa, ¿no? Y comentaste que muchas de estas evaluaciones realmente no son mejores que la astrología. Es cierto. Me gustaría saber, ¿qué impulsa la validez científica de una prueba y en qué deberían fijarse realmente los responsables de recursos humanos cuando consideran estas herramientas?
Jason Hreha: Sí, el problema con muchas de estas evaluaciones es que muchas fueron desarrolladas hace mucho tiempo y están desactualizadas, ¿verdad? Ese es un problema. Otro problema es que muchas simplemente surgieron porque alguien tenía una idea o teoría sobre el comportamiento o desempeño humano y creó una prueba para tratar de medir su teoría preferida, su teoría de sillón.
El problema es que muchas veces la teoría de base era incorrecta. Así que basura entra, basura sale. Si tienes una teoría incorrecta sobre la naturaleza humana o desactualizada, aunque la midas con precisión y fiabilidad, si la base no es válida, entonces realmente no importa. Diría que, en general, el problema es que muchas de estas pruebas están muy mal construidas desde el punto de vista psicométrico y se basan en mala ciencia y malas teorías.
Entonces, lo que realmente hay que buscar en una evaluación de personalidad son dos variables clave: fiabilidad y validez predictiva. La fiabilidad significa que haces que una persona realice la prueba hoy y luego la repita en una semana, un mes, seis meses o un año.
¿Los resultados son aproximadamente iguales? ¿No hay mucha desviación? Y la segunda cosa en la que hay que poner atención es la validez predictiva, es decir, ¿los resultados realmente predicen cosas relevantes en el mundo real? Y ese es el problema de muchas evaluaciones: tienen problemas tanto de fiabilidad como de validez predictiva.
Algunas pueden ser bastante fiables, pero si se mide consistentemente algo irrelevante o que no predice nada útil, ¿a quién le importa? Por eso diría que esas son las dos variables que siempre deberías tener en cuenta al analizar una evaluación.
Debes tratar de encontrar la investigación detrás de la evaluación, buscar el white paper y ver si es fiable: ¿cuáles son las estadísticas de fiabilidad? Y luego la validez predictiva: ¿qué hicieron para demostrar que los resultados predicen con precisión el comportamiento o el resultado de una persona en el futuro?
Y diría que en la mayoría de los aspectos, estas pruebas no se desempeñan bien en esas dos variables. Por ejemplo, como Myers Briggs: no es tan fiable, no predice cosas de manera consistente. Hay muchas investigaciones sobre esto a lo largo de los años. El gran problema es que las personas tienden a cambiar de tipo con frecuencia.
Por ejemplo, una persona puede, en una versión de la prueba o si la hace una vez, salir como ENTP y la siguiente vez cambiar de E a I o a otro tipo. Ese es un problema. Así que una prueba como esa, por ejemplo, puedes hacer que la gente la tome, y creo que está bien si el objetivo es generar autoconocimiento, diversión, una actividad de integración o para fomentar conversación interesante.
Pero no haría decisiones importantes basadas en esa información.
David Rice: Exacto. Es casi como si vieran que a la gente le gustan esas pruebas de Buzzfeed, tipo "¿qué mariposa o especie de animal eres?", y pensaron, ¿podemos aplicar esto en el trabajo? Estoy de acuerdo. El tema es, como dijiste, ¿qué estás midiendo?
¿Importa? Basado en eso, mi pregunta sería cuánto peso debería realmente otorgar un gerente de selección al resultado de una prueba de personalidad.
Jason Hreha: Creo que la personalidad por sí sola es bastante importante. No es lo más importante, pero sí importa mucho. Si tuviera que ponerle un porcentaje, diría que debería ser como el 25% del peso en la decisión de contratación.
Algo así. Considero que la otra variable más importante es la capacidad cognitiva de la persona. ¿Es generalmente inteligente? ¿Puede aprender cosas rápido? ¿Es buena resolviendo problemas que nunca ha visto antes? Diría que eso es lo más importante, porque si piensas en qué es el trabajo, sin importar el rol,
entras a una organización o trabajas desde casa y te enfrentas a problemas y desafíos, muchos de los cuales nunca has enfrentado antes. Debes descubrir qué pasa, resolverlo y hacerlo bien, ¿verdad? Eso es pura capacidad intelectual o de aprendizaje.
Así que diría que eso es lo más importante. Detrás de eso pondría la personalidad. Después agregarían otros factores como si la persona te agrada, si encaja bien. Tienes que trabajar todos los días con ella y quieres a alguien que encaje interpersonalmente contigo y con el equipo para que todos disfruten.
Esos factores vendrían después. Pero diría que probablemente es la segunda variable más importante. Pero si tuviera que ponerle porcentaje, digamos que sería como una cuarta parte del peso total.
David Rice: Una de las cosas interesantes, porque hablo con mucha gente de reclutamiento, particularmente en tecnología:
En este momento los procesos de entrevistas están sobrecargados. Sí. Suele ser un proceso colaborativo. Por eso, uno de los grandes retos es comparar candidatos a lo largo de las entrevistas, ya que unos interactúan bien con alguien, pero a veces simplemente tuvieron un mal día o no conectaron con otra persona.
Me interesa saber cómo ayudan las herramientas psicométricas a solucionar esto, ya que obviamente entre entrevistas puede variar la respuesta de los candidatos.
Jason Hreha: Sí, es buena pregunta. Realmente depende de la organización, de los objetivos y del flujo de candidatos, etc., ¿verdad?
Por ejemplo, en nuestra empresa recibimos más de cien mil solicitudes al mes. No podemos hacer que un reclutador hable con cada persona; necesitaríamos un equipo gigantesco de reclutadores. Así que tratamos de entender con este tipo de pruebas, desde el inicio, si pensamos que la persona puede encajar bien.
No solo si pueden desempeñar el rol, sino si lo disfrutarán y lo encontrarán significativo, y eso lo puedes calcular con estas evaluaciones. Si recibes muchos candidatos, puedes poner estas pruebas al comienzo. Si tienes pocos candidatos o es un puesto de liderazgo, o solo tienes 10, 15 o 20 candidatos potenciales, puedes incorporar la prueba al final del proceso. Hablas con todos, revisas CVs, referencias, etc., tienes dos o tres finalistas y necesitas un criterio de desempate. Entonces ahí uso estas pruebas, para entender de manera más precisa quién encaja mejor.
David Rice: Sí, parece que añade estructura y consistencia.
Jason Hreha: Exacto. El gran problema de los procesos de reclutamiento es que suelen ser desordenados y dificulta las comparaciones. Por ejemplo, las entrevistas estructuradas son mucho mejores que las no estructuradas. Lo mejor es definir previamente qué preguntas deben hacerse para ese puesto y hacer siempre las mismas a cada candidato.
Así puedes comparar las respuestas directamente. Estos tests llevan esa estructura al extremo, porque comparar los resultados numéricos es mucho más sencillo que comparar respuestas abiertas.
Por ejemplo, en un test cognitivo comparas números; y en personalidad, comparas perfiles numéricos, lo que facilita mucho la comparación frente a analizar diez respuestas diferentes de dos minutos cada una.
David Rice: Mencionabas puestos de liderazgo hace un momento, y sé que estás trabajando en una nueva evaluación de personalidad enfocada en liderazgo. Quiero saber, ¿qué patrones reales has visto? ¿Qué fallos tienen las evaluaciones actuales sobre liderazgo ejecutivo y qué brechas buscas cubrir?
Jason Hreha: Es interesante. A lo largo de mi carrera no he visto buenas pruebas realmente centradas en el liderazgo como competencia específica. Es un proyecto personal que llevo un año investigando:
Me interesa saber qué tipos de líderes existen, qué los hace grandes y cómo se puede medir y predecir eso. No voy a decir que lo he resuelto, pero creo que estoy cerca de lograrlo.
He investigado y leído mucho porque como líder quiero medir mis capacidades de liderazgo, conocer mis fortalezas y debilidades para mejorar globalmente.
He trabajado en grandes empresas y startups; he visto distintos tipos de líderes excelentes. Lo que noté es que los grandes líderes de una empresa enorme como Walmart no necesariamente encajarían en una startup pequeña desarrollando una tecnología desde cero en un garaje en San Francisco.
Así que evidentemente existen tipos muy diferentes de liderazgo: lo clasifico en dos grandes categorías, aunque es un espectro.
Liderazgo transformacional (concepto recogido en la literatura académica), el que entra en una organización y revoluciona, crea productos o líneas nuevas desde cero (tipo fundador de startup); y el liderazgo operacional, para quien gestiona organizaciones existentes, mejora sistemas y procesos para evitar que la máquina falle y funcione cada vez mejor.
Ambos requieren habilidades distintas. El transformacional implica tolerar caos, desorganización, incertidumbre, creatividad y visión. El operacional exige organización, comprensión de sistemas existentes y adaptación a la cultura vigente, asegurando buen clima.
Por eso trato de entender, a partir de la literatura y mis propios estudios, cómo identificar en las personas esas tendencias y medirlas bien.
Así puedo autocomprenderme y entender qué hace bueno a un líder. El objetivo es dar esto a empresas para evaluar candidatos clave: si hay que lanzar una nueva división, buscaría alguien con liderazgo transformacional, por ejemplo, y con bastantes habilidades operativas también.
Quiero ayudar a las empresas a reducir el riesgo en decisiones clave con esa herramienta, rellenando ese 25% de peso de la personalidad del que hablaba antes.
David Rice: Tengo que preguntar, porque está en boca de todos: la IA y todo esto. ¿Dónde encaja? ¿Estamos cerca de un futuro donde se pueda automatizar la selección usando psicometría e IA?
Jason Hreha: Creo que psicometría e IA son diferentes. La IA es probabilística: si preguntas lo mismo varias veces, te responde ligeramente diferente. La ventaja de las pruebas psicométricas es poder comparar perfectamente porque todos toman el mismo test estandarizado.
Con IA, esa comparabilidad disminuye, ya que las respuestas varían. Por eso creo que la psicometría y estos tests seguirán vigentes y siendo valiosos. La IA puede complementar y aportar análisis, pero no los reemplazará.
David Rice: ¿En qué suelen equivocarse las empresas al tratar de aplicar la ciencia del comportamiento a estas discusiones sobre talento? ¿Qué crítica práctica harías?
Jason Hreha: Llevo toda mi carrera aplicando ciencia del comportamiento. Mi observación: la gente no piensa ni define bien el comportamiento que busca. Es decir, cuando deseas contratar un líder, por ejemplo en Amazon para una nueva división de robots, lo típico es decir "necesitamos un líder con experiencia técnica y en manufactura". Eso es demasiado genérico.
Debes ser específico sobre lo que va a hacer ese líder: ¿reclutar gente?, ¿dibujar planes de fábrica?, ¿dirigir el diseño del producto? Hacer un perfil muy detallado de todos los comportamientos y actividades necesarios. Una vez definido eso, puedes plantear preguntas o pruebas concretas y saber qué buscar en personalidad, habilidades o referencias.
En definitiva: hay que tener clarísimo lo que se busca, descender al nivel de comportamiento cotidiano y responsabilidad específica. Solo entonces podrás construir el proceso de evaluación ideal para elegir a la persona correcta.
David Rice: Perfecto. Antes de terminar, siempre me gusta darte espacio para mencionar lo que desees. ¿En qué trabajas o cómo pueden encontrarte?
Jason Hreha: Tengo una empresa llamada Persona, nos dedicamos a reclutamiento y selección, creo que evaluamos rigurosamente el talento y encontramos los mejores perfiles no técnicos de todo el mundo.
Nos enfocamos en puestos remotos no técnicos, como gerentes de proyectos, asistentes administrativos, asistencias ejecutivas, etc. Creo que lo hacemos muy bien. Si buscas algo así, creo que somos un gran socio. Además, escribo bastante en mi web:
es thebehavioralscientist.com. Si te interesa este campo, puedes seguirme en LinkedIn (Jason Hreha, el apellido es raro, H-R-E-H-A, nombre checoslovaco). Seguiré investigando y publicando sobre ciencia aplicada al comportamiento, personalidad y evaluaciones.
David Rice: Genial, genial. Última sección del episodio: siempre doy a mis invitados la oportunidad de hacerme una pregunta. Adelante.
Jason Hreha: Relacionado con esta conversación, sé que creaste un motor de recomendación de tests de personalidad, así que ¿cuáles son tus favoritos y cómo los has usado?
David Rice: No los he usado mucho, la verdad. Creé el cuestionario para trasladar lo que aprendía de expertos a la audiencia y también para aprender yo mismo, porque no conocía muchos. Conocía el Enneagrama y el Myers-Briggs por experiencias pasadas o porque estuvo de moda —lo ves hasta en las descripciones de LinkedIn junto a los pronombres—. Me interesó porque hay mucha controversia y percibo que la visión de usuario versus la de RRHH/candidato es muy distinta.
He aprendido sobre otros, como Ocean (que mencionabas) y Kolby. Descubro su eficacia y por qué sirven en ciertos contextos. Es fascinante ver tantas opiniones diferentes: unos muy escépticos, otros muy creyentes. Me interesa ver qué opinan cuando hacen el quiz: si descubrieron algo útil, si les resulta mejor que lo previo, etc.
Jason Hreha: Sí, tiene sentido. Buena respuesta.
David Rice: Gracias por venir hoy, realmente lo aprecio. Podría hablar de este tema todo el día.
Jason Hreha: Encantado de participar. Cuando quieras, aquí estoy.
David Rice: Si aún no lo has hecho, ve a peoplemanagingpeople.com/subscribe y suscríbete al boletín.
También prueba el Quiz de Evaluación de Personalidad. Cuéntanos tu opinión sobre el uso de pruebas de personalidad y cuán efectivas han sido para ti en el proceso de selección. No recojo información privada ni la comparto. Solo quiero conocer tus impresiones generales sobre su utilidad. Haz el quiz y descubre cuál es la mejor para ti.
Hasta la próxima, disfruta el verano.
