Por Ignacio Briones, decano Escuela de Gobierno UAI Agosto 13, 2015

Carl Friedrich Gauss (1777-1855) fue uno de los más grandes matemáticos de la historia. El llamado “príncipe de las matemáticas” tuvo un genio precoz. A los cinco años le llevaba las cuentas a su padre. A los siete descolocó al profesor que había castigado a sus alumnos pidiéndoles sumar los enteros del 1 al 100. Gauss resolvió el problema en un santiamén: había descubierto la regla de las sumatorias. 

Para la mayoría de nosotros el nombre de Gauss nos es familiar por uno de sus aportes a la estadística. Gauss se dio cuenta de que un cúmulo de fenómenos de la naturaleza podían ser descritos a partir de una distribución de probabilidades en que la mayoría de las observaciones se concentran alrededor de la media y convergen a cero conforme nos movemos a los extremos. Es la famosa campana de Gauss, o distribución normal, pilar fundacional de la estadística moderna.

Sabemos que una serie de atributos humanos, tales como el peso, el coeficiente intelectual o la altura, entre otros, se distribuyen normalmente. En simple, hay pocos gigantes y enanos y muchas personas en torno a la altura promedio. Y lo mismo es cierto para la evaluación de competencias y conocimientos. Por ejemplo, en la PSU (matemáticas) son contados los casos de puntajes nacionales o de alumnos bajo los 200 puntos. La mayoría está en torno a la media nacional de 500 puntos. 

Sin embargo, en el último tiempo hemos conocido en Chile casos de evaluación de competencias que parecen violar descaradamente el principio de normalidad. El problema es que se basan en la autoevaluación y no en una evaluación externa objetiva. 

Tomemos la autoevaluación de profesores, uno de los cuatro instrumentos con que se realiza la evaluación docente. Bajo este criterio, un 88,7% de los profesores se considera “sobresaliente”, y un 10,7% “competente”. Apenas un 0,5% se autocalifica en nivel “básico” y un 0,1% en “insatisfactorio”. ¿Qué diría usted del colegio de su hijo si ésta fuera la distribución de notas de los alumnos? Sospechoso, ¿no? Ello contrasta con los resultados de otro de los instrumentos: el llamado “portafolio” que hace una evaluación externa sobre las prácticas pedagógicas. Aquí los resultados son más normales: tan sólo un 0,1% (2,7%) está en nivel sobresaliente (insatisfactorio), mientras que un 68,2% y un 29% está en nivel básico y satisfactorio, respectivamente.  

Hace unas semanas se dio a conocer la evaluación de los fiscales en nuestro país. Autoevaluación, por cierto. Y, ¿adivine qué? Según los resultados, tenemos una Fiscalía compuesta de lumbreras. En efecto, la mitad de los fiscales tiene nota 7 y apenas un 1% de ellos está por debajo del 6, siendo la nota mínima un 5,2. Notable. A 15 años de la reforma procesal penal, este podría ser un nuevo producto de exportación.

Los ejemplos anteriores dan cuenta de una condición básica de toda medida de evaluación de utilidad. Debe tener dispersión de resultados y tender a respetar el principio de normalidad. De lo contrario, la evaluación no es informativa ni sirve para tomar medidas correctivas o reforzativas. 

Quienes creemos que los incentivos importan, tendemos a desconfiar de las autoevaluaciones. Aunque parezca loable “conocerse a sí mismo”, lo cierto es que el ser humano tiende a ser más dadivoso de lo normal al autoevaluarse. Sobre todo cuando existe algo de valor en juego vinculado al resultado (remuneraciones, ascensos, etc.). De aquí la necesidad de reemplazar las autoevaluaciones por evaluaciones externas imparciales. Sin duda, una cuestión de normalidad. 

Relacionados