Psicometría
UNED 2ºCURSO – 2º CUATRIMESTRE
AMELIA GARCIA
, Psicometría | AMELIA GARCIA
Índice Psicometría
Tema 1: Introducción a la Psicometría ............................................................................ 5
1. APROXIMACIÓN AL CONCEPTO DE PSICOMETRÍA .................................................. 5
2. LA MEDICIÓN EN PSICOLOGÍA ............................................................................... 5
3. ORÍGENES Y DESARROLLO DE LA PSICOMETRÍA ..................................................... 6
4. MÉTODOS DE ESCALAMIENTO................................................................................ 7
4.1 Métodos de escalamiento psicológico ............................................................... 7
5. ORÍGENES Y DESARROLLO DE LOS TEST................................................................. 8
5.1 Los primeros test mentales ............................................................................... 8
5.2 Los primeros test de inteligencia ....................................................................... 9
5.3 Los test colectivos ............................................................................................ 9
5.4 Las baterías de aptitud múltiple ......................................................................... 9
5.5 Los test de personalidad ................................................................................. 10
5.6 La medición de interese y actitudes ................................................................. 10
5.7 Test referidos al criterio TRC frente a los test referidos a normas TRN ............... 10
5.8 Los test adaptativos informatizados TAI´s ....................................................... 11
6. DESARROLLO DE LA TEORÍA DE LOS TEST ............................................................. 11
6.1 La teoría clásica de los test TCT ....................................................................... 11
6.2 Teoría de respuesta al ítem (TRI) ...................................................................... 12
Tema 2: Principios básicos para construcción de instrumentos de medición psicológica13
1. DIFERENCIACIÓN TERMINOLÓGICA ..................................................................... 13
2. PROCESO DE CONSTRUCCIÓN DE UN TEST ......................................................... 14
3. LA FINALIDAD DEL TEST ........................................................................................ 14
3.1 La variable objeto de estudio o constructo ...................................................... 14
3.2 Población a la que va dirigido........................................................................... 14
3.3 Utilización prevista .......................................................................................... 15
4. ESPECIFICACIÓN DE LAS CARACTERÍSTICAS DEL TEST ......................................... 15
4.1 Contenido ....................................................................................................... 15
4.2 Formato de los ítems ....................................................................................... 16
4.3 Longitud del test ............................................................................................. 18
4.4 Características psicométricas de los ítems ...................................................... 18
5. REDACCIÓN DE LOS ÍTEMS .................................................................................. 19
5.1 Recomendaciones generales .......................................................................... 19
5.2 Recomendaciones para ítems de elección ....................................................... 19
5.3 Recomendaciones para los ítems de construcción........................................... 21
5.4 Los sesgos de respuesta ................................................................................. 21
1
, Psicometría | AMELIA GARCIA
6. REVISIÓN CRÍTICA DE LOS ÍTEMS POR UN GRUPO DE EXPERTOS .......................... 22
7. CONFECCIÓN DE LA PRUEBA PILOTO................................................................... 22
7.1 Las instrucciones de administración ................................................................ 22
7.2 Formato de presentación y de registro de las respuestas .................................. 22
8. APLICACIÓN DE LA PRUEBA PILOTO ..................................................................... 23
9. CORRECCIÓN DE LA PRUEBA PILOTO Y ASIGNACIÓN DE PUNTUACIONES A LOS
SUJETOS .................................................................................................................. 24
9.1 En los test formados por ítems de elección ...................................................... 24
9.2 En los test formados por ítems de construcción ............................................... 25
Tema 3: Técnicas para la construcción de escalas de actitudes .................................... 26
1. ORIENTACIONES DIDÁCTICAS .............................................................................. 26
2. EL MODELO ESCALAR DE THURSTONE ................................................................. 26
2.1 Supuestos básicos del modelo ........................................................................ 26
2.2 La ley del Juicio Comparativo: Método de las Comparaciones Binarias ............. 27
2.3 La ley del Juicio Categórico .............................................................................. 29
3. LA TÉCNICA DE LIKERT ......................................................................................... 31
3.1 Fundamentos de la técnica ............................................................................. 31
3.2 Asignación de valores numéricos a los ítems y puntuaciones a los sujetos ........ 32
4. EL DIFERENCIAL SEMÁNTICO DE OSGOOD ........................................................... 32
4.1 Los conceptos ................................................................................................ 32
4.2 Escalas bipolares ............................................................................................ 33
4.3 El espacio semántico: criterios de selección de las escalas .............................. 33
4.4 Elaboración de la prueba piloto y aplicación .................................................... 34
5. LA TÉCNICA DE GUTTMAN .................................................................................... 36
5.1 Evaluación del error en el modelo .................................................................... 37
5.2 Pasos a seguir para la elaboración de una escala ............................................. 37
6. DIFERENCIAS ENTRE LAS DISTINTAS TÉCNICAS .................................................... 40
Tema 4: La fiabilidad de las puntuaciones .................................................................... 41
1. INTRODUCCIÓN Y EL PROBLEMA DEL ERROR DE MEDIDA .................................... 41
2. EL MODELO LINEAL DE SPEARMAN....................................................................... 42
3. TEST PARALELOS. CONDICIONES DE PARALELISMO ............................................. 43
4. INTERPRETACIÓN TEÓRICA DEL COEFICIENTE DE FIABILIDAD .............................. 43
5. TIPOS DE ERRORES DE MEDIDA ............................................................................ 44
6. FACTORES QUE AFECTAN A LA FIABILIDAD ........................................................... 44
6.1 La longitud del test .......................................................................................... 44
6.2 La variabilidad de la muestra ........................................................................... 45
2
, Psicometría | AMELIA GARCIA
7. LA FIABILIDAD COMO EQUIVALENCIA Y COMO ESTABILIDAD DE LAS MEDIDAS ..... 46
7.1 Método de las formas paralelas ....................................................................... 46
7.2 Método test-retest .......................................................................................... 46
8. LA FIABILIDAD COMO CONSISTENCIA INTERNA .................................................... 47
8.1 Métodos basados en la división del test en dos mitades ................................... 47
8.2 Métodos basados en la covariación entre los ítems .......................................... 49
8.3 Coeficientes basados en el análisis factorial de los ítems: θ Theta y Ω Omega .. 57
8.4 El coeficiente beta β de Raju ............................................................................ 57
9. ESTIMACIÓN DE LA PUNTUACIÓN VERDADERA DE LOS SUJETOS EN EL ATRIBUTO
DE INTERÉS ............................................................................................................. 58
9.1 Estimación mediante la desigualdad de Chebyshev ......................................... 58
9.2 Estimación basada en la distribución normal de los errores .............................. 58
9.3 Estimación basada en el modelo de Regresión ................................................. 59
10. FIABILIDAD DE UNA BATERÍA DE TEST ................................................................. 60
Tema 6: Validez de las inferencias (I) ............................................................................ 61
1. ORIENTACIONES DIDÁCTICAS .............................................................................. 61
2. INTRODUCCIÓN AL CONCEPTO DE VALIDEZ Y SU EVOLUCIÓN HISTÓRICA ........... 61
3. VALIDACIÓN DE CONTENIDO ............................................................................... 62
4. VALIDACIÓN DE CONSTRUCTO ............................................................................ 64
4.1 La matriz Multimétodo-Multirrasgo .................................................................. 64
4.2 El análisis factorial .......................................................................................... 66
5. VALIDACIÓN REFERIDA AL CRITERIO .................................................................... 66
5.1 Procedimientos estadísticos utilizados en la validación referida al criterio ........ 67
6. VALIDACIÓN CON UN ÚNICO PREDICTOR Y UN SOLO INDICADOR DEL CRITERIO. 67
6.1 El coeficiente de validez .................................................................................. 68
6.2 El modelo de regresión lineal simple ................................................................ 69
6.3 Interpretación de la evidencia obtenida acerca de la capacidad predictora del
test ...................................................................................................................... 71
Tema 7: Validez de las inferencias II ............................................................................. 72
1. VALIDEZ Y UTILIDAD DE LAS DECISIONES ............................................................. 72
1.1 Índices de validez y de selección ..................................................................... 72
1.2 ¿Dónde situar el punto de corte? ..................................................................... 74
1.3 Modelos de selección...................................................................................... 75
2. FACTORES QUE INFLUYEN EN EL CONCEPTO DE VALIDEZ .................................... 76
2.1 La variabilidad de la muestra ........................................................................... 76
2.2 La fiabilidad de las puntuaciones del test y del criterio ..................................... 76
3
, Psicometría | AMELIA GARCIA
2.3 Validez y longitud ............................................................................................ 78
Tema 8: Análisis de los ítems ....................................................................................... 80
1. ORIENTACIONES DIDÁCTICAS .............................................................................. 80
2. INTRODUCCIÓN................................................................................................... 80
3. DIFICULTAD DE LOS ÍTEMS ................................................................................... 81
3.1 Corrección de los aciertos por azar .................................................................. 81
4. DISCRIMINACIÓN................................................................................................. 82
4.1 Índice de discriminación basado en grupos externos ........................................ 82
4.2 Índices de discriminación basados en la correlación ........................................ 83
4.3 Discriminación en los ítems de actitudes ......................................................... 84
4.4 Factores que afectan a la discriminación ......................................................... 85
5. ÍNDICAS DE FIABILIDAD Y VALIDEZ DE LOS ÍTEMS ................................................. 86
5.1 Índice de fiabilidad (criterio interno) ................................................................. 86
5.2 Índice de validez (criterio externo) .................................................................... 87
6. ANÁLISIS DE DISTRACTORES ................................................................................ 87
6.1 Equiprobabilidad de los distractores ................................................................ 88
6.2 Poder discriminativo de los distractores .......................................................... 88
7. FUNCIONAMIENTO DIFERENCIAL DE LOS ÍTEMS FDI ............................................. 88
7.1 Mantel-Haenszel ............................................................................................. 88
Tema 9: Asignación, transformación y equiparación de las puntuaciones ...................... 90
1. ORIENTACIONES DIDÁCTICAS .............................................................................. 90
2. NECESIDAD DE TRANSFORMACIÓN DE LAS PUNTUACIONES PARA SU
INTERPRETACIÓN .................................................................................................... 90
3. TRANSFORMACIÓN DE LAS PUNTUACIONES EN LOS TEST REFERIDOS A LA NORMA
................................................................................................................................ 90
3.1 Transformaciones lineales .............................................................................. 91
3.2 Transformaciones no lineales .......................................................................... 92
3.3 Normas cronológicas ...................................................................................... 93
4. EQUIPARACIÓN DE PUNTUACIONES .................................................................... 94
4.1 Diseños de equiparación ................................................................................. 94
4.2 Métodos de equiparación ................................................................................ 95
5. ERROR TÍPICO DE EQUIPARACIÓN ....................................................................... 98
6. EL MANUAL DEL TEST ........................................................................................... 99
4
, Psicometría | AMELIA GARCIA
Tema 1: Introducción a la Psicometría
1. APROXIMACIÓN AL CONCEPTO DE PSICOMETRÍA
La Psicometría es una disciplina metodológica, dentro del área de la Psicología, cuya
tarea fundamentales la medición o cuantificación de las variables psicológicas con todas
les implicaciones que ello conlleva, tanto teóricas (posibilidades y criterios de medición),
como prácticas (cómo y con qué se mide). La Psicometría debe ocuparse de:
• La justificación y legitimación de la medición psicológica, para ello:
a) Desarrolla modelos formales que permiten representar los fenómenos que
se quieren estudiar y posibilitan la transformación de los hechos en datos.
b) Valida los modelos desarrollados para determinar en qué medida
representan la realidad que pretenden.
c) Establece las condiciones que deja llevar a cabo el proceso de medición.
• Las implicaciones prácticas y aplicadas que dicha medición conlleva:
proporciona los métodos necesarios que indican, en cada caso concreto, cómo se
debe llevar a cabo la cuantificación, y cómo construir los instrumentos necesarios
y adecuados para poder efectuarla.
La Psicometría no tiene un campo de actuación específico, abarca todos los campos de la
Psicología y se ubica en el área denominada Metodología de las Ciencias del
Comportamiento. La Metodología estudia las estrategias y procedimientos que, de una
forma más o menos estructurada, se utilizan para la obtención de los conocimientos que
configuran un disciplina científica. Por otra parte, las Ciencias del Comportamiento son
aquellas que estudian la conducta mediante el uso del método científico, con el fin de
encontrar estructuras generales o leyes. Dentro del marco de la Metodología de las
Ciencias del Comportamiento se consideran tres bloques: Los diseños de investigación;
el análisis de datos; y la Psicometría, que incluye todo lo referente a la medición.
Proporciona las reglas que van a permitir llevar a cabo el proceso de operativización de
las variables que se quieren medir. Una vez obtenidas las medidas mediante la asignación
de números, los modelos psicométricos facilitarán un análisis del error que les afecta
(fiabilidad de la medidas) y, a su vez, los estudios de validación permitirán hacer
inferencias acerca de las relaciones entre los datos empíricos (medidas) y el constructo o
variables psicológica que se quiere medir.
2. LA MEDICIÓN EN PSICOLOGÍA
De acuerdo con Coombs, Dawes y Tversky, se considera que uno de los papeles
fundamentales asignados a la Ciencia es la descripción, explicación y predicción de los
fenómenos observables por medio de unas cuantas leyes generales que expresen las
relaciones entre las propiedades de los objetos investigados. En las ciencias más
avanzadas las leyes expresan relaciones cuantitativas, lo que indica que las propiedades
de los objetos se pueden representar por medio de números mediante un proceso de
medición.
5
, Psicometría | AMELIA GARCIA
Actualmente la medición se considera como la asignación de números a entidades o
eventos con el fin de representar sus propiedades y sus relaciones. La medición de las
características psicológicas es difícil, se trata de conceptos abstractos, constructos
teóricos (o variables latentes) cuya medida no puede llevarse a cabo de una forma directa,
sino que debe inferirse a través de una serie de conductas representativas de dicho
constructo. Así, para Zeller y Carmines, el proceso de medir enlaza conceptos abstractos
(los constructos inobservables directamente) con indicadores empíricos observables
directamente (las conductas). Este tipo de medición se llama medición por indicadores.
A la hora de interpretar las puntuaciones obtenidas por los sujetos hay dos formas de
afrontar el problema de las unidades de medida:
• La Norma (forma más habitual): consiste en comparar los resultados obtenidos
por el sujeto con los obtenidos por un grupo de sujetos que forman el grupo
normativo de la misma población.
• El Criterio (se interpreta con relación a un criterio preestablecido): los resultados
obtenidos se comparan con dicho criterio (un punto crítico) y la superación o no
del mismo es lo que va a dar significado a las puntuaciones obtenidas.
La medición psicológica tiene una serie de objetivos comunes sea cual sea el campo de
estudio: estimar los errores aleatorios que conlleva toda medición (fiabilidad de las
medidas); y garantizar que la medida no es algo inútil, sino que sirve para explicar y
predecir los fenómenos de interés (validez de las medidas).
3. ORÍGENES Y DESARROLLO DE LA PSICOMETRÍA
Existieron dos motivos fundamentales para introducir la medición en la Psicología: la
tendencia a formular los problemas científicos en términos matemáticos; y el
enfrentamiento de la Psicología de mitad del s. XIX con dos problemas fundamentales:
• El problema psicofísico: estudio cuantitativo de las relaciones entre las
características físicas de los estímulos y las sensaciones que suscitan en los
sujetos, en función de las cuales se asignan valores numéricos a estímulos. Los
estudios de Psicofísica dieron lugar al desarrollo de modelos que permitieron
asignar valores numéricos a los estímulos y, por tanto, permitieron el
escalamiento de los estímulos.
• El problema de la cuantificación de las diferencias individuales: mediante la
asignación de números a los sujetos en función del grado que manifiesten un
atributo o conducta. Los estudios acerca de las diferencias individuales dieron
lugar al desarrollo de las distintas Teorías de los Tests (modelos) que posibilitaron
la asignación de valores numéricos a los sujetos y, por tanto, permitieron el
escalamiento de los sujetos.
6
, Psicometría | AMELIA GARCIA
4. MÉTODOS DE ESCALAMIENTO
Escalamiento: campo de la psicometría cuyo objetivo fundamental es la construcción de
escalas de medida; es decir, la construcción de instrumentos que permitan llevar a cabo
mediciones para representar las propiedades de los objetos (estímulos, sujetos o
respuestas) por medio de números, de acuerdo con unas normas o reglas.
Desde la perspectiva de la psicometría hay dos supuestos básicos en todos los métodos
de escalamiento:
• La existencia de un continuo latente o subyacente, a lo largo del cual varían los
objetos psicológicos que se van a escalar (estímulos sujetos o respuestas) y no
puede ser observado de forma directa.
• Que los objetos psicológicos (estímulos, sujetos o respuestas) pueden situarse de
forma ordenada a lo largo de ese continuo.
El propósito del escalamiento de estímulos es determinar las características que los
sujetos perciben en ellos y, por tanto, la respuesta del sujeto es una respuesta subjetiva
que nos va a permitir diferenciarlos y escalarlos; es decir, asignar un valor numérico a
cada uno de los estímulos. En este caso los estímulos se sitúan a lo largo del continuo y
los sujetos, que han emitido juicios sobre los éstos, actúan como instrumento de medida.
Cuando el objeto a escalar son los sujetos se utiliza una muestra extraída de forma
aleatoria de la población y todos los sujetos responden al mismo conjunto de estímulos
(un test). Las respuestas emitidas por los sujetos proporcionan una puntuación numérica
para cada sujeto de la muestra (las diferencias entre puntuaciones reflejan la diferencia
entre sujetos respecto al atributo o característica medida). En esta caso los sujetos se
sitúan a lo largo del continuo y los estímulos como instrumento de medida.
Hay casos en los que interesa situar en el conjunto sobre el que varía el atributo estudiado
tanto a los estímulos como a los sujetos. La posición de cada sujeto respecto del atributo
que se está analizando (actitud, aptitud, sentimientos, etc.) es un factor que determina
su respuesta (Torgerson: aproximación centrada en la respuesta).
En sus orígenes el escalamiento estuvo asociado a las escalas de estímulos (proceso de
construcción de escalas para la cuantificación de estímulos). Todo lo referente a la
cuantificación de los sujetos para apreciar de forma sistemática las diferencias
individuales (escalar a los sujetos) lo estudiamos en el marco de la Teoría de los Test. En
la actualidad esta distinción está superada, pero se mantiene por razones didácticas.
4.1 Métodos de escalamiento psicológico
(En estos apuntes se deja por el momento los métodos de escalamiento psicofísico).
A partir de las ideas de Fechner se desarrollan las escalas psicológicas o subjetivas.
Thurstone ha sido la figura que más contribuyó a su desarrollo, aportando un modelo
basado en la variabilidad perceptual de los sujetos, e incluso de un mismo sujeto cuando
se le presentan los mismos estímulos es distintas ocasiones, y en la limitación que tienen
los sujetos para percibir las diferencias de magnitud entre los del estímulos cuando estas
7
, Psicometría | AMELIA GARCIA
son muy pequeñas. Las ecuaciones de su modelo matemático se denominan: Ley de
juicio comparativo (método de las comparaciones binarias); y Ley de juicio categórico
(método de intervalos sucesivos, aparentemente iguales y de ordenación de rangos).
Se dieron nuevas formas de escalamiento psicológico. Guttman desarrolló un nuevo
modelo para el escalamiento conjunto de sujetos y estímulos (escalamiento de
respuestas). Para la obtención de la escala utiliza el escalograma. La escala resultante se
denomina escala de entrelazamiento (los sujetos y los estímulos se sitúan a lo largo del
mismo continuo psicológico de forma entrelazada). Coombs desarrolló una teoría
conocida como teoría del despliegue y propuso un modelo que permite escalar sujetos y
estímulos conjuntamente.
Estos modelos y sus métodos asociados se desarrollaron, en principio, para la
construcción de escalas unidimensionales (que permitieran ordenar un conjunto de
estímulos y/o sujetos respecto a un único atributo o característica). Más tarde, se
desarrollaron métodos de escalamiento multidimensional (atienden, simultáneamente, a
más de un atributo o característica).
5. ORÍGENES Y DESARROLLO DE LOS TEST
El intento por apreciar de forma sistemática las diferencias individuales (escalar a los
sujetos) llevó al desarrollo del método de los Test y de las distintas teorías de los test.
Un test es un instrumento de medición diseñado especialmente para estudiar de un modo
objetivo y sistemático el nivel de los sujetos respecto a algún atributo, característica o
dominio de conocimientos (a partir de la puntuaciones de los sujetos en el test, se analizan
las diferencias existentes entre ellos).
Hay tres factores que se pueden considerar decisivos en el desarrollo de los test:
• La apertura del laboratorio antropométrico de Galton en Londres. Recurrió a
la correlación como medida de asociación y fue el primero en aplicar el concepto
estadístico de distribución normal, de media, mediana, varianza y correlación a
datos psicológicos.
• El desarrollo de la correlación de Pearson.
• La interpretación de Spearman: considerando que la correlación entre dos
variables indica que ambas tienen un factor común.
5.1 Los primeros test mentales
Para Cattel, primer autor en utilizar el término, los test constituían un sistema uniforme
que permitía comparar y combinar, en lugares y momentos diferentes, la medida de las
funciones mentales. Compartía con Galton la creencia de que se podía medir el
funcionamiento intelectual de las personas mediante test de discriminación sensorial y
midiendo el tiempo de reacción TR (no medían la inteligencia).
8
, Psicometría | AMELIA GARCIA
5.2 Los primeros test de inteligencia
El primero en destacar la importancia de los procesos mentales superiores para estudiar
las diferencias individuales fue Binet. Binet y Simon publicaron la primera escala de
inteligencia, ya no se ocupaba de las funciones sensoriales o motoras, se centraban en la
capacidad de razonamiento y comprensión de los niños. Terman adaptó el test (Stanford-
Binet), introdujo el concepto de edad mental, la cual equivale a la edad cronológica de
los niños intelectualmente normales; y definió la inteligencia como la habilidad para
llevar a cabo razonamientos abstractos. Para medir la inteligencia utiliza el término
acuñado por Stern Cociente Intelectual CI = (edad mental / edad cronológica) x 100.
5.3 Los test colectivos
Comienzan a utilizarse con la entrada de EEUU en la WWI, para seleccionar y clasificar
a las personas disponibles para el ejército según sus posibilidades. Yerkes sería el
encargado de investigar nuevos procedimientos que posibilitaran la administración de test
en el ejército. De esta forma se crearon: el test Alpha, diseñado para la población general;
y el test Beta, para los reclutas analfabetos o aquellos que no dominaban el inglés.
Una vez finalizada la guerra el uso de test se extendió a la industria y al resto de
instituciones. En 1922 Cattel fundó la primera empresa dedicada a la publicación masiva
de test y, a partir de ahí, empezaron a utilizarse como instrumento de selección en la
administración americana. En 1938 apareció el Test de Weschler-Bellevue para la
medición de la inteligencia en los adultos y en 1949 una versión para niños conocida
como WISC. En 1955 apareció una revisión de la escala anterior conocida como Weschler
Adult Intelligence Scale WAIS. La aparición de estas escalas supuso un avance en el
desarrollo de los test ya que el test Stanford-Binet tenía poca efectividad en adultos.
Se desarrolló el coeficiente de correlación de Pearson y el análisis factorial, que consistía
en representar un conjunto de variables observables mediante un número más pequeño de
variables, no observables, latentes, llamadas factores, de las que las primeras son
indicadores. Surgen los primeros test para la medida de aptitudes y del rendimiento. La
influencia del análisis factorial respecto a los test de inteligencia fue doble:
• Facilitó una fundamentación teórica, mostrando que en la mayor parte de las
funciones cognoscitivas interviene un factor general ‘g’ común a todas ellas.
• Los resultados del análisis factorial subrayan la importancia de estudiar otras
aptitudes más específicas en el campo de la inteligencia.
5.4 Las baterías de aptitud múltiple
Facilitan una medida de posición de cada sujeto en un cierto número de rasgos (en lugar
de un CI, se obtiene una puntuación por separado de cada rasgo). Un ejemplo destacado
es la batería de aptitudes mentales primarias, de Thurstone, que incluye pruebas para la
medida de los componentes fundamentales del comportamiento inteligente (comprensión
verbal, fluidez verbal, aptitud numérica, aptitud espacial, memoria, rapidez perceptiva y
razonamiento general).
9