1
TEMA 5: PROGRAMAS Y TEORÍAS DEL REFORZAMIENTO
1. PROGRAMAS DE REFORZAMIENTO
1.1. PROGRAMAS BÁSICOS DEL REFORZAMIENTO
1.1.1. PROGRAMAS DE RAZÓN FRENTE A PROGRAMAS DE INTERVALO:FUNCIONES DE RETROALIMENTACIÓN
Definición forma en que se programan los reforzadores en contingencia con la emisión de una respuesta operante.
Cada uno de ellos especifica una regla que determina las condiciones en las que una respuesta puede ser reforzada.
tan solo se refuerzan algunas de las respuestas que emite el
PROGRAMAS DE REFORZAMIENTO PARCIAL O INTERMITENTE
sujeto y no todas. Generalmente mantiene todo
Tipos de reforzamiento comportamiento condicionado de forma operante
CONTINUO produce un aprendizaje más duradero y más difícil de extinguir.
Nº de respuestas requerido para que se administre el reforzador es siempre el
Fija (RF+nº) mismo. Ej: RF-1 sería reforzamiento continuo porque sería reforzada cada
emitir un número determinado respuesta.
De razón
de respuestas antes de que la
Nº de respuestas requerido varía de una ocasión a la siguiente, de manera
PROGRAMAS DE última de ellas sea reforzada Variable (RV+ nº) irregular (RV) Ej: RV-100 se conseguirá el reforzador si en promedio se han
emitido cien respuestas, en unas ocasiones más y en otras menos, pero
REFORZAMIENTO
teniendo 100 como valor medio.
POSITIVO INTERMITENTE
Mantener constante el tiempo requerido para el siguiente reforzador,
Fijo (IF+nº) reforzarán la primera respuesta que ocurra una vez haya transcurrido un
debe pasar un determinado tiempo
tiempo siempre igual desde que se dispensó el último reforzador.
De intervalo desde la consecución del reforzador
anterior antes de que la respuesta
requerida sea de nuevo reforzada Varía la cantidad de tiempo a transcurrir entre un reforzador y el
Variable (IV+ nº) siguiente antes de que la respuesta sea reforzada, dando lugar a un
valor promedio de intervalo entre reforzadores.
(+) Tanto los programas de razón como los de intervalo son a partir de la presencia del reforzador anterior.
,2
Rollo de papel que va girando a velocidad constante y sobre el que se apoyan dos plumillas que van dibujando, una cuando el sujeto da
respuestas, indicando cuáles son reforzadas, y otra que marca cuando se presenta el estímulo discriminativo.
Se puede medir el nº de respuestas, el nº de pausas, el tiempo entre respuestas (TER), el tiempo sin responder… dando como
resultado una curva cumulativa continua que refleja las tasas de respuesta y los cambios asociados a ella.
REGISTRADOR ACUMULATIVO
Si la tasa de respuesta es alta, el registro será muy inclinado. Si la tasa de respuesta es baja, el registro será más plano. Si la tasa de
respuesta es intermedia, la pendiente será intermedia.
Ventajas puede medir todas las respuestas aunque ocurran rápidamente y registrar las estructuras de comportamiento, haciendo una
medición no contaminada durante largos periodos de tiempo
Ambos producen un índice de perseverancia
PROGRAMAS RV tasas de respuesta muy altas y constantes, que a veces se aproximan a los límites de capacidad física muy elevado
PROGRAMAS IV tasas constantes de respuesta pero de un valor inferior a las de RV.
Inicialmente tasas elevadas de respuesta, que se mantienen desde la primera respuesta tras el reforzador hasta la siguiente respuesta reforzada.
Razón relativamente pequeña ejecución alta y estable de conducta
Razón mayor (ej. RF-50) hay una pausa post reforzamiento que se sigue de una transición casi instantánea a una tasa alta de respuesta anterior
PROGRAMAS RF
(carrera de la razón). La duración de esa pausa depende del valor de la razón, si es muy elevado, se puede dejar de responder por completo (tensión de la
razón)
Pausa post reforzamiento más o menos prolongada en función de la duración del intervalo, y por una
progresiva aceleración posterior de la tasa de respuesta en cada uno de los intervalos (la tasa mayor de
respuesta se produce cerca del final del intervalo).
Ej. IF-60 s (llamado FESTONEADO) resalta la existencia de cambios en la tasa de respuesta.
PROGRAMAS IF
En IF la tasa global de respuesta no parecer ser el mejor indicador de la ejecución conductual.
La tasa de respuesta aumenta progresivamente en cada uno de los intervalos.
El patrón de respuestas IF refleja un proceso de discriminación temporal
(los animales responden subjetivamente cuando consideran probable el reforzador)
, 3
DIFERENCIAS ENTRE PROGRAMAS FIJOS Y VARIABLES en los fijos suele aparecer una pausa tras cada reforzamiento.
DIFERENCIA ENTRE RF E IF la ejecución del primero se pasa de la pausa post-reforzamiento a una tasa alta y estable de respuesta, mientras que en el IF, se pasa de la
pausa post reforzamiento a una aceleración gradual en la tasa de respuesta hasta alcanzar una tasa alta al final.
PROGRAMAS DE INTERVALO una vez que la respuesta está disponible, el sujeto puede recibirla en cualquier momento a partir de entonces con tal de que dé la
respuesta requerida. En muchas ocasiones, esta disponibilidad del reforzador se limita en el tiempo, estipulando un tiempo límite para conseguir el reforzador
(DURACIÓN LIMITADA)
RF su duración se incrementa a medida que aumenta el requisito de la razón. Killer mostró que la duración depende más de la frecuencia
del reforzamiento que del propio requisito del programa en cuanto al número de respuestas a realizar.
IF la pausa está directamente relacionada con la longitud del programa, a mayor duración del intervalo mayor será la respuesta.
PRG. DE RAZÓN a medida que se aumenta el requisito del número de respuestas, se aumenta también el intervalo entre reforzadores,
dado que se tarda más en completar las respuestas necesarias para conseguir el reforzador. La duración de la pausa está determinada más
por el programa que se va a completar que por el que ha ocurrido inmediatamente antes.
PAUSA POST-REFORZAMIENTO
Los programas (RF) se pueden disponer en cuatro series secuenciales en base a la longitud de la razón: larga-larga, corta-larga, corta-corta,
larga-corta. Si el programa que va a ocurrir es el responsable de la longitud de la pausa, se esperan pausas más largas en los dos primeros
casos, en los que el programa que viene después es una RF larga, que en los dos últimos.
De forma contraria, si el programa que ya ha ocurrido es el responsable de la pausa siguiente, las pausas más largas deberían ocurrir cuando
el programa precedente hubiera sido una RF larga, es decir, secuencias larga-larga y larga-corta.
La longitud de la pausa está mejor predicha por el programa de RF que va a ocurrir que por el que ya ha ocurrido, las RF más largas aumentan
la separación entre las respuestas iniciales y el reforzador que ocurre al final de la serie, es más contiguo a las últimas respuestas que a las
primeras.