Vamos a ver el tema 5 de Programas y Teorías de Reforzamiento de
Psicología del Aprendizaje, pero primero, como este tema está conectado
con el tema 4, quería recordaros un poco los principios básicos. Vamos a
ver el aprendizaje estímulo-respuesta, la respuesta del sujeto y la
consecuencia que obtiene. Por lo tanto, vamos a hablar de que son tres
términos, van a reunirse, va a ser una contingencia de tres términos, que
es el estímulo discriminativo, el estímulo que en el condicionamiento
clásico puede ser el estímulo condicionado, ahora pasa a ser estímulo
discriminativo que no, simplemente informa de que si da la respuesta
obtendrá la consecuencia. Posteriormente teníamos otro término, la
respuesta del sujeto, la respuesta operante, porque por eso se llama
condicionamiento operante. Se da la respuesta hacia algo en el medio
ambiente. Y luego teníamos el reforzador que le vamos a dar. Pues vamos,
vamos a ver, en el laboratorio vamos a meter a una rata o un animal en una
caja de Skinner donde puede dar muchas respuestas. Decíamos que era
operante libre porque tiene una palanca para dar respuestas, tenemos para
darle la luz, el estímulo discriminativo, da la respuesta en la palanca y
le damos la consecuencia. Puede ser apetitiva o aversiva. Apetitiva una
bolita de comida o aversiva le vamos a dar descargas. Entonces veíamos que
hay cuatro procedimientos fundamentales en condicionamiento operante. El
reforzamiento positivo, entrenamiento de recompensa, donde la contingencia
respuesta a consecuencias es positiva, pues si da la respuesta le damos la
consecuencia y la consecuencia era apetitiva. Decíamos que esto es lo que
provoca un incremento de la fuerza de la respuesta. Luego teníamos otro
procedimiento, lo llaman reforzamiento negativo pero incluye el escape y la
evitación. Aquí hay una contingencia negativa entre la respuesta y la
consecuencia, es decir, si el animal da la respuesta de escape o se escapa
de la descarga o de evitar la descarga, no le damos la descarga, no recibe
la contingencia y también incrementa la fuerza de la respuesta. Los que
disminuyen la fuerza de la respuesta son el castigo y el castigo negativo o
entrenamiento de omisión. Bueno, ya estudiamos el tema cuatro, que es más
teórico, y vamos a ver aquí en este tema ya los programas, estos son los
cuatro programas básicos de reforzamiento positivo o negativo o castigo
positivo o negativo, y vamos a pasar a los programas y teorías de
reforzamiento. Vamos a ver qué es, esto está relacionado con los tres
términos que decíamos en el tema anterior, ¿no? El estíbulo
discriminativo, la respuesta y la consecuencia. Los experimentos que vamos
a utilizar van a ser programas de reforzamiento que especifican unas reglas
que van a decir, a determinar en qué condición va la respuesta de la
fuerza de la fuerza del sujeto, de la rata o de quien esté en el aparato
que estamos investigando, puede ser reforzada. Normalmente vamos a
dividirlos en programa de reforzamiento continuo si reforzamos todas las
respuestas o, como veremos aquí, cuando vamos a reforzar algunas de las
respuestas lo vamos a llamar programa de reforzamiento intermitente,
también reforzamiento parcial, ¿no? Solo reforzamos parte de la
respuesta. El programa de reforzamiento intermitente o parcial, en
comparación con el continuo, pues el programa de intermitente produce un
aprendizaje más duradero y más difícil de extinguir, es decir, de
eliminar. Ya lo vimos en condicionamiento clásico, ¿no? Creamos el
condicionamiento y lo extinguimos. Pues aquí también se puede extinguir
como se hace pues no dándole la consecuencia al final del reforzamiento. O
sea, si el sujeto da la respuesta no le damos el reforzador, no le
eliminamos el reforzador. Entonces vamos a basarnos en la adquisición de
respuestas y no en la extinción porque... Y vamos a ver diferentes efectos
de estos programas de reforzamiento. Vamos a dividirlos en primer lugar en
programas de razón y de intervalo. ¿Vale? Y programas fijos y variables.
Imaginaros que estamos haciendo un programa de reforzamiento parcial. Si es
de razón, es a razón del número de respuesta que da el sujeto. Por
ejemplo, un programa de razón fijo 5, vamos a pedirle a la rata que
después de dar 5 respuestas le damos el reforzador. Si fuera un programa
de razón variable 5, le daríamos el reforzador después de un número
variable de respuestas que rondarán al 5. Unas veces serán 4, otras 6,
otras 3, otras 7. Esa es la diferencia entre el fijo y el variable. Y los
programas de razón y de intervalo se diferencian porque los programas de
razón es por el número de respuestas que da el sujeto y los programas de
intervalo va a tener que dar... Una respuesta al final del intervalo. No
necesita estar dando... O sea, es intervalo de tiempo, ¿no? Entonces,
imagina que intervalo fijo 30. Pues son cada... A los 30 segundos si da la
respuesta antes, le damos el reforzador. No necesita estar dando
respuestas. Programa de intervalo variable 30, pues puede ser que no
siempre será los 30. Será alrededor del 30, ¿no? De 25, 35 segundos,
¿no? O sea, esa es la diferencia entre programas fijos y programas
variables. Y también programas de razón que... Vamos a verlos
detenidamente. De forma intermitente vamos a utilizar programas de razón
que dependen del número de respuestas que emita el sujeto antes que la
última de ellas, la última de las respuestas. O sea, da la última de las
respuestas y se la reforza, ¿no? Razón fija, el número de respuestas es
siempre el mismo, es fijo. Razón variable, el número de respuestas varía
de una ocasión a otra de manera irregular, pero se hace un promedio. Por
eso decía de razón variable 5, pues sería 5 respuestas alrededor de 5
respuestas. Una vez a los 4, otros a los 6, 3, otros 7, pero que el
promedio sea 5. Entonces, vamos a ver que veis que hay una gráfica ahí
que indica razón fija, ¿no? Abajo está el tiempo, pero el sujeto cuando
va para arriba es que da muchas respuestas. Cuando queda unido horizontal
es que da pocas respuestas. El programa de razón fija tiene un dibujo
determinado, tiene una forma determinada que ya veréis que lo explicaré
luego, que es más uniforme en las respuestas. El sujeto sí mantiene
durante el tiempo la respuesta, aunque hay variaciones, y produce más
respuestas, más respuestas. Es el programa que más respuestas produce. Ya
hablaremos de él con detenimiento. Los programas de intervalo establecen
que debe pasar un determinado tiempo desde que la respuesta requerida sea
de nuevo reforzada. El intervalo fijo, cuando se mantiene constante el
tiempo, es fijo el tiempo para que se entregue el siguiente reforzador, y
refuerzan la respuesta después de que haya ocurrido un tiempo siempre
igual, pues eso es fijo, un intervalo fijo de tiempo, desde que se dio el
anterior reforzado. Sin embargo, en el intervalo variable, aquí varía la
cantidad. La cantidad de tiempo que debe transcurrir entre un reforzador y
el siguiente antes de que la respuesta sea reforzada. Hacemos un promedio,
¿no? Lo que dije antes, intervalo variable 30 no se lo damos a los 30
segundos, se los damos a los 28, a los 32, a los 27, a los 33, etc., en un
promedio entre todos los programas. Y se han dado cuenta que cada programa
produce un tipo de ejecución conductual diferente. Lo que vemos en la
gráfica, ¿no? Que se puede apreciar en la gráfica viendo cómo se
distribuyen las respuestas de los sujetos. Veis ahí en el programa de
intervalo fijo que el sujeto se da cuenta y hace como una carrerilla al
final del intervalo para dar respuestas, y luego baja un poco la respuesta
y continúa, ¿no? Ya veremos con detenimiento los cuatro programas.
Intervalo variable, sé que menos... Respuestas obtienen, ¿no? Aunque la
conducta parece que se mantiene constante. Bien, vamos a ver el programa de
razón fija. Aquí entregamos el reforzador tras un número fijo de
respuestas emitidas. La tasa de respuesta que obtenemos aquí es alta y
estable una vez que la conducta se ha iniciado. Es decir, el sujeto da una
respuesta, muchas respuestas, la respuesta es alta y estable. Hay una
carrera de la razón con este programa de razón fija, porque dice cuando
es la tasa de respuesta alta después de la pausa por reforzamiento para
completar el requerimiento de la razón. Es decir, el animal recibe la
bolita de comida, el reforzamiento, y después de una pausa de ese
reforzamiento da una respuesta alta, da muchas respuestas para completar el
siguiente. Recibir otro reforzado. Se produce, como dice, una pausa
post-reforzamiento tras la entrega del reforzador, que depende más de la
frecuencia del reforzamiento, es decir, del intervalo temporal entre
reforzadores, que del propio requisito del programa en cuanto al número de
respuestas a realizar. También se produce lo llamado tensión de la
razón. Es decir, que si con un programa de razón fija tensionamos, es
decir, aumentamos demasiado... El valor ese, imagínate que lo pasamos de
razón fija 5 a razón fija 50, pues tienden a ocurrir pausas
post-reforzamiento más largas y en casos extremos el sujeto puede dejar de
responder, puede dejar de apretar la palanca. Como ejemplo de programas de
razón fija tenemos el trabajo en cadena de las fábricas, donde el sujeto
tiene que hacer una serie de lo que tenga que hacer, o un vendedor de un
producto que cobra por cada bolsa que cobra, de razón fija o una razón
fija y quiere cobrar tanto, obtiene un reforzador fijo. Vamos a ver el
programa de razón variable. Es un programa que el número de respuestas
que le vamos a pedir al sujeto para obtener el reforzador depende, varía
de un ensayo a otro alrededor de un promedio, sí. Y lo definimos por el
número medio de respuestas requeridas para conseguir el reforzador.
Imaginaos el primer reforzador, sí, a los 5, a los 5 respuestas. El
siguiente le vamos a dar reforzador después de 7, el siguiente se lo vamos
a dar después de 3, el siguiente después de 6, el siguiente después de
4, es decir, la media sea alrededor del 5. Aquí este programa sería un
buen cuento. Pues bien, este programa es el que impide que el sujeto
adquiera una impresión exacta del número de respuestas requeridas para
obtener el reforzador. Por lo que tanto disminuyen las pausas, bajan las
pausas. Y produce una tasa de respuesta muy alta y constante. ¿Qué
ejemplo tenemos aquí? Una máquina traga perras, lleva un programa de
razón variable, es decir, que provoca menos pausas, o sea que le vamos a
dar el reforzador, un premio, cada un cierto número de monedas. Imaginaros
que son 10, pero la siguiente no es de 10, igual es cada 5 monedas, o
necesita 50, o necesita 30. Es decir, al ser variable, al no saber el
sujeto cuándo le van a dar el reforzador, produce una tasa de respuesta
muy alta y constante. El sujeto recibe el premio, sigue echando, sigue
echando, sigue echando, sigue echando. Bien, vamos a ver, pasamos a los
programas de intervalo. De tiempo, ¿no? Intervalo fijo. Programa de
intervalo fijo donde las respuestas son reforzadas sólo se ocurre cuando
ha transcurrido un periodo de tiempo fijo. Y ese intervalo indica que sólo
cuando está disponible el reforzador, no cuando se entrega. Se entrega al
final del intervalo si el sujeto da la respuesta. Y produce una tasa de
respuesta que aumenta hacia el final del intervalo. Es decir, los sujetos
aprenden a esperar y luego responder para terminar el intervalo. Y refleja
la precisión del sujeto, del animal que ponemos en la caja, para contar el
tiempo. Lo llamamos, ese dibujo que hace ahí de intervalo fijo, es la
gráfica, lo llamamos el cestón de intervalo fijo. Porque sigue un patrón
de respuestas con un intervalo fijo. También se produce pausa por
reforzamiento y la aceleración hacia el final del intervalo. Esto lo
tienen en común con el programa de razón fija. Lo que dice que a mayor
duración del intervalo, mayor pausa. Ejemplo, las pautas de estudio en
exámenes. Es un intervalo fijo, ¿no? Tú vas en octubre, te matriculas. Y
hay unas asignaturas que te examinas en enero y otras que te examinas en
mayo. Pues muy bien, ese intervalo de tiempo hasta que obtienes el
reforzador. Tienes que dar la respuesta, tienes que examinarte y luego te
darán el reforzador. Lo habrás aprobado o lo habrás suspendido. Y los
programas de intervalo variable, donde vamos a darle el reforzador. Es
decir, después de un... Un intervalo de tiempo variable. Ese intervalo lo
definimos como tiempo medio. Es un promedio transcurrido entre
reforzamientos sucesivos. Imaginaos, el primer reforzador, un minuto.
Segundo reforzador, dos minutos. Tercer reforzador, treinta segundos.
Cuarto reforzador, minuto y medio. Etcétera, un promedio. Y el sujeto
tiene que realizar la respuesta para obtener el reforzador una vez
finalizado el intervalo. Por lo tanto, las anteriores respuestas no
cuentan. Es una tasa de respuesta constante y estable. No produce altas
tasas de respuesta, pero la respuesta es constante y estable. En los otros
programas, en el intervalo fijo y en el intervalo variable, en estos
programas el reforzador está disponible hasta que se realice la respuesta.
La respuesta sin importar el tiempo que lleve. Pero ocurre que a veces se
pone una duración limitada de ese intervalo, una espera, donde se
restringe el tiempo que está disponible el reforzador. Es decir, pasa el
tiempo, dos minutos, y van a poner una duración limitada. Es decir,
durante diez segundos está disponible el reforzador. Para dar la respuesta
se obtiene el reforzador. Si pasa el tiempo, no tiene que ser restringido.
Si pasa el tiempo, ya no lo tiene. Por ejemplo, en la pesca, tiras la
caña, tienes que tirar la caña, tienes que tirar la caña, da la
respuesta constante, estable, sin pausas, y cuando pica es cuando tienes tu
reforzador. Entonces, vamos a comparar los programas de intervalo con los
de razón. ¿En qué se parece? ¿Qué similitudes hay entre los programas
de intervalo y de razón? Ya sean fijo o variable, vamos. Pues se ve que en
los programas... Los programas de razón fija y de intervalo fijo, o sea,
los fijos, producen pausa por reforzamiento, y también producen altas
tasas de respuesta tras esa pausa. Otra, la similitud de los programas de
razón variable y de intervalo variable. Los variables. ¿De qué se
parecen? Pues que mantienen tasas estables de respuesta. Sin pausas. Al
contrario que los fijos. Y tasas estables no significa altas, como en los
otros, sino que mantienen la respuesta. ¿En qué se diferencian los
programas de intervalo y de razón? Pues que la conducta que se ha
realizado mediante programas de intervalo está mediada por el sentido del
tiempo, y en los programas de razón los sujetos presentan una conducta
instrumental más vigorosa, es decir, tasas... ...tasas más altas de
respuesta. O sea, los programas de intervalo, tasas más bajas, porque el
sujeto espera, sabe el sentido del tiempo, y los programas de razón, tasas
más altas, más vigorosa respuesta. Y se diferencian en que los de razón
fija tienen pausa... De una pausa pasamos a una tasa alta y estable de
respuesta, y en los programas de intervalo fijo, de la pausa, pasamos...
...a una aceleración gradual de la tasa de respuesta. Hasta llegar, hasta
alcanzar una tasa alta al final del intervalo. Esa duración de la pausa
por reforzamiento se incrementa, sobre todo en los programas de razón
fija, si aumentamos el requisito de la razón, es decir, si le pedimos más
respuestas, hará más pausa por reforzamiento. Y esa pausa por
reforzamiento está directamente relacionada con la longitud del programa
de intervalo fijo, es decir, a mayor duración del intervalo, mayor será
la pausa. Resumiendo, esa pausa dura más en los programas de intervalo
fijo, esa pausa está relacionada con si el programa es muy largo o muy
corto. A mayor... ...a mayor... ...respuestas, duración, perdón, a mayor
de... ...requisito de la razón, número de respuestas pedidas, más pausa.
Sin embargo, en los programas de intervalo fijo, es a mayor duración del
intervalo, mayor será la pausa. Kielem demostró que la duración de la
pausa por reforzamiento en los programas de razón fija, depende más de la
frecuencia de reforzamiento, es decir, el intervalo temporal entre
reforzadores, que del propio requisito del programa en cuanto a respuestas
que tiene que dar el sujeto. En los programas de razón, la duración de la
pausa está determinado más por el programa que se va a completar que por
el que ocurrió inmediatamente antes. Esto se comprobó en estudios con
programas múltiples de razón. En los programas de razón fija, y
encontrando que los resultados obtenidos utilizando estos programas,
indican que la longitud de la pausa post reforzamiento está mejor predicha
por el programa de razón fija que va a ocurrir, que por el que ya ha
ocurrido. Es decir, es como si la rata presumiera qué programa le van a
pedir. Y se para hacer la pausa mayor o menor, depende. Vamos a pedir más,
más respuestas. En los programas de intervalo, ¿qué ocurre con esta
pausa post reforzamiento? Pues se ajusta proporcionalmente a los cambios en
la frecuencia de reforzamiento. Parece paradójico, ¿no?, que el que
ejerce control sobre la longitud de la pausa post reforzamiento no son
diferentes en los programas de razón y en los de intervalo, aunque en los
de razón... El sujeto deja de responder, lo que lleva a una pérdida
efectiva de reforzadores. Es decir, en los de razón, cuanto más rápido
responda la rata, más reforzadores obtendrá. Y decíamos que era la
frecuencia de reforzamiento y el programa que se acaban de iniciar los
determinantes fundamentales. Bueno, vamos a ver, hemos estado hablando
mucho, comparando los programas de razón, los programas de intervalo.
Vamos a ver qué función de retroalimentación tiene, vamos a poder
relacionar, en cuanto unos programas de razón o unos programas de
intervalo. Vamos a ver qué han observado los investigadores. Al igualar,
imaginaros que igualamos las tasas de reforzamiento con un programa de
razón y con otro de intervalo. Pues bien, la tasa de reforzamiento, o sea,
cuando se igualan, la respuesta es mayor en los programas de razón que los
de intervalo. Es decir, en la misma situación, el sujeto responde más, da
más respuestas a los programas de razón. ¿Qué procedimiento usaron para
equiparar los dos programas, de razón y de intervalo, en cuanto al número
de reforzadores y cómo se distribuyan? Pues bien, usaron un procedimiento
en el que se asigna un valor de intervalo a un programa de reforzamiento,
en función de lo que tarden los animales en completar previamente un
programa de razón. Es decir, si vemos que el sujeto termina un programa de
razón 5 en 10 segundos, pues le programamos un programa de intervalo de 10
segundos. Pues bien, esa retroalimentación que ejercen los reforzadores
sobre las respuestas, etc., que es de lo que estamos hablando, en los
programas de intervalo esa tasa de respuesta no influye directamente sobre
la frecuencia de administración de los reforzadores. Pero sí, en los
programas de razón sí vimos que la variaba, que la tasa de reforzamiento
variaba de forma directa con los cambios en la tasa de respuesta en un
programa de razón. Es decir, los programas de razón producen más
respuestas que los programas de intervalo. Los programas de razón, la tasa
de reforzadores, cantidad de reforzadores que obtenía el sujeto variaba de
manera directa influyendo en la tasa de respuesta que daba el sujeto. Por
lo tanto, llegaron a la conclusión de que los programas de intervalo
refuerzan tener tiempo entre respuestas largos porque el paso del tiempo
lleva a un incremento de que le puedan reforzar y, y los programas de
razón vieron que no tenían tendencia a reforzar un tiempo entre
respuestas en particular. Por lo tanto, no favorece que haya un tiempo de
respuestas largo, tiempo entre respuestas largo. Es más, como los
programas de razón responden en ráfagas, un rato luego hacen una pausa,
pues por lo tanto es probable que el reforzador actúe sobre este tiempo
entre respuestas corto. El investigador Brown denominó a este tipo de
explicación sobre el tiempo de respuestas como molecular, ahí está la
del programa de razón, porque un acontecimiento que es como el ser
reforzado es suficiente para producir un efecto. Y el mecanismo que explica
esto son las variaciones momento a momento en la contiguidad, lo cerca que
está la respuesta con el reforzado. Ten en cuenta que estamos viendo
programas parciales de reforzamiento intermitente. También, por otro lado,
vimos que en los programas de razón variable también existe una
correlación directa entre la tasa de respuesta y la tasa de reforzamiento
en las cuales la tasa de respuesta aumenta para mejorar la tasa de
reforzamiento. Pues bien, en los programas de intervalo variable no hay esa
relación directa, no hay esa relación entre tasa de respuesta y tasa de
reforzamiento. Por lo tanto las variaciones de respuesta de una afectan a
la otra, afectan al reforzamiento. A esta explicación Brown la ha
denominado como molar porque dice que las variables, tasa de reforzamiento
y tasa de respuesta, son fenómenos extensos temporalmente. Hablando de que
hay correlación, no contiguidad, no tiene que estar cerca en el tiempo en
los programas de intervalo variable. Pues bien, esta relación entre la
conducta y el ambiente que sería entre la respuesta del sujeto, el
operante y el reforzador, establecida como programas de reforzamiento, se
pueden describir en unas funciones de retroalimentación. ¿Qué es una
función de retroalimentación? Una descripción de la forma en que actúa
el ambiente, como puede ser la frecuencia del reforzamiento, la magnitud
del reforzador, la demora del reforzador, en función, vamos a poner esto
como actúa el ambiente, en función de algún aspecto de la ejecución
conductual. Es decir, vamos a hacer que los reforzadores, etc., se muevan
dependiendo de cómo el sujeto da su respuesta. Y esas funciones de
retroalimentación no asumen que la conducta esté bajo el control de una
variable independiente, sino que la conducta afecta a algún aspecto del
ambiente. Es decir, que la respuesta del sujeto tiene que ver con la
obtención de los reforzadores del aspecto del ambiente. Por lo tanto,
aquí los aspectos de la conducta y del reforzamiento son variables
dependientes que se relacionan por funciones de retroalimentación, pero
que no necesariamente tienen o tienen que mantener una relación causal. En
los programas de razón fija la tasa de reforzamiento es proporcional a la
tasa de respuesta que ha realizado el sujeto. Y esta proporcionalidad es el
requisito de la razón. Bien, ¿por qué? Porque cuanto más rápido se
responda, mayor será la tasa de reforzamiento por minuto, etc., ¿no? Y
también que el número de respuestas requeridas para producir un
incremento en la tasa de reforzamiento debe aumentar conforme aumenta el
requisito de la razón. Es decir, si el sujeto de razón fija 5, tarda poco
en dar las respuestas y cuando le piden razón fija 10 le aumenta su tasa
de respuesta para obtener el reforzador, pues bien, lo mejor que dicen, se
supone que lo mejor para el sujeto es obtener mucho reforzamiento. Vamos a
estudiar un poco cómo es la gráfica de las funciones de
retroalimentación. Las gráficas que vimos ahí al principio, ¿no? En los
programas de intervalo cuando hay un área aplanada y luego sube aplanada
indica que hay un control débil de la conducta, un control diferencial
débil. Y ese reforzamiento, esa contingencia de reforzamiento no empuja la
conducta en ninguna dirección. Lo que significa que en el punto en el que
la variable dependiente y la variable independiente parece que llegan a
estar semiestables es muy impredecible en base a la tasa de reforzamiento.
Por esto sabemos que los programas de intervalo generan variabilidad, mayor
variabilidad entre los sujetos en su tasa de respuestas. Por lo que se
encuentran muchas diferencias individuales entre unos animales y otros en
cuanto a la tasa de respuesta ya sea para los programas, bajo programas de
intervalo y también los de raza. ¿Qué hacemos cuando no? Primero tenemos
que entrenar a los sujetos, ¿no? Sin entrenamiento previo ¿qué hacen los
animales que colocamos en una caja de Skinner con un programa de
reforzamiento? Pues que desarrollan conductas propias de la especie innatas
específicas de cada especie y son el resultado de historias conductuales
remotas, se podría decir. Bien, vamos a hacer un poco de resumen. ¿Qué
hemos hablado? Hemos hablado de que hay unos programas y otros producen una
diferencia en el tiempo entre respuestas. Es decir, la explicación
molecular de Baum que explicamos hace un momento en este resumen
aplicándola a la teoría centrada en el tiempo entre respuestas se sabe
que los programas de razón los tiempos entre respuestas largos posponen el
reforzamiento hace que tarde tarde más en reforzarle, ¿no? Cuanto antes
complete el sujeto el requerimiento de la razón más rápido recibirá el
reforzador. Por lo tanto un programa de razón favorece ter cortos tiempo
entre respuestas cortos y lo que implica una alta tasa de respuesta da
muchas respuestas y que haya poco tiempo entre respuestas. Sin embargo, en
los programas de intervalo como la probabilidad de recompensa aumenta con
tener largos tiempo entre respuestas largos y esto implica tasas de
respuesta bajas. Vamos a ver la correlación directa entre la tasa de
respuesta y la tasa de reforzamiento. En los programas de razón variable
sí hay correlación directa entre tasa de respuesta tiende a aumentar para
mejorar la tasa de reforzamiento. Pero sin embargo no hay correlación
directa nada en los programas de intervalo variable entre tasa de respuesta
y tasa de reforzamiento. Estas correlaciones entre tasa de respuesta y tasa
de reforzamiento se denominan funciones de retroalimentación. Pues bien,
la relación entre conducta y ambiente las hemos descrito conducta,
respuesta y consecuencias es un programa con un programa de reforzamiento
se describen funciones de retroalimentación con correlaciones entre la
tasa de respuesta y de reforzamiento. Resumen Decíamos la conducta del
sujeto afecta algún aspecto del ambiente en este caso la respuesta que da
la palanca afecta a cuando obtendrá cuanto reforzamiento obtendrá. Y se
sabe que en los programas de intervalo las áreas aplanadas indican que la
conducta es débil no hay correlación y en los programas de razón sí, la
tasa de reforzamiento es proporcional a la tasa de respuesta. Es un
requisito de los programas de razón es decir, la razón tiene que ser
proporcional. Cuanto más rápido se responda mayor será la tasa de
reforzamiento y el número de respuestas requeridas para producir
incrementos en la tasa de reforzamiento debe aumentar conforme se
incrementa el requisito de la razón las respuestas que le pedimos. Los
programas de razón son los que más respuestas producen porque en los de
intervalo el reforzador se obtiene por esperar el momento oportuno no por
dar muchas respuestas. Y sabemos que los programas fijos producen menos
respuestas que los variables porque los programas fijos son más
predecibles y se eliminan fácilmente porque un programa fijo sería como
un programa de razón fija 1 sería un reforzamiento continuo no un
reforzamiento partido son más predecibles por lo tanto, para producir un
buen condicionamiento operante utilizamos razón variable el sujeto no sabe
cuando le vamos a dar reforzado es más eficaz Vamos a ver los programas de
reforzamiento teorías de reforzamiento diferencial de los tiempos de
respuestas. Vamos a retomar que los programas de razón producían tiempo
entre respuestas cortos, o sea muchas respuestas y los programas de
intervalo producían tiempo entre respuestas largos, por lo tanto pocas
respuestas En los programas de tasas de respuesta vamos a requerir que el
sujeto responda a una tasa particular para obtener el reforzador El
reforzamiento de una determinada respuesta vendrá determinado en función
del tiempo transcurrido entre esas respuestas y la respuesta anterior Pues
bien, el reforzamiento diferencial de tasas altas es ese en el cual
reforzamos una respuesta sólo si ocurre antes de que haya transcurrido
cierta cantidad de tiempo tras la respuesta precedente por lo tanto aquí
vamos a reforzar tiempo entre respuestas corto lo que fomenta tasas altas
de respuesta. Queremos muchas respuestas para hacer la ejecución de estos
programas que los otros de tasas bajas Por ejemplo, un ejemplo de
reforzamiento diferencial de tasas altas lo tenemos porque cuando está en
el cuestionario con tiempo límite para cada pregunta podemos saltar a la
siguiente o el tiempo que tiene un tenista para hacer el saque en un
partido de tenis es corto o un niño que come lento le vamos reforzando
para que vaya comiendo un poco más rápido pasamos ahora al reforzamiento
diferencial de tasas bajas aquí queremos, reforzamos una respuesta sólo
si ocurre después de que haya transcurrido cierta cantidad de tiempo tras
la respuesta precedente es decir, queremos que el sujeto dé pocas
respuestas aquí reforzamos los tiempos entre respuestas largos y bajos un
ejemplo es retirar la comida del horno antes de que se cuezca es decir, vas
tienes que transcurrir un tiempo a que se cueza la comida también cuando
coordinas pasos de baile no haces el ensayo rápido como es el baile sino
que coordinas los pasos lentos rápidamente cuando tocas un instrumento
musical al comienzo hay que poner el dedo para que suene correctamente
despacio poca respuesta un niño inquieto en clase le ponía como ejemplo
si le ponemos un programa de reforzamiento diferencial de tasas bajas le
vamos a reforzar por no levantarse mantenerse en su asiento también hay
que diferenciar los programas de reforzamiento diferencial de tasas bajas
se diferencian de los de intervalo fijo que reforzábamos una respuesta
después de un intervalo de tiempo en que aquí en los programas de
reforzamiento diferencial de tasas bajas se refuerza la respuesta si ha
transcurrido un tiempo desde la respuesta anterior sin embargo, en los
intervalos de tiempo fijo se refuerza una respuesta donde ha transcurrido
un tiempo fijo desde el anterior reforzado desde que obtuvo el anterior
reforzado hay que entender que los programas de reforzamiento diferencial
de tasas bajas añaden castigo es decir, si la respuesta ocurre antes del
tiempo especificado para obtener el reforzador que tiene que esperar pues
se añade un tiempo de penalización por responder antes le penalizamos con
tiempo que obtendrá el reforzador es más difícil ejecutar la respuesta
en tasas bajas porque no se hace de forma repetida es espaciada y hay una
degradación del valor del reforzador porque está demorado desde la
emisión de la respuesta a criterio es decir, aquí es más difícil que la
rata del programa porque no lo hace de forma repetida es espaciada en el
tiempo el reforzador se degrada es decir o se demora el tiempo que le damos
esto porque desde que ha dado la respuesta hasta que ha obtenido el
reforzador ha pasado un tiempo además los reforzadores además de reforzar
la respuesta refuerzan también el determinado espaciamiento de tres
respuestas la teoría del reforzamiento diferencial de los tiempos en tres
respuestas se basa en esto y dice que en todos los programas de
condicionamiento operante se refuerzan específicamente ter tiempo en tres
respuestas de una duración determinada hay que decir que los programas de
reforzamiento diferencial en tasas bajas y altas están diseñados para
reforzar respectivamente tasas bajas y altas de respuesta en tiempos entre
respuestas de larga duración o de corta sin embargo en los programas de
reforzamiento operante el sujeto puede responder libremente en los periodos
entre reforzadores por lo que los sujetos y el tipo de programas ya sean
fijos, variables, de razón o de intervalo se relacionan son
interdependientes dependen unos de otros y se debería reforzar el tiempo
entre respuestas que ocurre antes de dar el reforzador tiempo entre la
penúltima respuesta entre reforzadores y la última respuesta que va
seguida del reforzador los programas variables de razón o de intervalo
variable decíamos que consiguen respuestas constantes sin pausa por
reforzamiento y la duración del TER es homogénea, es decir los programas
variables provocan una duración del tiempo entre respuestas homogénea
hemos dicho que lo que decíamos antes se producen respuestas constantes
sin pausa y es fácil atribuir su ejecución es decir, ver cómo lo hace el
sujeto a un reforzamiento diferencial de tiempo entre respuestas de una
duración determinada más largos en los de intervalo y más cortos en los
de razón los programas fijos decíamos que la ejecución del sujeto no es
tan homogénea como en los programas variables es decir, tienen acusada
pausa por reforzamiento y los tiempos entre respuestas deberían ser cortos
puesto que los reforzadores se presentan al final cuando los sujetos están
respondiendo a una tasa alta pues bien esa pausa por reforzamiento que se
obtiene en los programas fijos de razón fija y intervalo fijo obedecen son
debidas a que los sujetos son capaces de discriminar con mucha eficacia el
momento de que le van a entregar el reforzador con lo que inmediatamente
después de obtener un reforzador como no le van a dar otro pues se ponen a
descansar la posibilidad de conseguir otro reforzador es muy improbable
inmediatamente que se hayamos dado muy bien con las teorías aquí hay que
considerar hay teorías que se basan en el nivel explicativo en la
competición entre respuestas es decir desarrollaron un modelo una teoría
por el que el peso de cada tiempo de respuestas cuenta en una función
exponencial con respecto a la distancia al reforzador de manera que los
tiempos entre respuestas más alejados del reforzador pesarán menos,
aportarán menos que los más cercanos que es lo que en su conjunto se les
va a determinar la tasa de respuesta de los sujetos vamos a dejarlo aquí y
luego seguimos con los programas compuestos de reforzamiento tema 5
continúa con programas compuestos de reforzamiento tema 6