Vamos a ver el tema 5 de Programas y Teorías de Reforzamiento de Psicología del Aprendizaje, pero primero, como este tema está conectado con el tema 4, quería recordaros un poco los principios básicos. Vamos a ver el aprendizaje estímulo-respuesta, la respuesta del sujeto y la consecuencia que obtiene. Por lo tanto, vamos a hablar de que son tres términos, van a reunirse, va a ser una contingencia de tres términos, que es el estímulo discriminativo, el estímulo que en el condicionamiento clásico puede ser el estímulo condicionado, ahora pasa a ser estímulo discriminativo que no, simplemente informa de que si da la respuesta obtendrá la consecuencia. Posteriormente teníamos otro término, la respuesta del sujeto, la respuesta operante, porque por eso se llama condicionamiento operante. Se da la respuesta hacia algo en el medio ambiente. Y luego teníamos el reforzador que le vamos a dar. Pues vamos, vamos a ver, en el laboratorio vamos a meter a una rata o un animal en una caja de Skinner donde puede dar muchas respuestas. Decíamos que era operante libre porque tiene una palanca para dar respuestas, tenemos para darle la luz, el estímulo discriminativo, da la respuesta en la palanca y le damos la consecuencia. Puede ser apetitiva o aversiva. Apetitiva una bolita de comida o aversiva le vamos a dar descargas. Entonces veíamos que hay cuatro procedimientos fundamentales en condicionamiento operante. El reforzamiento positivo, entrenamiento de recompensa, donde la contingencia respuesta a consecuencias es positiva, pues si da la respuesta le damos la consecuencia y la consecuencia era apetitiva. Decíamos que esto es lo que provoca un incremento de la fuerza de la respuesta. Luego teníamos otro procedimiento, lo llaman reforzamiento negativo pero incluye el escape y la evitación. Aquí hay una contingencia negativa entre la respuesta y la consecuencia, es decir, si el animal da la respuesta de escape o se escapa de la descarga o de evitar la descarga, no le damos la descarga, no recibe la contingencia y también incrementa la fuerza de la respuesta. Los que disminuyen la fuerza de la respuesta son el castigo y el castigo negativo o entrenamiento de omisión. Bueno, ya estudiamos el tema cuatro, que es más teórico, y vamos a ver aquí en este tema ya los programas, estos son los cuatro programas básicos de reforzamiento positivo o negativo o castigo positivo o negativo, y vamos a pasar a los programas y teorías de reforzamiento. Vamos a ver qué es, esto está relacionado con los tres términos que decíamos en el tema anterior, ¿no? El estíbulo discriminativo, la respuesta y la consecuencia. Los experimentos que vamos a utilizar van a ser programas de reforzamiento que especifican unas reglas que van a decir, a determinar en qué condición va la respuesta de la fuerza de la fuerza del sujeto, de la rata o de quien esté en el aparato que estamos investigando, puede ser reforzada. Normalmente vamos a dividirlos en programa de reforzamiento continuo si reforzamos todas las respuestas o, como veremos aquí, cuando vamos a reforzar algunas de las respuestas lo vamos a llamar programa de reforzamiento intermitente, también reforzamiento parcial, ¿no? Solo reforzamos parte de la respuesta. El programa de reforzamiento intermitente o parcial, en comparación con el continuo, pues el programa de intermitente produce un aprendizaje más duradero y más difícil de extinguir, es decir, de eliminar. Ya lo vimos en condicionamiento clásico, ¿no? Creamos el condicionamiento y lo extinguimos. Pues aquí también se puede extinguir como se hace pues no dándole la consecuencia al final del reforzamiento. O sea, si el sujeto da la respuesta no le damos el reforzador, no le eliminamos el reforzador. Entonces vamos a basarnos en la adquisición de respuestas y no en la extinción porque... Y vamos a ver diferentes efectos de estos programas de reforzamiento. Vamos a dividirlos en primer lugar en programas de razón y de intervalo. ¿Vale? Y programas fijos y variables. Imaginaros que estamos haciendo un programa de reforzamiento parcial. Si es de razón, es a razón del número de respuesta que da el sujeto. Por ejemplo, un programa de razón fijo 5, vamos a pedirle a la rata que después de dar 5 respuestas le damos el reforzador. Si fuera un programa de razón variable 5, le daríamos el reforzador después de un número variable de respuestas que rondarán al 5. Unas veces serán 4, otras 6, otras 3, otras 7. Esa es la diferencia entre el fijo y el variable. Y los programas de razón y de intervalo se diferencian porque los programas de razón es por el número de respuestas que da el sujeto y los programas de intervalo va a tener que dar... Una respuesta al final del intervalo. No necesita estar dando... O sea, es intervalo de tiempo, ¿no? Entonces, imagina que intervalo fijo 30. Pues son cada... A los 30 segundos si da la respuesta antes, le damos el reforzador. No necesita estar dando respuestas. Programa de intervalo variable 30, pues puede ser que no siempre será los 30. Será alrededor del 30, ¿no? De 25, 35 segundos, ¿no? O sea, esa es la diferencia entre programas fijos y programas variables. Y también programas de razón que... Vamos a verlos detenidamente. De forma intermitente vamos a utilizar programas de razón que dependen del número de respuestas que emita el sujeto antes que la última de ellas, la última de las respuestas. O sea, da la última de las respuestas y se la reforza, ¿no? Razón fija, el número de respuestas es siempre el mismo, es fijo. Razón variable, el número de respuestas varía de una ocasión a otra de manera irregular, pero se hace un promedio. Por eso decía de razón variable 5, pues sería 5 respuestas alrededor de 5 respuestas. Una vez a los 4, otros a los 6, 3, otros 7, pero que el promedio sea 5. Entonces, vamos a ver que veis que hay una gráfica ahí que indica razón fija, ¿no? Abajo está el tiempo, pero el sujeto cuando va para arriba es que da muchas respuestas. Cuando queda unido horizontal es que da pocas respuestas. El programa de razón fija tiene un dibujo determinado, tiene una forma determinada que ya veréis que lo explicaré luego, que es más uniforme en las respuestas. El sujeto sí mantiene durante el tiempo la respuesta, aunque hay variaciones, y produce más respuestas, más respuestas. Es el programa que más respuestas produce. Ya hablaremos de él con detenimiento. Los programas de intervalo establecen que debe pasar un determinado tiempo desde que la respuesta requerida sea de nuevo reforzada. El intervalo fijo, cuando se mantiene constante el tiempo, es fijo el tiempo para que se entregue el siguiente reforzador, y refuerzan la respuesta después de que haya ocurrido un tiempo siempre igual, pues eso es fijo, un intervalo fijo de tiempo, desde que se dio el anterior reforzado. Sin embargo, en el intervalo variable, aquí varía la cantidad. La cantidad de tiempo que debe transcurrir entre un reforzador y el siguiente antes de que la respuesta sea reforzada. Hacemos un promedio, ¿no? Lo que dije antes, intervalo variable 30 no se lo damos a los 30 segundos, se los damos a los 28, a los 32, a los 27, a los 33, etc., en un promedio entre todos los programas. Y se han dado cuenta que cada programa produce un tipo de ejecución conductual diferente. Lo que vemos en la gráfica, ¿no? Que se puede apreciar en la gráfica viendo cómo se distribuyen las respuestas de los sujetos. Veis ahí en el programa de intervalo fijo que el sujeto se da cuenta y hace como una carrerilla al final del intervalo para dar respuestas, y luego baja un poco la respuesta y continúa, ¿no? Ya veremos con detenimiento los cuatro programas. Intervalo variable, sé que menos... Respuestas obtienen, ¿no? Aunque la conducta parece que se mantiene constante. Bien, vamos a ver el programa de razón fija. Aquí entregamos el reforzador tras un número fijo de respuestas emitidas. La tasa de respuesta que obtenemos aquí es alta y estable una vez que la conducta se ha iniciado. Es decir, el sujeto da una respuesta, muchas respuestas, la respuesta es alta y estable. Hay una carrera de la razón con este programa de razón fija, porque dice cuando es la tasa de respuesta alta después de la pausa por reforzamiento para completar el requerimiento de la razón. Es decir, el animal recibe la bolita de comida, el reforzamiento, y después de una pausa de ese reforzamiento da una respuesta alta, da muchas respuestas para completar el siguiente. Recibir otro reforzado. Se produce, como dice, una pausa post-reforzamiento tras la entrega del reforzador, que depende más de la frecuencia del reforzamiento, es decir, del intervalo temporal entre reforzadores, que del propio requisito del programa en cuanto al número de respuestas a realizar. También se produce lo llamado tensión de la razón. Es decir, que si con un programa de razón fija tensionamos, es decir, aumentamos demasiado... El valor ese, imagínate que lo pasamos de razón fija 5 a razón fija 50, pues tienden a ocurrir pausas post-reforzamiento más largas y en casos extremos el sujeto puede dejar de responder, puede dejar de apretar la palanca. Como ejemplo de programas de razón fija tenemos el trabajo en cadena de las fábricas, donde el sujeto tiene que hacer una serie de lo que tenga que hacer, o un vendedor de un producto que cobra por cada bolsa que cobra, de razón fija o una razón fija y quiere cobrar tanto, obtiene un reforzador fijo. Vamos a ver el programa de razón variable. Es un programa que el número de respuestas que le vamos a pedir al sujeto para obtener el reforzador depende, varía de un ensayo a otro alrededor de un promedio, sí. Y lo definimos por el número medio de respuestas requeridas para conseguir el reforzador. Imaginaos el primer reforzador, sí, a los 5, a los 5 respuestas. El siguiente le vamos a dar reforzador después de 7, el siguiente se lo vamos a dar después de 3, el siguiente después de 6, el siguiente después de 4, es decir, la media sea alrededor del 5. Aquí este programa sería un buen cuento. Pues bien, este programa es el que impide que el sujeto adquiera una impresión exacta del número de respuestas requeridas para obtener el reforzador. Por lo que tanto disminuyen las pausas, bajan las pausas. Y produce una tasa de respuesta muy alta y constante. ¿Qué ejemplo tenemos aquí? Una máquina traga perras, lleva un programa de razón variable, es decir, que provoca menos pausas, o sea que le vamos a dar el reforzador, un premio, cada un cierto número de monedas. Imaginaros que son 10, pero la siguiente no es de 10, igual es cada 5 monedas, o necesita 50, o necesita 30. Es decir, al ser variable, al no saber el sujeto cuándo le van a dar el reforzador, produce una tasa de respuesta muy alta y constante. El sujeto recibe el premio, sigue echando, sigue echando, sigue echando, sigue echando. Bien, vamos a ver, pasamos a los programas de intervalo. De tiempo, ¿no? Intervalo fijo. Programa de intervalo fijo donde las respuestas son reforzadas sólo se ocurre cuando ha transcurrido un periodo de tiempo fijo. Y ese intervalo indica que sólo cuando está disponible el reforzador, no cuando se entrega. Se entrega al final del intervalo si el sujeto da la respuesta. Y produce una tasa de respuesta que aumenta hacia el final del intervalo. Es decir, los sujetos aprenden a esperar y luego responder para terminar el intervalo. Y refleja la precisión del sujeto, del animal que ponemos en la caja, para contar el tiempo. Lo llamamos, ese dibujo que hace ahí de intervalo fijo, es la gráfica, lo llamamos el cestón de intervalo fijo. Porque sigue un patrón de respuestas con un intervalo fijo. También se produce pausa por reforzamiento y la aceleración hacia el final del intervalo. Esto lo tienen en común con el programa de razón fija. Lo que dice que a mayor duración del intervalo, mayor pausa. Ejemplo, las pautas de estudio en exámenes. Es un intervalo fijo, ¿no? Tú vas en octubre, te matriculas. Y hay unas asignaturas que te examinas en enero y otras que te examinas en mayo. Pues muy bien, ese intervalo de tiempo hasta que obtienes el reforzador. Tienes que dar la respuesta, tienes que examinarte y luego te darán el reforzador. Lo habrás aprobado o lo habrás suspendido. Y los programas de intervalo variable, donde vamos a darle el reforzador. Es decir, después de un... Un intervalo de tiempo variable. Ese intervalo lo definimos como tiempo medio. Es un promedio transcurrido entre reforzamientos sucesivos. Imaginaos, el primer reforzador, un minuto. Segundo reforzador, dos minutos. Tercer reforzador, treinta segundos. Cuarto reforzador, minuto y medio. Etcétera, un promedio. Y el sujeto tiene que realizar la respuesta para obtener el reforzador una vez finalizado el intervalo. Por lo tanto, las anteriores respuestas no cuentan. Es una tasa de respuesta constante y estable. No produce altas tasas de respuesta, pero la respuesta es constante y estable. En los otros programas, en el intervalo fijo y en el intervalo variable, en estos programas el reforzador está disponible hasta que se realice la respuesta. La respuesta sin importar el tiempo que lleve. Pero ocurre que a veces se pone una duración limitada de ese intervalo, una espera, donde se restringe el tiempo que está disponible el reforzador. Es decir, pasa el tiempo, dos minutos, y van a poner una duración limitada. Es decir, durante diez segundos está disponible el reforzador. Para dar la respuesta se obtiene el reforzador. Si pasa el tiempo, no tiene que ser restringido. Si pasa el tiempo, ya no lo tiene. Por ejemplo, en la pesca, tiras la caña, tienes que tirar la caña, tienes que tirar la caña, da la respuesta constante, estable, sin pausas, y cuando pica es cuando tienes tu reforzador. Entonces, vamos a comparar los programas de intervalo con los de razón. ¿En qué se parece? ¿Qué similitudes hay entre los programas de intervalo y de razón? Ya sean fijo o variable, vamos. Pues se ve que en los programas... Los programas de razón fija y de intervalo fijo, o sea, los fijos, producen pausa por reforzamiento, y también producen altas tasas de respuesta tras esa pausa. Otra, la similitud de los programas de razón variable y de intervalo variable. Los variables. ¿De qué se parecen? Pues que mantienen tasas estables de respuesta. Sin pausas. Al contrario que los fijos. Y tasas estables no significa altas, como en los otros, sino que mantienen la respuesta. ¿En qué se diferencian los programas de intervalo y de razón? Pues que la conducta que se ha realizado mediante programas de intervalo está mediada por el sentido del tiempo, y en los programas de razón los sujetos presentan una conducta instrumental más vigorosa, es decir, tasas... ...tasas más altas de respuesta. O sea, los programas de intervalo, tasas más bajas, porque el sujeto espera, sabe el sentido del tiempo, y los programas de razón, tasas más altas, más vigorosa respuesta. Y se diferencian en que los de razón fija tienen pausa... De una pausa pasamos a una tasa alta y estable de respuesta, y en los programas de intervalo fijo, de la pausa, pasamos... ...a una aceleración gradual de la tasa de respuesta. Hasta llegar, hasta alcanzar una tasa alta al final del intervalo. Esa duración de la pausa por reforzamiento se incrementa, sobre todo en los programas de razón fija, si aumentamos el requisito de la razón, es decir, si le pedimos más respuestas, hará más pausa por reforzamiento. Y esa pausa por reforzamiento está directamente relacionada con la longitud del programa de intervalo fijo, es decir, a mayor duración del intervalo, mayor será la pausa. Resumiendo, esa pausa dura más en los programas de intervalo fijo, esa pausa está relacionada con si el programa es muy largo o muy corto. A mayor... ...a mayor... ...respuestas, duración, perdón, a mayor de... ...requisito de la razón, número de respuestas pedidas, más pausa. Sin embargo, en los programas de intervalo fijo, es a mayor duración del intervalo, mayor será la pausa. Kielem demostró que la duración de la pausa por reforzamiento en los programas de razón fija, depende más de la frecuencia de reforzamiento, es decir, el intervalo temporal entre reforzadores, que del propio requisito del programa en cuanto a respuestas que tiene que dar el sujeto. En los programas de razón, la duración de la pausa está determinado más por el programa que se va a completar que por el que ocurrió inmediatamente antes. Esto se comprobó en estudios con programas múltiples de razón. En los programas de razón fija, y encontrando que los resultados obtenidos utilizando estos programas, indican que la longitud de la pausa post reforzamiento está mejor predicha por el programa de razón fija que va a ocurrir, que por el que ya ha ocurrido. Es decir, es como si la rata presumiera qué programa le van a pedir. Y se para hacer la pausa mayor o menor, depende. Vamos a pedir más, más respuestas. En los programas de intervalo, ¿qué ocurre con esta pausa post reforzamiento? Pues se ajusta proporcionalmente a los cambios en la frecuencia de reforzamiento. Parece paradójico, ¿no?, que el que ejerce control sobre la longitud de la pausa post reforzamiento no son diferentes en los programas de razón y en los de intervalo, aunque en los de razón... El sujeto deja de responder, lo que lleva a una pérdida efectiva de reforzadores. Es decir, en los de razón, cuanto más rápido responda la rata, más reforzadores obtendrá. Y decíamos que era la frecuencia de reforzamiento y el programa que se acaban de iniciar los determinantes fundamentales. Bueno, vamos a ver, hemos estado hablando mucho, comparando los programas de razón, los programas de intervalo. Vamos a ver qué función de retroalimentación tiene, vamos a poder relacionar, en cuanto unos programas de razón o unos programas de intervalo. Vamos a ver qué han observado los investigadores. Al igualar, imaginaros que igualamos las tasas de reforzamiento con un programa de razón y con otro de intervalo. Pues bien, la tasa de reforzamiento, o sea, cuando se igualan, la respuesta es mayor en los programas de razón que los de intervalo. Es decir, en la misma situación, el sujeto responde más, da más respuestas a los programas de razón. ¿Qué procedimiento usaron para equiparar los dos programas, de razón y de intervalo, en cuanto al número de reforzadores y cómo se distribuyan? Pues bien, usaron un procedimiento en el que se asigna un valor de intervalo a un programa de reforzamiento, en función de lo que tarden los animales en completar previamente un programa de razón. Es decir, si vemos que el sujeto termina un programa de razón 5 en 10 segundos, pues le programamos un programa de intervalo de 10 segundos. Pues bien, esa retroalimentación que ejercen los reforzadores sobre las respuestas, etc., que es de lo que estamos hablando, en los programas de intervalo esa tasa de respuesta no influye directamente sobre la frecuencia de administración de los reforzadores. Pero sí, en los programas de razón sí vimos que la variaba, que la tasa de reforzamiento variaba de forma directa con los cambios en la tasa de respuesta en un programa de razón. Es decir, los programas de razón producen más respuestas que los programas de intervalo. Los programas de razón, la tasa de reforzadores, cantidad de reforzadores que obtenía el sujeto variaba de manera directa influyendo en la tasa de respuesta que daba el sujeto. Por lo tanto, llegaron a la conclusión de que los programas de intervalo refuerzan tener tiempo entre respuestas largos porque el paso del tiempo lleva a un incremento de que le puedan reforzar y, y los programas de razón vieron que no tenían tendencia a reforzar un tiempo entre respuestas en particular. Por lo tanto, no favorece que haya un tiempo de respuestas largo, tiempo entre respuestas largo. Es más, como los programas de razón responden en ráfagas, un rato luego hacen una pausa, pues por lo tanto es probable que el reforzador actúe sobre este tiempo entre respuestas corto. El investigador Brown denominó a este tipo de explicación sobre el tiempo de respuestas como molecular, ahí está la del programa de razón, porque un acontecimiento que es como el ser reforzado es suficiente para producir un efecto. Y el mecanismo que explica esto son las variaciones momento a momento en la contiguidad, lo cerca que está la respuesta con el reforzado. Ten en cuenta que estamos viendo programas parciales de reforzamiento intermitente. También, por otro lado, vimos que en los programas de razón variable también existe una correlación directa entre la tasa de respuesta y la tasa de reforzamiento en las cuales la tasa de respuesta aumenta para mejorar la tasa de reforzamiento. Pues bien, en los programas de intervalo variable no hay esa relación directa, no hay esa relación entre tasa de respuesta y tasa de reforzamiento. Por lo tanto las variaciones de respuesta de una afectan a la otra, afectan al reforzamiento. A esta explicación Brown la ha denominado como molar porque dice que las variables, tasa de reforzamiento y tasa de respuesta, son fenómenos extensos temporalmente. Hablando de que hay correlación, no contiguidad, no tiene que estar cerca en el tiempo en los programas de intervalo variable. Pues bien, esta relación entre la conducta y el ambiente que sería entre la respuesta del sujeto, el operante y el reforzador, establecida como programas de reforzamiento, se pueden describir en unas funciones de retroalimentación. ¿Qué es una función de retroalimentación? Una descripción de la forma en que actúa el ambiente, como puede ser la frecuencia del reforzamiento, la magnitud del reforzador, la demora del reforzador, en función, vamos a poner esto como actúa el ambiente, en función de algún aspecto de la ejecución conductual. Es decir, vamos a hacer que los reforzadores, etc., se muevan dependiendo de cómo el sujeto da su respuesta. Y esas funciones de retroalimentación no asumen que la conducta esté bajo el control de una variable independiente, sino que la conducta afecta a algún aspecto del ambiente. Es decir, que la respuesta del sujeto tiene que ver con la obtención de los reforzadores del aspecto del ambiente. Por lo tanto, aquí los aspectos de la conducta y del reforzamiento son variables dependientes que se relacionan por funciones de retroalimentación, pero que no necesariamente tienen o tienen que mantener una relación causal. En los programas de razón fija la tasa de reforzamiento es proporcional a la tasa de respuesta que ha realizado el sujeto. Y esta proporcionalidad es el requisito de la razón. Bien, ¿por qué? Porque cuanto más rápido se responda, mayor será la tasa de reforzamiento por minuto, etc., ¿no? Y también que el número de respuestas requeridas para producir un incremento en la tasa de reforzamiento debe aumentar conforme aumenta el requisito de la razón. Es decir, si el sujeto de razón fija 5, tarda poco en dar las respuestas y cuando le piden razón fija 10 le aumenta su tasa de respuesta para obtener el reforzador, pues bien, lo mejor que dicen, se supone que lo mejor para el sujeto es obtener mucho reforzamiento. Vamos a estudiar un poco cómo es la gráfica de las funciones de retroalimentación. Las gráficas que vimos ahí al principio, ¿no? En los programas de intervalo cuando hay un área aplanada y luego sube aplanada indica que hay un control débil de la conducta, un control diferencial débil. Y ese reforzamiento, esa contingencia de reforzamiento no empuja la conducta en ninguna dirección. Lo que significa que en el punto en el que la variable dependiente y la variable independiente parece que llegan a estar semiestables es muy impredecible en base a la tasa de reforzamiento. Por esto sabemos que los programas de intervalo generan variabilidad, mayor variabilidad entre los sujetos en su tasa de respuestas. Por lo que se encuentran muchas diferencias individuales entre unos animales y otros en cuanto a la tasa de respuesta ya sea para los programas, bajo programas de intervalo y también los de raza. ¿Qué hacemos cuando no? Primero tenemos que entrenar a los sujetos, ¿no? Sin entrenamiento previo ¿qué hacen los animales que colocamos en una caja de Skinner con un programa de reforzamiento? Pues que desarrollan conductas propias de la especie innatas específicas de cada especie y son el resultado de historias conductuales remotas, se podría decir. Bien, vamos a hacer un poco de resumen. ¿Qué hemos hablado? Hemos hablado de que hay unos programas y otros producen una diferencia en el tiempo entre respuestas. Es decir, la explicación molecular de Baum que explicamos hace un momento en este resumen aplicándola a la teoría centrada en el tiempo entre respuestas se sabe que los programas de razón los tiempos entre respuestas largos posponen el reforzamiento hace que tarde tarde más en reforzarle, ¿no? Cuanto antes complete el sujeto el requerimiento de la razón más rápido recibirá el reforzador. Por lo tanto un programa de razón favorece ter cortos tiempo entre respuestas cortos y lo que implica una alta tasa de respuesta da muchas respuestas y que haya poco tiempo entre respuestas. Sin embargo, en los programas de intervalo como la probabilidad de recompensa aumenta con tener largos tiempo entre respuestas largos y esto implica tasas de respuesta bajas. Vamos a ver la correlación directa entre la tasa de respuesta y la tasa de reforzamiento. En los programas de razón variable sí hay correlación directa entre tasa de respuesta tiende a aumentar para mejorar la tasa de reforzamiento. Pero sin embargo no hay correlación directa nada en los programas de intervalo variable entre tasa de respuesta y tasa de reforzamiento. Estas correlaciones entre tasa de respuesta y tasa de reforzamiento se denominan funciones de retroalimentación. Pues bien, la relación entre conducta y ambiente las hemos descrito conducta, respuesta y consecuencias es un programa con un programa de reforzamiento se describen funciones de retroalimentación con correlaciones entre la tasa de respuesta y de reforzamiento. Resumen Decíamos la conducta del sujeto afecta algún aspecto del ambiente en este caso la respuesta que da la palanca afecta a cuando obtendrá cuanto reforzamiento obtendrá. Y se sabe que en los programas de intervalo las áreas aplanadas indican que la conducta es débil no hay correlación y en los programas de razón sí, la tasa de reforzamiento es proporcional a la tasa de respuesta. Es un requisito de los programas de razón es decir, la razón tiene que ser proporcional. Cuanto más rápido se responda mayor será la tasa de reforzamiento y el número de respuestas requeridas para producir incrementos en la tasa de reforzamiento debe aumentar conforme se incrementa el requisito de la razón las respuestas que le pedimos. Los programas de razón son los que más respuestas producen porque en los de intervalo el reforzador se obtiene por esperar el momento oportuno no por dar muchas respuestas. Y sabemos que los programas fijos producen menos respuestas que los variables porque los programas fijos son más predecibles y se eliminan fácilmente porque un programa fijo sería como un programa de razón fija 1 sería un reforzamiento continuo no un reforzamiento partido son más predecibles por lo tanto, para producir un buen condicionamiento operante utilizamos razón variable el sujeto no sabe cuando le vamos a dar reforzado es más eficaz Vamos a ver los programas de reforzamiento teorías de reforzamiento diferencial de los tiempos de respuestas. Vamos a retomar que los programas de razón producían tiempo entre respuestas cortos, o sea muchas respuestas y los programas de intervalo producían tiempo entre respuestas largos, por lo tanto pocas respuestas En los programas de tasas de respuesta vamos a requerir que el sujeto responda a una tasa particular para obtener el reforzador El reforzamiento de una determinada respuesta vendrá determinado en función del tiempo transcurrido entre esas respuestas y la respuesta anterior Pues bien, el reforzamiento diferencial de tasas altas es ese en el cual reforzamos una respuesta sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente por lo tanto aquí vamos a reforzar tiempo entre respuestas corto lo que fomenta tasas altas de respuesta. Queremos muchas respuestas para hacer la ejecución de estos programas que los otros de tasas bajas Por ejemplo, un ejemplo de reforzamiento diferencial de tasas altas lo tenemos porque cuando está en el cuestionario con tiempo límite para cada pregunta podemos saltar a la siguiente o el tiempo que tiene un tenista para hacer el saque en un partido de tenis es corto o un niño que come lento le vamos reforzando para que vaya comiendo un poco más rápido pasamos ahora al reforzamiento diferencial de tasas bajas aquí queremos, reforzamos una respuesta sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente es decir, queremos que el sujeto dé pocas respuestas aquí reforzamos los tiempos entre respuestas largos y bajos un ejemplo es retirar la comida del horno antes de que se cuezca es decir, vas tienes que transcurrir un tiempo a que se cueza la comida también cuando coordinas pasos de baile no haces el ensayo rápido como es el baile sino que coordinas los pasos lentos rápidamente cuando tocas un instrumento musical al comienzo hay que poner el dedo para que suene correctamente despacio poca respuesta un niño inquieto en clase le ponía como ejemplo si le ponemos un programa de reforzamiento diferencial de tasas bajas le vamos a reforzar por no levantarse mantenerse en su asiento también hay que diferenciar los programas de reforzamiento diferencial de tasas bajas se diferencian de los de intervalo fijo que reforzábamos una respuesta después de un intervalo de tiempo en que aquí en los programas de reforzamiento diferencial de tasas bajas se refuerza la respuesta si ha transcurrido un tiempo desde la respuesta anterior sin embargo, en los intervalos de tiempo fijo se refuerza una respuesta donde ha transcurrido un tiempo fijo desde el anterior reforzado desde que obtuvo el anterior reforzado hay que entender que los programas de reforzamiento diferencial de tasas bajas añaden castigo es decir, si la respuesta ocurre antes del tiempo especificado para obtener el reforzador que tiene que esperar pues se añade un tiempo de penalización por responder antes le penalizamos con tiempo que obtendrá el reforzador es más difícil ejecutar la respuesta en tasas bajas porque no se hace de forma repetida es espaciada y hay una degradación del valor del reforzador porque está demorado desde la emisión de la respuesta a criterio es decir, aquí es más difícil que la rata del programa porque no lo hace de forma repetida es espaciada en el tiempo el reforzador se degrada es decir o se demora el tiempo que le damos esto porque desde que ha dado la respuesta hasta que ha obtenido el reforzador ha pasado un tiempo además los reforzadores además de reforzar la respuesta refuerzan también el determinado espaciamiento de tres respuestas la teoría del reforzamiento diferencial de los tiempos en tres respuestas se basa en esto y dice que en todos los programas de condicionamiento operante se refuerzan específicamente ter tiempo en tres respuestas de una duración determinada hay que decir que los programas de reforzamiento diferencial en tasas bajas y altas están diseñados para reforzar respectivamente tasas bajas y altas de respuesta en tiempos entre respuestas de larga duración o de corta sin embargo en los programas de reforzamiento operante el sujeto puede responder libremente en los periodos entre reforzadores por lo que los sujetos y el tipo de programas ya sean fijos, variables, de razón o de intervalo se relacionan son interdependientes dependen unos de otros y se debería reforzar el tiempo entre respuestas que ocurre antes de dar el reforzador tiempo entre la penúltima respuesta entre reforzadores y la última respuesta que va seguida del reforzador los programas variables de razón o de intervalo variable decíamos que consiguen respuestas constantes sin pausa por reforzamiento y la duración del TER es homogénea, es decir los programas variables provocan una duración del tiempo entre respuestas homogénea hemos dicho que lo que decíamos antes se producen respuestas constantes sin pausa y es fácil atribuir su ejecución es decir, ver cómo lo hace el sujeto a un reforzamiento diferencial de tiempo entre respuestas de una duración determinada más largos en los de intervalo y más cortos en los de razón los programas fijos decíamos que la ejecución del sujeto no es tan homogénea como en los programas variables es decir, tienen acusada pausa por reforzamiento y los tiempos entre respuestas deberían ser cortos puesto que los reforzadores se presentan al final cuando los sujetos están respondiendo a una tasa alta pues bien esa pausa por reforzamiento que se obtiene en los programas fijos de razón fija y intervalo fijo obedecen son debidas a que los sujetos son capaces de discriminar con mucha eficacia el momento de que le van a entregar el reforzador con lo que inmediatamente después de obtener un reforzador como no le van a dar otro pues se ponen a descansar la posibilidad de conseguir otro reforzador es muy improbable inmediatamente que se hayamos dado muy bien con las teorías aquí hay que considerar hay teorías que se basan en el nivel explicativo en la competición entre respuestas es decir desarrollaron un modelo una teoría por el que el peso de cada tiempo de respuestas cuenta en una función exponencial con respecto a la distancia al reforzador de manera que los tiempos entre respuestas más alejados del reforzador pesarán menos, aportarán menos que los más cercanos que es lo que en su conjunto se les va a determinar la tasa de respuesta de los sujetos vamos a dejarlo aquí y luego seguimos con los programas compuestos de reforzamiento tema 5 continúa con programas compuestos de reforzamiento tema 6