Vamos a empezar la tutoría del tema 4, condicionamiento operante. Principios básicos, porque hay dos temas. Luego está el tema de los programas y las teorías. Condicionamiento operante. ¿Por qué nos interesa conocer el condicionamiento operante? Habíamos visto conductas automáticas ante el estímulo en el condicionamiento clásico, pero ahora hay muchas conductas diarias que no ocurren de forma automática. El sujeto emite una respuesta relacionada con algo que pasó en el pasado, con algún acontecimiento que ocurrió otras veces. Pues eso es el condicionamiento operante. Cuando las conductas es probable que se vuelvan a repetir si reciben un incentivo, o sea, si es agradable, de placer. Pero si recibimos aversión, es probable que no se vuelva a hacer. En condicionamiento operante vamos a estudiar esos principios que permiten predecir cómo se produce una respuesta que es evocada, por un estímulo. Entonces, los antecedentes históricos tenemos a Darwin, que influyó en el análisis experimental de la conducta del condicionamiento operante. Y postulaba Darwin en su teoría que la variación y la selección son importantes en cuanto a las características heredadas y se aplica al comportamiento. Variedad de comportamientos, seleccionamos un comportamiento u otro. En el condicionamiento operante, el reforzador es el seleccionador de las respuestas más apropiado y así aparece una conducta según sea la circunstancia. ¿Quiénes fueron los que empezaron con esto del condicionamiento operante? Tórtico y la ley del efecto. Tórtico empezaba a ensayar los gatos, les metía en una caja problema y se dio cuenta que los gatos por casualidad activaban el mecanismo de apertura. Les ponían el refuerzo fuera, las comidas. Y se daba cuenta que cada vez, cada vez. En cada experimento que repetía, tardaba menos. Iba disminuyendo la latencia de tiempo desde que empezaba el experimento. Hoy lo llamó aprendizaje por ensayo y error. Y dice, decía Tórtico, que cuando una conducta va seguida de un incentivo agradable para el animal... Al estar de nuevo en esa situación será más probable que la conducta se vuelva a repetir. Por eso desarrolló Tórnike un sistema de aprendizaje basado en una concepción hedonista de placentera, ¿vale? Quedando decir, las conductas que son placenteras se fortalecen y las conductas que tienen resultados desagradables se van a debilitar. Posteriormente a Tórnike apareció en el condicionamiento operante Stine. Él ya lo llama el análisis experimental del comportamiento y es el primer responsable del reforzamiento. Decía que, bueno, los reflejos podían ser estudiados como conductas y distingue el condicionamiento de los reflejos, el condicionamiento clásico de Paulot, y el aprendizaje de Tórnike, ¿no? Dice que el aprendizaje... La conducta de los sujetos se regula por condicionamiento de reflejos y operante. Reflejos es la respuesta respondiente y el operante es el condicionamiento operante. Se centra en las relaciones funcionales entre la conducta y sus consecuencias. entonces, ¿por qué lo llama operante? porque llama condicionamiento operante a la capacidad que tiene el sujeto para operar sobre el ambiente, para hacer algo dar una respuesta, la respuesta la vamos a llamar operante también lo llaman instrumental, ¿por qué? porque la conducta del sujeto es un instrumento para obtener conseguir un reforzador y, pero bueno Torrice hacía ensayos discretos cada vez un ensayo en la caja el gato lo metía en la caja y Skinner hacía el procedimiento experimental de operante libre, para diferenciarlo de los ensayos discretos y torres luego diremos lo que diferencia bien definición de condicionamiento operante el condicionamiento operante es el proceso, es un proceso que da lugar a que una respuesta se vea modificada por los efectos que tiene el ambiente sobre ella, por las consecuencias que obtiene, que lo vamos a llamar el ambiente, el contexto Por lo tanto, el condicionamiento operante dispone al sujeto a algunas circunstancias en las que alguna de sus conductas da lugar a la aparición de una respuesta, de una admisión de una respuesta. Por lo tanto, en el condicionamiento operante es el sujeto el que opera en el medio, lo modifica y al mismo tiempo el medio modifica al organismo de este sujeto. Si el resultado es beneficioso, la conducta se fortalece. Si es perjudicial, tiende a desaparecer. Por lo tanto, con el condicionamiento operante, los sujetos aprenden a obtener o eliminar, si el resultado no les gusta, consecuencias del ambiente. También aprenden los sujetos a dar respuestas ante una nueva circunstancia, con respuestas que formaban parte de su... No con las mismas respuestas que daban antes, sino que pueden dar... Respuestas nuevas. Ahora vamos a pasar a ver la contingencia de tres términos. Allí, en el condicionamiento clásico, decíamos que el estímulo condicionado tenía que estar unido con el incondicionado. Es decir, contingente, aparecer uno detrás de otro. Eso lo llamamos contingente. Aquí, en el condicionamiento operante... La consecuencia está relacionada con la respuesta, con la presentación de la respuesta anterior. Entonces, la unidad fundamental de análisis en el estudio de la conducta operante es estos tres términos. El estímulo discriminativo, la respuesta y la consecuencia. ¿La consecuencia qué significa? Que en presencia de un estímulo específico, un estímulo discriminativo, el reforzador se presentará si la respuesta operante sucede. Entonces, primero va el estímulo discriminativo, digamos, un alumno. Veo el semáforo en verde de peatónico, que es el estímulo discriminativo para mi conducta, de cruzar al otro lado sin que me atropelle. ¿Vale? Entonces, ¿cómo sería eso? ¿Qué es el estímulo discriminativo? Vamos a ir uno por uno estos tres términos. Los estímulos antecedentes tienen mucha importancia. La importancia del condicionamiento operante lo vamos a llamar discriminatorio. Pues bien, esos estímulos no provocan la aparición de la respuesta, sino señalan la ocasión. Para que un estímulo indique que una respuesta puede tener una consecuencia. ¿vale? la luz de una de una la luz encendida de una máquina de refresco un estímulo discriminativo yo quiero, tengo sed quiero beber un refresco doy la respuesta que es meter la moneda y obtengo la consecuencia son los tres elementos estímulo discriminativo, respuesta y consecuencia aquí hablan un poco de que el reforzamiento diferencial consiste en reforzar una respuesta operante en una situación y no en otra ¿no? por lo que aquí el estímulo discriminativo ejerce control sobre esa respuesta pero no la provoca si el estímulo discriminativo es seguido de una respuesta con una consecuencia repetitiva la respuesta se ve reforzada y hace que aumente la probabilidad de que se produzca posteriormente ya ves, os estoy diciendo estímulo discriminativo si la consecuencia es repetitiva lo llamamos positivo pero si fuera un estímulo que diga el semáforo rojo que dice no pases ahora lo llamaremos estímulo delta queriendo decir que posteriormente a la respuesta no va a obtener el reforzado estos términos también se ven más evidentes Entonces, en presencia de un estímulo discriminativo, la respuesta operante aumenta y en presencia de un estímulo delta, un discriminativo negativo, la operante disminuye. Esto lo vamos a ver en el tema dedicado al control por el estímulo. Aquí se habla del control por el estímulo, habla de cómo los estímulos que preceden, o sea, que van anteriores a una conducta, pueden controlar la ocurrencia de esa conducta. Eso lo estudiaremos en el tema. Pasamos al otro elemento del condicionamiento operante, la respuesta. La respuesta operante son los efectos provocados en el ambiente. En la máquina de refrescos, ¿qué efectos provoco? Suelto monedas en un semáforo, hago camino por el semáforo. Aquí vamos a ver que la operante se define por su función y no por su forma. Forma será la topografía de la respuesta. O cuando digo operante, es una respuesta musical. Su función. Por ejemplo. La misma respuesta en la misma operación. ¿Cómo puede apretar un animal? Tenemos una caja de esquinas, la palanca, pues lo va a apretar. La puede presionar con el pico, con la pata. Tiene diferentes tipos de respuestas, topografía de respuestas, pero diferentes respuestas tienen los mismos efectos, o sea, tienen la misma función. Por ejemplo, ¿cómo podemos ponernos un gorro para no tener frío? Es una clase de respuesta, es decir, la forma, con una misma función. Da igual cómo te lo pongas. La función es no tener frío. Y finalmente el reforzador. Para el condicionamiento instrumental u operante hay mucha variedad de estímulos que refuerzan una conducta. ¿Qué es un reforzador? Es cualquier evento que cambie la probabilidad. De aparición de una respuesta en el futuro. Cualquier evento. ¿Reforzamiento? Vamos a ver qué es el reforzamiento condicionado. Es como, es secundario, ¿no? Con lo que os acordáis que vimos, que vimos condicionamiento de segundo grado en el... El condicionamiento clásico, que decíamos, asociábamos una luz con comida. Vale, pues luego, después de mucho emparejarlo, vamos a asociar un sonido con esa luz. Hablamos de un condicionamiento de segundo orden. Aquí en el reforzamiento condicionado secundario es un estímulo, que en principio no es reforzante, una luz o un sonido, pero que puede adquirir esa capacidad de ser reforzante por su asociación repetida con otro estímulo que era previamente reforzante, siempre dependiendo de la historia del sonido. Es decir, cuando algo o un evento arbitrario es capaz de aumentar la frecuencia de la respuesta. En la especie humana hay muchas consecuencias que se mantienen día a día como consecuencia del reforzamiento condicionado. ¿Qué pueden ser los elogios, las críticas? Críticas en negativo, elogios en positivo, el dinero. Son reforzadores porque pueden fortalecer... fortalecer o debilitar la ocurrencia de una conducta. Y las experiencias que tenga el sujeto condicionan la consecuencia. Hay que ver una serie de aclaraciones con los conceptos. El reforzador es el evento. ¿Vale? Reforzamiento es todo el proceso, todo el procedimiento, no solo el reforzador. El reforzamiento incluye, si tiene estímulo discriminativo, respuesta a consecuencias. Pues bien, el reforzamiento es el que produce un incremento en la conducta y los reforzadores son los eventos que hacen que el reforzamiento tenga efecto. Digamos, el premio que damos. Por el contrario, el castigo es cuando el procedimiento disminuye la conducta y los eventos aquí son de naturaleza aversiva. También luego veremos el castigo. También otras aclaraciones que hay que hacer tienen que ver con la respuesta discreta y el operante libre. En los ensayos discretos, donde el investigador solo puede intervenir para suponer al sujeto en el aparato, solo puede medir una respuesta, por eso lo llama respuesta discreta. La variable dependiente que mide es la latencia de respuesta, o sea, el tiempo que tarda, y el tiempo entre los ensayos. Sin embargo, en la caja de Skinner permitía los procedimientos de operante libre. ¿Qué quiere decir? Que los sujetos pueden emitir respuestas de forma constante, sin la manipulación del investigador entre ensayo y ensayo, pudiendo medir presión, fase de respuesta, número de respuestas... La otra aclaración es topografía-función, que ya lo hemos dicho. La topografía es la forma de la respuesta. Para cerrar una puerta podemos usar el codo, la mano, un pie, etc. De prisa, despacio, ¿no? Y cada una sería una forma, está relacionada con las contingencias de reforzamiento. Suponemos que estando en una situación social es menos probable cerrar la puerta con el pie. Por lo que la topografía es una función de las contingencias de reforzamiento. Estás solo igual, sí. Estás una patada. Pero la función de la respuesta se refiere a las relaciones de la respuesta con los estímulos antecedentes y la consecuencia. La función es la relación del reforzamiento con el reforzamiento, con el estímulo discriminativo, con la respuesta y con la consecuencia. Dos respuestas con la misma topografía, forma, pueden tener una función diferente. Y dos respuestas con distinción. Y dos respuestas con distinta topografía pueden tener la misma función. La biología puede imponer limitaciones al condicionamiento de alguna respuesta. Sí. Otra distinción de conceptos que vamos a ver. es la de instancia de respuesta y clase de respuesta. La instancia de respuesta es la unidad mínima de una conducta, es decir, a la ocurrencia particular específica de una respuesta, teniendo en cuenta más su topografía. Sin embargo, la clase de respuesta es todas las formas que puede el sujeto de emitir una respuesta que llevan a una función similar, lo que son respuestas, o sea, ¿vale? Por ejemplo, podemos especificar, imagínate que escribimos, la rata presionó la palanca con la pata delantera derecha a 10.05. Señalamos una instancia de respuesta. Utilizar la clase de respuesta, presionó la palanca, independientemente del momento en que ocurrió y sin tener en cuenta cómo lo hizo, si fue con la pata delantera o esta distinción de concepto. Vale. Interacciones clásicas y operantes en el concepto. Control de las alternativas. Habíamos visto el automoldeamiento, el condicionamiento clásico en el tema 2 y creo que comenté que lo deberíamos saber porque es la interacción entre el condicionamiento clásico y el operante. Cuando no hay ninguna respuesta en el sujeto, tenemos que crearla mediante el auto-moldeamiento, el recondicionamiento clásico. Pues bien, el recondicionamiento clásico es un aprendizaje pasivo, es decir, solo vamos a exponer a los sujetos a los estímulos para que ocurra el aprendizaje. Parejando un estímulo condicionado con un incondicionado. Muy bien, en el operante, en el recondicionamiento operante, se requiere que el sujeto sea activo y emita la respuesta. Para reforzar o castigar una conducta, tiene que haber una conducta. Bueno, pues bien, allí en el experimento del auto-moldeamiento, decimos que cuando queremos que una paloma picotee un botón en la caja de Skinner, tenemos que esperar a que ocurra por casualidad lo que lleva tiempo para poder reforzar y condicionar. Este auto-moldeamiento consiste en poner en un primer momento... ...un procedimiento clásico, estilatorio y apetitivo. Tenemos que picotear una luz y le damos comida. Si la picotea, aparece comida. Ya creamos un... Estamos emparejando un estímulo inicialmente neutro con la presentación de la comida, que es el estímulo incondicionado. La técnica iluminada sería el estímulo neutro. Ahora es el estímulo condicionado que provoca una respuesta similar a la que le provocaba la comida. Que picotea como si fuera a comer. Una vez que la luz ya provoca esa respuesta, podemos someterla a control operante, haciendo que la comida solo se presente si la paloma picotea la tecla. Así entonces la luz se ha convertido en un estímulo discriminativo que correlaciona con la presentación del reforzador. Cuando el animal presiona la paloma, que es la respuesta operante. Por tanto, la iluminación de la tecla tiene una doble función. Por un lado es un estímulo discriminativo porque señala la ocasión del condicionamiento operante, señala la ocasión para que la respuesta operante sea reforzada y actúa como un estímulo condicionado, tanto clásico porque le elicita, le provoca una condición, conducta condicionada clásica. Este ejemplo nos hace ver cómo ciertas respuestas inicialmente condicionadas clásicamente, posteriormente pueden caer bajo control operante y por tanto depender del efecto que produce y del estado de privación del sujeto. Pues bien, esa interacción clásico-operante se da porque los acontecimientos ambientales, los que rodean a los sujetos, actúan sobre los sistemas neurofisiológicos de los organismos de forma global y no en un sistema concreto. Se ha dicho o se ha sugerido que neurológicamente se consideran fenómenos distintos el condicionamiento clásico y el condicionamiento operante, pero hay mucha discusión sobre esto, sobre si son distintos o son no. Vamos a ver, en resumen, definición de condicionamiento operante. Condicionamiento operante es un proceso que da lugar a que la probabilidad de una respuesta se vea modificada por sus consecuencias, es decir, por el efecto que tiene el ambiente sobre ella. Si el resultado es beneficioso, se fortalece. Si es perjudicial, esa conducta tiende a desplazarse. Hemos hablado de operante y condicionamiento operante. El término operante es porque el sujeto interviene, opera en el medio. Esto es diferente del condicionamiento clásico donde las respuestas no son emitidas, sino elicitadas, provocadas por el sujeto. Vamos a ver procedimientos básicos del condicionamiento operativo. ¿Qué procedimientos básicos vamos a ver? Son cuatro. O si da la respuesta, le doy algo que le gusta. Si da la respuesta, evita algo que no le gusta. Si da una respuesta, le castigo, le doy algo que no le va a gustar. O si da la respuesta, le quito algo que sí le gusta. Básicamente son esos cuatro. Los tenemos en cuenta. Esos cuatro. Recesamiento positivo, recesamiento negativo, escapabilitación, castigo y entrenamiento de omisión. La conducta es dinámica. Se modifica según las variables de interrelación que haya. Entonces, la contingencia es una dependencia funcional entre dos componentes del condicionamiento y es la relación que se establece cuando un componente correcciona con el otro. Es decir, si da la respuesta... Le puedo dar algo. Ya tenemos la respuesta relacionada con el reforzador. Puede ser positivo lo que obtienes si la respuesta es seguida de una consecuencia. O puede ser negativa si la respuesta elimina la aparición de la consecuencia. Ahí en el reforzamiento positivo y negativo, el negativo no significa que le vamos a dar algo malo, ¿no? Sí. El negativo significa que esa respuesta elimina, hace que no aparezca una consecuencia negativa. Una consecuencia aversiva. Castigo. Pues bien, según el que la contingencia sea positiva o negativa y tenemos las consecuencias, pueden ser apetitivas o aversivas, se pueden establecer esos cuatro procedimientos fundamentales de condicionamiento operante. Unos que incrementan la conducta, reforzamiento positivo y evitación y escape, es el reforzamiento negativo. Y otros que la disminuyen la conducta, como el castigo y el entrenamiento de omiso. La última conducta es la última columna. Es el resultado de la conducta. En el reforzamiento positivo, la contingencia es positiva. Si da la respuesta, ahí te doy algo. Y a consecuencia apetitiva, apetitiva, que le gusta. Incrementa la fuerza de la respuesta. El escape-evitación, si la contingencia es negativa, pues si da la respuesta... evita algo que no le iba a gustar, algo aversivo. También incrementa, volverá a repetirlo. En el castigo la contingencia es positiva, pero si da una respuesta le damos algo, le damos algo que no le va a gustar, aversivo. Disminuye la fuerza de esa respuesta. Y en el entrenamiento de omisión la contingencia es negativa y la consecuencia es apetitiva, porque es como si te pusieran una multa. Si haces, si conduces a más de 150 por hora, te quito dinero, te quito algo apetitivo. Vamos a ver en primer lugar los procedimientos para aumentar conductas. El reforzamiento positivo también se llama entrenamiento de recompensa, aumenta la fuerza de la respuesta en frecuencia, en intensidad, en tasa. Es decir, si nos metemos en una caja de esquina y era un sujeto, le vamos haciendo un reforzamiento positivo, se nota que... responde más veces, más intensamente, o con más número de veces. Y con una consecuencia apetitiva que puede consistir en un reforzador primario, como la comida, o el placer, o algo placentero, o secundario. El reforzador secundario es un elogio, es dinero, pero el sujeto tiene que estar motivado para obtener el reforzador. ¿Por qué? Porque si las ratas no tuvieran hambre, el reforzador de comida no les gustaría, ¿no? Entonces se las mantienen las investigaciones con un poco de hambre. Ya veremos en las prácticas, imagino que habrá algo. Pasamos al otro. Escape evitación, conocida como reforzamiento negativo. Ah, perdón, me he olvidado del moldeamiento. Sí, imagínate que todavía no sabe hacer la respuesta, ¿no? Pues el moldeamiento es un método de aproximaciones sucesivas que implica reforzar respuestas, no la respuesta total, sino respuestas que se aproximen a la respuesta final que hemos estudiado. Esto está muy lejos de cómo se actúa. Podría en el medio natural, bueno, presionar una palabra, ¿no? Seguimos. El escape evitación, dice, es reforzamiento negativo. Y también incrementa la tasa de respuesta o la intensidad de respuesta. Escape. ¿Por qué el sondo? Porque primero, en el escape, la respuesta del sujeto, ya sea apretar una palanca o lo que sea, consiste en la eliminación de un evento de naturaleza aversiva. Es decir, ya está, ya le estamos dando una descarga y al dar la respuesta se para. Lo llamamos escape, tiene que escapar de una situación en la que ya está. Evitación. Y esta otra consiste en impedir que esté presente el evento de naturaleza aversiva. Es decir, todavía no ha ocurrido la descarga y la rata apretando la palanca la evita. Por eso dice que en el laboratorio los sujetos primero apretan el escape y luego la evitación. Porque le vamos a ir poniendo en una caja de Skinner, por ejemplo, con estímulo discriminativo o no. Eso también lo veremos en el tema 6, me parece. Si le ponemos la luz, el estímulo discriminativo, para decirle que va a aparecer una descarga. Si no da ninguna respuesta, el sujeto recibe la descarga y tiene que apretar la palanca o saltar al otro lado de la caja. para escapar, luego que ya ha habido eso primero aprenden el escape y luego la habitación la luz ya le indica al sujeto que le van a dar una descarga por lo tanto ya da la respuesta antes de que aparezca la consecuencia en este caso la descarga pasamos ahora a los otros dos procedimientos para disminuir conductas, castigo positivo porque damos algo hacemos algo, el otro es el castigo negativo o entrenamiento de omisión, es decir hacemos castigo por quitarle algo aquí en el castigo positivo dar un castigo el resultado es la disminución en la fuerza de la respuesta pero el castigo se define por su función y cuando no tiene efectos en la conducta del sujeto entendemos, se considera que este castigo no ha público para castigar una respuesta primero, antes ha tenido que ser reforzada y el digamos, imagínate que a una a una rata por Le vamos a apretar una palanca, le vamos a dar comida. Ya que ya sabe apretar una palanca, ahora le vamos a dar castigo. Si aprieta la palanca, le damos castigo, porque entendemos que disminuye o no haga esa contingencia. Pues bien, el castigo es imponer una contingencia de tipo aversivo sobre la respuesta. El castigo negativo o entrenamiento de omisión, ¿qué implica? No entregar una, si es que te da la respuesta, no le entregamos una recompensa cuando hay una conducta no deseada. Es decir, si te aportas mal, te quedas sin postre. Si andas, si conduces a más de 160 kilómetros por hora, el tráfico te quita dinero. Eso es un castigo negativo o entrenamiento de omisión. Los eventos, las circunstancias eliminadas en castigo negativo son eventos reputados. Reforzantes o cosas que le gustan. Como ves, es muy polar, ¿no? Reforzamiento, te doy algo que te gusta. Reforzamiento negativo, si das la respuesta, evitas algo que no te gusta. Castigo positivo, te doy algo que no te va a gustar. Castigo negativo o omisión. Si da la respuesta, te quito algo porque es muy... Pero los castigos tienen unos efectos colaterales. También lo veremos en el tema 7. Se trata bastante de este tema. Hay efectos colaterales. Sabemos por razones éticas que se les aconseja los procedimientos aversivos para producir cambios conductuales. Porque Skinner decía que los procedimientos aversivos, el castigo, no es una forma fiable de disminuir la conducta y además tiene efectos emocionales que no impiden que en el futuro vuelva a ocurrir cuando la activación emocional se disipe. A un niño le castigas, le produces un efecto emocional. Sí, dejará de hacer lo que estaba haciendo en ese momento. Pero cuando se le pase, le dice que no lo vuelva a hacer. También es posible que la estimulación aversiva se asocie. Sí, cuando damos castigo, se asocia a otros estímulos presentes. Si un profesor da un castigo a un alumno, lo asocia al aula, a quien le da el castigo. Y eso puede inhibir conductas deseadas. Eso es otro efecto colateral. También se asocia al castigo con quien lo ejecuta, más que con la conducta indeseada. Se supone que en el futuro puede ser que rechace a quien castiga en vez de cambiar el comportamiento. Entonces no aprende mucho, digamos. Vale, ya hemos creado un condicionamiento operante. Estímulo legislativo, respuesta a consecuencia. Hemos visto los cuatro procedimientos básicos. También hay extinción. Lo mismo que en el condicionamiento clásico, que queríamos extinguir. La respuesta condicionada aquí es esta extinción en el reforzamiento propositivo. Es decir, no le vamos a pedir la respuesta, no le vamos a dar el caramelo a la rata, no le vamos a dar un shell de la comida. Pues es un procedimiento, una respuesta que previamente se reforzaba, se deja de reforzar. También disminuye la frecuencia, la intensidad de la respuesta. La distinción de la respuesta causada por qué? Por la ausencia del reforzador. Y va provocando una disminución gradual de la respuesta. Pues bien, no la elimina completamente. La extinción es la disminución de la tasa de respuesta. Pero no se elimina completamente. ¿Por qué? Porque se observa que a veces se produce cierta recuperación de la respuesta. Es decir, aunque no le demos el reforzador, se llama recuperación espontánea. Pasado cierto tiempo, después de practicar la extinción, el sujeto recupera la respuesta. Que no tenga reforzador. Vamos a llamar estallido de extinción es a la conducta que se presenta en el sujeto cuando dejamos de darle el reforzador. Al principio de la extinción se da lo que es el estallido de extinción. Y aumenta la respuesta sobre la que anteriormente se daba. Por ejemplo, imaginaos que voy a la máquina de tabaco. Meto las monedas, pero la máquina, por lo que sea, está averiada. Yo quiero apretar, apretar, apretar, apretar, apretar para que me dé el reforzador. Por eso es la misma respuesta sobre la que se daba anteriormente. Luego ya cuando me doy cuenta de que no hay tabaco, no hay reforzador, pues la tasa de respuesta empieza a disminuir de forma gradual. ¿Qué se da durante la extinción? También se da un aumento de la variabilidad de la respuesta. Porque hay variación conductual al aumentar las oportunidades de que el organismo pueda restaurar y reforzar. Imaginaros que un niño que sale con su padre, que está reforzando, que sale por el parque con su padre, pero el padre se encuentra con un amigo, con un señor mayor, y se ponen a hablar. Y el niño quiere seguir obteniendo el reforzador que le da su padre, ¿no? Pero como están en extinción, el padre está hablando con otra persona, el niño aumenta la variabilidad de respuestas con hacer otras cosas. Pues se sube a un banco, se mete en la arena, etc. Eso es lo que significa aumentar la variabilidad de las respuestas. Si no me vas a dar el reforzador porque está en extinción, vamos a aumentar después del estallido o extinción, que sería igual que el niño protestara, ¿no? Pues aquí es el aumento de la variabilidad. También se dan las respuestas emocionales incontrolables. Es decir, estamos reforzando una conducta, es decir, le dan la respuesta, le damos el reforzador. Llega a la extinción y le produce un estado emocional de frustración que hace que el sujeto responda repetidamente. parecido un poco a lo que decíamos del estallido de la extinción, pero imaginaros que presionas un botón de una máquina que no ha dado la debida hasta exponer dinero. Incluso puede aparecer la agresión. Se provoca como diciendo, oye, yo he hecho la respuesta, ¿por qué no me das? Porque siempre me da. Resistencia a la extinción. Vamos a llamar resistencia a la extinción a tasa de respuesta mostrada hasta conseguir la extinción completa. Es decir, si a una rata le estamos dando reforzamiento para apretar una palanca, la resistencia a la extinción sería las veces que aprieta la palanca tasa de respuesta hasta conseguir la extinción. Otro, el efecto de sobreentrenamiento en la extinción. Fíjate, es un poco paradójico porque dice que las respuestas han sido reforzadas. En pocas ocasiones se extinguen de forma lenta y las que han sido muy reforzadas muestran menor resistencia a la extinción. Es decir, si yo he reforzado pocas veces Alguien, un sujeto, una respuesta, le costará más entender que ya no le voy a reforzar. Sin embargo, si una respuesta se extingue de forma lenta, será más resistente a la extinción. Las que han sido muy reforzadas muestran menor resistencia a la extinción. Parece paradójico, ¿no? Por ejemplo, también hablamos, ¿los reforzadores parciales o intermitentes? Vamos a hablar de ello en el tema siguiente. En el tema siguiente se habla del reforzamiento continuo cuando por cada respuesta damos un reforzador. Pero el reforzamiento parcial intermitente, ya veremos en otros programas, es que no le doy un reforzador por cada respuesta, sino cada cierto número de respuestas. Por ejemplo, en el llanto del niño que a veces es reforzado, recogen cuando llora y otras no. Este es difícil de erradicar. Porque el reforzamiento parcial o intermitente aumenta la resistencia a la extinción. Hace que el sujeto no entienda. Vale, me reforzaban dos sí y dos no. Dos sí y dos no. Y ahora, ya no le reforzamos ninguna. El sujeto sigue apretando la palanca o apretando la respuesta para obtener el reforzador, sin darse cuenta que estamos en extinción. Pues bien, el efecto del reforzamiento parcial se explica como el resultado de dos procesos básicos, que son el reforzamiento y la discriminación, es decir, el reforzamiento aumenta la resistencia al cambio, es decir, a mayor tasa de reforzamiento, mayor tasa de resistencia al cambio. Y hay mayor resistencia al pasar de un reforzamiento continuo a uno parcial o intermitente. Y los programas de reforzamiento continuo serían más resistentes al cambio que los programas de reforzamiento intermitente. Si le refuerzo cada respuesta, el reforzamiento continuo le cuesta más, o sea, tiene más resistencia al cambio, pero hay que entender que ahora... Ahora le voy a reforzar intermitentemente, sin embargo, la extinción ocurre más rápido con programas de reforzamiento continuo. Porque es lógico, si te voy a reforzar por cada respuesta, un reforzamiento continuo es una respuesta a un reforzador. Después de comprobar que da dos, tres, cinco respuestas y no hay reforzador, Pero si es un reforzamiento intermitente donde te refuerza cada tres respuestas una, por ejemplo te costaría más saber si ya ha dejado de aparecer el reforzador si estaremos en la extinción Luego está la teoría de la frustración de Hansel explica la persistencia de la respuesta durante la extinción como resultado de que de algo paradójico es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado Por eso esta teoría asume que el reforzamiento parcial intermitente hace que el resultado del aprendizaje sea esperar que la ausencia del reforzamiento no se reforzara Pero, sin embargo, durante el reforzamiento continuo no hay nada que motive a los sujetos a emitir la respuesta durante la extinción El reforzamiento continuo como es siempre la respuesta consecuencia, respuesta-consecuencia El sujeto no está motivado para continuar la respuesta Pero en el parcial sí. Parece que es esperar la ausencia del reforzamiento según esta teoría de la frustración. Vamos a ver la magnitud del reforzador y la inmediatez. Es decir, le vamos a dar de la recompensa. Son variables que incluyen en la presencia de la respuesta de la inteligencia. Si le damos una bolita de comida grande, la magnitud de la recompensa salta y lo administramos de forma continua, cada vez que da una respuesta le damos una recompensa de gran magnitud, la resistencia disminuye. Pero la resistencia a la extinción es alta cuando las recompensas grandes se administran intermitentemente. Si es en reforzamiento continuo no hay mucha resistencia. Pero si es administrar recompensas grandes intermitentemente produce más resistencia a la extinción, resistencia alta. Lo mismo ocurre con la inmediatez, es decir, el tiempo que tardamos en darle la bolita de comida. o sea, lo vamos a llamar inmediatez, rápido, la demora en el reforzamiento. En la inmediatez de la recompensa, cuando la demora es baja, o sea, tarda poco tiempo que se le da la respuesta que le damos al reforzador, la resistencia a la extinción es mayor. El ejemplo son las máquinas tracaperras. Es importante en conductas adictivas, como el juego patológico, donde al obtener una recompensa inmediata, existe un potencial adictivo mayor que en los juegos en los que se reciben los premios de forma demorada. La lotería, ¿no? Otros te dan más adelante el premio por eso mismo, porque en la máquina tracaperra te da la moneda, pues, chop, chop, sale inmediatamente. Lo pondremos como ejemplo valiente. Bien, otro, la extinción, o lo que estábamos hablando, de que esa disminución... La disminución de respuesta se puede pensar que sea debido al olvido, debido al paso del tiempo. La extinción no revierte lo ocurrido, sino no es un olvido, sino que implica un nuevo aprendizaje. le enseñamos aprendizaje por condicionamiento operante a dar una respuesta para obtener un reforzador la extinción implica un nuevo aprendizaje ya veremos donde hablamos de esto más adelante Paulo decía que no era bueno, en el condicionamiento clásico también hay extinción lo vimos, que decía que no desaprendía el sujeto en la extinción, sino que se producía un nuevo aprendizaje decíamos que la extinción es un procedimiento en el que una respuesta anteriormente reforzada ya no produce reforzamiento pero el sujeto puede emitir la respuesta sigue disponible, en cambio el olvido es disminuir la respuesta por el paso del tiempo y también porque no está disponible la posibilidad de emitir la respuesta la diferencia entre la extinción y el olvido en la extinción también se dan unos fenómenos parecidos aquí en el condicionamiento operante de los que vimos en el condicionamiento clásico se da la renovación o sea, si te practico extinción en este contexto, en el aula Y pasamos a otro contexto diferente, el sujeto puede recuperar la respuesta extinguida. Porque estamos en un contexto diferente al que se llevó a cabo la extinción. A una rata le estamos haciendo reforzamiento en su caja de espines. En la caja le ponemos un contexto rojo, ¿vale? Y practicamos la extinción allí. Pero igual la metemos en otra caja azul, que tiene un contexto diferente. Y recupera la respuesta. Se dice que se da la renovación de la respuesta. Otra, la restauración. La restauración de la conducta propia de la extinción. Imaginaros que se ha recuperado la respuesta y ahora queremos restaurar la conducta propia de la extinción. ¿Cómo lo hacemos? Volvemos a situar al sujeto en el contexto original donde practicamos la extinción. Por eso es restauración de la conducta propia de la extinción. Restablecimiento. Imaginaros que hay respuestas que hemos extinguido, que las hemos eliminado. Y vuelve a aparecer, aunque no... esa respuesta no dé lugar al reforzado. Todos estos fenómenos de la extinción concuerdan con que la recuperación espontánea de una respuesta se debe a la disminución del control que las claves del contexto tienen sobre la conducta con el paso del tiempo. Y dice que, igual que en el condicionamiento clásico, la extinción también en el condicionamiento operativo es específica del contexto en el que ha ocurrido. O sea, pues lo hemos entrenado. Vale, hasta aquí la extinción. Aquí vamos a ver fenómenos del condicionamiento operativo. La conducta supersticiosa es una respuesta que da un sujeto que sin motivo aparente luego va seguida de un reforzado y el sujeto ¿qué hace? Que da una conducta reforzada accidentalmente. Skinner hizo un experimento de superstición y demostró las consecuencias de reforzamiento accidental en las palomas. En el aprendizaje, ¿no? Palomas que les daba, les hacía caer un grano de trigo cada 15 segundos. Pero esas palomas presentaban una pauta de comportamiento que parecía indicar que su conducta controlaba la entrega del reforzador y lo llamó reforzamiento occidental o adventicio. ¿Cómo era? Si caía el grano del tigre cuando la paloma estaba al fondo de la cabeza, lo iba a relacionar y esa conducta quedaba reforzada. Si estaba escarbando en el suelo, lo iba a relacionar con la cabeza y esa conducta quedaría reforzada. Por lo tanto, repetiría la conducta aumentando la probabilidad de que se dé la ocurrencia y quede reforzada la relación conducta-respuesta. Stadon y Simmelheim concluyeron que las respuestas de los animales se podían englobar en dos grupos, estas de reforzamiento occidental. Las conductas de ínterin son las que tienen lugar en medio del intervalo de tiempo cuando falta tiempo para la aparición del siguiente reforzador. Esto ya lo veremos más claramente cuando veamos programas herméticos. Para los programas de intervalo, por ejemplo, le vamos a reforzar tan cierto tiempo. Una conducta de ínterin se daría a la mitad del intervalo. Si le vamos a dar un reforzador que hará 20 segundos, se daría hacia los pies cuando falta tiempo para la aparición del siguiente reforzador. Y como vieron que su respuesta no variaba de una paloma a otra, dijeron que las conductas se producen de forma innata y no por el reforzamiento accidental, cuando la probabilidad de reforzamiento es baja. Luego lo llamaron las conductas terminales a las que ocurrían al final del intervalo, próximas a la aparición del reforzador, y sí, su aparición no está relacionada con el reforzamiento accidental, sino con el programa de reforzamiento. Por consecuencia, no todas las conductas que aparecen cuando se entregan reforzadores de forma periódica son el resultado de un emparejamiento aleatorio de respuesta. ¿Qué resulta? Un reforzador, siendo algunas respuestas son conductas innatas propias de la especie con alta probabilidad de aparición cuando el sujeto está esperando un reforzador por la comida. Por ejemplo, las palomas escarbar o picotear conductas innatas de su especie a la espera de alimento reforzado. Por lo tanto, algunas conductas sí se podrían explicar que son supersticiosas y otras tienen que ver con conductas innatas. Relacionalmente. Están relacionadas con reforzadores en acierto natural. En los humanos ocurren conductas supersticiosas, ¿cuándo? Cuando en una situación no tenemos ningún tipo de control sobre las consecuencias de las acciones. Por ejemplo, en juegos de azar. También es habitual deportistas, jugadores, las personas controladoras que necesitan el control sobre los eventos suelen ser supersticiosas. Todo empezó con un repensamiento aciuditario. Hedestein también estableció que era de dos tipos de supersticiones. Supersticiones idiosincráticas, que están consideradas por la propia experiencia en situaciones anteriores. Si he ido al examen con unos calcetines rojos y lo he aprobado, intentaré volver a cada vez que tenga que hacer exámenes poniéndose un calcetín rojo. Son supersticiones propias, la propia situación. La propia situación anterior es lo que hace que el sujeto coja esta superstición. Sin embargo, luego hay otras supersticiones sociales típicas, que son las típicas que hay sociales que mantienen a lo largo del tiempo. Ojo con el número 13, cuidado con pasar por debajo de una escalera, cuidado con los gatos negros, etc. Son sociales, ¿no? Que tienen indicios en creencias populares que ya no serán efectivas. Porque, fíjate, en la guerra... La guerra de incendios, tres cigarros con la misma cerilla, venía de la Guerra Mundial porque el tercero moría. ¿Por qué? Porque al primer serciente de la cerilla empiezan a apuntar. Pasa la cerilla al otro, sigue apuntando al tercero, al que más tiempo tiene de apuntarle y darle. Pues la cerilla incendiada va al enemigo, la posición, etc. Deriva instintiva y el concepto de relevancia o pertinencia en los condicionamientos fundamentales. Todavía no hemos empezado al condicionamiento, pero estaremos en el siguiente tema. Estamos viendo cosas fenómenas. La deriva instintiva se refiere a que el condicionamiento no condiciona siempre la misma forma de respuesta. Hay situaciones que esa relación de pertenencia, relevancia entre una respuesta y un reforzador depende del tipo de reforzador. Habrá animales que les gustará más un tipo de reforzador que otro, es lo que viene a decir. La deriva instintiva al distinto le llevará por un caso y otro no. Por lo tanto, el condicionamiento depende del reforzador que usemos y de la historia evolutiva del animal. Marion y Kellen vieron que las conductas innatas interferían con las respuestas operantes que pretendían, porque fíjate, lo llamaron deriva instintiva, porque también eran un poco flipados, ¿no? Les hacía que le daban monedas para meterlos en una hucha, los mapaches las flotaban, pero estas son respuestas naturales, caballos no linchan, ¿no? Son respuestas naturales muy fuertes relacionadas con la comida, compiten con lo que quiere el entrenador para el condicionamiento operante. Entonces, por eso lo llamaron deriva instintiva. El animal no da la respuesta que le pedimos, apretar la palanca. No da lo que sea, sino que va por su propio camino. Y por eso habla de relevancia o pertenencia. También hay que tener en cuenta los cambios en la cantidad y la calidad de recompensa, por lo que el efecto de la recompensa depende de la experiencia pasada de ese sujeto con otros reforzadores. Y dependiendo de la motivación y la efectividad de un reforzador... Para controlar una conducta, puede verse modificada por la experiencia previa. Lo llamamos contraste conductual. Si te pago más que antes, es contraste conductual positivo, trabajarás mal. Si te pago menos que antes, contraste conductual negativo, trabajarás mal. Por eso los efectos de la recompensa dependen de la experiencia previa con otra recompensa. Aquí vamos a ver cómo es descontrolable la consecuencia aversiva y un efecto de indefensión aprendida. La hipótesis de la indefensión aprendida. Las situaciones incontrolables para los sujetos desarrollan una reacción emocional. Lo manifiestan con un comportamiento pasivo ante las circunstancias. Este es similar a la depresión. Las conductas no tienen efectos, por lo que la aparición de la descanse es independiente de la conducta. Vamos a verlo. El experimento que hicieron es el imán y maíz. ¿Por qué lo intentáis? O sea, viene a decir la hipótesis de la indefensión aprendida que si a una persona la han estado castigando, una mujer maltratada, un niño que le hacen bullying, etc., y no sabe cómo salir, no lo controla, puede llegar a pasivo entonces por eso dice que es similar a la depresión humana así no te defiendes ni sales de las piezas como lo hicieron se limanen mayas en la primera fase vamos a poner 33 grupos de rata un grupo control que puede escapar de la situación sobre el plan digo escapar pero vamos a hacer un procedimiento de escape evitación van a estar en unas en unas jaulas donde a una parte de la jaula le vamos a dar una rejilla una vez carga cada siempre puede ser avisada con claves es decir con estímulo discriminativo o no el grupo control es capable está sometido al entrenamiento si emite la respuesta que le pedimos al otro lado de la caja de tiempo de escapar o impide la descarga el segundo grupo acoplado recibía las mismas descargas que el grupo anterior Estaban las cajas acopladas, pero su respuesta no detenía a nadie de los descargos. Su respuesta no le permitía a nada más. Y había un tercer grupo confinado que ahora no lo sube a tratar. Esa era la primera fase. En la sociedad tenemos dos grupos, uno acoplado con descargas escapables, de las que puede escapar, y otro acoplado, ese grupo experimental, que vamos a ver cómo, que recibe descargas, las mismas descargas que el grupo anterior, pero su respuesta no detiene la descarga. En la segunda fase del experimento, todos los grupos, los tres grupos de animales, fueron sometidos a ensayos de entrenamiento en escape-evitación. Se dieron cuenta que el grupo acoplado, que recibía descargas inescapables, durante la fase anterior de predisposición, mostró un aprendizaje de escape-evitación mucho más lento que los otros dos grupos en la fase, en la segunda fase del experimento. ¿Qué conclusión sacaron los investigadores? Que el entrenamiento anterior con descargas inescapables les generaba a los animales la expectativa de que su conducta no tenía ningún efecto sobre las consecuencias aversivas. no controlaba las consecuencias no las podía parar que aprendía que la aparición de los descargas era independiente de lo que hiciera y a esto lo llamaron la hipótesis de la indefensión Seliman sugirió que para reducir el efecto de la indefensión el mejor tratamiento es ubicar al sujeto en situaciones en las que no fuese posible fallar reforzando lo que estás haciendo, reforzando la expectativa de toma de control de la conducta sobre las consecuencias por ejemplo, si a una mujer le ha sucedido un maltrato y tiene una indefensión aprendida se supone que habría que colocarle en unas situaciones en donde sí puede, su respuesta sí tiene efecto para que vuelva a motivarse y a tomar el control de la conducta sobre las consecuencias Seliman también propuso para evitar que desarrollase en indefensión aprendida la inmunización sería un proceso imaginaros que se enseñara en las escuelas o lo que sea es un proceso que se desarrolla cuando un sujeto tiene una primera experiencia con las cargas escapable puede escapar Que bloquea el desarrollo de la indefensión aprendida. Porque posteriormente le vamos a poner descargas inescapables. Pero el sujeto ya comprobó que podía escapar. La indefensión aprendida se produjo. Porque al principio le metimos una situación de que no podían escapar. Y luego cuando podían escapar, ya no escapaban. Ya habían desarrollado la indefensión aprendida. Bueno, y la siguiente es los efectos de la demora del reforzador, cómo lo superamos. Que si le vamos a tratar de dar el reforzador al sujeto, igual no aprende. O sea, la entrega, vamos a marcarlo, ¿no? El procedimiento que vamos a hacer es el marcado. Sabemos que la entrega de la recompensa aumenta probabilidad de respuesta si es inmediata en el tiempo. Esa demora del reforzamiento, hay un periodo de tiempo para la respuesta y el reforzador siguiente. Pues bien, cuando la línea de base de respuesta. La respuesta es estable y se pone una demora. Normalmente se reduce la respuesta, aunque no siempre es así. porque en primer momento puede ocurrir incluso, ¿no? Muchas teorías asociativas del aprendizaje dicen que dos eventos deben ser contiguos para que sean asociados. Si pasa mucho tiempo entre la respuesta y la consecuencia, no lo asocia bien. Para evitar los efectos de la demora en la entrega del reforzador, tenemos el procedimiento de Marcado de Lieberman, que significa que marcamos la respuesta a un sujeto, la podemos diferenciar de otros eventos que ocurren durante el periodo de demora. Por lo tanto, el Marcado evita los efectos de la demora en la entrega del reforzador. ¿Qué marcamos? Marcamos la respuesta haciendo que ésta pueda diferenciarse. Fue un experimento de ratas con un brazo lateral negro o blanco y una caja de demora. Si iba al blanco, por ejemplo, y el sujeto era la respuesta, el experimentador le marcaba al sujeto la ecología y le colocaba en la caja de demora. Si era el brazo incorrecto, no le decía nada. Eso hacía que luego las ratas recordaran mejor cuál era el brazo que tenían. Sin pasar demorada, luego le vamos a dar el precio. Y también, ¿qué podemos hacer? Devaluar el reforzador. Si estamos dando comida a un sujeto, imagínate que le vamos a asociar el reforzador, la comida, con un estímulo de naturaleza opuesta, contraria, una sustancia aversiva que da dolor de barriga. El efecto resultante es una disminución de la respuesta operante que ha sido reforzada con este reforzador devaluado. Pues los animales aprenden acerca de las consecuencias de su conducta durante el posicionamiento oral. Bueno, se ha acabado. Los PowerPoints de la grabación de Inteka los pueden descargar. O sea, yo los pego a la grabación y cuando esté colgada la grabación Inteka pueden descargar este PowerPoint. Porque si no estoy... Pero bueno, que si alguien me lo pide también se lo pido por mí. Pero que lo que sepáis es que la presentación se ha acabado.