Vamos a empezar la tutoría del tema 4, condicionamiento operante.
Principios básicos, porque hay dos temas. Luego está el tema de los
programas y las teorías. Condicionamiento operante. ¿Por qué nos
interesa conocer el condicionamiento operante? Habíamos visto conductas
automáticas ante el estímulo en el condicionamiento clásico, pero ahora
hay muchas conductas diarias que no ocurren de forma automática. El sujeto
emite una respuesta relacionada con algo que pasó en el pasado, con algún
acontecimiento que ocurrió otras veces. Pues eso es el condicionamiento
operante. Cuando las conductas es probable que se vuelvan a repetir si
reciben un incentivo, o sea, si es agradable, de placer. Pero si recibimos
aversión, es probable que no se vuelva a hacer. En condicionamiento
operante vamos a estudiar esos principios que permiten predecir cómo se
produce una respuesta que es evocada, por un estímulo. Entonces, los
antecedentes históricos tenemos a Darwin, que influyó en el análisis
experimental de la conducta del condicionamiento operante. Y postulaba
Darwin en su teoría que la variación y la selección son importantes en
cuanto a las características heredadas y se aplica al comportamiento.
Variedad de comportamientos, seleccionamos un comportamiento u otro. En el
condicionamiento operante, el reforzador es el seleccionador de las
respuestas más apropiado y así aparece una conducta según sea la
circunstancia. ¿Quiénes fueron los que empezaron con esto del
condicionamiento operante? Tórtico y la ley del efecto. Tórtico empezaba
a ensayar los gatos, les metía en una caja problema y se dio cuenta que
los gatos por casualidad activaban el mecanismo de apertura. Les ponían el
refuerzo fuera, las comidas. Y se daba cuenta que cada vez, cada vez. En
cada experimento que repetía, tardaba menos. Iba disminuyendo la latencia
de tiempo desde que empezaba el experimento. Hoy lo llamó aprendizaje por
ensayo y error. Y dice, decía Tórtico, que cuando una conducta va seguida
de un incentivo agradable para el animal... Al estar de nuevo en esa
situación será más probable que la conducta se vuelva a repetir. Por eso
desarrolló Tórnike un sistema de aprendizaje basado en una concepción
hedonista de placentera, ¿vale? Quedando decir, las conductas que son
placenteras se fortalecen y las conductas que tienen resultados
desagradables se van a debilitar. Posteriormente a Tórnike apareció en el
condicionamiento operante Stine. Él ya lo llama el análisis experimental
del comportamiento y es el primer responsable del reforzamiento. Decía
que, bueno, los reflejos podían ser estudiados como conductas y distingue
el condicionamiento de los reflejos, el condicionamiento clásico de
Paulot, y el aprendizaje de Tórnike, ¿no? Dice que el aprendizaje... La
conducta de los sujetos se regula por condicionamiento de reflejos y
operante. Reflejos es la respuesta respondiente y el operante es el
condicionamiento operante. Se centra en las relaciones funcionales entre la
conducta y sus consecuencias. entonces, ¿por qué lo llama operante?
porque llama condicionamiento operante a la capacidad que tiene el sujeto
para operar sobre el ambiente, para hacer algo dar una respuesta, la
respuesta la vamos a llamar operante también lo llaman instrumental, ¿por
qué? porque la conducta del sujeto es un instrumento para obtener
conseguir un reforzador y, pero bueno Torrice hacía ensayos discretos cada
vez un ensayo en la caja el gato lo metía en la caja y Skinner hacía el
procedimiento experimental de operante libre, para diferenciarlo de los
ensayos discretos y torres luego diremos lo que diferencia bien definición
de condicionamiento operante el condicionamiento operante es el proceso, es
un proceso que da lugar a que una respuesta se vea modificada por los
efectos que tiene el ambiente sobre ella, por las consecuencias que
obtiene, que lo vamos a llamar el ambiente, el contexto Por lo tanto, el
condicionamiento operante dispone al sujeto a algunas circunstancias en las
que alguna de sus conductas da lugar a la aparición de una respuesta, de
una admisión de una respuesta. Por lo tanto, en el condicionamiento
operante es el sujeto el que opera en el medio, lo modifica y al mismo
tiempo el medio modifica al organismo de este sujeto. Si el resultado es
beneficioso, la conducta se fortalece. Si es perjudicial, tiende a
desaparecer. Por lo tanto, con el condicionamiento operante, los sujetos
aprenden a obtener o eliminar, si el resultado no les gusta, consecuencias
del ambiente. También aprenden los sujetos a dar respuestas ante una nueva
circunstancia, con respuestas que formaban parte de su... No con las mismas
respuestas que daban antes, sino que pueden dar... Respuestas nuevas. Ahora
vamos a pasar a ver la contingencia de tres términos. Allí, en el
condicionamiento clásico, decíamos que el estímulo condicionado tenía
que estar unido con el incondicionado. Es decir, contingente, aparecer uno
detrás de otro. Eso lo llamamos contingente. Aquí, en el condicionamiento
operante... La consecuencia está relacionada con la respuesta, con la
presentación de la respuesta anterior. Entonces, la unidad fundamental de
análisis en el estudio de la conducta operante es estos tres términos. El
estímulo discriminativo, la respuesta y la consecuencia. ¿La consecuencia
qué significa? Que en presencia de un estímulo específico, un estímulo
discriminativo, el reforzador se presentará si la respuesta operante
sucede. Entonces, primero va el estímulo discriminativo, digamos, un
alumno. Veo el semáforo en verde de peatónico, que es el estímulo
discriminativo para mi conducta, de cruzar al otro lado sin que me
atropelle. ¿Vale? Entonces, ¿cómo sería eso? ¿Qué es el estímulo
discriminativo? Vamos a ir uno por uno estos tres términos. Los estímulos
antecedentes tienen mucha importancia. La importancia del condicionamiento
operante lo vamos a llamar discriminatorio. Pues bien, esos estímulos no
provocan la aparición de la respuesta, sino señalan la ocasión. Para que
un estímulo indique que una respuesta puede tener una consecuencia.
¿vale? la luz de una de una la luz encendida de una máquina de refresco
un estímulo discriminativo yo quiero, tengo sed quiero beber un refresco
doy la respuesta que es meter la moneda y obtengo la consecuencia son los
tres elementos estímulo discriminativo, respuesta y consecuencia aquí
hablan un poco de que el reforzamiento diferencial consiste en reforzar una
respuesta operante en una situación y no en otra ¿no? por lo que aquí el
estímulo discriminativo ejerce control sobre esa respuesta pero no la
provoca si el estímulo discriminativo es seguido de una respuesta con una
consecuencia repetitiva la respuesta se ve reforzada y hace que aumente la
probabilidad de que se produzca posteriormente ya ves, os estoy diciendo
estímulo discriminativo si la consecuencia es repetitiva lo llamamos
positivo pero si fuera un estímulo que diga el semáforo rojo que dice no
pases ahora lo llamaremos estímulo delta queriendo decir que
posteriormente a la respuesta no va a obtener el reforzado estos términos
también se ven más evidentes Entonces, en presencia de un estímulo
discriminativo, la respuesta operante aumenta y en presencia de un
estímulo delta, un discriminativo negativo, la operante disminuye. Esto lo
vamos a ver en el tema dedicado al control por el estímulo. Aquí se habla
del control por el estímulo, habla de cómo los estímulos que preceden, o
sea, que van anteriores a una conducta, pueden controlar la ocurrencia de
esa conducta. Eso lo estudiaremos en el tema. Pasamos al otro elemento del
condicionamiento operante, la respuesta. La respuesta operante son los
efectos provocados en el ambiente. En la máquina de refrescos, ¿qué
efectos provoco? Suelto monedas en un semáforo, hago camino por el
semáforo. Aquí vamos a ver que la operante se define por su función y no
por su forma. Forma será la topografía de la respuesta. O cuando digo
operante, es una respuesta musical. Su función. Por ejemplo. La misma
respuesta en la misma operación. ¿Cómo puede apretar un animal? Tenemos
una caja de esquinas, la palanca, pues lo va a apretar. La puede presionar
con el pico, con la pata. Tiene diferentes tipos de respuestas, topografía
de respuestas, pero diferentes respuestas tienen los mismos efectos, o sea,
tienen la misma función. Por ejemplo, ¿cómo podemos ponernos un gorro
para no tener frío? Es una clase de respuesta, es decir, la forma, con una
misma función. Da igual cómo te lo pongas. La función es no tener frío.
Y finalmente el reforzador. Para el condicionamiento instrumental u
operante hay mucha variedad de estímulos que refuerzan una conducta.
¿Qué es un reforzador? Es cualquier evento que cambie la probabilidad. De
aparición de una respuesta en el futuro. Cualquier evento.
¿Reforzamiento? Vamos a ver qué es el reforzamiento condicionado. Es
como, es secundario, ¿no? Con lo que os acordáis que vimos, que vimos
condicionamiento de segundo grado en el... El condicionamiento clásico,
que decíamos, asociábamos una luz con comida. Vale, pues luego, después
de mucho emparejarlo, vamos a asociar un sonido con esa luz. Hablamos de un
condicionamiento de segundo orden. Aquí en el reforzamiento condicionado
secundario es un estímulo, que en principio no es reforzante, una luz o un
sonido, pero que puede adquirir esa capacidad de ser reforzante por su
asociación repetida con otro estímulo que era previamente reforzante,
siempre dependiendo de la historia del sonido. Es decir, cuando algo o un
evento arbitrario es capaz de aumentar la frecuencia de la respuesta. En la
especie humana hay muchas consecuencias que se mantienen día a día como
consecuencia del reforzamiento condicionado. ¿Qué pueden ser los elogios,
las críticas? Críticas en negativo, elogios en positivo, el dinero. Son
reforzadores porque pueden fortalecer... fortalecer o debilitar la
ocurrencia de una conducta. Y las experiencias que tenga el sujeto
condicionan la consecuencia. Hay que ver una serie de aclaraciones con los
conceptos. El reforzador es el evento. ¿Vale? Reforzamiento es todo el
proceso, todo el procedimiento, no solo el reforzador. El reforzamiento
incluye, si tiene estímulo discriminativo, respuesta a consecuencias. Pues
bien, el reforzamiento es el que produce un incremento en la conducta y los
reforzadores son los eventos que hacen que el reforzamiento tenga efecto.
Digamos, el premio que damos. Por el contrario, el castigo es cuando el
procedimiento disminuye la conducta y los eventos aquí son de naturaleza
aversiva. También luego veremos el castigo. También otras aclaraciones
que hay que hacer tienen que ver con la respuesta discreta y el operante
libre. En los ensayos discretos, donde el investigador solo puede
intervenir para suponer al sujeto en el aparato, solo puede medir una
respuesta, por eso lo llama respuesta discreta. La variable dependiente que
mide es la latencia de respuesta, o sea, el tiempo que tarda, y el tiempo
entre los ensayos. Sin embargo, en la caja de Skinner permitía los
procedimientos de operante libre. ¿Qué quiere decir? Que los sujetos
pueden emitir respuestas de forma constante, sin la manipulación del
investigador entre ensayo y ensayo, pudiendo medir presión, fase de
respuesta, número de respuestas... La otra aclaración es
topografía-función, que ya lo hemos dicho. La topografía es la forma de
la respuesta. Para cerrar una puerta podemos usar el codo, la mano, un pie,
etc. De prisa, despacio, ¿no? Y cada una sería una forma, está
relacionada con las contingencias de reforzamiento. Suponemos que estando
en una situación social es menos probable cerrar la puerta con el pie. Por
lo que la topografía es una función de las contingencias de
reforzamiento. Estás solo igual, sí. Estás una patada. Pero la función
de la respuesta se refiere a las relaciones de la respuesta con los
estímulos antecedentes y la consecuencia. La función es la relación del
reforzamiento con el reforzamiento, con el estímulo discriminativo, con la
respuesta y con la consecuencia. Dos respuestas con la misma topografía,
forma, pueden tener una función diferente. Y dos respuestas con
distinción. Y dos respuestas con distinta topografía pueden tener la
misma función. La biología puede imponer limitaciones al condicionamiento
de alguna respuesta. Sí. Otra distinción de conceptos que vamos a ver. es
la de instancia de respuesta y clase de respuesta. La instancia de
respuesta es la unidad mínima de una conducta, es decir, a la ocurrencia
particular específica de una respuesta, teniendo en cuenta más su
topografía. Sin embargo, la clase de respuesta es todas las formas que
puede el sujeto de emitir una respuesta que llevan a una función similar,
lo que son respuestas, o sea, ¿vale? Por ejemplo, podemos especificar,
imagínate que escribimos, la rata presionó la palanca con la pata
delantera derecha a 10.05. Señalamos una instancia de respuesta. Utilizar
la clase de respuesta, presionó la palanca, independientemente del momento
en que ocurrió y sin tener en cuenta cómo lo hizo, si fue con la pata
delantera o esta distinción de concepto. Vale. Interacciones clásicas y
operantes en el concepto. Control de las alternativas. Habíamos visto el
automoldeamiento, el condicionamiento clásico en el tema 2 y creo que
comenté que lo deberíamos saber porque es la interacción entre el
condicionamiento clásico y el operante. Cuando no hay ninguna respuesta en
el sujeto, tenemos que crearla mediante el auto-moldeamiento, el
recondicionamiento clásico. Pues bien, el recondicionamiento clásico es
un aprendizaje pasivo, es decir, solo vamos a exponer a los sujetos a los
estímulos para que ocurra el aprendizaje. Parejando un estímulo
condicionado con un incondicionado. Muy bien, en el operante, en el
recondicionamiento operante, se requiere que el sujeto sea activo y emita
la respuesta. Para reforzar o castigar una conducta, tiene que haber una
conducta. Bueno, pues bien, allí en el experimento del auto-moldeamiento,
decimos que cuando queremos que una paloma picotee un botón en la caja de
Skinner, tenemos que esperar a que ocurra por casualidad lo que lleva
tiempo para poder reforzar y condicionar. Este auto-moldeamiento consiste
en poner en un primer momento... ...un procedimiento clásico, estilatorio
y apetitivo. Tenemos que picotear una luz y le damos comida. Si la picotea,
aparece comida. Ya creamos un... Estamos emparejando un estímulo
inicialmente neutro con la presentación de la comida, que es el estímulo
incondicionado. La técnica iluminada sería el estímulo neutro. Ahora es
el estímulo condicionado que provoca una respuesta similar a la que le
provocaba la comida. Que picotea como si fuera a comer. Una vez que la luz
ya provoca esa respuesta, podemos someterla a control operante, haciendo
que la comida solo se presente si la paloma picotea la tecla. Así entonces
la luz se ha convertido en un estímulo discriminativo que correlaciona con
la presentación del reforzador. Cuando el animal presiona la paloma, que
es la respuesta operante. Por tanto, la iluminación de la tecla tiene una
doble función. Por un lado es un estímulo discriminativo porque señala
la ocasión del condicionamiento operante, señala la ocasión para que la
respuesta operante sea reforzada y actúa como un estímulo condicionado,
tanto clásico porque le elicita, le provoca una condición, conducta
condicionada clásica. Este ejemplo nos hace ver cómo ciertas respuestas
inicialmente condicionadas clásicamente, posteriormente pueden caer bajo
control operante y por tanto depender del efecto que produce y del estado
de privación del sujeto. Pues bien, esa interacción clásico-operante se
da porque los acontecimientos ambientales, los que rodean a los sujetos,
actúan sobre los sistemas neurofisiológicos de los organismos de forma
global y no en un sistema concreto. Se ha dicho o se ha sugerido que
neurológicamente se consideran fenómenos distintos el condicionamiento
clásico y el condicionamiento operante, pero hay mucha discusión sobre
esto, sobre si son distintos o son no. Vamos a ver, en resumen, definición
de condicionamiento operante. Condicionamiento operante es un proceso que
da lugar a que la probabilidad de una respuesta se vea modificada por sus
consecuencias, es decir, por el efecto que tiene el ambiente sobre ella. Si
el resultado es beneficioso, se fortalece. Si es perjudicial, esa conducta
tiende a desplazarse. Hemos hablado de operante y condicionamiento
operante. El término operante es porque el sujeto interviene, opera en el
medio. Esto es diferente del condicionamiento clásico donde las respuestas
no son emitidas, sino elicitadas, provocadas por el sujeto. Vamos a ver
procedimientos básicos del condicionamiento operativo. ¿Qué
procedimientos básicos vamos a ver? Son cuatro. O si da la respuesta, le
doy algo que le gusta. Si da la respuesta, evita algo que no le gusta. Si
da una respuesta, le castigo, le doy algo que no le va a gustar. O si da la
respuesta, le quito algo que sí le gusta. Básicamente son esos cuatro.
Los tenemos en cuenta. Esos cuatro. Recesamiento positivo, recesamiento
negativo, escapabilitación, castigo y entrenamiento de omisión. La
conducta es dinámica. Se modifica según las variables de interrelación
que haya. Entonces, la contingencia es una dependencia funcional entre dos
componentes del condicionamiento y es la relación que se establece cuando
un componente correcciona con el otro. Es decir, si da la respuesta... Le
puedo dar algo. Ya tenemos la respuesta relacionada con el reforzador.
Puede ser positivo lo que obtienes si la respuesta es seguida de una
consecuencia. O puede ser negativa si la respuesta elimina la aparición de
la consecuencia. Ahí en el reforzamiento positivo y negativo, el negativo
no significa que le vamos a dar algo malo, ¿no? Sí. El negativo significa
que esa respuesta elimina, hace que no aparezca una consecuencia negativa.
Una consecuencia aversiva. Castigo. Pues bien, según el que la
contingencia sea positiva o negativa y tenemos las consecuencias, pueden
ser apetitivas o aversivas, se pueden establecer esos cuatro procedimientos
fundamentales de condicionamiento operante. Unos que incrementan la
conducta, reforzamiento positivo y evitación y escape, es el reforzamiento
negativo. Y otros que la disminuyen la conducta, como el castigo y el
entrenamiento de omiso. La última conducta es la última columna. Es el
resultado de la conducta. En el reforzamiento positivo, la contingencia es
positiva. Si da la respuesta, ahí te doy algo. Y a consecuencia apetitiva,
apetitiva, que le gusta. Incrementa la fuerza de la respuesta. El
escape-evitación, si la contingencia es negativa, pues si da la
respuesta... evita algo que no le iba a gustar, algo aversivo. También
incrementa, volverá a repetirlo. En el castigo la contingencia es
positiva, pero si da una respuesta le damos algo, le damos algo que no le
va a gustar, aversivo. Disminuye la fuerza de esa respuesta. Y en el
entrenamiento de omisión la contingencia es negativa y la consecuencia es
apetitiva, porque es como si te pusieran una multa. Si haces, si conduces a
más de 150 por hora, te quito dinero, te quito algo apetitivo. Vamos a ver
en primer lugar los procedimientos para aumentar conductas. El
reforzamiento positivo también se llama entrenamiento de recompensa,
aumenta la fuerza de la respuesta en frecuencia, en intensidad, en tasa. Es
decir, si nos metemos en una caja de esquina y era un sujeto, le vamos
haciendo un reforzamiento positivo, se nota que... responde más veces,
más intensamente, o con más número de veces. Y con una consecuencia
apetitiva que puede consistir en un reforzador primario, como la comida, o
el placer, o algo placentero, o secundario. El reforzador secundario es un
elogio, es dinero, pero el sujeto tiene que estar motivado para obtener el
reforzador. ¿Por qué? Porque si las ratas no tuvieran hambre, el
reforzador de comida no les gustaría, ¿no? Entonces se las mantienen las
investigaciones con un poco de hambre. Ya veremos en las prácticas,
imagino que habrá algo. Pasamos al otro. Escape evitación, conocida como
reforzamiento negativo. Ah, perdón, me he olvidado del moldeamiento. Sí,
imagínate que todavía no sabe hacer la respuesta, ¿no? Pues el
moldeamiento es un método de aproximaciones sucesivas que implica reforzar
respuestas, no la respuesta total, sino respuestas que se aproximen a la
respuesta final que hemos estudiado. Esto está muy lejos de cómo se
actúa. Podría en el medio natural, bueno, presionar una palabra, ¿no?
Seguimos. El escape evitación, dice, es reforzamiento negativo. Y también
incrementa la tasa de respuesta o la intensidad de respuesta. Escape. ¿Por
qué el sondo? Porque primero, en el escape, la respuesta del sujeto, ya
sea apretar una palanca o lo que sea, consiste en la eliminación de un
evento de naturaleza aversiva. Es decir, ya está, ya le estamos dando una
descarga y al dar la respuesta se para. Lo llamamos escape, tiene que
escapar de una situación en la que ya está. Evitación. Y esta otra
consiste en impedir que esté presente el evento de naturaleza aversiva. Es
decir, todavía no ha ocurrido la descarga y la rata apretando la palanca
la evita. Por eso dice que en el laboratorio los sujetos primero apretan el
escape y luego la evitación. Porque le vamos a ir poniendo en una caja de
Skinner, por ejemplo, con estímulo discriminativo o no. Eso también lo
veremos en el tema 6, me parece. Si le ponemos la luz, el estímulo
discriminativo, para decirle que va a aparecer una descarga. Si no da
ninguna respuesta, el sujeto recibe la descarga y tiene que apretar la
palanca o saltar al otro lado de la caja. para escapar, luego que ya ha
habido eso primero aprenden el escape y luego la habitación la luz ya le
indica al sujeto que le van a dar una descarga por lo tanto ya da la
respuesta antes de que aparezca la consecuencia en este caso la descarga
pasamos ahora a los otros dos procedimientos para disminuir conductas,
castigo positivo porque damos algo hacemos algo, el otro es el castigo
negativo o entrenamiento de omisión, es decir hacemos castigo por quitarle
algo aquí en el castigo positivo dar un castigo el resultado es la
disminución en la fuerza de la respuesta pero el castigo se define por su
función y cuando no tiene efectos en la conducta del sujeto entendemos, se
considera que este castigo no ha público para castigar una respuesta
primero, antes ha tenido que ser reforzada y el digamos, imagínate que a
una a una rata por Le vamos a apretar una palanca, le vamos a dar comida.
Ya que ya sabe apretar una palanca, ahora le vamos a dar castigo. Si
aprieta la palanca, le damos castigo, porque entendemos que disminuye o no
haga esa contingencia. Pues bien, el castigo es imponer una contingencia de
tipo aversivo sobre la respuesta. El castigo negativo o entrenamiento de
omisión, ¿qué implica? No entregar una, si es que te da la respuesta, no
le entregamos una recompensa cuando hay una conducta no deseada. Es decir,
si te aportas mal, te quedas sin postre. Si andas, si conduces a más de
160 kilómetros por hora, el tráfico te quita dinero. Eso es un castigo
negativo o entrenamiento de omisión. Los eventos, las circunstancias
eliminadas en castigo negativo son eventos reputados. Reforzantes o cosas
que le gustan. Como ves, es muy polar, ¿no? Reforzamiento, te doy algo que
te gusta. Reforzamiento negativo, si das la respuesta, evitas algo que no
te gusta. Castigo positivo, te doy algo que no te va a gustar. Castigo
negativo o omisión. Si da la respuesta, te quito algo porque es muy...
Pero los castigos tienen unos efectos colaterales. También lo veremos en
el tema 7. Se trata bastante de este tema. Hay efectos colaterales. Sabemos
por razones éticas que se les aconseja los procedimientos aversivos para
producir cambios conductuales. Porque Skinner decía que los procedimientos
aversivos, el castigo, no es una forma fiable de disminuir la conducta y
además tiene efectos emocionales que no impiden que en el futuro vuelva a
ocurrir cuando la activación emocional se disipe. A un niño le castigas,
le produces un efecto emocional. Sí, dejará de hacer lo que estaba
haciendo en ese momento. Pero cuando se le pase, le dice que no lo vuelva a
hacer. También es posible que la estimulación aversiva se asocie. Sí,
cuando damos castigo, se asocia a otros estímulos presentes. Si un
profesor da un castigo a un alumno, lo asocia al aula, a quien le da el
castigo. Y eso puede inhibir conductas deseadas. Eso es otro efecto
colateral. También se asocia al castigo con quien lo ejecuta, más que con
la conducta indeseada. Se supone que en el futuro puede ser que rechace a
quien castiga en vez de cambiar el comportamiento. Entonces no aprende
mucho, digamos. Vale, ya hemos creado un condicionamiento operante.
Estímulo legislativo, respuesta a consecuencia. Hemos visto los cuatro
procedimientos básicos. También hay extinción. Lo mismo que en el
condicionamiento clásico, que queríamos extinguir. La respuesta
condicionada aquí es esta extinción en el reforzamiento propositivo. Es
decir, no le vamos a pedir la respuesta, no le vamos a dar el caramelo a la
rata, no le vamos a dar un shell de la comida. Pues es un procedimiento,
una respuesta que previamente se reforzaba, se deja de reforzar. También
disminuye la frecuencia, la intensidad de la respuesta. La distinción de
la respuesta causada por qué? Por la ausencia del reforzador. Y va
provocando una disminución gradual de la respuesta. Pues bien, no la
elimina completamente. La extinción es la disminución de la tasa de
respuesta. Pero no se elimina completamente. ¿Por qué? Porque se observa
que a veces se produce cierta recuperación de la respuesta. Es decir,
aunque no le demos el reforzador, se llama recuperación espontánea.
Pasado cierto tiempo, después de practicar la extinción, el sujeto
recupera la respuesta. Que no tenga reforzador. Vamos a llamar estallido de
extinción es a la conducta que se presenta en el sujeto cuando dejamos de
darle el reforzador. Al principio de la extinción se da lo que es el
estallido de extinción. Y aumenta la respuesta sobre la que anteriormente
se daba. Por ejemplo, imaginaos que voy a la máquina de tabaco. Meto las
monedas, pero la máquina, por lo que sea, está averiada. Yo quiero
apretar, apretar, apretar, apretar, apretar para que me dé el reforzador.
Por eso es la misma respuesta sobre la que se daba anteriormente. Luego ya
cuando me doy cuenta de que no hay tabaco, no hay reforzador, pues la tasa
de respuesta empieza a disminuir de forma gradual. ¿Qué se da durante la
extinción? También se da un aumento de la variabilidad de la respuesta.
Porque hay variación conductual al aumentar las oportunidades de que el
organismo pueda restaurar y reforzar. Imaginaros que un niño que sale con
su padre, que está reforzando, que sale por el parque con su padre, pero
el padre se encuentra con un amigo, con un señor mayor, y se ponen a
hablar. Y el niño quiere seguir obteniendo el reforzador que le da su
padre, ¿no? Pero como están en extinción, el padre está hablando con
otra persona, el niño aumenta la variabilidad de respuestas con hacer
otras cosas. Pues se sube a un banco, se mete en la arena, etc. Eso es lo
que significa aumentar la variabilidad de las respuestas. Si no me vas a
dar el reforzador porque está en extinción, vamos a aumentar después del
estallido o extinción, que sería igual que el niño protestara, ¿no?
Pues aquí es el aumento de la variabilidad. También se dan las respuestas
emocionales incontrolables. Es decir, estamos reforzando una conducta, es
decir, le dan la respuesta, le damos el reforzador. Llega a la extinción y
le produce un estado emocional de frustración que hace que el sujeto
responda repetidamente. parecido un poco a lo que decíamos del estallido
de la extinción, pero imaginaros que presionas un botón de una máquina
que no ha dado la debida hasta exponer dinero. Incluso puede aparecer la
agresión. Se provoca como diciendo, oye, yo he hecho la respuesta, ¿por
qué no me das? Porque siempre me da. Resistencia a la extinción. Vamos a
llamar resistencia a la extinción a tasa de respuesta mostrada hasta
conseguir la extinción completa. Es decir, si a una rata le estamos dando
reforzamiento para apretar una palanca, la resistencia a la extinción
sería las veces que aprieta la palanca tasa de respuesta hasta conseguir
la extinción. Otro, el efecto de sobreentrenamiento en la extinción.
Fíjate, es un poco paradójico porque dice que las respuestas han sido
reforzadas. En pocas ocasiones se extinguen de forma lenta y las que han
sido muy reforzadas muestran menor resistencia a la extinción. Es decir,
si yo he reforzado pocas veces Alguien, un sujeto, una respuesta, le
costará más entender que ya no le voy a reforzar. Sin embargo, si una
respuesta se extingue de forma lenta, será más resistente a la
extinción. Las que han sido muy reforzadas muestran menor resistencia a la
extinción. Parece paradójico, ¿no? Por ejemplo, también hablamos, ¿los
reforzadores parciales o intermitentes? Vamos a hablar de ello en el tema
siguiente. En el tema siguiente se habla del reforzamiento continuo cuando
por cada respuesta damos un reforzador. Pero el reforzamiento parcial
intermitente, ya veremos en otros programas, es que no le doy un reforzador
por cada respuesta, sino cada cierto número de respuestas. Por ejemplo, en
el llanto del niño que a veces es reforzado, recogen cuando llora y otras
no. Este es difícil de erradicar. Porque el reforzamiento parcial o
intermitente aumenta la resistencia a la extinción. Hace que el sujeto no
entienda. Vale, me reforzaban dos sí y dos no. Dos sí y dos no. Y ahora,
ya no le reforzamos ninguna. El sujeto sigue apretando la palanca o
apretando la respuesta para obtener el reforzador, sin darse cuenta que
estamos en extinción. Pues bien, el efecto del reforzamiento parcial se
explica como el resultado de dos procesos básicos, que son el
reforzamiento y la discriminación, es decir, el reforzamiento aumenta la
resistencia al cambio, es decir, a mayor tasa de reforzamiento, mayor tasa
de resistencia al cambio. Y hay mayor resistencia al pasar de un
reforzamiento continuo a uno parcial o intermitente. Y los programas de
reforzamiento continuo serían más resistentes al cambio que los programas
de reforzamiento intermitente. Si le refuerzo cada respuesta, el
reforzamiento continuo le cuesta más, o sea, tiene más resistencia al
cambio, pero hay que entender que ahora... Ahora le voy a reforzar
intermitentemente, sin embargo, la extinción ocurre más rápido con
programas de reforzamiento continuo. Porque es lógico, si te voy a
reforzar por cada respuesta, un reforzamiento continuo es una respuesta a
un reforzador. Después de comprobar que da dos, tres, cinco respuestas y
no hay reforzador, Pero si es un reforzamiento intermitente donde te
refuerza cada tres respuestas una, por ejemplo te costaría más saber si
ya ha dejado de aparecer el reforzador si estaremos en la extinción Luego
está la teoría de la frustración de Hansel explica la persistencia de la
respuesta durante la extinción como resultado de que de algo paradójico
es decir, continuar respondiendo cuando se espera no ser reforzado o ser
frustrado Por eso esta teoría asume que el reforzamiento parcial
intermitente hace que el resultado del aprendizaje sea esperar que la
ausencia del reforzamiento no se reforzara Pero, sin embargo, durante el
reforzamiento continuo no hay nada que motive a los sujetos a emitir la
respuesta durante la extinción El reforzamiento continuo como es siempre
la respuesta consecuencia, respuesta-consecuencia El sujeto no está
motivado para continuar la respuesta Pero en el parcial sí. Parece que es
esperar la ausencia del reforzamiento según esta teoría de la
frustración. Vamos a ver la magnitud del reforzador y la inmediatez. Es
decir, le vamos a dar de la recompensa. Son variables que incluyen en la
presencia de la respuesta de la inteligencia. Si le damos una bolita de
comida grande, la magnitud de la recompensa salta y lo administramos de
forma continua, cada vez que da una respuesta le damos una recompensa de
gran magnitud, la resistencia disminuye. Pero la resistencia a la
extinción es alta cuando las recompensas grandes se administran
intermitentemente. Si es en reforzamiento continuo no hay mucha
resistencia. Pero si es administrar recompensas grandes intermitentemente
produce más resistencia a la extinción, resistencia alta. Lo mismo ocurre
con la inmediatez, es decir, el tiempo que tardamos en darle la bolita de
comida. o sea, lo vamos a llamar inmediatez, rápido, la demora en el
reforzamiento. En la inmediatez de la recompensa, cuando la demora es baja,
o sea, tarda poco tiempo que se le da la respuesta que le damos al
reforzador, la resistencia a la extinción es mayor. El ejemplo son las
máquinas tracaperras. Es importante en conductas adictivas, como el juego
patológico, donde al obtener una recompensa inmediata, existe un potencial
adictivo mayor que en los juegos en los que se reciben los premios de forma
demorada. La lotería, ¿no? Otros te dan más adelante el premio por eso
mismo, porque en la máquina tracaperra te da la moneda, pues, chop, chop,
sale inmediatamente. Lo pondremos como ejemplo valiente. Bien, otro, la
extinción, o lo que estábamos hablando, de que esa disminución... La
disminución de respuesta se puede pensar que sea debido al olvido, debido
al paso del tiempo. La extinción no revierte lo ocurrido, sino no es un
olvido, sino que implica un nuevo aprendizaje. le enseñamos aprendizaje
por condicionamiento operante a dar una respuesta para obtener un
reforzador la extinción implica un nuevo aprendizaje ya veremos donde
hablamos de esto más adelante Paulo decía que no era bueno, en el
condicionamiento clásico también hay extinción lo vimos, que decía que
no desaprendía el sujeto en la extinción, sino que se producía un nuevo
aprendizaje decíamos que la extinción es un procedimiento en el que una
respuesta anteriormente reforzada ya no produce reforzamiento pero el
sujeto puede emitir la respuesta sigue disponible, en cambio el olvido es
disminuir la respuesta por el paso del tiempo y también porque no está
disponible la posibilidad de emitir la respuesta la diferencia entre la
extinción y el olvido en la extinción también se dan unos fenómenos
parecidos aquí en el condicionamiento operante de los que vimos en el
condicionamiento clásico se da la renovación o sea, si te practico
extinción en este contexto, en el aula Y pasamos a otro contexto
diferente, el sujeto puede recuperar la respuesta extinguida. Porque
estamos en un contexto diferente al que se llevó a cabo la extinción. A
una rata le estamos haciendo reforzamiento en su caja de espines. En la
caja le ponemos un contexto rojo, ¿vale? Y practicamos la extinción
allí. Pero igual la metemos en otra caja azul, que tiene un contexto
diferente. Y recupera la respuesta. Se dice que se da la renovación de la
respuesta. Otra, la restauración. La restauración de la conducta propia
de la extinción. Imaginaros que se ha recuperado la respuesta y ahora
queremos restaurar la conducta propia de la extinción. ¿Cómo lo hacemos?
Volvemos a situar al sujeto en el contexto original donde practicamos la
extinción. Por eso es restauración de la conducta propia de la
extinción. Restablecimiento. Imaginaros que hay respuestas que hemos
extinguido, que las hemos eliminado. Y vuelve a aparecer, aunque no... esa
respuesta no dé lugar al reforzado. Todos estos fenómenos de la
extinción concuerdan con que la recuperación espontánea de una respuesta
se debe a la disminución del control que las claves del contexto tienen
sobre la conducta con el paso del tiempo. Y dice que, igual que en el
condicionamiento clásico, la extinción también en el condicionamiento
operativo es específica del contexto en el que ha ocurrido. O sea, pues lo
hemos entrenado. Vale, hasta aquí la extinción. Aquí vamos a ver
fenómenos del condicionamiento operativo. La conducta supersticiosa es una
respuesta que da un sujeto que sin motivo aparente luego va seguida de un
reforzado y el sujeto ¿qué hace? Que da una conducta reforzada
accidentalmente. Skinner hizo un experimento de superstición y demostró
las consecuencias de reforzamiento accidental en las palomas. En el
aprendizaje, ¿no? Palomas que les daba, les hacía caer un grano de trigo
cada 15 segundos. Pero esas palomas presentaban una pauta de comportamiento
que parecía indicar que su conducta controlaba la entrega del reforzador y
lo llamó reforzamiento occidental o adventicio. ¿Cómo era? Si caía el
grano del tigre cuando la paloma estaba al fondo de la cabeza, lo iba a
relacionar y esa conducta quedaba reforzada. Si estaba escarbando en el
suelo, lo iba a relacionar con la cabeza y esa conducta quedaría
reforzada. Por lo tanto, repetiría la conducta aumentando la probabilidad
de que se dé la ocurrencia y quede reforzada la relación
conducta-respuesta. Stadon y Simmelheim concluyeron que las respuestas de
los animales se podían englobar en dos grupos, estas de reforzamiento
occidental. Las conductas de ínterin son las que tienen lugar en medio del
intervalo de tiempo cuando falta tiempo para la aparición del siguiente
reforzador. Esto ya lo veremos más claramente cuando veamos programas
herméticos. Para los programas de intervalo, por ejemplo, le vamos a
reforzar tan cierto tiempo. Una conducta de ínterin se daría a la mitad
del intervalo. Si le vamos a dar un reforzador que hará 20 segundos, se
daría hacia los pies cuando falta tiempo para la aparición del siguiente
reforzador. Y como vieron que su respuesta no variaba de una paloma a otra,
dijeron que las conductas se producen de forma innata y no por el
reforzamiento accidental, cuando la probabilidad de reforzamiento es baja.
Luego lo llamaron las conductas terminales a las que ocurrían al final del
intervalo, próximas a la aparición del reforzador, y sí, su aparición
no está relacionada con el reforzamiento accidental, sino con el programa
de reforzamiento. Por consecuencia, no todas las conductas que aparecen
cuando se entregan reforzadores de forma periódica son el resultado de un
emparejamiento aleatorio de respuesta. ¿Qué resulta? Un reforzador,
siendo algunas respuestas son conductas innatas propias de la especie con
alta probabilidad de aparición cuando el sujeto está esperando un
reforzador por la comida. Por ejemplo, las palomas escarbar o picotear
conductas innatas de su especie a la espera de alimento reforzado. Por lo
tanto, algunas conductas sí se podrían explicar que son supersticiosas y
otras tienen que ver con conductas innatas. Relacionalmente. Están
relacionadas con reforzadores en acierto natural. En los humanos ocurren
conductas supersticiosas, ¿cuándo? Cuando en una situación no tenemos
ningún tipo de control sobre las consecuencias de las acciones. Por
ejemplo, en juegos de azar. También es habitual deportistas, jugadores,
las personas controladoras que necesitan el control sobre los eventos
suelen ser supersticiosas. Todo empezó con un repensamiento aciuditario.
Hedestein también estableció que era de dos tipos de supersticiones.
Supersticiones idiosincráticas, que están consideradas por la propia
experiencia en situaciones anteriores. Si he ido al examen con unos
calcetines rojos y lo he aprobado, intentaré volver a cada vez que tenga
que hacer exámenes poniéndose un calcetín rojo. Son supersticiones
propias, la propia situación. La propia situación anterior es lo que hace
que el sujeto coja esta superstición. Sin embargo, luego hay otras
supersticiones sociales típicas, que son las típicas que hay sociales que
mantienen a lo largo del tiempo. Ojo con el número 13, cuidado con pasar
por debajo de una escalera, cuidado con los gatos negros, etc. Son
sociales, ¿no? Que tienen indicios en creencias populares que ya no serán
efectivas. Porque, fíjate, en la guerra... La guerra de incendios, tres
cigarros con la misma cerilla, venía de la Guerra Mundial porque el
tercero moría. ¿Por qué? Porque al primer serciente de la cerilla
empiezan a apuntar. Pasa la cerilla al otro, sigue apuntando al tercero, al
que más tiempo tiene de apuntarle y darle. Pues la cerilla incendiada va
al enemigo, la posición, etc. Deriva instintiva y el concepto de
relevancia o pertinencia en los condicionamientos fundamentales. Todavía
no hemos empezado al condicionamiento, pero estaremos en el siguiente tema.
Estamos viendo cosas fenómenas. La deriva instintiva se refiere a que el
condicionamiento no condiciona siempre la misma forma de respuesta. Hay
situaciones que esa relación de pertenencia, relevancia entre una
respuesta y un reforzador depende del tipo de reforzador. Habrá animales
que les gustará más un tipo de reforzador que otro, es lo que viene a
decir. La deriva instintiva al distinto le llevará por un caso y otro no.
Por lo tanto, el condicionamiento depende del reforzador que usemos y de la
historia evolutiva del animal. Marion y Kellen vieron que las conductas
innatas interferían con las respuestas operantes que pretendían, porque
fíjate, lo llamaron deriva instintiva, porque también eran un poco
flipados, ¿no? Les hacía que le daban monedas para meterlos en una hucha,
los mapaches las flotaban, pero estas son respuestas naturales, caballos no
linchan, ¿no? Son respuestas naturales muy fuertes relacionadas con la
comida, compiten con lo que quiere el entrenador para el condicionamiento
operante. Entonces, por eso lo llamaron deriva instintiva. El animal no da
la respuesta que le pedimos, apretar la palanca. No da lo que sea, sino que
va por su propio camino. Y por eso habla de relevancia o pertenencia.
También hay que tener en cuenta los cambios en la cantidad y la calidad de
recompensa, por lo que el efecto de la recompensa depende de la experiencia
pasada de ese sujeto con otros reforzadores. Y dependiendo de la
motivación y la efectividad de un reforzador... Para controlar una
conducta, puede verse modificada por la experiencia previa. Lo llamamos
contraste conductual. Si te pago más que antes, es contraste conductual
positivo, trabajarás mal. Si te pago menos que antes, contraste conductual
negativo, trabajarás mal. Por eso los efectos de la recompensa dependen de
la experiencia previa con otra recompensa. Aquí vamos a ver cómo es
descontrolable la consecuencia aversiva y un efecto de indefensión
aprendida. La hipótesis de la indefensión aprendida. Las situaciones
incontrolables para los sujetos desarrollan una reacción emocional. Lo
manifiestan con un comportamiento pasivo ante las circunstancias. Este es
similar a la depresión. Las conductas no tienen efectos, por lo que la
aparición de la descanse es independiente de la conducta. Vamos a verlo.
El experimento que hicieron es el imán y maíz. ¿Por qué lo intentáis?
O sea, viene a decir la hipótesis de la indefensión aprendida que si a
una persona la han estado castigando, una mujer maltratada, un niño que le
hacen bullying, etc., y no sabe cómo salir, no lo controla, puede llegar a
pasivo entonces por eso dice que es similar a la depresión humana así no
te defiendes ni sales de las piezas como lo hicieron se limanen mayas en la
primera fase vamos a poner 33 grupos de rata un grupo control que puede
escapar de la situación sobre el plan digo escapar pero vamos a hacer un
procedimiento de escape evitación van a estar en unas en unas jaulas donde
a una parte de la jaula le vamos a dar una rejilla una vez carga cada
siempre puede ser avisada con claves es decir con estímulo discriminativo
o no el grupo control es capable está sometido al entrenamiento si emite
la respuesta que le pedimos al otro lado de la caja de tiempo de escapar o
impide la descarga el segundo grupo acoplado recibía las mismas descargas
que el grupo anterior Estaban las cajas acopladas, pero su respuesta no
detenía a nadie de los descargos. Su respuesta no le permitía a nada
más. Y había un tercer grupo confinado que ahora no lo sube a tratar. Esa
era la primera fase. En la sociedad tenemos dos grupos, uno acoplado con
descargas escapables, de las que puede escapar, y otro acoplado, ese grupo
experimental, que vamos a ver cómo, que recibe descargas, las mismas
descargas que el grupo anterior, pero su respuesta no detiene la descarga.
En la segunda fase del experimento, todos los grupos, los tres grupos de
animales, fueron sometidos a ensayos de entrenamiento en escape-evitación.
Se dieron cuenta que el grupo acoplado, que recibía descargas
inescapables, durante la fase anterior de predisposición, mostró un
aprendizaje de escape-evitación mucho más lento que los otros dos grupos
en la fase, en la segunda fase del experimento. ¿Qué conclusión sacaron
los investigadores? Que el entrenamiento anterior con descargas
inescapables les generaba a los animales la expectativa de que su conducta
no tenía ningún efecto sobre las consecuencias aversivas. no controlaba
las consecuencias no las podía parar que aprendía que la aparición de
los descargas era independiente de lo que hiciera y a esto lo llamaron la
hipótesis de la indefensión Seliman sugirió que para reducir el efecto
de la indefensión el mejor tratamiento es ubicar al sujeto en situaciones
en las que no fuese posible fallar reforzando lo que estás haciendo,
reforzando la expectativa de toma de control de la conducta sobre las
consecuencias por ejemplo, si a una mujer le ha sucedido un maltrato y
tiene una indefensión aprendida se supone que habría que colocarle en
unas situaciones en donde sí puede, su respuesta sí tiene efecto para que
vuelva a motivarse y a tomar el control de la conducta sobre las
consecuencias Seliman también propuso para evitar que desarrollase en
indefensión aprendida la inmunización sería un proceso imaginaros que se
enseñara en las escuelas o lo que sea es un proceso que se desarrolla
cuando un sujeto tiene una primera experiencia con las cargas escapable
puede escapar Que bloquea el desarrollo de la indefensión aprendida.
Porque posteriormente le vamos a poner descargas inescapables. Pero el
sujeto ya comprobó que podía escapar. La indefensión aprendida se
produjo. Porque al principio le metimos una situación de que no podían
escapar. Y luego cuando podían escapar, ya no escapaban. Ya habían
desarrollado la indefensión aprendida. Bueno, y la siguiente es los
efectos de la demora del reforzador, cómo lo superamos. Que si le vamos a
tratar de dar el reforzador al sujeto, igual no aprende. O sea, la entrega,
vamos a marcarlo, ¿no? El procedimiento que vamos a hacer es el marcado.
Sabemos que la entrega de la recompensa aumenta probabilidad de respuesta
si es inmediata en el tiempo. Esa demora del reforzamiento, hay un periodo
de tiempo para la respuesta y el reforzador siguiente. Pues bien, cuando la
línea de base de respuesta. La respuesta es estable y se pone una demora.
Normalmente se reduce la respuesta, aunque no siempre es así. porque en
primer momento puede ocurrir incluso, ¿no? Muchas teorías asociativas del
aprendizaje dicen que dos eventos deben ser contiguos para que sean
asociados. Si pasa mucho tiempo entre la respuesta y la consecuencia, no lo
asocia bien. Para evitar los efectos de la demora en la entrega del
reforzador, tenemos el procedimiento de Marcado de Lieberman, que significa
que marcamos la respuesta a un sujeto, la podemos diferenciar de otros
eventos que ocurren durante el periodo de demora. Por lo tanto, el Marcado
evita los efectos de la demora en la entrega del reforzador. ¿Qué
marcamos? Marcamos la respuesta haciendo que ésta pueda diferenciarse. Fue
un experimento de ratas con un brazo lateral negro o blanco y una caja de
demora. Si iba al blanco, por ejemplo, y el sujeto era la respuesta, el
experimentador le marcaba al sujeto la ecología y le colocaba en la caja
de demora. Si era el brazo incorrecto, no le decía nada. Eso hacía que
luego las ratas recordaran mejor cuál era el brazo que tenían. Sin pasar
demorada, luego le vamos a dar el precio. Y también, ¿qué podemos hacer?
Devaluar el reforzador. Si estamos dando comida a un sujeto, imagínate que
le vamos a asociar el reforzador, la comida, con un estímulo de naturaleza
opuesta, contraria, una sustancia aversiva que da dolor de barriga. El
efecto resultante es una disminución de la respuesta operante que ha sido
reforzada con este reforzador devaluado. Pues los animales aprenden acerca
de las consecuencias de su conducta durante el posicionamiento oral. Bueno,
se ha acabado. Los PowerPoints de la grabación de Inteka los pueden
descargar. O sea, yo los pego a la grabación y cuando esté colgada la
grabación Inteka pueden descargar este PowerPoint. Porque si no estoy...
Pero bueno, que si alguien me lo pide también se lo pido por mí. Pero que
lo que sepáis es que la presentación se ha acabado.