Así que sí, ya sí que podemos empezar. Bueno, nos quedamos viendo los
procedimientos, los efectos colaterales que podían tener y que de hecho
tienen los procedimientos que utilizan estímulos adhesivos tanto para
aumentar las conductas como para disminuir las conductas, es decir, el
castigo y el escape-evitación. Bien, vimos problemas éticos, también el
hecho de que hay consecuencias emocionales y posibles asociaciones que se
establecen que no son deseables, por ejemplo, el hecho de que se asocie el
castigo no solo a la conducta sino también a la persona que castiga.
Bueno, esto ya terminamos de verlo, así que vamos a pasar a lo siguiente.
El procedimiento de extinción en el reforzamiento positivo, en el
condicionamiento operante. Ya hemos visto algo de esto, bastante de esto,
en el condicionamiento clásico. De hecho, allí vimos el mismo
procedimiento de extinción. Si recordáis, en el condicionamiento clásico
el procedimiento de extinción consistía en que tras crear una asociación
excitatoria entre un estímulo condicionado y un estímulo incondicionado,
pongamos una relación entre la aparición de comida, perdón, sí, entre
la, entre, ay, no me sale ahora, por ejemplo, los perros de Pavlov entre el
tono, en este caso, el tono y la comida. Una vez que siempre aparece un
tono, después aparece la comida, el tono termina siendo un señalizador o
termina prediciendo la aparición de la comida. Una vez hecho esto, cuando
presentamos el tono en ausencia de la comida, es decir, sin que aparezca el
estímulo incondicionado, en esta situación tenemos... que tras bastantes
ensayos el tono deja de provocar la respuesta condicionada. Esto era en el
condicionamiento clásico, vamos a ver la misma situación en el
condicionamiento operante. ¿En qué consiste en el caso del
condicionamiento operante el procedimiento de extinción? Bueno, pues una
vez que hemos asociado una respuesta a la obtención de un premio, de una
consecuencia, voy a llamarlo C para no repetir R de reforzador sino con C,
una vez que hemos asociado una respuesta a la aparición de una
consecuencia, ahora lo que vamos a hacer es dejar de reforzar esa respuesta
que va a tener la consecuencia de que se dejará de ejecutar la respuesta
operante. La ausencia de la consecuencia que previamente ocurría da como
lugar la disminución y al final la desaparición de la respuesta operante.
Es algo para lo que, igual que en el condicionamiento clásico, son
necesarias muchas repeticiones, son necesarios muchos ensayos. Y además...
Tienen algunos fenómenos o consisten en algunos fenómenos o aparecen
algunos fenómenos que son similares a los que ocurrían en el
condicionamiento clásico. También tienen algunas diferencias y vamos a
ver ahora cuáles son. Y aunque algunos son bastante parecidos, otros
tienen que ver con la peculiaridad del condicionamiento operante en el que
las respuestas son emitidas por parte del sujeto de una manera voluntaria y
con el hecho de que aparece un reforzador. Vamos a ver alguno de ellos.
Algunos de los efectos esenciales. Vamos a hacerlo con un ejemplo. Un
ejemplo que además os será bastante familiar. Es un ejemplo que suelo
utilizar siempre para... para explicar los efectos de la extinción y
porque seguramente la mayoría de vosotros os habréis encontrado en
situaciones similares en muchas ocasiones. Imaginaros que vais al trabajo,
vais a la facultad, vais a cualquier sitio y hay una máquina expendedora,
¿de acuerdo? O en el metro, que también hay máquinas expendedoras, una
máquina expendedora de refrescos. Y a vosotros siempre os gusta antes de,
o cuando vais a coger el metro, o cuando vais hacia el trabajo, lo que sea,
tomaros un refresco, el que sea. Bueno, la asociación usual en este caso
es que vosotros metéis el dinero, dais una respuesta y obtenéis una
consecuencia. Esa consecuencia es obtener el refresco que vosotros
queréis, obtenéis un reforzador. Algo que en el futuro hace que sea más
probable vuestra conducta. Cuando volváis a encontraros con la máquina de
refrescos volveréis a tener la misma respuesta porque sabéis que está
disponible la consecuencia. Esto ya lo hemos visto, es el reforzamiento
positivo de toda la vida. Bien, pero ¿qué ocurre si un día... Vais a la
misma máquina de refrescos, echáis una monedita y no cae vuestro
refresco? Bueno, pues seguramente cuando no caiga vuestro refresco, ahora
nos encontramos en un procedimiento de extinción. La respuesta no va
seguida de la consecuencia. La máquina puede estar rota, puede estar
agotado el producto, cualquier cosa. Pero nos encontramos en un
procedimiento de extinción. Y tenemos la suerte además que como podéis
pulsar todas las veces que queráis, nos encontramos en algo muy similar a
lo que sería un procedimiento operante. Como los de Skinner. ¿Qué ocurre
en esas situaciones? Pues ocurren fenómenos que son comunes a todos los
procedimientos de extinción. En primer lugar, y vamos a empezar por el
final, es un fenómeno que no se elimina del todo. ¿Por qué? Imaginaros
que no conseguís vuestro refresco y os vais a casa. Seguramente, a lo
mejor al día siguiente cuando volváis tampoco, por miedo a perder más
dinero, no pulséis o no cojáis un refresco allí o vayáis a otra
máquina. Pero ¿qué pasará con el paso del tiempo? Cuando pasen 10
días, 15 días, 20 días, seguramente muchos de vosotros volveréis a
probar pensando que puede estar ya arreglada, que era simplemente que
faltaban refrescos o que fue un fallo puntual. Así que en algunas
ocasiones ocurre un fenómeno que se denomina recuperación espontánea. El
simple paso del tiempo hace que volváis a ejecutar la conducta sin que
haya habido una asociación de nuevo, sin que la respuesta se haya dado
junto con la consecuencia en ningún momento. Simplemente por el paso del
tiempo puede volver a aparecer la respuesta. Pero vamos a verlo un poquito
más. Imaginaros que volvemos al primer día, el día en el que no
obtenéis vuestro refresco porque la máquina estaba rota o porque no
había producto o cualquier cosa. ¿Qué es lo que pasa? ¿Qué es lo que
ocurre en esta situación? Cuando echáis la moneda y pulsáis el pulsador
para obtener el refresco, no obtenéis nada. La cosa no suele quedar ahí,
sino que ocurre o suele ocurrir un fenómeno que se denomina estallido de
extinción. Esto es un aumento de la tasa de respuesta justo tras el primer
ensayo o una vez que se deja de obtener el reforzador. Es decir, no lo
obtienes y no te quedas tan tranquilo. Normalmente empiezas a pulsar mucho
más rápido, empiezas a pulsar más veces. Empiezas a realizar más
conductas. Esto es algo que nos ha pasado muchas veces. Empezamos a darle a
la máquina hasta que, o para ver si conseguimos algo. Bien, pero sigue sin
salir nada. Así que ¿cuál es el siguiente paso en un procedimiento de
extinción? Bueno, pues un aumento de la variabilidad de la respuesta, una
exploración de diferentes respuestas. Cuando no obtenemos lo que queremos
dando al pulsador empezaremos a realizar otras conductas. Empezaremos a
pulsar en otros pulsadores para ver si es el nuestro que no funciona.
Empezaremos a darle al botón de recuperar monedas para ver si podemos por
lo menos recuperar el dinero. O incluso empezaremos a darle más fuerte o
hacer alguna otra conducta o incluso meter la mano por debajo. Es decir,
explorar conductas alternativas que tengan relación con la conducta que
estamos acostumbrados a que sea reforzada. ¿Y qué ocurre en última
instancia cuando vemos que nada de eso funciona? Pues algo que también
ocurre bastante en la extinción. Las respuestas emocionales
incondicionadas. La frustración, incluida la agresividad. Seguramente
también os habrá pasado en alguna ocasión que cuando todo esto no
funciona empecéis a darle golpes a la máquina. Hasta que una vez que uno
se harta de darle golpes y ve que no cae nada, pues ya se va y la conducta
disminuye y desaparece. Esto sería un procedimiento de extinción. Esto
que nos ha ocurrido a muchos en muchas ocasiones es lo que se denomina un
procedimiento de extinción. Y estos son los fenómenos que suelen ocurrir.
Y que nos ocurren igual a nosotros y también en ratas u otros animales
cuando se prueba en laboratorio. Es una de las situaciones en las que
podemos vernos reflejados en procedimientos de condicionamiento operante y
que nos pueden hacer ver que las mismas reglas que valen para animales de
laboratorio, las mismas reglas de aprendizaje son aplicables a los humanos.
Las reglas de aprendizaje... o los mecanismos que determinan cómo
establecemos asociaciones, se supone que son universales para todos los
seres. No cambian, son leyes universales. O por lo menos se cumplen en la
mayoría de ocasiones, como podéis ver. Bueno, esto en cuanto a los
efectos de la extinción. ¿A qué cosas ocurren cuando empezamos un
procedimiento de extinción? Una cosa importante que no os he dicho.
Exactamente igual que en el procedimiento de extinción que vimos para el
condicionamiento clásico, en el procedimiento de extinción en
condicionamiento operante lo que ocurre es algo distinto al olvido. No es
un desaprendizaje. Recordad que cuando hablábamos de olvido, de lo que
hablábamos, era de que el paso del tiempo hacía que la respuesta no
estuviese disponible. Se olvidaba qué es lo que había que hacer. Eso es
en la definición de olvido. Ya no tienes disponible ese aprendizaje.
Cuando estamos en un proceso de extinción, el aprendizaje sí está
disponible. Pero se aprende algo distinto. Se aprende algo que no es lo
mismo que habías aprendido antes. Pero el aprendizaje sigue disponible. El
mero hecho de la recuperación espontánea es un ejemplo de ello. Luego en
las siguientes diapositivas vamos a ver algo más sobre esto. Está un
poquito más especificado. Pero me adelanto para que lo veáis desde aquí.
Para que tengáis en cuenta que lo mismo que dijimos para el experimento,
el hecho de que desaprendizaje y extinción son fenómenos distintos, lo
mismo vale para lo que estamos viendo en esta situación. Bueno, ¿qué
cosas importantes hay también en los procedimientos de extinción? Pues
algo que se denomina resistencia a la extinción. Es decir, cuánto nos
cuesta que el organismo que ha aprendido una conducta deje de realizar esa
conducta. Y eso depende de una serie de parámetros. Por ejemplo, vamos a
ver algunos de ellos y algunos bastante curiosos incluso de alguna manera
contraintuitivos. Las respuestas que han sido poco reforzadas son más
resistentes a la extinción. ¿Qué quiere decir esto? Bueno, pues que
cuando hemos ofrecido pocos reforzadores o cuando, y eso lo vamos a ver en
el tema siguiente aunque os voy a adelantar algo aquí, cuando hemos
reforzado de manera parcial la conducta, esto quiere decir que no se
refuerza la conducta cada vez que hay una extinción. Que hay una conducta
en sí misma, sino que se refuerza cada cierto número de veces o cada
cierto tiempo. Bueno, pues cuando eso ocurre, cuando se refuerza menos
veces o se refuerza de manera parcial, tal como vemos aquí, de manera
parcial intermitente, hay una mayor resistencia a la extinción. Sin
embargo, si se refuerza muchas veces o hay muchos ensayos, muchísimos
ensayos de asociación, de condicionamiento operante, entonces la
resistencia es menor. Esto es lo que se ha denominado el efecto. El efecto
del sobreentrenamiento en la extinción. Una mayor cantidad de
entrenamiento resulta en una menor resistencia a la extinción. Y esto
podría parecer un poco contraintuitivo, ¿no? Se supone que cuanto más
entrenamos algo, cuanto más lo asociamos con un reforzador, más fuerte es
la respuesta, más fuerte es la asociación y se supone que más difícil
debería ser eliminar esa asociación o cambiar el sentido de esa
asociación, ¿no? Bueno, pues eso es lo que se refuerza. Esto tiene que
ver con algo que vamos a ver, como os digo, en el siguiente capítulo, que
son los programas parciales o intermitentes. Es decir, cuando no reforzamos
todas las respuestas, cuando solo reforzamos unas determinadas respuestas
en función de una serie de criterios. Y fijaros, en el fondo tiene
bastante lógica. Cuando nosotros reforzamos todas las respuestas, cuando
se da una respuesta y siempre hay una consecuencia, es mucho más fácil
que ocurra una serie de cosas durante la fase de extinción. Cuando pasamos
a la fase de extinción, tenemos unas situaciones que varían entre un tipo
de programa y otro. Fijaros, cuando tenemos un programa o una situación de
asociación en la que reforzamos todas las respuestas, la discriminación
entre esa fase de reforzamiento y la fase de extinción es mucho más
sencilla. Mirad de nuevo, cuando reforzamos todas las respuestas, siempre
que obtenemos una conducta, obtenemos una consecuencia. Sin embargo, cuando
no hacemos eso, solamente pongamos una de cada diez respuestas. Eso sería
un programa de razón fija 10. Luego estudiaremos qué es esto. Seguramente
la semana que viene, no creo que nos dé tiempo hoy, pero lo veremos en los
siguientes temas. Razón fija 10. Esto es que de cada diez respuestas se
refuerza una. Fijaros, cuando llegamos a la extinción, alguien que ha
estado en un programa continuo, en cuanto entra en el programa de
extinción, entra en contacto con algo nuevo. ¿Qué es esto? Con una
situación en la que no hay reforzador. Es muy fácil discriminar entre la
fase anterior y la fase nueva, porque antes siempre había reforzador.
Ahora desde el primer ensayo no hay reforzador. Sin embargo, si tienes un
programa de este tipo, 9 de cada 10 respuestas aparecen sin reforzador.
Así que cuando entramos en un programa de extinción va a ser muy difícil
para el organismo diferenciar entre el programa anterior en el que se
reforzaban las respuestas y este, porque 9 de cada 10 respuestas son
exactamente iguales, no dan lugar al reforzador. El resto de cosas que
vamos a ver están muy relacionadas con esto. Por ejemplo, la
generalización del reforzamiento parcial a la extinción. De nuevo, en un
programa de extinción, perdón, en un programa de reforzamiento parcial,
por ejemplo este que tenemos aquí, 9 de cada 10 respuestas no son
reforzadas. Cuando pasamos un procedimiento de extinción, el hecho de que
no haya reforzamiento se generaliza o se generalizan los ensayos sin
reforzamiento de la parte de adquisición a la parte de extinción. Así
que tardamos mucho más en darnos cuenta de la situación en la que
estamos, en aprender la nueva contingencia. Porque el contacto con las
contingencias en un programa parcial es menor. Parte de exactamente lo
mismo. Si 9 de cada 10 respuestas no son reforzadas, cuando entremos en el
programa de extinción, al menos las 9 primeras respuestas, al menos los 9
primeros ensayos, no notaremos ninguna diferencia. Así que para entrar en
contacto con una nueva contingencia, que es el que no hay reforzamiento, el
que no aparece nada, necesitamos esperar. Por lo menos hasta el décimo
ensayo. Y ahí tendremos un contacto con la contingencia. Pasarán otros 9
ensayos en los que damos por hecho que no va a haber reforzador porque es
lo que hemos aprendido en la fase de adquisición. Y después volveremos a
tener contacto con una nueva contingencia. Fijaros, para entrar dos veces
en contacto con la nueva contingencia, con la nueva relación entre
respuesta y consecuencia, hemos necesitado 20 ensayos. 20 ensayos para
entrar dos veces en contacto con ella. En un programa continuo, en 20
ensayos, entramos en contacto 20 veces con la nueva contingencia. Así que
es lógico pensar que en 20 ensayos de contacto con la nueva contingencia
se aprenda más que en dos ensayos. Y por último, también la teoría de
la frustración, que en el fondo parte de lo mismo. Es otra manera de
explicar el hecho de que durante los programas parciales se tiene menos
contacto con el reforzador. ¿Qué se aprende durante los programas
parciales? Pues una de las cosas que se aprende es a no tener el
reforzador, porque como os digo aquí, en 9 de cada 10 ensayos en este tipo
de programa, por ejemplo, podría ser incluso RF100 o otro tipo de
programa, ya lo veremos, pero en 9 de cada 10 ensayos no hay... No hay
reforzador. Así que lo que uno aprende durante la fase de adquisición no
es solo a que le van a dar reforzadores, sino también a no esperar
reforzadores durante la mayor parte de los ensayos. Cuando llega a la fase
de extinción está acostumbrado a no recibir reforzadores. Sabe que eso es
parte del programa. Así que aprender algo nuevo también le costará más.
Porque parte del programa ha sido y... Bueno, parte no. El 90% del programa
de adquisición ha sido no tener reforzadores. Bien, esto en cuanto a
los... Algunas de las características y de las situaciones que ocurren, de
las variables que influyen en los programas de extinción. Tenemos algunas
más, algunas que están relacionadas con el propio reforzador. En
particular, con dos características, la magnitud y la demora. Bueno, en
esto es bastante fácil cuanto... Vamos a empezar con lo más sencillo.
Cuanto mayor es la demora del reforzador, menor es la resistencia a la
extinción. Es decir, cuando los reforzadores son inmediatos, cuando se dan
justo después de la conducta, es más difícil eliminar esta conducta.
Esto sí es bastante intuitivo. Es bastante fácil pensar que si el
reforzador se da de inmediato, será más difícil extinguir la conducta
puesto que la asociación va a ser más fuerte. En cuanto a la magnitud, en
este caso depende, y veréis que en el libro lo explica de una forma un
poco confusa, porque habla de la magnitud en función de cómo se ha
realizado el programa de entrenamiento. En función de si el programa es
continuo, es decir, se refuerza siempre o si el programa es parcial, es
decir, se refuerzan solo algunas respuestas. Y cuando la magnitud es alta y
el programa continuo, hay una menor resistencia a la extinción. Cuando la
magnitud es alta y el programa es parcial, hay una mayor resistencia. Que
básicamente lo que está diciendo es que lo que ocurra con la magnitud
depende de cómo sea el programa, cosa que también depende cuando la
magnitud es baja. Así que el efecto de la magnitud depende de cómo
hayamos enfrentado. Por ejemplo, si hemos establecido el programa en
general, la magnitud de un premio, el efecto que tiene es hacer más fuerte
la asociación. Cuanto mayor es el premio, mejor se aprende algo en
general. También depende del valor de reforzador que tiene para ese
sujeto. Pero en este caso, el valor de la magnitud va asociado a lo que
ocurre con el tipo de programa, es decir, a cómo se refuerza el programa.
Bueno y aquí tenéis las tres cosas que hemos hablado antes y una nueva,
algo que ya vimos también en el condicionamiento clásico. En primer
lugar, la disminución de la respuesta no se debe al olvido, es algo
distinto, es un nuevo aprendizaje. La respuesta continúa disponible. Y si
os acordáis de lo que vimos, la recuperación espontánea, es decir, el
fenómeno de recuperación espontánea y también fenómenos como la
renovación, la restauración y el restablecimiento indican que el
aprendizaje es algo diferente, que no es simplemente un desaprendizaje. La
renovación es algo que vimos ya en el condicionamiento clásico, el que la
respuesta vuelva a aparecer cuando cambiamos de contexto. De nuevo volvemos
a lo que vimos. Y es que la extinción es algo que es dependiente de
contexto, es particular del contexto. Cuando se cambia el contexto, cuando
se cambian los estímulos, que en este caso son discriminativos, que nos
indican que no está disponible el deforzador, cuando cambiamos esos
estímulos puede volver a aparecer la respuesta. La restauración, cuando
ocurre en el mismo contexto. Hay situaciones en las que simplemente, como
hemos visto antes, en la recuperación espontánea por el paso del tiempo o
simplemente porque volvemos a... presentar un estímulo discriminativo o
porque volvemos a presentar, como en el restablecimiento, el reforzador sin
que ni siquiera aparezca la respuesta, vuelve a aparecer de nuevo la
respuesta. Bueno, todas estas situaciones que son análogas a las que vimos
en la extinción en el condicionamiento clásico nos indican dos cosas en
particular, esto quizás sea lo más importante. El hecho de que la
extinción es un aprendizaje diferente, no es un desaprendizaje de lo ya
adquirido, sino que se aprende a no emitir una respuesta cuando el
reforzador no está disponible, no es que se deje de aprender la respuesta.
Y también que el aprendizaje es dependiente de contexto, que hay variables
en el contexto que nos indican cuando estamos en un procedimiento de
extinción o cuando está o no está disponible el reforzador y que por lo
tanto cambiando esas variables o simplemente dejando pasar el tiempo o
cambiando de contexto podemos volver a obtener la respuesta. Bueno, esto en
cuanto a la extinción. Vamos con algunos otros fenómenos bastante
interesantes. Este resumen. Pues va a resultar bastante curioso. Además es
un fenómeno que se da en humanos, que es bastante común y usual en
humanos. Y es curioso ver como los animales en los experimentos se
comportan de una manera bastante similar a lo que hacen los humanos en
otras situaciones. Fijaros, vamos con ello. La conducta supersticiosa. ¿En
qué consiste? En un experimento la conducta supersticiosa, que no es
exactamente lo mismo que lo que nosotros estamos acostumbrados a ver o a
hablar sobre ello. Bueno. Es un procedimiento que inventó Skinner. Fue el
que desarrolló este tipo de procedimiento y era bastante sencillo. Se
metía un animal en una caja de Skinner, como la que hemos visto hasta
ahora. Y cada, digamos, cada 15 segundos... Se soltaba un reforzador,
pongamos que es comida. Cada 15 segundos un reforzador, pero sin que la
paloma pongamos o el animal. Vamos a poner una paloma que creo que Skinner
además lo hizo con palomas, sin que la paloma tuviese que hacer
absolutamente nada. Simplemente cada 15 segundos que hay un reforzador.
Esto es lo que se llama reforzamiento accidental o adventicio. Os
recordará a otro procedimiento que vimos en el condicionamiento clásico.
No sé si alguno se acuerda, si alguno se acuerda me lo puede poner en el
chat. Si no os lo digo ahora mismo. Bueno, como os digo, recordará a un
procedimiento que ya vimos, pero no es lo mismo. Es el automoldeamiento. No
sé si lo recordáis. En el automoldeamiento había una señal, una luz que
aparecía. Antes, o justo antes, o de forma contingente a la aparición de
un reforzador. En este caso la comida. Aquí lo que ocurría es que la
paloma terminaba picoteando la luz como si su conducta tuviese algo que ver
con la aparición del reforzador cuando realmente no tenía absolutamente
nada que ver. Solamente caía asociado a la aparición de la luz. Esto era
un tipo de condicionamiento clásico, pero que daba una respuesta
condicionada que era muy similar a la que ocurre con la conducta de las
palomas. Cuando hay comida, es decir, una especie de picoteo sobre el
estímulo condicional. En este caso lo único que ocurre, no hay luz ni
nada que lo señale, no se asocia a nada, simplemente cae una bolita de
comida cada 15 segundos. Reforzamiento accidental o adventicio, es decir,
caen de manera accidental sin que haya ningún patrón. Bueno, en este caso
lo que... Lo que ocurría es que los animales empezaban a comportarse
según diferentes pautas, es decir, metías varios palomas en una caja,
hacías este procedimiento y cuando volvías a cabo de unas horas te
encontrabas con que cada paloma había desarrollado una conducta diferente.
Empezaba a hacer cosas cuando aparecía el reforzador y cada una lo hacía
de una manera diferente. Lo que decía Skinner es que cualquier
comportamiento que hubiese tenido lugar justo antes de la aparición del
reforzador quedaba por la propia aparición del reforzador reforzado, es
decir, tenía más probabilidad de aparición en el futuro. Si la paloma
por un casual estaba, digamos, levantando las alas en el momento anterior a
que apareciese el reforzador, empezaría a asociar ese movimiento a la
aparición del reforzador. Como todo reforzador, la primera consecuencia
que tiene es inmediatamente. Es el incremento de la probabilidad de
aparición de una conducta, así que esa conducta que había aparecido por
casualidad ahora es más probable. Como es más probable, es también más
probable que aparezca justo antes de que aparezca el reforzador, es decir,
que aparezca acompañando antes de que aparezca el reforzador. Así que la
propia superstición se va retroalimentando, va haciéndose cada vez más
probable hasta que queda establecida la asociación. Así que, como nos
contamos, pasa a los humanos, la superstición se retroalimenta.
Seguramente muchos de vosotros tendréis algún tipo de superstición,
pongamos una de las más típicas en el ámbito universitario, que es tener
algún amuleto para los exámenes o utilizar siempre un mismo boli,
etcétera, etcétera. Si cuando vosotros habéis desarrollado esa conducta
o habéis utilizado un boli, por ejemplo, o ya habéis llevado una prenda
de ropa o un amuleto, habéis obtenido un buen resultado, eso hace que esa
conducta, hacer eso, vaya a ser más probable en el futuro. Como lo vais a
volver a hacer en el futuro, si volvéis a obtener un buen resultado al
final, es decir, si desactiváis el reforzador, eso hace que sea mucho más
fácil que esa conducta se vuelva a dar en presencia del reforzador porque
lo vais a hacer más veces. Así que la propia superstición se va
retroalimentando, haciendo que la asociación sea cada vez más fuerte.
Esta es la explicación que daba Skinner, lo daba como una situación
accidental, un reforzamiento que tenía que ver con la casualidad, con el
hecho de que determinadas conductas, conductas se diesen en un determinado
momento y no en otro, que coincidiesen exactamente y que por eso había
tanta variabilidad o él observaba variabilidad en los comportamientos de
las diferentes palomas. Cada una lo que había hecho en ese momento. Sin
embargo, otros, bueno, en este vídeo, por cierto, esto no se puede ver
aquí lógicamente, pero lo tenéis en los documentos que os he pasado. Por
cierto, en la parte de documentos de este mismo aula virtual tenéis no
solo el PDF, Sino también el PowerPoint del tema 5, si no me equivoco. Si
lo tenéis, el del tema 5, por si queréis descargarlo, ¿vale? Tenéis el
del tema 5 con todos los vídeos. El del tema 4 ya os lo di. Bueno, en este
vídeo simplemente aparece una representación del comportamiento
supersticioso de la paloma. Lo podréis ver, si no lo habéis visto ya, lo
podéis ver tranquilamente en casa. No es un vídeo muy bueno, pero sí,
bueno, sí por lo menos es un ejemplo de cómo más o menos se realizaba
este tipo de experimentos. Que en el fondo son muy sencillos. Solamente hay
que dejar... Comida cayendo sin parar y un organismo que empieza a imaginar
cosas. También habréis visto este tipo de comportamientos en, bueno, pues
por ejemplo en los casinos, en todos los juegos de azar. Son muy típicos
de las situaciones en las que no hay control. Luego vamos a ver algo de
esto. Bueno, otros investigadores, sin embargo, en este caso ha estado
Nishimelag, dieron una explicación algo diferente. Ellos lo que hicieron
fue hacer un procedimiento muy similar al que desarrolló Skinner.
Básicamente era lo mismo, pero hicieron algo nuevo y es hacer una
anotación, estudiar de una manera mucho más minuciosa cada una de las
respuestas que daban los animales en la situación de conducta
supersticiosa, de asociaciones supersticiosas o de reforzamiento
adventicio. Y se dieron cuenta de que había dos tipos de conductas, dos
categorías de conductas en los animales. Conductas que dependían del
momento, del intervalo entre reforzadores en el que se encontraban.
Recordad que tenemos un intervalo de 15 segundos. Así que dependiendo si
estamos cerca de cuando aparece el reforzador o estamos en esos momentos
intermedios en los que no va a aparecer reforzador, aparecían dos
conductas diferentes. A las primeras la llamó conductas de interim. Son
conductas que ocurren en mitad del intervalo de reforzamiento, cuando
todavía no va a aparecer ningún reforzador, cuando falta tiempo para
ello. Y son conductas innatas, conductas propias de la especie, conductas
que sirven para pasar el tiempo. Conductas que hacen o que sirven incluso
como reforzadores para el paso del tiempo. De este tipo de conductas os
habréis dado cuenta que muchos tenemos o nos hemos encontrado en
situaciones en las que hay muchas de éstas. Cuando estáis esperando algo,
generalmente no estáis parados. Generalmente uno no está sin hacer
absolutamente nada. Si está esperando que le llamen, si tiene algo en el
horno y está esperando que se haga, si está esperando una llamada o,
bueno, una llamada o que venga alguien a casa. Normalmente empezamos a
hacer cosas que no tienen mucho sentido. Es decir, vamos a la cocina,
empezamos a mirar cosas, nos levantamos, dando paseos. Estos conductas que
son muy similares en todos los humanos y que también se dan en otros
animales. Eso es lo que se denominan las conductas de interín. Es decir,
conductas que se dan en mitad de los intervalos de reforzamiento. Conductas
que rellenan ese tiempo de intervalo. Y en segundo lugar, conductas
terminales. Que son las que aparecen al final del intervalo y muy próximas
al reforzador. ¿Qué decían Stadon y Simenac? Bueno, pues cuando se va a
dar el reforzador, cuando el momento de que aparezca el reforzador se
acerca, entonces aparecen este tipo de conductas. Y estas conductas tienen
mucho que ver con el tipo de reforzador. Si es comida, tendrá mucho que
ver con la conducta del animal a la hora de comer. Si es bebida, lo mismo.
Si es una descarga o si es algún otro tipo de estímulo aversivo, también
tendrá que ver con ello. Así que ellos se dieron cuenta de que ocurrían
estos dos tipos. Así que pensaban que no era una cuestión accidental,
sino que en este tipo de situaciones los animales siguen un tipo de patrón
muy específico, muy pautado, que tiene que ver con conductas innatas. Son
conductas que tienen que ver con el reforzador. Para ellos, además, la
entrega del reforzador, es decir, el momento en que aparece el reforzador,
solo influye sobre las respuestas terminales. sobre las respuestas que se
dan en ese momento y que están relacionadas con el reforzador. Así que da
una explicación totalmente diferente. Dice, no, no, esto no es un
reforzamiento o una conducta aleatoria, sino que son conductas muy pautadas
que tienen que ver o bien con la parte innata, con la parte de las
conductas que suele realizar una especie de manera innata, o sin embargo
tienen que ver con conductas que tienen que ver con lo que harían esos
sujetos o que tienen que ver con el propio reforzador que se va a
administrar. Así que tenemos dos posibles mecanismos y estos dos
mecanismos se piensa que actúan de manera conjunta, aunque en algunas
ocasiones actúan unos y otros otros y que los dos dan lugar a la conducta
supersticiosa. Por un lado, el reforzamiento accidental que Skinner
postulaba y por otro lado, el hecho de que haya determinadas conductas
innatas unido al paso del tiempo. Ciertas conductas innatas que aparecen
para pasar el tiempo o que ocurren en el tiempo. O que ocurren hasta que
aparece el reforzador y que luego se transforman en otro tipo de conductas,
las conductas terminales. Estas son las dos explicaciones que tenemos sobre
la conducta supersticiosa. En realidad ambas ocurren, ambas cosas pueden
ocurrir. Y como siempre os he dicho, la cantidad de variables que hay
alrededor de una situación de aprendizaje influirán mucho en que ocurra
una u otra o en el tipo de aprendizaje que vaya ocurriendo. Recordad
siempre que por mucho que intentemos controlar las variables que hay en una
situación de aprendizaje, son muchas las que se nos escapan y muchas
asociaciones están ocurriendo en el mismo momento o a la vez que nuestra
situación o que nuestra pretendida situación experimental controlada,
aunque la controlemos todo lo que podamos. Siempre ocurrirán varias cosas.
Vamos con otro fenómeno. Algo distinto. Bueno, perdón, nos queda algo
más sobre conducta supersticiosa. Ya os he dicho que es un comportamiento
muy típico de humanos. Si hay un tipo de humanos o una clase de personas
en los que es todavía más exacerbado, que son personas que necesitan
mucho control o que tienen una gran intolerancia a la incertidumbre, las
personas que toleran muy mal el hecho de no conocer las causas o de no
controlar las situaciones, tienen más tendencia a generar conductas
supersticiosas. Porque dan algo que es muy atrayente, que es una falsa
ilusión de control. Esto es algo que se ha estudiado bastante. De hecho,
en la facultad, entre el equipo docente de aprendizaje, hay parte del
equipo que ha dedicado gran parte de su carrera investigadora a la ilusión
de control, a lo que se denomina ilusión de control en particular, a la
ilusión de control en jugadores de azar o en los juegos de azar. Esas
conductas y esas explicaciones que desarrollan los jugadores de juegos de
azar que intentan deshacerse. Intentan dar explicación a lo que no la
tiene o intentan buscar causa a lo que no lo tiene. Como intentando ganar
control sobre situaciones sobre las que no se puede ganar control porque
son totalmente azarosas. Esto es lo que se llama de toda la vida ilusión
de control, la creencia de que uno tiene control sobre algo. Por eso la
conducta supersticiosa suele ser más acusada en personas con una alta
necesidad de control o al revés, con una baja tolerancia a la
incertidumbre. Bueno, en humanos además, Hennstein dice, hay una
distinción entre dos tipos o dos formas de adquirir estas conductas
supersticiosas. Os sonarán ambas. En general, los humanos tenemos dos
tipos de supersticiones. La primera es la que Hennstein denominó
supersticiones idiosincráticas. Son las nuestras propias, las que tienen
que ver con nuestra historia con los reforzadores. Las que tienen que ver
con el hecho de que llevemos amuletos a... a un examen pensando que como
antes se ha asociado ese amuleto a un buen resultado, pues la conducta de
llevarlo más veces hará que vuelva a obtener la misma consecuencia o el
mismo reforzador o con algún otro tipo de supersticiones como por ejemplo
los deportistas salir siempre con el pie derecho o con el pie izquierdo o
bueno, toda la larga lista, solo tenéis que ver un vídeo de Nadal antes
de sacar y podéis ver una larga lista de conductas aunque ahí realmente
se mezclan muchas cosas, no os quiero confundir con esto porque aparte de
superstición también hay una parte de rutina de ejecutar ciertas rutinas
para que los movimientos se automaticen pero bueno, por ejemplo los
deportistas, los futbolistas el hecho de entrar con el pie derecho o el pie
izquierdo todo el tema de amuletos, etcétera, besos al campo, al larguero,
etcétera tiene que ver con este tipo de conductas supersticiones
idiosincráticas propias de uno mismo pero también tenemos las
supersticiones, lo que Herstein llamó supersticiones sociales típicas
estas no tienen que ver con nuestra experiencia con lo que nosotros hemos
vivido con nuestra experiencia con los reforzadores, con nuestro propio
aprendizaje sino con el aprendizaje social, con el aprendizaje cultural son
todas esas supersticiones que hemos heredado en nuestra cultura que en
origen generalmente tenían que ver con contingencias que si eran efectivas
con situaciones que no eran efectivas con situaciones en las que sí
tenían sentido pero que han ido perdiéndolo poco a poco y se han quedado
como un reducto, como un reducto cultural en el libro tenéis algunas hay
otras también muy famosas el hecho de que el viernes 13 sea una fecha de
mala suerte tiene que ver con ciertas cosas que ocurrían o que ocurrieron
en su momento no las recuerdo ahora si os digo la verdad en el libro
tenéis explicado lo de los tres cigarros con una misma cerilla El hecho de
que la primera guerra mundial, o se piense que encender varios cigarros con
una misma cerilla trae mala suerte, porque durante la primera guerra
mundial si encendías varios cigarros con una cerilla por la noche había
más posibilidades de que el enemigo te diese y por lo tanto de que te
matase. Así que era mejor apagar enseguida, no encender varios cigarros
con una cerilla, sino ir encendiendo en diferentes momentos y durante un
corto periodo de tiempo. Es que son cosas que se han ido heredando y que se
han quedado como un pozo cultural y que hemos heredado esas supersticiones
culturalmente, no a través de nuestra experiencia con el reforzamiento
adventicio o con el reforzamiento supersticioso en este caso. Bueno, vamos
con lo siguiente, vamos con otro de los fenómenos. En este caso, si quiere
pasar la diapositiva, que tarda un poquito, a ver si pasa, espero que nos
haya quedado... clavado, me imagino que el otro día me pasó con otra de
las clases, mira ya ha aparecido aquí, me pasó con otra de las clases,
que di un error, se me colgó la plataforma y ya no se podía volver a
conectar hasta el final de la clase, así que espero que no pase. Bueno,
vamos con la deriva instintiva. Este también es un fenómeno bastante
curioso, os explico algo sobre ello. Bueno, lo primero tiene que ver con el
hecho de la universalidad del condicionamiento operante. Es decir, la
pregunta de si se puede condicionar cualquier respuesta, ¿se puede
condicionar cualquier respuesta a través de la aparición de cualquier
reforzador? O dicho de otra manera, ¿es necesaria que haya cierta
pertinencia o cierta relevancia entre la respuesta que damos y el
reforzador que obtenemos? Si recordáis cuando hablábamos del
condicionamiento clásico, hablábamos de que no todas las situaciones eran
igual de fáciles de condicionar. Cuando teníamos como estímulo
incondicionado una descarga, era más fácil condicionar ciertos estímulos
que otros. Es decir, para condicionar o para generar una asociación entre
un estímulo condicionado y una descarga era mucho más fácil con una luz
que, por ejemplo, con un estímulo gustativo o con un olor. Era mucho más
sencillo porque generalmente en el mundo real, en el mundo de la luz, en el
mundo del animal, es mucho más fácil que una descarga sea producida por
un estímulo audiovisual o que tenga que ver con algo audiovisual. Sin
embargo, un malestar es mucho más fácil que sea producido por la
ingestión de comida. Así que cuando intentas condicionar un malestar a la
aparición de una luz es mucho más difícil o viceversa. Así que era
necesaria cierta pertinencia. Había cosas que eran más fáciles de
condicionar que otras. Bueno, pues lo mismo ocurre aquí. No todas las
respuestas son igualmente asociables a la aparición de distintos
reforzadores porque hay algunas respuestas que se relacionan de manera
natural con un reforzador. Y hay veces que cuando presentamos un reforzador
no se refuerza o no aumenta la probabilidad de la respuesta que nosotros
queremos, sino de la respuesta asociada o similar a la que produciría en
la situación natural ese reforzador. Esto es muy similar al
condicionamiento clásico. Recordáis que los estímulos incondicionados,
como la comida, producen unas respuestas que son innatas. Bueno, pues algo
tendría que ver con esto. No es lo mismo, ¿vale? Pero algo tendría que
ver con esto, con el hecho de que ante la presentación de ciertos
reforzadores es más fácil condicionar ciertas respuestas que tienen que
ver con las que produce ese reforzador en la vida real, en la vida del
organismo. Bueno, ¿quién desarrolló este tipo de experimentos? ¿O
quién descubrió este fenómeno, el fenómeno de deriva estímula? Pues un
matrimonio, el matrimonio de los Breland. Los Breland eran alumnos de
Skinner. Fueron sus alumnos de doctorado. Y una vez que terminaron su
formación, dejaron la vida académica y montaron una empresa. Montaron una
empresa que se dedicaba a maestrar, a enseñar ciertas conductas animales.
Para circos, para ferias, bueno, pues para diferentes actividades. Y la
verdad es que les iba muy bien. Ellos, como tenían alma de investigadores,
seguían haciendo ciertos experimentos. Y lo que se dieron cuenta es que
cuando ellos intentaban realizar ciertos... O asociar... O asociar
determinadas respuestas a la obtención de reforzadores, cuando intentaban
enseñar ciertas cosas a los animales, hay veces que les resultaba muy
difícil en determinadas situaciones. Por ejemplo, el ejemplo que pone en
el libro, y lo tenéis, luego os enseño, os cuento cómo es el vídeo que
os he puesto. En los materiales. El experimento, bueno el experimento, la
situación que ellos encontraron, porque ellos se lo encontraron de frente
cuando intentaban amaestrar a un animal, en este caso un mapache. Bueno
pues ellos encontraron, ellos lo que querían hacer era enseñar a un
mapache a coger monedas y llevarlas a una hucha. Una hucha, una especie de
forma de casita o una hucha grande y lo que tenía que hacer el mapache era
coger las monedas, llevarlas, introducirlas por la ranura de la hucha y se
les daba comida, obtenía un premio. Bueno y se dieron cuenta de que al
principio el mapache lo hacía, cogía y llevaba a la hucha y obtenía
reforzamiento. Pero que con el tiempo empezaban a ocurrir cosas raras. El
mapache dejaba de ir a la hucha y empezaba a manosear las monedas, empezaba
a manosearlas, a frotarlas, a lamerlas, a mordisquearlas como si aquello
fuese comida. Bueno esto es lo que ellos denominaron con deriva instintiva.
Era una competición entre la conducta que ellos querían. Que es reforzar,
que ellos querían asociar a la obtención del premio y otras conductas
innatas que están relacionadas con el reforzador. Así que se dieron
cuenta de que cuando intentaban reforzar una cierta conducta esta competía
con otras que eran muchas más fuertes. Y al final terminaban ocurriendo
aquellas conductas que eran más fuertes. Este es el concepto de deriva
instintiva. Y de aquí se deriva la cuestión de que no es igual de fácil
reforzar cualquier conducta. La pertinencia. La pertinencia entre la
conducta y el reforzador es esencial. En la siguiente diapositiva, entre
comillas, porque aquí solo queda la foto de ello, pero en las diapositivas
que os he mandado lo tenéis. Tenéis un vídeo precisamente de un mapache
introduciendo monedas en una hucha y veréis que con el paso del tiempo el
mapache deja de hacer lo que debería hacer y empieza a manosear las
monedas, a realizar una deriva instintiva, a realizar conductas que tienen
que ver con la manipulación de los alimentos que realizan los mapaches.
Solo que en vez de hacerlo con la comida, lo hace con el reforzador que se
ha asociado a la aparición de comida. Es un fenómeno bastante
interesante, lo veréis, es bastante curioso. Bueno, vamos con algunos
otros fenómenos, vamos con algo un poquito distinto. El fenómeno de
contraste conductual. Seguramente a algunos de vosotros ya os suene. Si
habéis hecho psicología de la motivación, si ya habéis terminado
motivación, os sonará porque esto además se explica con un poquito más
de detenimiento en motivación. De hecho, es un fenómeno típico de la
psicología motivacional, de cómo afectan las recompensas y el cambio de
las recompensas o la historia de las diferentes recompensas a la conducta
de los individuos. Bueno, una cosa importante sobre los reforzadores, algo
que ya hemos visto, que veremos y que seguramente ya os hayan contado,
aparte de haberlo contado yo en las tutorías, es que el efecto de los
reforzadores no tiene un efecto absoluto, porque su efecto depende de la
experiencia o del aprendizaje pasado de los sujetos. ¿Qué experiencia han
tenido los sujetos con esos reforzadores? En particular de la historia del
reforzamiento, de lo que les ha ocurrido antes con el reforzamiento. ¿A
qué se refiere el contraste conductual? Bueno, pues al hecho de que una
misma magnitud y un reforzador no tiene el mismo efecto sobre diferentes
organismos en función de la historia de reforzamiento de esos organismos o
de lo que ha ocurrido con el reforzador en esos organismos. En particular,
con la magnitud o con la calidad, pero vamos a llamarlo magnitud, con la
cantidad de premio que han recibido antes. El caso más sencillo, y ahora
nos metemos con el experimento, pero yo creo que es el caso más sencillo
para que lo entendáis. Imaginaros una situación en la que tenemos varias
personas trabajando en una empresa. Y en esa empresa tenemos una persona
que cobra 1.800 euros, otra persona que cobra 1.100. Y de repente... Y de
repente un día le subimos... Perdón, una 1.800 y otra 1.200, para que
así coincida más fácil. Y de repente un día a la persona que cobra
1.800 le bajamos el sueldo 300 euros y pasa a cobrar 1.500. Sin embargo, a
la persona que cobra 1.200 le subimos el sueldo también 300 euros y pasa a
cobrar 1.500 euros. Seguramente en los momentos previos, si por el mismo
trabajo uno le paga 1.800 y otro 1.200, el rendimiento de la persona que
cobra 1.800 euros sea mayor que el de la persona que cobra 1.800 euros. O
sea, de 1.200 eso es algo que suele ocurrir cuando tienes una mayor
valoración de lo que haces. Suele trabajar más a gusto, suele trabajar
mejor, suele ser más cómodo. Vale, una vez que tenemos esto, bajamos a
uno el sueldo y se lo subimos. Pasan a cobrar los dos lo mismo. Se supone
que el rendimiento de los dos será el mismo. Sin embargo, esto no sucede
así. Lo que suele ocurrir en estos casos es que el rendimiento de la
persona que cobra 1.500 euros pero viene de que le bajen el sueldo es
bastante peor que el de la persona que se lo han subido, a pesar de que el
reforzador es el mismo. Esto es un ejemplo clásico de cómo la historia de
reforzamiento, la historia previa de reforzadores, la magnitud, la
experiencia que tenemos con la magnitud de reforzamiento, con la calidad de
reforzamiento afecta por encima de lo esperado a nuestro desempeño. En
este caso a la calidad de nuestra conducta, en este caso a la calidad de
nuestro trabajo. Vamos a verlo en un experimento donde queda más claro y
donde se ve exactamente el fenómeno de contraste porque el contraste no es
sólo un cambio en el rendimiento, es un cambio en el rendimiento. Por
encima de lo esperado, por encima de lo que uno debería esperar. Vamos a
verlo aquí. Bueno, en primer lugar tengo una errata, ¿vale? Os corrijo la
errata aquí mismo. Esto sería el grupo C y esto sería el grupo D. He
puesto tres grupos A. Bueno, esto es A, B, C, D. Bueno, tenemos cuatro
grupos. Fijaros, en los dos primeros, tenemos dos fases además, dos fases
de entrenamiento. En los dos primeros grupos, durante la primera fase de
entrenamiento, reciben una recompensa pequeña. Por pulsar, perdón, por
pulsar una palanca, no. Esto os explico un poco mejor aquí en la
situación. Lo que tienen que hacer las ratas es correr por un corredor
recto para obtener comida, ¿vale? La velocidad a la que corren es un
indicativo de la magnitud del premio. Es decir, la mayor cantidad de premio
corren más rápido. Una magnitud, un indicador de la magnitud de la
asociación. Bueno, pues para el grupo A y el grupo B tenemos que en la
primera fase empiezan recibiendo un premio de dos bolitas. Ambos grupos
corren y obtienen dos bolitas. Bien, perfecto. En esta primera fase los
grupos C y D cuando corren obtienen 22 bolitas, un premio muchísimo más
grande. Os podéis imaginar que durante esta primera fase los dos últimos
grupos corren bastante más rápido a través del corredor para obtener la
comida. La magnitud del premio es muchísimo mayor. Bueno, vamos a la
segunda fase donde algunas cosas van a cambiar. Para el grupo A en la
segunda fase se mantiene el mismo premio pequeño. Así que el grupo A
recorre el corredor a la misma velocidad que lo hacía antes. No ha
cambiado nada, la primera y la segunda fases son exactamente las mismas,
así que misma velocidad. El grupo B sin embargo hacemos algo y es que voy
a borrar un segundo para que lo podáis ver mejor. Y así lo vemos en
términos de velocidades de ejecución. Tenemos el grupo A. El grupo A,
tanto en la primera como en la segunda fase, tiene el mismo premio, así
que tiene este nivel de ejecución. Pongamos que aquí hay unos ejes de
coordenadas. Tiene ese nivel de ejecución. Bien, empezamos justo aquí.
Segundo, el grupo B cambia de pequeño a grande. Así que durante la
primera fase empezará exactamente igual que el grupo A. Pero en la segunda
fase le hemos dado un premio más grande. Así que su ejecución, la
magnitud de ejecución, va a cambiar. La velocidad a la que corre va a ser
mayor durante la segunda fase. Ya tenemos el grupo A y el grupo B. Vamos a
ver el grupo C y el grupo D. En el grupo C tenemos una ejecución alta
porque han empezado con un premio de 22 bolitas y en el grupo C no cambia
así que su ejecución va a ser la misma, empezará alta y seguirá alta.
Fijaros, aquí tenemos los dos grupos ya de línea base, el A que tiene una
ejecución igual en todos porque siempre tiene el mismo premio pequeño. No
me digas, no se ve si dibujo algo o es que lo que ocurre es que no se ven
las letras o no se ve el trazo que dibujo. Ah, qué raro, algunos sí lo
veis y otros no. Bueno, como va a quedar grabado, en el caso de que no lo
veáis yo lo voy explicando, lo intento decir lo mejor que pueda y luego lo
que voy a explicar os lo voy a explicar. Como podéis ver en la grabación,
si acaso si hay alguno que no lo veáis. Bueno, continúo aún así por la
explicación, espero que lo podáis entender. Grupo A se comporta igual en
las dos situaciones, el grupo C también porque reciben el mismo premio en
las dos situaciones. Vamos a centrarnos en el grupo B y el grupo D. El
grupo B pasa de un premio pequeño a uno grande, así que empiezan
rindiendo igual, El grupo A, pero ¿qué pasa cuando en la segunda fase
aumentamos el premio? Lo esperable será que se comporten como el grupo C
en este caso, es decir, que pasen a ejecutar, a correr a la misma velocidad
que el grupo C porque van a recibir el mismo premio, el premio grande. Pero
esto no ocurre. Ejecutan por encima del nivel del grupo C. Corren más
rápido que el grupo C aunque tengan la misma recompensa. Y vamos ahora al
caso contrario. El grupo T y el grupo D empiezan con 22 bolitas. Empiezan
con una ejecución alta. Pero ¿qué ocurre en la segunda fase? Les bajamos
el premio a dos bolitas. Así que van a disminuir su velocidad de
ejecución. Lo intuitivo sería pensar que bajarán su velocidad de
ejecución hasta la misma que tiene el grupo que recibe dos bolitas
siempre. El grupo A que siempre ha recibido dos bolitas. Pero esto no es lo
que ocurre. Lo que ocurre es que su ejecución baja por debajo de la
ejecución propia del grupo A. Del grupo que siempre ha recibido dos
bolitas. ¿Qué quiere decir esto? Pues que el efecto del reforzador
depende de lo que uno ha recibido antes. Cuando uno ha recibido siempre dos
bolitas, bueno, pues corre una velocidad. Pero si uno está acostumbrado a
recibir 22 bolitas y le bajan a dos, no va a rendir como el que siempre ha
recibido dos, sino que va a rendir por debajo del que ha recibido dos. Y lo
mismo cuando hablamos de un contraste conductual positivo. Es decir, cuando
pasamos de un reforzador pequeño a un reforzador. Una cosa muy importante
de este fenómeno es que es temporal. Cuando pasa un tiempo, ese fenómeno
de contraste, es decir, de ejecución por encima o por debajo de lo
esperado, baja y se adecua. Al rendimiento del grupo que tenía o que tiene
el mismo reforzador que el grupo que ha tenido contraste. Es decir, vuelve
a los niveles del grupo que desde el principio tuvo ese nivel de
reforzador. Se vuelve al estado de normalidad. ¿Qué quiere decir esto?
Bueno, pues que las personas que uno cobraba 1.800 y otro 1.200, cuando
pasen a cobrar los 2.500, uno rendirá más de lo esperado y otro rendirá
menos de lo esperado. Pero con el tiempo los dos volverán a igualarse y
rendirán los dos lo mismo. Al nivel del reforzador de 1.500 euros. Así
que es un efecto pasajero, es un efecto temporal que depende mucho además
del estado afectivo y emocional del sujeto. De cómo le afectan esos
reforzadores, de lo importantes que son, de la situación en la que está,
de otras variables relacionadas. Por eso es un fenómeno muy estudiado en
psicología, sobre todo en psicología motivacional. Cómo afectan los
cambios y cómo afecta la historia de reforzadores y los cambios en los
reforzadores a la ejecución, al nivel de ejecución. A la ejecución
conductual de los sujetos. Bueno, esto en cuanto al contraste conductual.
Vamos con otro fenómeno. Nos quedan creo que tres fenómenos. El otro muy
importante y uno además bastante interesante por las implicaciones que
tiene en humanos. Por las implicaciones que tiene además en un trastorno
específico humano que es la depresión. Sirve como modelo o ha servido
como modelo de depresión o como hipótesis sobre algunas de las causas o
esos orígenes de la depresión. Tener en cuenta que la depresión es un
trastorno multicausado. Tiene un montón, no solo de síntomas, sino de
consecuencias sobre la conducta y también sobre otras situaciones. No es
una cuestión de que la indefensión aprendida sea un modelo de todo lo que
ocurre en la depresión, pero sí puede explicar ciertas cosas o ciertas
observaciones que también se dan en personas con depresión, en personas
que tienen un trastorno depresivo. Bueno, vamos a explicar qué es esto.
¿Qué es la indefensión aprendida? El efecto que descubrió Seligman, uno
de los efectos más famosos en el aprendizaje. Bueno, pues es el efecto que
ocurre cuando no tenemos control sobre las circunstancias o sobre las
consecuencias adhesivas. Por ejemplo, si yo estoy en una caja de Skinner,
imaginaos que tengo una ratilla en la caja de Skinner, y le empiezo a dar,
tenemos un suelo electrificado, y le empiezo a dar descargas. Pero le doy
descargas sin que ella pueda hacer nada para evitarlas. Simplemente le doy
descargas y descargas y no puede ni escapar. Ni puede evitarlas de ninguna
manera. Haga lo que haga, sigue recibiendo descargas. Incluso cuando salta,
recibe descargas porque le ha enganchado la pata a otro electrodo. Es
decir, no puede hacer nada. Haga lo que haga, siempre recibe descargas.
Esto es una situación de falta de control. No hay ningún control sobre la
situación. Y esto produce, como ya vimos en las consecuencias de los
procedimientos con estímulos aversivos, conduce a ciertas... o produce
ciertas respuestas emocionales. En este caso lo que produce es una
respuesta emocional de pasividad. El animal deja de realizar cualquier
conducta. Se para, frena, no hace nada, no tiene control sobre lo que
ocurre, así que deja decidir, o decide, perdón, dejar de actuar. Eso es
lo que se denomina... independencia aprendida. Y además este fenómeno se
generaliza a situaciones que perciban como similares. Fijaros la
similaridad que hay con el fenómeno de la depresión humana o con los
síntomas de la depresión humana. En los trastornos depresivos las
personas suelen dejar de realizar conductas, su nivel conductual desciende
mucho y eso hace que también dejen de recibir reforzadores. Cuando
estudiamos esto o cuando pensamos en depresión humana podemos pensar en
situaciones en las que la persona ha perdido el control o siente que ha
perdido el control sobre lo que ocurre y que empiezan a ocurrir cosas
negativas, empieza a perder reforzadores, empieza a perder situaciones las
que antes se sentía reforzado y que eran agradables, empieza a perderlas y
no tiene control sobre ellas. Por eso habréis visto que muchas veces las
depresiones van asociadas a ciertos eventos, ciertos eventos o a una
conjunción de eventos. Pérdida de una pareja, muerte de un familiar,
etcétera, etcétera. Situaciones en las que yo no puedo hacer nada, que no
puedo controlar nada, estoy perdiendo reforzadores. O estoy recibiendo una
estimulación muy aversiva y no puedo hacer nada para evitarlo. Esa
situación puede provocar que yo deje de realizar conductas, que me vuelva
pasivo ante todo el resto de situaciones. ¿Y qué ocurre si yo dejo de
realizar conductas? Que pierdo todo el resto de reforzadores. Así que
¿qué es en lo que caigo? En una depresión he perdido todos los
reforzadores, dejo de realizar conductas y entro en un círculo vicioso en
el que cada vez recibo menos reforzadores y cada vez actúo menos. Por eso,
En las terapias o en la forma de tratar la depresión, más allá de los
medicamentos que sirven para situaciones puntuales y que tendrían un
efecto distinto, más de elevar artificialmente o a través del principio
activo, elevar el estado de ánimo para permitir volver a iniciar la rueda
de la conducta. Pero las terapias psicológicas, por lo menos, y
cognitivo-conductuales de la depresión se basan sobre todo en hacer cosas,
en volver a la rueda de la conducta. Porque solo si actuamos obtenemos
reforzadores. Y una de las cosas principales es volver a actuar para volver
a obtener reforzamiento por la conducta. Y también para volver a obtener
control sobre los reforzadores. Ver que nuestra conducta tiene un efecto,
tiene consecuencias sobre lo que hay. Eliminar ese círculo vicioso y
volver a actuar, volver a... A generar nuevas conductas y obtener nuevos
reforzadores y reemplazarlos que ya no están por unos nuevos, sería una
de las grandes bases de la terapia y del tratamiento de la depresión en
este caso. Vamos a explicar un poco el experimento, cómo ocurre en
animales, para que veáis la similaridad con este fenómeno. Imaginaros,
tenemos en este caso tres grupos distintos. El grupo de escape, el grupo
acoplado y el grupo control confirmado. Agárrate, es control confirmado.
Finado, ¿vale? Es otra errata. Estoy descubriendo muchas erratas en los...
Confinado, no confirmado. Nada de control confirmado. Bueno, os voy
explicando uno por uno. Bueno, tenemos varias fases. Tenemos una fase de
preexposición y una fase de aprendizaje del escape-evitación. Es decir,
aquí lo que tenemos que aprender es a escapar de una situación a ver
si... Pero antes del escape o de la evitación de esa situación aversiva
voy a poner al sujeto en una serie de condiciones. En el grupo de escape lo
que hago es someter al sujeto a una serie de descargas pero que puede
controlar, es decir, puede escapar de ellas. Como si fuese un escape a
evitación, por eso se llama grupo escape. El animal, la persona, lo que
sea puede escapar de la situación aversiva. Su conducta tiene
consecuencias sobre el entorno, puede controlar lo que ocurre. Así que se
le somete a ese tipo de descargas pero de manera escapable. En el grupo
acoplado, que es el grupo específicamente de indefensión aprendida, lo
sometemos a descargas incontrolables. Lo que hemos hablado antes, se somete
un animal a una serie de descargas de las que no puede escapar. De ninguna
manera. Simplemente la recibirá una y otra y otra y otra vez. Y el grupo
de control confinado simplemente se le mete o simplemente se le mete en la
misma situación sin recibir ningún tipo de descarga ni hacer
absolutamente nada. Simplemente está en la misma caja de esquina
recibiendo los mismos estímulos excepto la descarga. Bueno, ¿qué hacemos
después? Pues después sometemos a los tres grupos a la misma situación
de aprendizaje. La presencia de una señal. En este caso, por ejemplo,
podría ser una luz. Anticipa la aparición de una descarga y pongamos que
en esta situación los sujetos pueden escapar de la descarga o pueden
evitar la descarga si saltan de una zona de la jaula a otra, que es una
zona segura. Así que siempre que aparezca la señal será. Siempre que
aparezca la luz será una señal para saltar al otro lado de la caja y
evitar la descarga. Bueno, pues en los grupos de escape el aprendizaje es
normal, rápido. En el grupo confinado también, el que no ha sido sometido
a ningún tipo de descarga. Además estos dos aprenden igual, aprenden de
la misma manera, no hay diferencias entre ellos. Sin embargo, el grupo
acoplado, el grupo que recibió previamente descargas que no eran
controlables, tuvo un aprendizaje muchísimo más lento. No eran capaces de
aprender esa asociación, tardaban muchísimos ensayos en aprender esa
misma asociación, les costaba muchísimo más. El hecho de recibir esas
descargas inescapables generaba una expectativa. La expectativa de que su
conducta en otras situaciones similares no va a tener ningún efecto. Así
que como les ocurría esto, generalizaban esa falta de control a las
situaciones de aprendizaje y dejaban de actuar. ¿Veis la similaridad con
las situaciones de depresión humana en la que generalizas esa falta de
control, esa inescapabilidad de las situaciones aversivas a otras
situaciones? Entonces dejas de actuar y dejas de obtener reforzadores, con
lo que se agudiza todavía esa sensación de falta de control. No quiere
decir que no pueda ocurrir el aprendizaje, de hecho ocurre, aunque tarde
muchísimo. Y de hecho de la depresión se sale, aunque se tarde mucho y
aunque cueste mucho, pero se puede salir de esos trastornos porque esto no
es irreversible. Además hay situaciones que ayudan a eliminar esta
sensación o a eliminar este efecto de indecencia de la aprendizaje. La
más fácil, poner al sujeto en una situación en la que no puede fallar,
situaciones de aprendizaje tan sencillas que no pueden fallarse. Por
ejemplo, en los experimentos lo que se hacía en estas situaciones es,
imaginaros que una rata, un perro, exactamente igual. En las situaciones en
las que vi una descarga y el sujeto podía escapar pero no aprendía, lo
que hacía el experimentador era coger al animal y ponerlo en la zona
segura. Una situación en la que siempre evitaba la descarga o escapaba de
la descarga, siempre, con independencia de su conducta. Esto ayuda a
recuperar el control. Una de las claves es poner al organismo, al sujeto,
al participante o al humano, lo que queráis, en una situación en la que
siempre va a acertar, en la que siempre va a obtener. Eso ayuda a recuperar
el control. Y también puede prevenirse, y esto es un tratamiento
preventivo para situaciones futuras, exponiendo a la persona o al animal a
situaciones en las que puede controlar más cosas. Con historia de control.
Si la historia de falta de control provoca indefensión aprendida, la
historia de control, la historia de que yo puedo controlar lo que me
ocurre, que yo tengo la capacidad de control sobre lo que me ocurre,
vacuna, palabra muy de moda ahora, por cierto, perdón para el chiste, pero
palabra muy de moda, por desgracia, por cierto, vacuna contra la
indefensión aprendida, contra la falta de control. Así que poner a las
personas en situaciones de control... va a hacerlas mucho más resistentes
a esa sensación de indefensión. Son dos procedimientos muy útiles tanto
para recuperar como para evitar lo que pueda ocurrir en un futuro. Vamos
con el siguiente, nos quedan dos fenómenos diferentes. El procedimiento de
marcado, fijaros, este es un procedimiento interesante, está un poco más
alejado de lo que solemos ver habitualmente, pero también es un fenómeno
que nos ocurre usualmente aunque no nos demos cuenta de ello. ¿Qué ocurre
con esto? Esto está muy relacionado con el fenómeno de demora del
reforzador. Ya hemos visto tanto en el condicionamiento clásico como en el
condicionamiento operante o instrumental que el momento en el que aparece
el reforzador influye mucho en el grado de asociación que se establece
entre la respuesta y la consecuencia, en este caso, en el caso del
condicionamiento operante. Bueno, como regla general es mucho más difícil
que algo quede reforzado, que una conducta quede reforzada, que se haga
más probable en el futuro, ¿cuánto mayor sea el espacio de tiempo que
pasa entre que yo hago la conducta o que yo realizo la conducta y ocurre el
reforzador? Si queremos reforzar algo, lo mejor es hacerlo de manera
inmediata. Es verdad que hay fenómenos en los que habría que ponerle
peros a todo esto y que la situación es compleja, hay situaciones en las
que no ocurre, recordad el caso del condicionamiento de la versión al
sabor, que se saltaban todas estas reglas, pero en general suele ocurrir
esto. Bueno, la cuestión es, la mayoría de los humanos... los humanos y
los animales no obtenemos siempre los reforzadores en el mismo momento en
el que realizamos las conductas, a veces hay demoras muy grandes. Tiene que
ver con muchos fenómenos, incluso con reforzadores secundarios o con una
cierta cadena de respuestas que se van reforzando secundariamente. Pero
también hay un fenómeno muy curioso, que es el fenómeno de marcado. Un
procedimiento que nos permite, o uno de los procedimientos que nos permite
evitar el efecto de la demora. ¿Cómo podemos lograr que un reforzador sea
efectivo a pesar de la demora que hay entre uno y otro? Fijaros, voy a
explicaros el experimento para que veáis cómo es. El experimento es
bastante sencillo. Tenemos dos grupos de ratas, el grupo de ratas A y el
grupo de ratas B. Al grupo de ratas A le vamos a denominar al grupo de
marcado y al grupo de ratas B es un grupo de control normal. Bueno, cogemos
al grupo de ratas A. El experimento es súper sencillo. ¿Veis esta caja
que hay aquí? O esta situación experimental, una especie de corredor
recto pero con dos brazos. Bueno, las ratas salen de la caja de salida y
llegan a lo que se denomina, la caja de elección. En la caja de elección
ven dos brazos. Tienen una elección que realizar. Tienen un brazo negro y
otro brazo blanco. Lo único que se diferencia es el color. La situación
experimental es muy sencilla. Si pasan por el brazo negro, después al
llegar a la meta tendrán comida. Si pasan por el brazo blanco, cuando
lleguen a la meta no tendrán comida. Pero una vez que pasan por alguno de
los brazos entran en una caja de demora, donde están un tiempo hasta que
reciben la comida. Bueno, cuando se realiza este procedimiento, el típico
del grupo de control, en el que no se hace nada más que esto. Las ratas
pasan por aquí, están un tiempo en la caja de demora y después de un
tiempo reciben el reforzador. cuando pasan por el brazo negro, recordad,
solo cuando pasan por el brazo negro. Cuando pasan por el brazo blanco,
nada. ¿Qué ocurre con este grupo? Bueno, pues que tras muchos ensayos su
ejecución se mantiene en niveles de azar. Es decir, siguen pasando un 50%
de veces por un brazo y otro 50% de veces por otro. No tienen muy claro por
dónde pasar. Vale, ¿qué ocurre con las ratas del grupo marcado? Bueno,
pues aquí es importante lo que se hace. En este caso, la única diferencia
con el otro grupo es qué ocurre después de la elección. En el primer
grupo, después de la elección, lo único que ocurría es que las ratas
pasaban por el corredor y esperaban aquí. En el caso del grupo de marcado,
una vez que toman su decisión y pasan a este brazo o a este brazo, el
experimentador las coge y las pone en la caja de demora. Lo hacen todo
igual. Tienen que esperar el mismo tiempo, tienen que tomar la misma
decisión. La única diferencia es que el experimentador... El
experimentador las manipula y las pone en la caja de demora. Tanto cuando
pasan por el corredor negro como cuando pasan por el corredor blanco. Es
decir, según entran aquí o aquí, se las coge y se las pone en la caja de
demora. Bueno, pues ese grupo aumentó su nivel de ejecución hasta que al
final pasaban más del 90% de las veces por el corredor correcto. Es decir,
aprendieron que pasando por aquí se obtenía el refuerzo. ¿Qué es lo que
ocurría en este caso? Bueno, pues la hipótesis es que... En este caso, el
marcado, es decir, la manipulación, marcaba la respuesta. La respuesta es
ir a un lado o a otro. Así que el hecho de coger a la rata, de
manipularla, servía como marcado de la respuesta. La diferenciaba de otros
eventos que podían ocurrir mientras esperaba. Todas las ratas hacían lo
mismo. La única diferencia es que al grupo A se las manipulaba. Justo
cuando revisaban la conducta recibían otra conducta o otro un estímulo de
marcado. Es decir, marcaba esa conducta. Era mucho más fácil que quedase
guardado de memoria asociado a esa elección y eso hacía que tuviese una
mayor posibilidad de recuperarse durante la demora. Es decir, de asociar lo
que aparecía aquí a la elección, a la conducta que se había realizado
aquí. Por eso es un procedimiento de marcado. Un procedimiento en el que
una conducta se marca, se pone una marca para luego recuperarla cuando
aparece la consecuencia. Las diferencias de otras conductas o de otras
cosas que puedan suceder en el espacio que hay entre que revisas la
conducta y el reforzador. ¿Qué posible explicación alternativa hay
aquí? Pues uno podría pensar, bueno, a lo mejor es que el marcado, el
hecho de cogerla, funciona como un reforzador. A la rata le gusta que la
cojas y eso es un reforzador secundario. Sin embargo, esto no es muy
probable porque se puede descartar por el hecho de que las ratas se
cogían, se manipulaban tanto cuando realizaban la elección correcta como
cuando no. Así que... Si esto fuese así, asociarían como reforzador
secundario de la manipulación tanto con las elecciones correctas como las
que no. Así que les daría igual pasar por uno que por otro. Sin embargo,
aprendieron a pasar solo por aquí aunque se las manipulaba Cuando
realizaban las dos decisiones. ¿Veis? Marcar una respuesta, cualquier
evento que marque una respuesta y que haga su disponibilidad mayor a la
hora de recibir el reforzador cuando el reforzador es demorado. Bueno, y
vamos con el último de los fenómenos, con el fenómeno de devaluación
del reforzador. En este caso, esto consiste en asociar un reforzador
específico a un estímulo o a una situación de naturaleza contraria.
Imaginaros, esto sería un condicionamiento clásico, claro, esto sería, o
la asociación sería un condicionamiento clásico. Imaginaros que
asociamos la comida a un malestar, el cloruro de litio, recordad. ¿Qué
producía malestar? Si os acordáis del condicionamiento de aversión a las
aves. Si asociamos la comida al malestar, seguramente la comida se ve
afectada con su valor como reforzador, ¿no? Bueno, pues esto es
exactamente lo que ocurre. Vamos a ver qué ocurre aquí. Tenemos dos
grupos. El grupo que se llama malestar y el grupo control. En el libro
tenéis varios ejemplos. Yo he cogido uno en el que hay dos mecanismos, dos
mecanismos diferentes que llevan a dos premios diferentes y cada uno se
asocia a una situación diferente. Vamos a explicarlo un poquito. Bueno,
tenemos una primera. Tienen dos mecanismos. De hecho, los mecanismos creo
que en el libro queda explicado así. Tienen una cadena y una palanca. Si
tiran de la cadena, obtienen agua con azúcar. Si tiran de la palanca,
obtienen una bolita de comida. La situación es tal que se propone de tal
manera que la rata no tiene preferencias por cada uno de ellos. Así que
cuando le metes en esto, dice, uy, qué bien, tengo agua, tengo comida,
puedo obtenerla libremente. Así que tira tantas veces de la cadena como
pulsaciones de la palancada. No tiene ninguna preferencia por ninguna. Se
reparte su conducta al 50%. Bien, ya tenemos esto. ¿Qué hacemos en una
segunda fase? Pues en una segunda fase, imaginaros que asociamos, por otra
parte, sin que tenga que realizar ninguna respuesta. Por eso pone aquí no
contingente. En esta segunda fase, cogemos en el grupo de malestar, en el
primero de los grupos, y asociamos el agua, es decir, les damos agua
azucarada, que les encanta, sin que tengan que realizar ninguna respuesta.
Esto es importante. No tienen que tirar de la palanca. Simplemente se les
da agua. Se les inyecta cloruro de litio y, por tanto, después, malestar.
El agua se ha asociado. Por condicionamiento clásico, al malestar. Sin
embargo, la comida no. En el otro grupo, simplemente se les presenta agua y
comida. Por cierto, en el primer grupo, en el grupo de malestar, se les
presenta agua y también comida, pero solo el agua se asocia con el
malestar. Es decir, cuando beben agua, después se les inyecta cloruro de
litio para que se encuentren mal, pero cuando toman comida, no. Y no tienen
que dar ninguna respuesta. En el otro grupo, simplemente tienen agua y
comida, el platito y el comedero, pero no se asocia a ningún malestar.
¿Qué ocurre cuando vuelven a la caja de Skinner? Bueno, pues el grupo de
control sigue con su conducta normal. Mitad de veces al agua, mitad de
veces a la comida. Sin embargo, el grupo de malestar obtiene o da como
resultado lo que se denomina devaluación del reforzador. El agua, por su
asociación con un estímulo de naturaleza contraria, con el malestar, deja
de tener valor como reforzador. Así que ahora, cuando le volvemos a meter
en una situación de reforzamiento en el que tiene que realizar una
conducta Para obtener una consecuencia, este reforzador ya no tiene el
mismo valor que antes, así que la mayoría de las conductas van a la
comida, a la palanca. Deja de realizar esta conducta porque el reforzador
ha perdido su valor. Ves que los reforzadores no son absolutos sino que
dependen de la historia con los mismos, depende del sujeto, depende del
estado del sujeto y de las asociaciones previas y de la historia de
reforzamiento el que el reforzador tenga un valor como tal o no lo tenga.
En este caso tendríamos también dos situaciones porque este fenómeno
puede revertirse a través de la práctica masiva, es decir, cuando uno
practica de manera masiva una respuesta puede que aunque el reforzador se
asocie con algo de signo contrario o con algo desagradable no se devalúe
su valor. Fijaros, tendríamos dos tipos de situaciones, lo que se
denominan acciones instrumentales Que son respuestas o acciones que varían
en función de las consecuencias. Si la consecuencia es peor, dejo de hacer
eso. Si yo he asociado ese reforzador con algo malo, dejo de hacer eso.
Imaginaos que yo asocio el hecho de ganar mucho dinero en el trabajo aunque
luego voy a tener que pagar muchos impuestos. Pues a lo mejor el ganar más
dinero deja de ser un reforzador tan valioso para mí porque no quiero
pagar más impuestos o porque lo veo de esa manera. Ves que depende de la
historia del reforzador. Eso sería una acción instrumental. Mis acciones
o la preponderancia... ...predisposición que yo tengo, el valor que tiene
el reforzador para reforzar ciertas conductas depende de las consecuencias,
depende del valor del propio reforzador. Así que las conductas se
modifican por el valor del reforzador. Esto es la situación usual. Pero
también hay otras conductas que se denominan hábitos. Todos sabéis lo
que es un hábito. Son conductas que no dependen del valor del reforzador.
Cuando una conducta se da durante mucho tiempo y de una manera usual, deja
de ser dependiente del valor del reforzamiento. Pasa a ser mucho más
rígida. Ya no depende de las consecuencias y empieza a depender
simplemente del propio hábito de realizarla. Se sigue realizando aunque no
se obtengan consecuencias claras de ella. Un ejemplo muy extremo es el
consumo de drogas. Cuando al principio las drogas provocan placer, tiene
sentido seguir realizando esa conducta. Sin embargo, cuando pasa mucho
tiempo y las drogas solo provocan displacer, solo provocan malas
consecuencias, uno se puede preguntar ¿por qué siguen consumiendo droga?
Uno podría decir, bueno, por la adicción. Bueno, es una de las cosas, una
de las variables que afectan la adicción. Aunque la adicción física no
sería la más importante, había otras situaciones. Pero otra de las
cuestiones que hay es que es un hábito, como el hábito de fumar. Todos
habéis hablado de lo del hábito de fumar. No, sino fumo porque,
simplemente fumo por el hábito, porque estoy acostumbrado. Otra situación
sería, es una situación que había pasado varias veces, habrá pasado
también. Cuando en algunas situaciones tenemos que ir a un sitio muchas
veces, por ejemplo, en coche a nuestro trabajo, y vamos siempre por el
mismo sitio. Y alguien nos dice, oye, sabes que si vas por este sitio vas a
tardar mucho menos. Seguramente os hayáis sorprendido vosotros mismos
diciendo, no, no, pero yo por aquí voy bien. Yo prefiero ir por aquí que
en mi sitio, aunque claramente es peor, se tarda más y la otra opción es
mejor y va a dar lugar a una mejor consecuencia, no resistimos hacerlo.
Tenemos un hábito adquirido. peores todavía cuando vamos por un sitio
cuando vamos a un lado y vamos de ida por un sitio y volvemos por el otro,
se supone que si el camino de ida es el más corto será también más
corto para la vuelta pero seguimos persistiendo entonces serían ejemplos
de hábitos en este caso, bueno pues hasta aquí terminamos el tema 4 voy a
daros un pequeño apunte sobre lo que vamos a ver en el tema 5 y terminamos
y empezamos con este tema ya la semana que viene en este caso, ¿qué vamos
a ver? bueno, pues vamos a ver o vamos a diferenciar el tema en dos partes
por un lado, programas de reforzamiento y aquí vamos a ver los diferentes
programas de reforzamiento parcial, también vamos a ver programas
concurrentes programas secuenciales, es decir, programas de reforzamiento
que ocurren uno detrás de otro o en secuencia o que solo ocurren una vez
que se ha cumplido otro programa o programas alternantes que van alternando
entre uno y otro o simultáneos en los que hay dos posibilidades de
actuación vamos a ver también cómo funciona la conducta de elección en
la segunda parte del programa es decir, cuando yo tengo dos opciones o
varias opciones de reforzamiento posibles ¿cómo se distribuirá mi
conducta? en función de las consecuencias y de los programas de
reforzamiento asociados a cada uno de los reforzadores de qué tengo que
hacer para obtener cada uno de los reforzadores y del valor del propio
reforzador vamos a ver esas dos cosas en particular al principio de la
semana que viene nos centraremos sobre todo en los programas de
reforzamiento reforzamiento de razón fija y de razón variable también
intervalo fijo y variable veremos que hay cuatro tipos de programas dos
programas de intervalo Y dos programas de razón. Programas que, como hemos
dicho antes, son programas de reforzamiento intermitente o de reforzamiento
parcial. Estos son los más usuales. Programas en los que no siempre se
refuerzan las respuestas. Os dejo como parte final un ejemplo de esto. Ya
seguramente los conoceréis todos. Un claro ejemplo de reforzamiento
parcial, uno de los más potentes y de los que llevan a las conductas más
perseverativas y a mayor cantidad de conductas es, por ejemplo, jugar a las
tragaperras. Es un programa de refuerzo variable. Se refuerza una respuesta
de entre un número de respuestas determinado, pero no siempre el mismo,
sino que varía entre un rango de respuestas. Ya veréis que este tipo de
programas son los que dan lugar a una tasa de respuesta más elevada y
también, recordad, a los niveles de resistencia a la extinción más
elevados. Así que lo vamos a dejar aquí para empezar con los programas la
semana que viene desde cero. Os recomiendo, si podéis, ya que vamos a
tener que dar atentos. Hay una tutoría también online y, por lo menos
hasta el 11 de abril, ya sabéis, hasta después de Semana Santa como poco.
Os recomiendo que, ya que tenéis los documentos, que veáis al menos los
vídeos de los programas de reforzamiento, de los cuatro programas
principales de reforzamiento. Así, por lo menos, bueno, ya cuando lo
explique ya lo tenéis visto. Son bastante interesantes. Ya veréis como
hay situaciones bastante curiosas. Algunas son de la vida real, personas
administrando a sus perros y otras son de laboratorio. Así que nada, lo
dejamos aquí. La semana que viene continuamos. Desde este punto espero
terminar en dos tutorías el tema 5 y, de momento, no vamos mal en cuanto a
la cantidad de Mario. Y a ver si nos sobra también alguna tutoría y
esperemos que pueda ser presencial para dar las partes prácticas antes
de... Si hay exámenes, exámenes o de lo que ocurra, ya veremos lo que va
ocurriendo. Os iré informando de todas maneras. Así que nada chicos,
muchísimas gracias y nos vemos la semana que viene.