Pues ya está. Yo creo que esto está grabando ya y si no lo estará en
breve. Estupendo, así que buenas tardes nuevamente y bueno pues aquí
estamos para seguir un poquito más avanzando en nuestro recorrido por los
principios del aprendizaje y del condicionamiento. Y bueno, como ya os
comenté voy a intentar ir un poco más rápido en este tema para dedicarle
pues las clases que nos quedan, al menos tres o cuatro, bueno que son las
que nos quedan, al tema cinco que es bastante más complejo y también una
clase a las actividades formativas complementarias, las que son
obligatorias. Porque por lo que vimos, pues las complementarias no van a
ser evaluadas puesto que no reduce el tiempo del examen. ¿Si no ha habido
cambios? ¿No ha habido cambios? No, creo que no. Muy bien, pues nada, no
sé si tenéis en primer lugar alguna duda, alguna cuestión de lo que
hemos visto hasta ahora. Algo que queráis quizás aclarar y si no pues
podemos seguir un poquito avanzando. ¿Cómo lo veis? Sí, es claro, son
clases, claro, dicen que por ahí que sería, que es diferente.
Efectivamente no, es otra parte de los principios del aprendizaje y del
condicionamiento en la que importan muchas cosas. Son las consecuencias y
las conductas que emite el organismo para alcanzar o repeler esas
consecuencias. En ese sentido, claro, que es diferente del condicionamiento
a clase. Bueno, pues estupendo. En realidad es que este tema tampoco es tan
complicado. Bueno, estábamos viendo esto. Esta tabla de aquí, como os
decía en la clase anterior, es súper importante. La van a preguntar
seguro, seguro, seguro, seguro. Así que tenéis que tenerla. Muy, muy
clarita, ¿de acuerdo? Hago un pequeño resumen rápido para luego ya
seguir avanzando. Mirad, esta tabla lo que hace es resumir los
procedimientos para generar un aumento o una disminución en la conducta a
través de procesos de aprendizaje. Y esos dos procesos de aprendizaje se
resumen en los dos conceptos que tenéis aquí. El refuerzo por un lado y
el castigo por el otro. El refuerzo es aquel procedimiento que tiene como
consecuencia un aumento en la probabilidad futura de la conducta. Mientras
que el castigo es todo lo contrario. Es aquel procedimiento o proceso de
aprendizaje que tiene como resultado un descenso en la probabilidad futura
de la conducta. ¿Vale? Eso es lo primero que tenéis que tener en cuenta.
Que los procedimientos de conocimiento operantes se definen por las
consecuencias. Las consecuencias que tienen sobre la conducta. Será
reforzamiento o refuerzo si la consecuencia es un aumento en la
probabilidad de la conducta y será castigo si la consecuencia es un
descenso en la probabilidad futura de la conducta. Eso es lo primero. El
segundo elemento que tenéis que tener en cuenta para entender bien esta
tabla es la contingencia que existe entre la conducta y la consecuencia. Si
la contingencia es positiva, es decir, si hay una contingencia, una
relación positiva entre la conducta y la consecuencia, es decir, siempre
que se dé la conducta va a ocurrir la consecuencia y nunca que se dé la
conducta va a ocurrir la consecuencia, pues estaremos hablando de
procedimientos positivos porque la contingencia es positiva. Mientras que
si la contingencia es negativa, esto querrá decir que cuando ocurra la
conducta no ocurrirá. No ocurrirá la consecuencia y cuando no ocurra la
conducta ocurrirá la consecuencia. ¿De acuerdo? Entonces, teniendo en
cuenta estos dos elementos de si es un refuerzo o es un castigo, es decir,
si el procedimiento aumenta la probabilidad futura de la conducta o si lo
disminuye y si la contingencia es positiva o negativa, podemos entonces
entender esta matriz de doble entrada, esta tabla de doble entrada por la
que se definen los diferentes procedimientos del condicionamiento operante,
condicionamiento instrumental. Entonces, si tenemos un procedimiento en el
que yo aumento o busco aumentar la probabilidad futura de la conducta con
una contingencia positiva, estamos ante un refuerzo positivo. ¿Esto qué
quiere decir? Si, no sé, si mi hijito se lava las manos antes de comer, le
doy un premio. Pues, no sé, le dejo que repita el postre, imaginaos. Eso
es una contingencia positiva. ¿Ocurre la conducta? Es una consecuencia y a
la vez tiene el efecto de aumentar la probabilidad en el futuro. Si lo que
hago es que, no sé, a una rata cada vez que presiona la palanca le doy una
descarga eléctrica, pues lo que pasa es que disminuye la conducta porque
hay una contingencia positiva. La presión de palanca es la consecuencia
negativa, ¿no? O sea, la consecuencia aversiva mejor. Dicho para no
liarnos. Hay una contingencia positiva entre un evento y la consecuencia,
pero lo que hacemos es reducir la probabilidad de conducta, por lo tanto
estamos ante un castigo positivo. El refuerzo negativo es cuando buscamos
aumentar la probabilidad de la conducta en el futuro, pero con una
contingencia negativa. En este caso, por ejemplo, creo que os comentaba el
caso de los adictos, las personas que tienen alguna adicción, que en fases
avanzadas de su trastorno, buscan, consumen la sustancia para que no ocurra
el síndrome de abstinencia. Hay una contingencia negativa entre la
conducta, inyección de la droga, y la consecuencia, síndrome de
abstinencia. Y esto hace que un poco se perpetúe la tendencia a repetir la
conducta en el futuro, ¿vale? Por otro lado tenemos el castigo negativo,
un procedimiento que busca o que contiene por consecuencia, reducir la
conducta en el futuro, pero quitando algo. Pues por ejemplo, imaginaros yo
cuando tengo miedo a hablar en público, ¿qué hago? Lo evito, ¿vale?
Entonces mi conducta es, por ejemplo, de huida. Yo estoy, imaginaros, o de
evitación, ¿no? Me invitan a dar una charla, pero yo tengo miedo a hablar
en público. Entonces rechazo la invitación, evito la situación, me
siento seguro y seguramente vuelva a rechazar las invitaciones. ¿Vale?
¿Qué pasa? Esa conducta de evitación se refuerza negativamente porque ha
evitado una consecuencia negativa. Ah, bueno, perdón, y está el castigo
negativo, que me he saltado, perdón. El castigo negativo es cuando... Cada
vez que... Es cuando elimina algo positivo. Por ejemplo, si mi hijo o mi
hija suspende el examen, le quito la consola. ¿Vale? Hay una contingencia
negativa entre suspender y tener disponible la consola. Entonces yo estoy
quitando algo. Estoy entrenando, estoy, pues eso, eliminando algo que es
positivo, ¿no? O, por ejemplo, cada vez que los niños... Esto se utiliza
también quizás en análisis de conducta aplicado en niños y niñas que
tienen algún trastorno del espectro autista. A lo mejor si se hacen
autolesiones, pues cada vez que esa conducta no ocurre, doy un premio, ¿de
acuerdo? Intento evitar algún entrenamiento, como tenéis ahí, en
omisión, en que se omita esa conducta que es problemática. Así las
cosas. Tenemos esta... Esta tabla que describe los procedimientos del
condicionamiento operante. Y tenéis que tenerla muy, muy clarita, ¿de
acuerdo? Estos son aquí estos procedimientos y un poco la tabla de doble
entrada o un poco la matriz de probabilidad de conducta y de contingencia
que los genera, ¿de acuerdo? Así que esto, clarísimo. Por favor. Estos
son los dos elementos que tenéis que tener claro. Muy bien. Bueno, pues
entonces... Habiendo visto esto, tenemos que dentro del condicionamiento
operante también hay extinción. Es cuando ocurre la respuesta, pero deja
de haber consecuencia. Entonces, bueno, pues aquí tenemos una línea de
base. Bueno, imaginaros, pues eso, un niño que cada vez que va a la
esquina después de salir del colegio siempre está el camión de los
helados y normalmente pues consigue un helado porque se lo compra su mamá.
Y cada vez más. Y lo que pasa es que de repente un día van a donde está
el camión de los helados y deja de estar. Y entonces, ¿qué ocurre?
¿Qué ocurre? Es muy probable que... Dice mamá, mamá, pero vamos a
volver. Dentro de cinco minutos ha venido. Vamos a ver dentro de cinco
minutos a ver si ha venido el camión. Hay un incremento momentáneo de la
conducta que corresponde a esta parte que es el estallido de la extinción,
que aumenta mucho más. Pero luego ya, pues cuando ya se dan cuenta de que
cada vez no viene, pues la conducta tiende a desaparecer. Es verdad que...
Y esto es cada vez que se emite la conducta. Si se pasa un tiempo sin
emitir la conducta, un tiempo largo, de repente puede haber una
recuperación. Una recuperación espontánea, ¿vale? Puede que se olvide
el entrenamiento en extinción, como está aquí puesto, ¿de acuerdo? Si a
lo mejor están las vacaciones de verano y el niño o la niña no puede ir
al sitio donde está el camión de helados y darse cuenta que no está
porque a lo mejor ha cambiado el recorrido, ya no va a esa zona. Y de
repente pasan tres meses, el niño está en vacaciones y no va. Y luego a
la vuelta al cole es muy probable que digan, vamos a volver, vamos a ver si
está, ¿de acuerdo? ¿De acuerdo? Que haya una especie de surgimiento, una
recuperación espontánea. Bueno, pues eso es un poco lo que tenéis, que
la extinción en el condicionamiento clásico es fácil y de nuevo,
perdón, en el condicionamiento operante, es insistir sobre el hecho de que
no quiere decir que se olvide la asociación previa, sino que se superpone
un aprendizaje encima del anterior normalmente compitiendo con la respuesta
y viviendo la respuesta adquirida previamente. Bueno, ¿hay alguna
pregunta? ¿Hay algunos factores que están relacionados? No todos los
individuos se extinguen igual, ni todos los programas de reforzamiento con
los que ya veremos en el tema que viene, están asociados al mismo patrón
de respuestas ni tampoco a la misma extinción. Depende de cómo se haya
entrenado la conducta, costará más o menos extinguirla. Esto tiene mucho
sentido. Si a ti de vez en cuando te da un caramelo, bueno, pues ya está,
menos que si te da un caramelo todos los días. Vas al principio, vas a
extinguir más lento, lo que pasa es que luego veremos que se extingue más
rápido, ¿no? Y esto es un poco la diferencia entre la extinción en
función de si hemos adquirido la conducta mediante un reforzamiento
continuo o mediante un reforzamiento intermitente. Fijaros, si se ha
adquirido la conducta mediante un reforzamiento intermitente, costará más
extinguirla, más, no menos, más. ¿Por qué? Porque fijaros. Si te tiene
la costumbre. Si te ha dado a que de vez en cuando vas al camino de los
helados y unas veces sí está y otras no, bueno, pues cuando deja de estar
al principio puedes pensar, ah, pues es que es de estas veces que no está.
Y así varias veces hasta que te das cuenta de que ya no va a venir, ¿de
acuerdo? A mí me acuerdo, recuerdo cuando al principio de los canales de
televisión, que ya no era ni la una ni la dos, pues de vez en cuando era
una locura con las series de dibujos animados y ponían, no había ninguna
regularidad. Entonces, pues yo iba los lunes a ver mi serie de dibujos
animados que me gustaba, no sé si a los caballos del zodiaco. Oye, pues a
veces no estaba porque habían puesto, pues yo qué sé, la corrida de
toros o el partido de fútbol, pero no es que lo hubieran quitado.
Entonces, yo estaba ahí, había unos lunes que sí y otras veces que no.
¿Y qué pasa? Claro, hasta... Y un día dejaron de emitir la serie que me
hicieron la puñeta. Pues, ¿qué pasa? Estuve yo todos los lunes viendo a
ver por qué, por qué, y creo que habían puesto más un recuerdo
automático, un programa de tertulias. Imaginaros, un chaval de diez años.
Le quitan su serie de televisión por un programa de tertulias. ¿Pero qué
pasa? Que como al principio no había ocurrido siempre, era un poco
aleatorio, pues yo estuve muchísimo tiempo tragándome las tertulias hasta
que me di cuenta de que aquello no iba a volver. ¿De acuerdo? Entonces,
claro, tiene más sentido que un programa de reforzamiento intermitente
genere más resistencia a la extinción. Bueno, pues, no sé si hay alguna
cosa más que se me olvida aquí, pero bueno, eso es un poco quizás lo que
más tenéis. ¿Qué ver? Existen, como también tenéis ahí puesta la
diapositiva, dos teorías diferentes que han intentado explicar por qué
los programas de reforzamiento intermitente generan más resistencia a la
extinción, tal y como tenéis un poco en este diagrama de aquí. Fijaros
que va desde el reforzamiento continuo hasta el reforzamiento intermitente
y del continuo al intermitente, pues cada vez hay más resistencia. A la
extinción, ¿no? Y, como os digo, estas son las dos teorías, la
discriminación entre fases de refuerzo y extinción y el contacto con las
contingencias. El caso es que en la discriminación entre fases de refuerzo
y extinción es un poco lo que os decía. En las primeras fases de
extinción el organismo, entre comillas, lo estamos un poco
antepormorfizando, pero puede pensar que está en esas fases de refuerzo
intermitente en las que no hay reforzador y todavía no sabe que está. O
no se ha dado cuenta, ¿no? Que está en una fase de extinción en la que
nunca más va a haber reforzador. Esa es una teoría y el contacto con las
contingencias en la que, bueno, pues que en la... Claro, en el
reforzamiento intermitente hay menos contacto con la contingencia que con
el reforzamiento continuo, ¿no? Y entonces eso hace que durante la
extinción también haya esa diferencia en el contacto con las
contingencias, ¿no? Hasta que... La contingencia conducta ausencia de
reforzador ocurre cada muchos más ensayos en los programas de
reforzamiento intermitente que los programas de reforzamiento continuo en
los que cada vez que se presiona una palanca y no viene el reforzador, se
asocia a esa ausencia de reforzador porque antes, cada vez que había una
presión de palanca, sí había reforzador, ¿de acuerdo? Entonces... Cada
contingencia negativa durante la extinción tiene un correspondiente en la
adquisición y se computa mejor la extinción, ¿de acuerdo? Bueno, pues
eso es un poquito así, lo podéis ver. Este tema también del
reforzamiento intermitente es muy curioso porque se aplica perfectamente a
las conductas supersticiosas y a esas conductas supersticiosas que tenéis
ahí en el experimento clásico de Skinner del condicionamiento. Es un
experimento occidental o adventicio, ¿vale? Es un experimento interesante.
Yo creo que podéis leerlo y os lo pueden preguntar, ¿eh? No quiere decir
que no sea importante, pero bueno, yo creo que es fácil. Sencillamente que
cuando hay un reforzamiento que es un reforzador que cae continuamente cada
X tiempo, en este caso los sujetos eran palomas, pues justo lo que la
paloma por azar estuviera haciendo cuando cayó el reforzador va a
reforzarse accidentalmente, adventicialmente. Y esto hace que en cada
paloma, en cada una de las tres palomas que tenía Skinner, pues hubiera
patrones de conducta muy diferentes, ¿no? Porque cada una, las primeras
veces que caía el reforzador, les pillaba haciendo algo distinto. Y bueno,
esto también además llama la atención a la diferencia entre lo que son
las conductas terminales y las conductas de ínterima. Las conductas
terminales son aquellas que como tenéis aquí en azul, en el gráfico que
tenéis aquí debajo que ha puesto Marco. Son las que van a ocurrir
cerquita de la aparición del reforzador. Mientras que las de ínterima son
las que también se llaman de espera y son las que ocurren después del
reforzador hasta que se va acercando la caída del siguiente reforzador. De
tal manera que justo cuando ha caído el reforzador, lo que hay más
probabilidad es que haya conductas de ínterima, de espera, porque ya se
sabe que ha caído el reforzador. Pero cuando está inminente su llegada,
lo que hay son muy... Muchas más conductas terminales, ¿de acuerdo? Y
estos son dos patrones de conducta distintos que pueden ser modificados muy
diferentemente por ejemplo el condicionamiento intermitente, los
experimentos del condicionamiento ambiental. Pero tened muy clara esa
diferenciación entre conductas de ínterima y conductas terminales y
cuáles son cuáles. Las terminales son las que ocurren próximas a la
aparición del reforzador y las de ínterima son las que ocurren en medio,
entre un reforzador y otro y sobre todo cuando aparecen el reforzador,
pasado ya uno hasta que viene el siguiente, ¿vale? Bueno, lo que ya aquí
se cuenta en el tema son más fenómenos importantes para conocer en el
tema del condicionamiento operante y uno de ellos es la deriva instintiva.
La deriva instintiva es un poco... A veces es difícil luchar contra los
instintos de la naturaleza, ¿no? Es un poco el resumen. Y es que hay
tener... Tenéis este matrimonio que intentaba enseñar de manera muy
sistemática y mediante procedimientos del condicionamiento operante
diferentes conductas a diferentes especies de animales. ¿Y qué pasa? Que
al final es verdad que hay un cierto éxito en conseguir entrenar estas
conductas. Por ejemplo, aquí a este cerdito echar una moneda en una hucha.
¿De acuerdo? Pero al final la deriva instintiva lo que dice es que el
instinto de esa especie animal se superpone al aprendizaje y al final esas
conductas se pierden y se sustituyen por otras que son típicas de la
especie. En el caso de los cerdos, pues no sé qué, imaginaros enterrar la
moneda o mortisquearla o lo que sea, ¿vale? Eso es el fenómeno de
respuesta, de deriva instintiva. Hay, como lo tenéis definido, que
aparecen de repente respuestas innatas, típicas de la especie que tienen
cierta relación con el reforzador, por ejemplo, este objeto brillante,
¿no? Pues enterrarlo o, bueno, lo que sea. Y que compiten con esas que nos
ha costado tiempo instaurar en el organismo mediante los procedimientos del
condicionamiento instrumental, ¿de acuerdo? Esa es la deriva instintiva,
vamos, que al final los cerdos son cerdos en el sentido de que tienden a
hacer lo que su instinto... Porcino, pues les dicta, ¿no? Y lo mismo,
pues, con los mapaches, ¿no? Ese fenómeno de deriva instintiva que es
interesante y que hay que tenerlo en cuenta sobre todo cuando se trabaja
con especies con poca domesticación, ¿no? Otro fenómeno muy, muy, muy
interesante, muy interesante y os recomiendo que lo estudiéis porque lo
están estudiando ahora bastante en el laboratorio de conducta animal.
Entonces, pues a lo mejor os lo preguntan por eso. ¿No? Pues porque están
investigando mucho sobre ello ahora y, bueno, pues entonces lo van a tener
en la cabeza. Es esto del contraste conductual. Y, básicamente, el
resumen, lo que quiere decir el contraste conductual es que el valor de un
determinado reforzador no depende intrínsecamente de su valor absoluto,
por ejemplo, de que tengamos 500 euros. El valor de un reforzador también
depende de nuestra historia previa, de reforzamiento, en el sentido de que,
imaginaros, yo paso de tener 1000 euros a tener 500 o si paso de tener 20
euros a tener 500 y luego con esos 500 me intentan reforzar una conducta.
Oye, pues si yo he pasado de 1000 a 500 o de 20 a 500, esos 500 euros con
los que me van a reforzar la conducta no van a tener la misma eficiencia.
Van a ser peores reforzadores. Van a ser peores reforzadores en los sujetos
que han pasado de 1000 a 500 y mucho mejores en los que han pasado de 20 a
500. Y los que tenían 500 y se quedan con 500 pues van a tener la
intensidad de referencia estándar, ¿no? Eso es lo que se llama el
contraste conductual sucesivo que puede ser negativo si vamos de más a
menos o positivo si vamos de menos a más. O de... sí, de menos a más.
Aquí tenéis, por ejemplo, cómo esto se puede... Esto yo digo que es un
contraste conductual. Digo, este tipo de experimentos se han estudiado
muchísimo porque es un modelo de frustración también. Esa pérdida de lo
que nos gustaba ese... Pues al final sí, nos deja con algo que no es que
esté mal pero claro, no es lo mismo. Y eso se supone que elicitan los
animales cuando lo inducimos a un estado de frustración bueno, pues que lo
están estudiando bastante parece ser que se reduce con fármacos
ansiolíticos como las benzodiazepinas que tiene efectos reforzadores sobre
la conducta. Aprendizaje, perdiferenciales... En fin, se está
caracterizando bastante y ya os digo, el profesor Ricardo Pellón en
colaboración con un grupo de Jaendra el profesor Carmen Torres y también
con un profesor de la universidad de una universidad en Texas Mauricio
Papini bueno, pues lo están caracterizando bastante. Aquí tenéis un
experimento en el que bueno, tenemos un grupo que tiene un reforzador
pequeño y se queda... queda en el reforzador pequeño tenemos un grupo que
tiene un reforzador pequeño y pasa a un reforzador grande otro que tiene
uno grande y se queda en grande y otro que tiene uno grande y se queda en
pequeño es decir, aquí no hay cambio no cambio, NC aquí tampoco hay
cambio, NC y aquí hay un contraste conductual sucesivo que este es
positivo vamos de pequeño a grande y este es negativo vamos de grande a
pequeño ¿vale? Pasamos, en este caso de dos bolitas a dos bolitas en este
caso de dos bolitas de comida a veintidós bolitas aquí nos quedamos con
las veintidós bolitas en los dos casos y aquí pasamos de veintidós a dos
y fijaros que tenemos dos condiciones en las que miramos la conducta con
dos bolitas y otras dos condiciones con veintidós pero dentro de cada una
de ellas en una no hay cambio y en otras bueno, pues aquí tenemos un
cambio tenemos un contraste positivo y uno negativo y fijaros, aquí lo que
se hacía era reforzar la carrera o sea, en un no me sale, en un pasillo
sí, en un laberinto pero que es de un laberinto recto en un corredor al
final había, pues se ponía este reforzador habiéndoles pasado por estas
condiciones de contraste y claro, fijaros voy a borrar para que lo veáis
mejor aquí tenemos en ambos casos dos bolitas de comida y dos bolitas de
comida pero curiosamente en los que no hay cambio es decir, se quedan
pequeños hay la misma velocidad en todas las carreras mientras que aquí
que pasamos de grande a pequeño hay una disminución ¿vale? y aquí que
tenemos veintidós bolitas de comida pero que ya las teníamos previamente
no hay cambios en la velocidad de la carrera y aquí fijaros que pasamos de
dos a veintidós claro que hay un aumento con el cambio del reforzador ¿de
acuerdo? o sea que no es tanto que tengamos dos bolitas de comida o
veintidós sino que hayamos pasado de mucho a poco o de poco a mucho eso es
el contraste conductual y como os digo es un fenómeno muy interesante se
está estudiando mucho a nivel psicobiológico ya os digo esta
colaboración que tiene el profesor Ricardo Pellón con la profesora Carmen
Torres y el profesor Mauricio Gaviria ¿vale? y yo os animo a que lo yo
cuando esto lo estudié en su momento hace ya tantos años en la carrera me
pareció un fenómeno súper interesante bueno otro fenómeno súper
interesante de el condicionamiento operante y que tiene una grandísima
aplicabilidad a la psicopatología sobre todo a los trastornos depresivos
es la indefensión aprendida y de una manera más general el control que
nosotros percibimos que tenemos sobre nuestra conducta ¿de acuerdo? eh
primero os cuento una especie de aplicación real y luego los experimentos
en los que se se fundaron ¿no? en perritos bueno pues fijaros en general y
esto fue Martin Seligman eh que fue que ahora es un poco el fundador de
todo movimiento que se llama de psicología positiva muy interesante eh que
dice este movimiento de psicología positiva que en realidad la psicología
no debería descentralizarse ni conectarse única y exclusivamente en
remediar las alteraciones psicológicas sino más bien de manera primera y
quizás principal de potenciar los aspectos positivos y las fortalezas
psicológicas de las personas obviamente también tratar aquellas personas
que tienen están pasando por malas rachas que tienen algún trastorno eh
de naturaleza psicológica pero que la psicología debería potenciar sobre
todo las fortalezas humanas ¿no? esa es la psicología positiva bueno
mucho más complejo obviamente os recomiendo que si os interesa pues
también leáis los últimos libros de Martin Seligman pero hace ya muchos
años Martin Seligman en realidad se le conoció porque fue el que un poco
descubrió este fenómeno de indefensión aprendida que os voy a contar y
básicamente consiste en que si yo tengo la percepción de que no tiene
ningún sentido lo que haga que las consecuencias van a ser las mismas es
decir que yo no tengo control sobre las consecuencias de mis acciones
entonces genero ese estado de indefensión de que no me de helplessness es
en inglés ¿no? como bueno pues desesperanza ¿no? y entonces dejo de
actuar pierdo la la esperanza dejo de actuar y en y bueno pues eso parece
que lleva a la depresión si haga lo que haga eso pasa un poco con con los
males del mundo ¿no? la gente piensa que haga lo que haga en el devenir de
los acontecimientos y eso genera ese estado de desesperanza aprendida en el
que que deriva en depresión pero fijaros toda esa teoría que es un poco
más compleja en seres humanos deriva de estos experimentos en perritos yo
creo que estos son son millions o son teclas el caso es que fijaros había
tres grupos en este experimento había un grupo de de perritos en los que
pues se les tenía sujetos pero podían evitar una descarga eléctrica pues
saltando cuando se les iba a encender una luz que les avisa dice ojo
cuidado que entre tres segundos si no saltas pues te llevas una descarga
así que perrete y salta y saltaba al otro lado ¿no? ese es el grupo que
se llama grupo de escape que puede prevenir o parar la descarga puede
prevenirla saltando a otro lado escapándola o una vez que ha ocurrido si
salta pues también paraba la descarga ¿no? luego había otro grupo y este
es el interesante que no podía hacer nada su conducta no servía para
evitar las descargas eléctricas tenían descargas que estaban acopladas a
los del grupo de escape de tal manera que si los en otras cajas en otras
habitaciones los perros del grupo de escape por lo que sea no escapaban la
descarga a estos pobres perros que se llamaban acoplados les iban a dar una
descarga eléctrica y luego tenían un control un grupo de control que
estaban igual sujetos o sea podían saltar y hacer lo que sea y nunca
recibían descargas eléctricas estos son los tres grupos bueno pues el
grupo acoplado es decir el grupo que no tenía niña control sobre su
conducta desarrolló todo un síntome es decir un conjunto de síntomas de
conductual de apatía de pérdida de peso alteraciones inmunes etcétera
que luego se vio que era muy compatible con lo que pasaba en los seres
humanos que tenían depresión ya no querían andar no querían habían
perdido la esperanza ahora estoy a decirlo un poco llevando este concepto
quizás humano entonces fijaros luego ya cuando aquí estos son los
resultados del experimento el caso es que el grupo acoplado tenía un
aprendizaje muy lento es decir no pensaban entre comillas los perros si es
que podemos antropomorfizarlos de esa manera que pudieran escapar después
en una fase en la que a todos los grupos ya sí se les permitía escapar
las descargas era un aprendizaje muy lento de acuerdo fijaros aquí cómo
el grupo acoplado tenían muchos más veces que no consiguían escapar es
decir ensayos fallidos que obviamente el grupo que ya había aprendido que
sí que podía escapar y que el grupo que había estado ahí sin nunca
tener posibilidad de descargas pero rápidamente cuando le dieron las
descargas pues dijo ostras esto yo me salto aquí para no pero fijaros la
poderosa diferencia entre estos dos vale el grupo acoplado había perdido
la esperanza de que su conducta pudiera evitar las consecuencias negativas
y como os digo como os digo este experimento sirvió un poco para estudiar
las bases del aprendizaje que podían sustentar los trastornos depresivos y
fue muy interesante porque permitió además diseñar estrategias
conductuales para proteger a los individuos de esta desesperanza aprendida
de esta indefensión aprendida de manera que bueno pues hay muchísimos y
en esto se basa toda la gran parte del abordaje conductual contra la
depresión por lo menos en esa época clásica ahora hay alternativas un
poco diferentes que parece que quizás funcionan mejor pero bueno pues un
poco enseñando que siempre hay estrategias de control de retomar el
control sobre la conducta incluso cuando la percepción es que no se tiene
control sobre la misma etcétera ya os digo que fueron unos experimentos
muy importantes contribuyó muchísimo además a generar esta especie de
modelo animal de trastorno depresivo que luego pues sirvió para estudiar
las diferentes alteraciones tanto conductuales como biológicas que se
daban y también para explorar nuevos fármacos o sea que este experimento
de la indefensión aprendida como os digo pues tiene pobrecito este perro
qué pena que da tiene muchas aplicaciones no sólo en el campo de la
conducta animal sino pues en el caso de los seres humanos también y este
tema ya acaba explicando un poco otro otro fenómeno interesante del
condicionamiento clásico perdón el condicionamiento operante el
condicionamiento instrumental que es el procedimiento demarcado el
procedimiento automarcado es un procedimiento que se da en los cuando
estamos generando estamos intentando implementar un procedimiento de
condicionamiento operante pero que hay una gran demora entre la conducta y
la consecuencia de acuerdo es decir se da la presión de palanca pero
tardan 5 minutos en caer la bolita de comida entonces claro ahí el
establecimiento de las contingencias se dificulta muchísimo hay mucha
demora entre la conducta y la consecuencia evitando el establecimiento de
la contingencia bueno pues este procedimiento demarcado es un procedimiento
que se puede implementar para un poco hacer de puente durante la demora
entre la conducta y la consecuencia y que luego se restablezcan esos lazos
de contingencia el procedimiento demarcado en algunos casos es tan sencillo
como llamar la atención del sujeto sobre lo que acaba de hacer o en
general incrementar su estado de activación fijaros este experimento tan
sencillo pues nada con ratitas tenemos aquí un laberinto en la que hay una
caja de salida aquí está la ratita y tiene una puerta tipo guillotina que
si abre y se cierra pues le abrimos sale la ratita aquí y tiene que elegir
tiene un brazo negro o un brazo blanco y entonces va por aquí en función
del que elija pasa una cosa u otra y bueno pues llega al siguiente
compartimento que se les deja pues una demora imaginaros cinco minutos diez
minutos entran en la caja de meta donde está la recompensa pero claro
fijaros todo el tiempo que pasa entre que hacen la elección hasta que
reciben la consecuencia hay una gran demora bueno pues lo que se hizo aquí
para ver el procedimiento de marcado fue que en un grupo me parece que eran
los que elegían el brazo negro se les cogía del cuerpo a la ratita y se
le transportaba hasta la caja de demora me parece que era así mientras que
los del brazo blanco pues no estaban ahí y llegaban o era de la caja de
demora a la meta cosa es que el procedimiento de marcado consistía en
coger al animal el cuerpo y ese estado de activación que bueno les da un
pequeño susto imaginaos una mano gigante que te coge y te lleva a otro
sitio pues hombre es raro como cuanto menos bueno pues ese procedimiento de
marcado hacía que fijaros en los animales estos pues había más
porcentaje de respuestas correctas es decir escogían más el brazo que les
llevaba a la presencia del reforzador frente a los que llevaba a que no
hubiera reforzado eso es el procedimiento de marcado vale y un poco se
resume lo que tenéis aquí que el marcaje de la respuesta se hace de tal
manera que esto hace que haya un estímulo contingente a la misma en este
caso cogerle con el brazo y eso reduce el efecto de la demora bueno pues
eso es el procedimiento de marcado es bastante sencillo pero bueno es un
procedimiento que también merece la pena que conozcáis dentro del
condicionamiento instrumental como lo veis tenéis alguna duda hasta ahora
estáis muy callados bien sí verdaderamente este tema pues es es
sencillito hay yo pensaba que con esto acababa el tema me parece que esto
no ha puesto marcos bueno el el procedimiento de devaluación yo creo que
no sé si está antes porque yo juraría que con el procedimiento de
marcado acababa el tema ah vale pues es que pensaba que era lo último lo
del marcado bueno pues devaluación del reforzador es otra cosa que esto
también es súper importante súper importante porque se está
investigando mucho con esto de la devaluación y y ahora os voy a explicar
varias cosas que yo creo que os puede interesar vamos a ver la devaluación
del reforzador es cuando intentamos devaluar la consecuencia que tiene vale
y por qué es importante esto pues mira tradicionalmente se asume que hay
como dentro de los sistemas de respuesta hay de los sistemas de conducta
que todo esto que estamos explicando ahora mismo del condicionamiento
instrumental es dentro de lo que se llama un sistema voy a borrar esto de
respuesta consecuencia oro lo de lo es porque es en inglés que es outcome
vale espera que voy a ponerlo dentro de así bueno más o menos como lo
puedo escribir con el ratón y entonces se supone que este sistema en el
condicionamiento instrumental la respuesta va a estar guiada por la
consecuencia por el outcome por la meta vale de tal manera que si estamos
dentro de este sistema de respuesta que es el que se supone que
tradicionalmente es el que guía todo el condicionamiento instrumental que
hemos visto hasta ahora pues si esta si este outcome si esta meta pierde su
valor pues entonces habrá menos respuestas para conseguirlo de acuerdo y
este tipo de experimentos son los que se hacen con lo de la devaluación
del reforzador manipulando el valor del reforzador para ver su consecuencia
sobre la conducta instrumental que se supone que le tiene que conseguir y
como os decía esto es importante porque hay dos sistemas de respuesta este
que hemos visto pero luego hay otro que es el que supuestamente es el que
guía el condicionamiento clásico de estímulo respuesta es un
condicionamiento respondiente y cuando estamos en este sistema de estímulo
respuesta fijaros que aquí no está el outcome la conducta es automática
o se supone que es mínimamente automática y está desencadenada por los
estímulos pero el outcome la respuesta no la modifica por lo tanto si por
lo que sea un animal estuviera comportándose siguiendo este sistema de
conducta por mucho que nosotros devaluáramos el reforzador no habría
cambios en la respuesta porque la respuesta ya está en un sistema
automático ilicitada por los estímulos y esto parece ser que es lo que
ocurre en los hábitos de conducta hábitos que no deben de ser confundidos
con habilidades no es lo mismo la habilidad de tocar un piano que
corresponde a una serie de actos motores que sí que son automáticos y que
los hacemos sin pensar y que además son muy resistentes al olvido porque
son sistemas de conducta almacenados en la memoria procedimentales los
sistemas procedimentales pero esto no quiere decir que una habilidad no
puede hacerse por hábito que yo imaginaros me pongo a tocar el piano casi
sin darme cuenta cuando veo la foto de mi madre que era la que me enseñó
a tocar el piano tocar el piano en sí es la habilidad pero empezar a tocar
el piano automáticamente y sin darme cuenta iniciar ese conjunto de sub
habilidades que corresponde en tocar el piano ese es el hábito ¿vale? y
como os digo es una conducta que es automática y es ilicitada es
respondiente a los estímulos bueno entonces ¿cómo podemos hacer
experimentos de evaluación del reforzador para ver si estamos en un
sistema RO o en un sistema SR? bueno pues aquí tenemos algún caso fijaros
aquí en este experimento teníamos a la ratita que puede estar presionando
una palanca para conseguir un sabor de naranja o un sabor de fresa y luego
a uno de los sabores es decir se ha estado tomando el sabor de naranja pues
se le deja que tome el sabor de naranja y se le da una inyección de
cloruro de litio ¿vale? y luego se le da a elegir es decir la rata ha
tenido la elección sabe que una palanquita da zumo de fresa imaginaros y
otro da zumo de naranja pero luego se le deja imaginaros que tome solo uno
y se le da cloruro de litio y luego se le da a elegir pues normalmente la
rata el cloruro de litio cuando se inyecta a los animales produce malestar
gástrico por procedimientos de condicionamiento versus gustativo que
vosotros conocéis de sobra pues si hemos asociado el cloruro de litio a la
naranja obviamente la rata se va a ir a la fresa eso está clarísimo ¿no?
entonces fijaros aquí tenéis este experimento una palanca da comida de
sabor naranja otra da comida de sabor fresa este es el grupo experimental
en el grupo de control exactamente lo mismo pero en la segunda fase en el
grupo experimental damos una inyección de cloruro de litio asociado a uno
de los dos sabores en este caso la fresa en este caso y luego en la tercera
fase pues se les ponen las dos palancas una da un sabor y otra de otro
¿no? pues obviamente va a haber más tasa de respuesta en el sabor que no
hemos condicionado aversivamente y aquí en el grupo de control vemos que
en los dos en los que no ha habido litio no ha habido devaluación es decir
en este caso pues claramente hay una devaluación por lo tanto estamos en
un sistema de respuesta a consecuencia las conductas están guiadas por sus
consecuencias ya os digo si seguramente si hubiéramos entrenado muchísimo
la presión de palanca ya sería insensible a la devaluación del
reforzador ¿qué es lo que qué es lo que hace de qué depende de que
estemos en un sistema SR o RO pues hay varios factores los hábitos en
teoría al no estar guiados por la consecuencia sino que estar activados
automáticamente por los estímulos da igual que devalúes la consecuencia
porque no tienen ya influencia sobre la conducta ¿vale? no hace falta
tener una representación mental del valor de la meta sino que es un acto
conductual automático elicitado por el estímulo por eso no es que no se
puedan devaluar es que tú puedes devaluar la meta pero es que la meta no
es relevante aquí bien pues esto es muy importante y de hecho hay toda una
teoría muy en boga actualmente y es que las adicciones por ejemplo suponen
se da una adicción cuando hemos pasado de un consumo controlado un consumo
instrumental guiado por las consecuencias oye pues yo consumo al principio
la cocaína por ejemplo pues porque por el subión que me da por la
sensación de euforia esa sensación de poder que yo tengo pero cuando yo
consumo muchas veces ya y estoy varios años consumiendo ya no consumo por
esa sensación supuestamente sino que es una cosa es un evento automático
es un hábito ya y no lo hago por las consecuencias no lo hago porque me
guste sino que lo hago un poco por pues por lo que se llama una
sensibilización del incentivo es decir la tendencia compulsiva al realizar
la conducta pero no ya porque me guste o no me guste de hecho muchos cuando
tú preguntas a gente que tiene problemas con adicciones con heroína con
alcohol etcétera cuando ya tiene muchos años con su problema te dicen no
yo ya no lo hago porque me guste es otra cosa es que lo necesito es que yo
no puedo pensar en irme de fiesta con mis amigos sino meterme unas rayas de
cocaína es algo que es automático es que además aunque no quieras si se
da las circunstancias adecuadas si estás en una fiesta con la típica mesa
tal no sé qué y tienes te ofrecen la droga es que lo vas a hacer ¿vale?
está automático dice seguiría tomando el zumo que le ha creado malestar
en el caso de efectivamente que ya hubiera un hábito conductual sí porque
es una una conducta que es automática y que no depende de las
consecuencias entonces lo que os pone aquí si se refuerza mucho una
respuesta instrumental puede automatizarse pero además también no es solo
si se refuerza mucho sino es por ejemplo en los programas de respuesta que
son intermitentes en los que son por ejemplo los veremos en el tema
siguiente los de los de reforzamiento variable los de intervalo razón
variable o sobre todo intervalo variable que luego veremos cómo son
entonces ya os digo las respuestas instrumentales son sensibles a la
devaluación ¿de acuerdo? y cuando ya hemos generado un hábito conductual
podemos intentar castigar lo que es la conducta y si es un hábito quizás
lo devaluaremos o sea no es que lo devaluaremos sino que castigaremos la
conducta en sí sin modificar el valor de la meta pero lo que es la
conducta en sí la podemos castigar y ya si es una compulsión se ha pasado
al nivel de compulsión por mucho que castiguemos la conducta incluso dando
descargas eléctricas cada vez que presionen la palanca por conseguir en el
caso de los experimentos con drogas imaginaros una inyección de cocaína
seguirá haciendo emitiendo la respuesta esto último creo que no viene en
el libro solo para que veáis un poco la aplicación práctica de estos
temas bueno y con eso acabaría el tema que tenéis un pequeño resumen de
todos los conceptos que se han ido viendo y que os tienen que sonar eh que
hemos ido viendo durante el tema vale pues un poco las diferencias entre la
ley del del efecto y la ley del refuerzo y los elementos entre zonda y
skinner la contingencia de tres términos con el papel de los estímulos
que hacen de discriminativos las respuestas y los reforzadores o los entre
comillas castigadores que no hay un término en castellano pero bueno el
que supone que aumenta o disminuye la probabilidad de conducta los cuatro
tipos de procesos de reforzamiento o de castigo de procedimientos de
condicionamiento operante que hemos visto vale y que esto es súper
importante y los diferentes fenómenos que también hemos ido viendo a lo
largo del tema las condiciones supersticiosas y que todo lo de las de
íntegrin y terminales la instintiva el contraste contextual la ingresión
aprendida la demora y la devaluación y todo lo relacionado con la
extinción ¿de acuerdo? para que son más grandes conceptos que os tienen
que quedar muy claritos después de haber estudiado este tema muy bien
bueno pues después de esto tenéis alguna pregunta sobre el tema 4 alguna
cuestión que queráis ver a ver es un tema que en realidad no es tan
complicado sobre todo bueno que tiene muchos conceptos pero no no es
difícil ¿alguna cuestión que nos haya quedado clara? bueno pues entonces
sin más dilación pasaríamos genial pues pasaríamos al tema 5 bueno pues
como siempre debemos estas estupendas diapositivas a Marcos Sucha que ya
sabéis que es tutor del centro de Jacinto Merlager y que es generoso para
pasárnoslas es que se le da muy bien hacer diapositivas así que usamos
las suyas que seguro que están mucho mejor de las que yo podría hacer
bueno en este tema vamos a es un tema denso ojo es un tema no os asustéis
pero es bastante denso bastante complejo y yo creo que le vamos a dedicar
ya el resto del curso ¿vale? también es que está complejo explicado
aquí yo os recomiendo de una manera muy ferviente si me lo permitís que
uséis también de manera complementaria el libro de Michael Dunjan de
principios de aprendizaje y conducta ¿de acuerdo? porque os va a ayudar a
comprender bastantes de las cosas que quizás no quedan tan claras en el
libro de texto aparte de lo que nosotros podamos ver aquí en clase en la
tutoría y por supuesto lo que vosotros pues vayáis preguntando en los
foros temáticos de ALF ¿no? entonces bueno entre eso y tal bueno yo creo
que quizás tenéis herramientas suficientes para salir más o menos
adelante bueno programas y teorías de reforzamiento este tema pues el
propio nombre lo indica está dividido en dos la primera parte es bastante
más corta y es donde vamos a ver los diferentes programas de reforzamiento
dentro del condicionamiento operativo del condicionamiento instrumental es
decir las reglas que dicen que establecen la relación entre la conducta y
los reforzadores ¿cuánta conducta tiene que ocurrir y cada cuánto tiempo
para que ocurra uno o más reforzadores? eso es un programa de
reforzamiento el más sencillo pues puede ser un programa de reforzamiento
continuo en el que cada vez que se presiona la palanca en caso de una caja
de Skinner pues caiga una bolita de comida esa es la regla más básica
pero hay otras reglas hay otros programas de reforzamiento pues por ejemplo
cada vez que se presiona una vez la palanca pero cada 15 minutos o cada
media 15 minutos siendo algunos ensayos dos minutos y en otros 30 ¿vale?
en fin hay diferentes reglas que establecen esa correspondencia entre la
conducta y las consecuencias ¿de acuerdo? esos son los programas de
reforzamiento y veremos veremos que cada uno de esos programas de
reforzamiento genera patrones de conducta diferenciales con morfologías
topografías distintas y muy y ya veréis que es muy interesante ver como
unas pues hacen una escalera así con lo que se llama una carrera de la
razón y luego una pausa otros si no hacen como si fuera el festón de una
cortina el intervalo fijo bueno generan yo os digo patrones conductuales
diferentes ¿vale? y en la vida real en algunos casos veremos que la
conducta de los individuos pues está bajo siempre todo más mezclado la
vida real no se puede separar tanto como en un laboratorio pero veremos que
la conducta de los individuos está marcada quizás más por un programa de
reforzamiento continuo o uno de reforzamiento variable el caso de las por
ejemplo de las máquinas tragaperras en los en los salones de juego ahí lo
que se está en marcha son programas de reforzamiento eh intermitente
normalmente de intervalo variable que generan una gran adherencia
conductual muchísima conducta que es lo que interesa es decir muchas
moneditas que se meten por la ranurita ¿vale? entonces ya os digo que en
la vida real también están operando estas reglas que veremos pero
normalmente de una manera no tan clara más difusa más mezclada y
normalmente además de manera compuesta varios programas de reforzamiento
unidos y actuando a la vez y luego vamos a ver todas las teorías bueno y
no todas unas pocas que hay para explicar el reforzamiento tened en cuenta
que este tema es como el el buque insignia de toda la disciplina y toda la
asignatura ¿vale? por eso es tan largo y es tan complejo muy bien eh ya os
digo hay varios programas de reforzamiento de la vida real aquí tenemos un
facóquero esto es un facóquero que es Pumba ¿no? de, del rey león y, y
bueno pues está huyendo de un supongo que esto es un león hembra si, si
no soy demasiado inculto en la zoología eh y bueno pues esto es un
programa de escape seguramente eh que además es continuo cada vez que el
facóquero ve al león siempre va a emitir la conducta de escape ¿no? por
ejemplo y esto es un para maximizar la supervivencia aquí tenemos otro
caso en los que como os decía este es el ejemplo que ponemos todos los
profesores de psicología del aprendizaje eh las máquinas tagaperras en
las que normalmente están operando para más de eh intervalo variable es
decir tú le echas la monedita le das a los botones y vas a tener jackpot
vas a tener premio pues cada X tiempo y además de una manera muy variable
y el premio además va a ser muy variable y esa combinación esa gran
variabilidad esa incertidumbre va a hacer que tengas una gran adherencia
conductual aquí los que diseñan las tagaperras no son tuctos seguramente
hayan contratado a psicólogos ¿vale? eh para diseñar el programa de
reforzamiento que más adherencia conductual genera además a expensas del
menor coste en reforzadores claro tú lo que quieres es que haya mucha
conducta muchas moneditas pero tú dar poco dinero ¿vale? entonces ¿cuál
es el programa de reforzamiento que genera ese patrón? y ahí tienes a los
psicólogos eh diseñándolo para, eh hacerte muy rico igual tenéis aquí
a Yuki porque Yuki no puede faltar yendo a su comedero pues eh supongo que
aquí también será el el cada vez que va al comedero pues cae un poco de
comida si es que no hay ¿no? también sería un programa de razón fija
aún es decir de reforzamiento continuo cada vez que se emite la conducta
ocurre la consecuencia bueno todo esto que hemos ido introduciendo vamos a
intentar sistematizarlo un poquito más eh fijaros hay de nuevo dos gran
una tabla de doble entrada dos tipos eh de variables que configuran los
cuatro tipos de programas de reforzamiento más sencillos que hay los
básicos que tenéis aquí porque luego veremos que hay compuestos ¿vale?
pero los programas de reforzamiento que insisto son esa regla que establece
la relación entre la conducta y las consecuencias ¿vale? cada cuantas
conductas y cada cuando van a ocurrir las consecuencias pues ya os digo en
primer lugar pueden ser programas de razón o programas de intervalo es
decir que lo importante sea cuanta conducta haya en los de razón o que lo
importante sea cada cuando se emite la conducta en los intervalos y luego
pueden ser fijos o variables que lo que se manipule sea una cantidad fija
imaginaros programa de razón fija cinco quiere decir que cada cinco
presiones de palanca recibe una horita de comida o pueden ser variables en
las que la cifra habla de una media una imagina razón variable cinco a
veces el requerimiento serán dos presiones de palanca pero otras veces
serán diez imaginaros y el el cómputo global la media aritmética global
pues me sale cinco entonces los programas pueden eso ser fijos o variables
y de razón o de intervalo combinando ambas variables tenemos programas de
razón fija de razón variable de intervalo fijo y de intervalo variable en
los intervalos fijo es que se refuerza la primera conducta la primera
respuesta que ocurre tras un periodo de tiempo imaginaros la presión de
palanca la primera presión de palanca que ocurra cada cinco minutos o sea
le doy una vez a la palanca me cae la bolita de comida y yo le puedo dar
millones de veces a la palanca que hasta que no pasen cinco minutos y yo le
doy una vez a la palanca no me cae la bolita de comida le puedo haber dado
doscientos millones de veces hasta el minuto cuatro cincuenta y nueve que
si no le vuelvo a dar una vez cuando ya ha llegado al minuto cinco no me
cae la bolita de comida es el intervalo fijo y el intervalo variable es lo
mismo solo que en veinte cinco minutos siempre pues es una media de tiempos
en los diferentes ensayos y que al final pues salen cinco ¿vale? ¿lo
entendéis esto? los cuatro grandes tipos de programas de reforzamiento
básicos que hay vale entonces también esto es muy importante os lo van a
preguntar seguro entonces aquí tenéis por un lado el reforzamiento
continuo que se le llama razón fija uno es decir una una respuesta un
reforzador y cuando ya no es continuo pues es parcial no siempre ocurre la
conducta ocurre la consecuencia pues tenemos estos de razón que lo que se
manipula es el requisito es el número de respuestas eso es lo que va
cambiando puede ser fija o variable o los programas de intervalo que lo que
se requiere es que al menos hay una conducta pero pasado un intervalo de
tiempo que puede ser fijo o que puede ser variable ¿vale? pues eso bueno
como estudiamos o como se estudiaba hace muchísimos años porque esto
ahora ya obviamente esta maquinita no existe se utilizan ordenadores pero
bueno está bien que es verdad que los ordenadores producen una gráfica
que es igual a la que tenéis ahí entonces tenéis que entender por qué
tiene esa forma la gráfica es lo que se llama el registro acumulativo
mirad en las antiquísimas cajas de Skinner de antes yo estas nunca las he
llegado a conocer yo solo he utilizado cajas de Skinner ya con ordenadores
tampoco soy tan mayor además y que el registro pues te lo daban en la
pantalla bueno pues ya os digo en las cajas que usaba Skinner que de hecho
el registro acumulativo lo inventó Skinner había un rollo de papel que
iba a estar en un rodillo y el rodillo iba girando como tenéis aquí
según esta esta esta dirección y podíamos un poco poner que girara más
rápido más despacio pues para hacer tiempos más cortos o tiempos más
largos si yo tengo una porque I una sesión que dura muy poco durante cinco
minutos pues voy a poner que vaya un poco más rápido pero si yo tengo
sesiones que duran dos horas pues voy a ir más voy a poner más lento el
rodillo para que no gaste tanto el papel y además la resolución de del
dibujo pues sea más acorde con lo que dura el tiempo y luego tenemos
diferentes plumillas que generaban un marcado hacían como las del
polígrafo pues parecido había una que marcaba las respuestas y otra que
marcaba los estímulos discriminativos cada vez que ocurría un estímulo
por ejemplo una luz que le decía al animal que si pues eso que era que
aparte cuando estuviera presente la luz pues podía haber conducta que iba
a tener consecuencias y a veces también había una tercera plumilla para
marcar cuando caían los reforzadores que obviamente los problemas de
reforzamiento continuo los reforzadores iba a haber cada vez que hubiera
una conducta pero los otros tipos de problemas de reforzamiento y el caso
es que fijaros tenemos si giráis un poco la cabeza así podéis ver este
registro en el que en esta dirección es avanza el tiempo y aquí tenéis
en este eje las respuestas y aparte es acumulativo es decir que va subiendo
y va subiendo o sea no marca una rayita en horizontal sino que cada vez que
sube o sea cada vez que da una respuesta del animal sube un poquito la
plumilla de tal manera que al final si tú tienes mides el área bajo la
curva tienes una idea de las respuestas totales ¿no? que has tenido bueno
pues este es el registro acumulativo es importante que entendáis un poco
que estas formas de conducta ¿vale? aquí nos permite también ver por
ejemplo este tiempo en el que está plano pues es tiempo que hay entre
respuestas en las que no se han dado respuestas ¿vale? fijaros aquí esta
es la plumilla del reforzador que os decía ¿vale? cada vez que hay ese
trazo en oblicuo es un reforzador que cae y aquí es lo que tenemos lo que
os decía los diferentes patrones de respuesta que podemos ver con los
diferentes programas de reforzamiento y cada uno de ellos hay una serie de
parámetros que tenemos que ver ¿no? por ejemplo en los programas de
razón fija que puede ser razón fija 1 razón fija 5 razón fija 50 aquí
es un programa de razón fija 50 en el que ojo que en el libro hay una rata
aquí Marcos lo ha corregido ¿vale? con los eh las etiquetitas de los
programas de reforzamiento pues eso esto es un razón fija 50 hasta que no
se producen 50 respuestas no ocurre el reforzador pero es siempre el mismo
requerimiento 50 ¿vale? cada 50 respuestas un reforzador y aquí hay no
las veis porque están muy juntitas pero las diferentes respuestas
acumulándose bueno pues en los programas de razón fija vemos algunas
cosas interesantes por ejemplo los fenómenos de aquí nos abro de la pausa
pos reforzamiento ¿no? como tenéis aquí pues la pausa pos reforzamiento
la veis aquí son estas paradas en la respuesta ahí se deja de responder
en en los diferentes tiempos luego también tenéis la carrera de la razón
una vez que como que han cogido fuerza fijaros ahí como no es progresivo
sino que es bastante inclinada la pendiente de la línea de respuesta y
luego también tenéis otro fenómeno que os tiene que sonar que es la
tensión de la razón y es que con las razones muy altas imagina la razón
fija 500 el sujeto ya deja de responder no me compensa porque además hay
muchas contingencias negativas en las que se dan muchos palancazos pero no
hay reforzador ¿vale? entonces hay un umbral en el que se da lo que se
llama la tensión de la razón en el que ya si te pasas ya dejas de
responder quizás muchas veces no sea por cansancio físico sino porque hay
muchos ensayos no reforzados entonces la contingencia es es más negativa
que positiva ¿no? si me lo permiten bueno pues esa es la razón fija en
cuanto a la razón variable pues lo que no se da son las pausas por
reforzamientos sino que es como bastante más eh bastante mayor tasa de
respuestas una respuesta más constante ¿no? veis así aquí que no hay
esas pausas sino que es todo mucho más constante bien y luego ahora ya nos
vamos a los programas de intervalo recordad que estos son los que eh se
refuerza la primera respuesta que ocurre tras un periodo de tiempo y todas
las respuestas que des antes de todo ese tiempo no sirven para nada ¿vale?
y aquí tenemos por ejemplo un programa de intervalo fijo 60 es decir que
se refuerza 60 segundos la primera respuesta que se da a los 60 segundos
tú has podido dar 5.000 millones de respuestas hasta los 59 segundos como
no des una más pasado los 60 segundos te queda sin bolita de comida
¿vale? y fijaros aquí se da este patrón muy interesante esperad voy a
ponerlo en otro color para que lo veáis mejor veis esta especie de
curvatura como el festón de una cortina eso es lo que se llama el festón
del intervalo fijo ¿vale? ¿de acuerdo? el festoneado y es un patrón
festoneado así es como se llama y bueno básicamente es característico
del intervalo fijo y lo que pasa es que no es o sea es una pausa por
reforzamiento pero que no es continua sino que es que se desacelera siempre
hay versión de palanca pero se desacelera un poquito se desacelera
bastante o sea justo después del reforzador pero luego se acelera cuando
se acerca el momento de que se pasa el requerimiento temporal del intervalo
¿vale? eso es lo que genera este patrón de festoneado esa desaceleración
inicial tras el el reforzador pero luego esa aceleración rápida cuando se
va acercando al reforzador y cada vez más rápido cuando se acerca el
momento pues eso es como os digo típico de los programas de intervalo fijo
y luego ya por último tenemos los programas de intervalo variable que de
nuevo pues generan muchísimas respuestas aunque no haya tantos
reforzadores es decir mucha adherencia conductual fijaros aquí hay muy
poquitos y todo lo que ocupa entre este y este todo esto es conducta todo
lo que tenéis aquí fijaros todo esto para conseguir este reforzador y con
haber esperado no haber hecho nada y haber dado uno justo en este momento
hubiera sido lo mismo en razón e intervalo variables no hay pausa por
reforzamiento no hay una pausa tan llamativa no siempre o sea una pausa
siempre estás un tiempo sin responder es decir a lo mejor responde cinco
veces para un segundito luego sigue respondiendo pero no es tan
característico como en los programas de razón fija el programa en los que
hay esa asociación temporal dejas de responder estás ahí disfrutando del
reforzador pero porque sabes en los programas de razón fija por ejemplo
tienes muy clara cuáles son los requisitos de conducta para conseguir el
reforzador y tú distribuyes los esfuerzos en los otros no en los otros
depende de tu estimación temporal vale bueno ahora en esta parte del tema
lo que se trata un poco es de comparar los programas dentro de los
programas variables las diferencias que generan los de intervalo y los de
razón fijaros que los de razón variable bueno pues por lo que veis aquí
bueno pues tiene más adherencia conductual hay más conducta hay más masa
conductual ¿no? que los de intervalo variable los de intervalo variable
bueno pues no hay esa aceleración de la conducta ¿de acuerdo? entonces en
general como os pone aquí hay más tasa de respuesta tasa de respuesta es
decir respuestas por unidad de tiempo eso es lo que quiere decir tasa de
respuesta en los programas de razón que en los de intervalo ¿vale? ¿por
qué? bueno pues se han venido a dar dos tipos de explicaciones diferentes
una más entre comillas local y otra más global ¿vale? una que se se
centra en las tasas de reforzamiento que hay en un momento muy concreto y
otras en las tasas de reforzamiento de todas las sesiones entonces es lo
que tenéis aquí la explicación que se ha venido a llamar molecular que
es como la más concreta la más acotada en el tiempo se centra en los
programas o bueno dice que estos programas de de razón de intervalo
perdón variable lo que refuerzan diferencialmente son los tiempos de
interrespuesta largos ¿vale? y claro esto es así efectivamente un
programa de de intervalo fijaros no tiene sentido que respondamos
muchísimo porque solo me van a responder solo me van a premiar por aquella
respuesta por una que ocurra justo después de que ha pasado el intervalo
de tiempo necesario entonces al final esos programas lo que lo que van
claro reforzando porque siempre se hace una todos los organismos lo hacemos
un análisis de coste-beneficios pues son que yo responda cada bastante
porque además así primero invierto poco esfuerzo conductual y voy
probando el programa voy afinando mi respuesta para que caiga en el
intervalo al principio esto no es así en las primeras sesiones esto es
algo que se adquiere con el programa de reforzamiento ¿vale? pero es que
los de intervalo al final acaban reforzando tiempos de respuesta largos y
eso quiere decir que hay menos conducta ¿vale? por eso los programas de
intervalo según esta explicación molecular generan menos conducta que los
de razón dentro de los variables siempre vale entonces una explicación de
que los programas de intervalo tengan menos tasa de respuesta es que estos
programas están reforzando al final tiempos entre respuesta largos ¿vale?
porque los tiempos entre respuesta cortos no llevan a reforzadores ¿vale?
si yo di muchos palancazos cada poco tiempo hay muchos palancazos que no
van a estar reforzados pero luego está la explicación molar que lo que
habla no es ya que se estén reforzando tiempos entre respuesta sino lo que
habla es de la tasa de reforzamiento ¿vale? la tasa siempre es el número
de reforzadores por unidad de tiempo y lo que dice es que esta tasa de
reforzamiento aumenta con la tasa de respuesta esto es lo que hace la
explicación molar que es como os digo una explicación como basada en
ventanas temporales más largas que los tiempos entre respuesta que siempre
es pues más local ¿no? si ya he dado una respuesta ya sé que ese
programa de reforzamiento no me va a reforzar las respuestas que de
inmediatamente después pero fijaros es más circunscrito a una vez que da
la respuesta y los tiempos que ocurren cerquita de esa respuesta ¿vale?
mientras que la tasa de reforzamiento es una tasa que se construye en el
global de la sesión ¿vale? al fin y al cabo los programas de
reforzamiento requieren de varias sesiones para ser efectivos entonces al
final bueno los programas de razón variable que generan más respuesta
pues también en estos programas hay más tasa de reforzamiento al fin y al
cabo si si doy más tasa de respuesta ¿no? porque el tiempo el tiempo en
estos programas de razón no es importante sino lo que es es la cantidad de
respuestas que se dé por lo tanto sí que aquí en los programas de razón
aunque sean variables sí que hay una relación de paralelismo entre
cuántas conductas de y cuántos reforzadores voy a recibir por lo tanto
los programas de razón variable están actuando sobre la tasa de
reforzamiento a mayor tasa de reforza voy a aumentar mi tasa de
reforzamiento reforzadores por medida de tiempo mientras que los programas
de intervalo es todo lo contrario bueno no es que sea todo lo contrario es
que los programas de intervalo no modifican la tasa de reforzamiento en un
programa de intervalo variable 10 tú vas a tener tus 6-7 reforzadores en
función de los tiempos establecidos por el programa independientemente que
des 500 respuestas o que des 5 ¿vale? entonces ya os digo la aproximación
molecular explica que haya menos tasas en respuestas en los programas de
intervalo porque dice que estos programas de intervalo variable están
premiando los tiempos entre respuesta largos y esto es una computación que
se hace a nivel local es decir he dado mi respuesta y ya voy a esperar va a
haber un tiempo de respuesta más largo hasta la siguiente y ese tipo de
patrón es el que refuerza en este tipo de programas de reforzamiento de
intervalo variable sin embargo los programas de razón lo que se está
reforzando es la tasa de reforzamiento alta que yo consigo con una tasa de
respuesta alta aunque sea variable los programas de reforzamiento si a mí
me premian cada media de 8 palancazos pues voy a me va a rentar entre
comillas tener una alta tasa de respuesta porque eso me va a llevar quizás
no de manera tan directa como los de intervalo fijo pero sí a una mayor
tasa de reforzamiento que son el número de reforzado por unidad de tiempo
¿esto se entiende? vale más o menos bueno luego lo leéis y lo veis otra
vez pero yo creo que es eso relacionar cuántos reforzadores voy a tener
por unidad de tiempo con la conducta que yo el número de respuestas que yo
haga por unidad de tiempo esa es la explicación molar mientras que la
explicación molecular lo que dice es que los programas de intervalo me van
a premiar si yo espacio mis respuestas porque solo va a estar reforzada la
que ocurra cada cinco minutos de media entonces no tiene sentido que me
responda en medio entonces se refuerza diferencialmente los tiempos entre
respuestas más largos muy bien bueno esta relación que existe entre la
tasa de respuesta dictaminada por un programa de reforzamiento y la tasa de
reforzadores que ese programa de reforzamiento me va a permitir en función
de las respuestas es lo que queda es una relación que queda un poco
determinada o que queda recogida en las que se llaman las funciones de
retroalimentación bueno una función y en matemáticas es así es una
relación una relación entre dos variables imaginaros una función por
ejemplo muy básica que dice que la tasa y es igual a 2x lo único que me
está diciendo es que esta variable va a ser siempre el doble de esta es
una relación entre dos cosas ¿no? bien pues es lo mismo en las funciones
de retroalimentación son funciones que me están explicando me están
describiendo la relación que existe entre por un lado la tasa de
respuestas respuestas por minuto en un determinado programa de
reforzamiento y la tasa de reforzamiento es decir reforzadores por minuto
fijaros que estamos hablando siempre en tasa en términos de tasa y por eso
siempre es por minuto por segundo por hora ¿no? pero por medida de tiempo
eso además me permite a mí llevarlo a una métrica común las dos
variables los reforzadores y las respuestas en términos de tasa muy bien
bueno lo voy a decir un poco rápido y con esto lo dejamos pero tenemos que
hay funciones de retroalimentación que son lineales y otras que no lo son
que son por ejemplo hiperbólicas ¿vale? fijaros aquí en los poemas de
razón las relaciones son siempre lineales con más o menos pendiente eso
sí en función de la razón razones más altas y pendientes más bajas es
decir hay menos tasa de reforzado de reforzamiento en función de la tasa
de respuesta mientras que los programas de intervalos son relaciones
hiperbólicas están negativamente aceleradas llega un momento al principio
con tasas de respuestas bajas se aumenta mucho la tasa de reforzamiento
pero luego llega un momento en que tasas de respuestas más altas no tienen
cambios tan notables en la tasa de reforzamiento es decir en los
reforzadores que yo voy a conseguir por unidad de tiempo bueno lo vamos a
dejar ahí mirad bien esto un poco avanzad bastante todo lo que podáis en
el tema y id apuntando dudas y cosas para un poco dinamizar más la clase
¿de acuerdo? porque tenemos que avanzar esto es un tema muy denso pero
bueno hemos cogido algo de carrerilla así que por mi parte ya está os
deseo muy buenas semanas y que estéis muy bien y nos vemos pues en la
clase del lunes 26 y bueno lo digo leed por favor todo lo que avanzad todo
lo que podáis en el tema para que podáis preguntarme todas las dudas que
tenéis ¿de acuerdo? muy bien pues nada buena semana y hasta luego adiós