Vamos a grabar. Hoy, yo os dije que a partir de este capítulo y de estas
condicionamiento operante ya tenemos el lenguaje, va a ir un poco más
reprisado, básico algunos resultados y nos iremos a las prácticas. Luego,
como habréis mirado muchas cosas no os preguntaréis dudas.
Condicionamiento operante. Vamos a recordar cuatro cosas del primer
capítulo que dijimos. ¿Cómo aprendemos? En el primer capítulo. Una de
las formas son respuestas automáticas como la del condicionamiento
clásico. Pero ¿cómo aprendemos a conducir? ¿Cómo aprendemos a abrir
una puerta? Lo que ocurre es que hacemos muchas cosas en el medio. Probamos
cosas. Y las cosas que funcionan o que nos traen consecuencias positivas se
van aplazando poco a poco. Y llamamos operante a cualquier movimiento de
respuesta abierta, completa, que no es un movimiento reflejo, sino una. Por
ejemplo, coger el bolígrafo este. Es una operación compleja que conlleva
buscarlo, agarrar la mano, hacer la pinza, agarrarlo, subir. Bueno, la
operación completa es una buena. Nosotros estamos continuamente operando.
Todo aquello nos va bien, las consecuencias que nos interesan se van
afianzando. Ahora veremos las teorías de cómo lo hacen. También le
llamamos instrumental, porque normalmente son para conseguir algo como
instrumento o como medio. Bien. Esta nueva forma de aprendizaje es la
segunda forma básica que vamos a estudiar. Una es el aprendizaje, digamos,
de seguro reflejo, de cosas que se asocian con algo que vamos a aprender. Y
la otra es la forma básica de aprendizaje. Es decir, una forma básica de
aprendizaje en el sentido que puede ser conductas o el comportamiento
clásico. Puede ser arribar como puede ser levantar la mano. Estas
conductas son complejas, pues son las bases de todo tipo de aprendizajes
que debemos hacer después o que acabamos de hacer. Las teorías que vimos
ya en el primer capítulo. Y ahora les voy a dar un poco más. Por eso os
dije en el primer capítulo que esto lo íbamos a volver a ver que no tiene
falta, que da sentido. Y luego, señor Zorn, el de los gatos. ¿Habéis
visto el vídeo? Este es el de los gatos. un gato en una jaula y esperaban
que saliera. Esto tenía que aprender un mecanismo más o menos complejo,
ya dijimos que los animales tienen capacidades igual que nosotros, esas
capacidades hay una continuidad biológica y que podemos experimentar con
ellos. Thorndike vio que la exploración al azar, las operaciones en la
caja iban llevándole a diversos efectos hasta que se abrió la puerta.
Cuando se abrió la puerta solía haber una comida o algo fuera por el mero
hecho de salir y el gato la segunda vez daba con la tecla mucho más
rápido, la tercera más rápida y la cuarta más rápida. Bueno, esto,
pues la ley del efecto, quiere decir que para Thorndike el hecho de
conseguir salir de la caja, de la caja de la caja, de salir y conseguir la
comida iba fortaleciendo la imagen de la caja en la mente del gato con lo
que tenía que hacer para salir de esa caja. Y eso quedaba asociado, pegado
gracias a la comida. Eso se llama ley del efecto, que es una ley de
perogullos y la miramos de otra manera pero que es una comprobación
científica. Las acciones que tienen consecuencias positivas tienden a
repetirse. Bien, Skinner. Skinner en vez de decir que cada estímulo se
asociaba con una respuesta lo hace todo mucho más global. Dice nosotros
operamos en el ambiente todo el tiempo estamos haciendo algo y todo el
tiempo estamos recibiendo consecuencias y somos libres. Entonces para él
no es lo importante qué estímulo me está provocando, qué respuesta
puntual. Sino la conducta a lo largo del tiempo y a lo largo de muchos
estímulos cómo vamos modelándonos, vamos haciendo unas cosas y no otras
con más probabilidad. Con Skinner todo es un análisis a lo largo del
tiempo y a lo largo de muchos estímulos. Para eso construye, se llama
operante libre, puede hacer lo que quiera en el mundo, construye una caja
que en vez de tener un mecanismo de salida tiene un mecanismo de salida que
se puede activar, que se puede hacer algo con él. Normalmente solo hay uno
para no complicarnos la vida, el ambiente real y muchas cosas. Ve por una
palanca, una palanca se le puede dar una vez, dos, tres o pone una palanca
y un botón, lo que sea. Bueno, la palanca se puede apretar muchas veces o
pocas dependiendo de las consecuencias. Y esto es lo que estudia él a
largo plazo. Las respuestas en principio son más naturales, por supuesto,
se parece mucho más que la... ¿no? Es una caja, cerradas. Y sí que es
verdad que podemos hacer cosas. Pero, claro, para poderlas estudiar tenemos
que poderlas contar. Después en una palanca tenemos un contador de las
veces que da la palanca, de las veces que consigue algo de la palanca, en
fin, las cajas de Skinner. O sea que para el trópico es más concreto,
más concreto. Puntual. Cada aprendizaje es puntual. Y para Skinner es más
a largo plazo, no son respuestas, son naturales. Hacemos lo que sea y lo
que aprendemos es que la probabilidad de que pase algo bueno haciendo esto,
es mayor que haciendo esto u otro. Por lo tanto, o sea, es todo más
probabilístico a largo plazo. Eso es el... Bueno, y Skinner tampoco
aludía a la asociación en la mente de estímulo y respuesta. Es decir,
para él, para Zombre, la respuesta, o sea, la comida, se llama una
asociación. Skinner decía que eso no era un trópico. No le importaba.
Que simplemente quería ver en qué condiciones se hacían qué respuestas.
No le importaba la asociación mental, sino ver unas leyes que describían
la conducta en función de los estímulos y las consecuencias. Y hacía una
descripción funcional, que le llamamos, sin aludir a asociaciones
puntuales de estímulos. Eso es conductista. Bien, en este tipo de
condicionamiento de aprendizaje, lo que antes íbamos a hablar de una serie
de... De conceptos... Yo voy, ya os digo que voy un poco... El esquema se
corresponde con el libro, pero no lo sigo, si tenéis algún problema
decídmelo con él. Lo sigo más o menos, pero no lo digo yo. Primero,
¿qué es una respuesta operante? Cualquier respuesta que produzca algo en
el medio, una unidad de acción. Sentarme en una silla, agarrar algo, abrir
la puerta, recorrer un pasillo, encender un ordenador. Cualquier cosa es
una respuesta operante. Como conjunto. No cada uno de los movimientos es
una respuesta, sino una respuesta funcional. Eso lo estamos haciendo todo
el tiempo. Y lo que cambia a medida que aprendemos es que unas respuestas
se hacen más probables que otras. ¿No? A medida que aprendo entiendo
hacer unas cosas más que otras. Eso es lo que cambia en el mundo del
movimiento. Y estamos preparados para aprender. ¿Por qué? Porque tendemos
a ser curiosos y hacer cosas. Y a probar cosas. Y esa variabilidad nos
permite aprender. Vamos observando el principio, ¿no? ¿Qué tenemos que
ver con esto? Cuántas respuestas se dan por unidad de tiempo, por ejemplo.
Pero se podría medir cualquier otra medida, ¿eh? La latencia, es decir,
lo rápido que respondo, que es un indicador de lo rápido que ha
aprendido. El tiempo de acción. El número de respuestas por minuto, por
segundo. La fuerza o la magnitud. Cualquier cosa. Lo que se suele medir es
el número de respuestas y la tasa de respuestas. Una vez que una respuesta
aprendida, por ejemplo, dar una palanca, aparece en medio de una palanca,
digamos, un botón o una cuerda, el mero hecho de dar la palanca se puede
transformar en tirar una cuerda. Es decir. La respuesta se construye una
sobre otras, pero al final son enteramente nuevas. Tú todo lo que has
aprendido son movimientos en base a los primeros reflejos. Bueno, pues la
variabilidad. Vas combinando movimientos y vas aprendiendo cada respuesta
más complejas que quedan en tu cerebro asociadas con un operante. Tú
cuando abres una puerta no piensas en cada paso. Ya lo tienes en el cerebro
como una unidad. ¿De acuerdo? Eso le llamamos operante. ¿De acuerdo? Eso
le llamamos aprender. Generar nuevas respuestas en situaciones en las que
la respuesta es efectiva. ¿Cómo sé yo cuando una situación en la que la
respuesta es efectiva una y no otra? Por ejemplo, cuando sé que tengo que
abrir una puerta. Pues cuando veo una puerta. Yo no trato de pasar por la
pared y veo una puerta y la reconozco. Trato de abrirla. Bueno. El
estímulo es esa señal que me dice dónde estoy y qué puedo hacer. Una
puerta o el que aporte el actor. Yo creo que no. La manecilla. Podría ser
el estímulo discriminativo que me dice por ahí se sale. ¿No? O sea, un
estímulo discriminativo es una señal o cualquier cosa en el contexto que
me indica que una respuesta es operativa en ese lugar. Aprendida
obviamente. Le llamamos estímulo discriminativo fijaos a lo que antes le
llamábamos a veces algo parecido. El estímulo condicional. ¿Os dais
cuenta? Una especie de señal. Pero en este caso no se condice. Sólo
señaliza. El estímulo discriminativo por sí mismo no genera ninguna
respuesta. Bueno, sí que genera una respuesta automática. Eso es
paralelo. La que nosotros sientes al operante por sí misma no. Sino que te
da la... Una señal. Una señal de que... ¿Cómo se dice? Once... Bueno,
el que predispone la ocasión de responder. Nada más. O sea, no es... Es
parecido pero no es lo mismo el estímulo condicional. El señal se va a
poner verde y el rojo. Se va a poner en el indicativo positivo. Ya puedes
pasar. Fijaos. Lo que tenemos en este tipo de argumentación es el
estímulo previo que dice ahora puedo. Segundo. La respuesta. Tercero. Las
consecuencias. Esos son los tres elementos que nos quedamos a jugar. El
estímulo puede ser cualquier señal o un contexto que indique que hemos
asociado con la respuesta. Ya veremos luego que también produce reacciones
de condicionamiento clásico. Si una señal sirve para que haga algo en vez
de comer, ese estímulo probablemente generará también la anticipación
de la comida. Pero es una mezcla con el otro. En este caso es diferente.
Obviando eso. Respuesta funcional. Le llamamos respuesta funcional aquella
que tiene como objetivo conseguir algo. Un operante que es un instrumento
para conseguir algo. Y como una totalidad, la respuesta, no como partes
separadas, se convierte en una unidad funcional. Abrir la puerta es una
unidad funcional. Arrancar el coche y conducir también. Lo haces casi
automáticamente. Se define por su función. A ver, entre la respuesta
podemos distinguir la forma y la descripción formal de la respuesta. Pues
levanto la mano, agarro la manecilla, la tiro para abajo y empujo. Eso es
describirla por la forma. Pero nosotros la vamos a describir por la
función. Y llamamos abrir la puerta. Es un conjunto de movimientos que
tienen una función. Por eso le llamamos función. Y no nos paramos a
analizar la forma. Aunque a veces también nos interesará saber la forma.
A veces abrir la puerta la puede abrir con la mano, con el pie. Con la
boca. O pidiéndote que la abras, ¿no? Muchas maneras de abrir la puerta.
Funcionalmente son equivalentes todas las formas. Porque consigo abrir la
puerta. Pero formalmente son diferentes. Nos va a interesar normalmente la
funcional. Normalmente. Y funcionar es porque consigue algo. Abrir la
puerta a lo mejor en sí mismo no es reforzante porque lo que hay afuera no
me gusta. O al revés, sí que es reforzante en el sentido negativo. Pero
lo que importa es después de la respuesta las consecuencias, que son las
que harán que esa respuesta sea más o menos probable. Si la respuesta,
después de hacerla, las consecuencias que vienen hacen que respondamos
más veces, le llamaremos bien un reforzamiento positivo. Y si es menos
veces, negativo. Y si no ocurre nada, no hay refuerzo, no hay aprendizaje.
Todo se define de forma funcional. Por ejemplo, que es un refuerzo
positivo. Yo os he hablado mucho de la comida. Bueno, sí. Pero puede ser
cualquier cosa que consiga que hagas más mal. Una medula, por ejemplo, es
eso que pone ahí ese 50%. Yo creo que es que eso ha guiado del reforzador.
El 50% que no va muy bien. Eso es medula. Sí. Mira, quiero decirte la
probabilidad de que hagas lo... No. No es cierto. Mira. Yo hago así. Sí.
Consecuencia. Ahora sí. Consecuencia. Y ahora sí. Ahora sí.
Consecuencia. Ahora sí. Consecuencia. Ahora sí. Aquí hay una asociación
que si tú sacas una cuenta se llama correlación. Sí. Es perfecta. Sí.
Están asociadas. Aquí sacas una cuenta. Sí. Y es cero. Es decir, es al
azar. Entonces la medida de eso es al azar. ¿En qué medida? Es al azar o
está asociada. Y normalmente eso se mide de cero a uno. Sí. Pero en
consecuencia es nula. Es nula. No. En consecuencia es nula. Es cero. Porque
la negativa sigue siendo una contingencia informativa. Si tú sabes que al
tocar un botón no va a ocurrir algo, es tan informativo como que... O sea,
el cero es que están asociados al azar. La probabilidad de que salgas uno
después del otro es artístico. Sí o no, es mitad-mitad. Vale, vale. Y
luego el último concepto básico... Bueno, perdón. Antes de saltar... Los
responsables primarios y secundarios. Igual que hablábamos en el clásico.
¿Cuál es primario? Aquel de que por sí mismo logra incrementar o
disminuir las respuestas. Por ejemplo, si tú sabes que al tocar un botón
no va a ocurrir algo, es cero. Entonces, ¿cuál es el primario? ¿Qué es
el primer momento en el cual se hace una carga eléctrica a la manera? El
secundario es aquel que, por aprendizaje, ha adquirido o lo ha reforzado.
Por ejemplo, el dinero, por ejemplo, yo qué sé, una felicitación, un
recuerdo social, ¿no? Ya está. Eso es sencillo, ¿no? Bien. Distinguir el
reportamiento, que le llamaríamos al proceso, a todo junto, estímulo
discriminativo, respuesta-refuerzo ese es un proceso y reforzado es la
consecuencia es una restricción la consecuencia no tiene por qué ser
positiva ahora la hablamos también bien esto yo lo veo es un proceso si
esto te lo puedes bajar tú el no, es lo que ocurre después de la
convocatoria las consecuencias o sea, perdón el proceso, ¿te refieres?
no, o sea el reforzador o el proceso de reforzamiento es que me ha ido que
en el cine lo cual era estímulo respuesta y conducta sí no, pero él se
refiere a que no tenemos que analizar cada cosa que haces y que ocurre a
continuación sino que tienes que analizar en global pero el reforzamiento
como proceso es todo le llamamos reforzamiento a toda la secuencia de lo
que yo veo lo que hago y las consecuencias y le llamamos refuerzo a las
consecuencias no te compliques más reforzamiento es todo el proceso para
nosotros de una forma estudiada lo llamamos proceso de reforzamiento
discriminación y olvídate o sea, las respuestas en este caso vamos a
medir normalmente que probablemente hay de respuesta y son totales millones
de veces más o menos nada más o sea, como cierto resumen de la parte
teórica los tipos de respuestas que podemos medir Fallback medía una
respuesta los laberintos que veréis en el vídeo también una sola, salir
de la jaula o irse un laberinto de un lado hacia otro o encontrar la salida
como solo hay una respuesta tenemos que medir la fuerza de respuesta la
rapidez que se prefiere A o B el tipo de medida que haremos cuando el
ensayo sea de una sola respuesta la latencia que es cuanto tiempo tarda en
empezar después de una señal la velocidad si es un laberinto de velocidad
acaba de encontrarla o delante de la corredora la elección, como prefiere
las... de Skinner, las que mediremos son números de respuestas, son tasas
normalmente cuando son muchas respuestas frecuencias distribuir topografía
en función de su expresión forma y finalidad la misma cosa se puede hacer
de varias formas diferentes topografía sería describir la respuesta en
sus movimientos detallados y función la finalidad eso es muy parecido a
instancia y clase de respuesta instancia movimiento de la mano hacia arriba
hacia abajo instancia clase sería una instancia, sería una análisis
puntual de los movimientos micros le llamamos instancia de respuesta a cada
uno de los movimientos que viene y clase a una agrupación de movimientos
que son ir juntos por ejemplo para para agarrar algo agarrar la mano juntar
los dedos bueno son tres formas de decirlo bueno algo parecido no es
exactamente lo mismo pero lo podéis leer y veréis que no tiene nada que
ver las relaciones entre este condicionamiento que estamos viendo y el
clásico uno de los fenómenos que vimos en el clásico era el seguimiento
del símbolo cuando en un trabajo de condicionamiento clásico una señal
que indica que va a haber comida SLC ¿os acordáis? muchas veces las
palomas se ponen a picotear esa señal eso le llamábamos seguimiento del
símbolo ese picoteo de la señal no deja de ser una respuesta elicitada
por la señal y porque aparece una comida después se está dando un
condicionamiento clásico porque esa luz me prepara para comer y me da y un
condicionamiento operante porque estoy respondiendo con una conducta ahí
vemos que la conexión interior de su aprendizaje ocurre todo el tiempo
fijaos un ejemplo el ejemplo tonto que se me ha ocurrido abro la puerta y
me encuentro al otro lado la comida o lo que sea, algo bueno obviamente hay
un condicionamiento operante tenderé a buscar detrás de esa puerta o
aprenderé a abrirla con más facilidad pero a la vez se está produciendo
el aprendizaje en el condicionamiento clásico apetitivo salivaré o sea,
en la naturaleza o incluso en los laboratorios los dos aprendizajes
comparten muchos conceptos entonces simplemente lo separamos muchas veces
por lo que estamos analizando y nos interesa y también porque se ha
demostrado que quizás un tipo de aprendizaje del otro tiene un sustrato
neurológico diferente puede ser que sean diferentes fijaos no es
automático casi el otro es de emisión de respuestas y como eso de
aprender pues el condicionamiento operante ¿para qué sirve esto? ¿cómo
enseñan a los elefantes en el circo a pasar por un cable? modelamiento
progresivo las técnicas son todas las que veremos aquí sólo que tenemos
que lograr que la respuesta que hasta ahora no existe en respecto al animal
se incorpore ¿cómo? le vamos dando refuerzos clásicos a medida que se
acerca, por ejemplo a medida que yo me acerco a la puerta si yo quiero que
un animal abra la puerta si se acerca hasta ahí le doy un premio cuando ya
logro que se acerca hasta ahí con cierta frecuencia le quito el premio de
ahí y se lo doy solo si va hasta allá luego si toca la manecilla y esto
claro es una combinación, el premio a consecuencia de condicionamiento del
uno y del otro y al final lograré que abre la puerta ¿de acuerdo?
¿moldamiento es unito o no condicionamiento? Usar normalmente los dos pero
normalmente usan los dos lo que se hace en condicionamiento operante se
llama moldamiento porque la respuesta hay que modelarla de alguna forma hay
que moldearla, es nueva a partir de lo que ya hace diciéndole en qué
dirección debe ir y esa dirección se puede hacer directamente con
refuerzos o con estímulos de condicionamiento clásicos, señales que
asocien a cierta consecuencia y a la cierta el refuerzo pues es de muchos
tipos pero que lo veáis en conjunto aunque lo analicemos por separado todo
se puede ver en conjunto de hecho hay unas teorías que si los tenéis en
cuenta visto esto que es la introducción vamos a ver los programas que se
pueden dar en un reforzamiento esta parte es la base con la que todo lo
demás tiene sentido por lo tanto es como cuando hablamos del primer
esquema de condicionamiento clásico sobre el que todo lo demás se divide
esto es lo mismo, no importa y que aquí pone automoldamiento no, el
automoldamiento es cuando lo haces tú solo no es que alguien te enseñe a
abrir la puerta sino que lo haces tú solo y vas viendo que cada día que
haces algo, te sale algo bien y lo has ido haciendo cada uno aprende no
solo es más automoldamiento la mayoría de la aprendizaje es
automoldamiento bien vamos a ver situación normal yo hago algo y hay una
consecuencia si la consecuencia es buena la probabilidad de que repitase
algo es alta eso es lo que llamamos un refuerzo positivo porque la
consecuencia, el refuerzo aumenta la probabilidad de una comida la
consecuencia de un refuerzamiento positivo es algo apetitivo comida y el
efecto es que aumenta la conducta bien vamos a hacer lo contrario vamos a
tratar de que alguien deje de hacer algo ¿cómo? castigándolo ¿qué es
un castigo? cualquier consecuencia que disminuya la probabilidad de una
conducta no os compliqueis en qué saber si va o deja de ser se define por
su esencial un castigo es todo aquello obviamente el castigo será poco
agradable para quien lo recibe por lo tanto será una consecuencia negativa
para el que la recibe poco deseada que no lo quiero olvidar que quiero
hacerlo poco a poco esas son las dos primeras cosillas te doy un palo o te
doy una zanahoria las otras dos son ¿qué ocurre cuando quiero que en el
reforzamiento negativo quiero que alguien haga algo mediante un castigo
¿qué tengo que hacer para que alguien haga algo o vas o te pincho o vas o
te golpeo esto se llama escape de limitación escape del castigo si lo
estás recibiendo y evitación si logras prevenirlos antes de que ocurra
normalmente vamos a aprender primero el escape y luego aprendemos a
evitarlo porque la señal nos dirá si hay señales pasaremos de escape a
evitación normalmente entonces son equivalentes aunque son diferentes al
final no lo recibo en la evitación directamente no imagínate se enciende
una luz y después de la luz hay una descarga a no ser que me aparte ahora
las primeras veces me apartaré al principio no te has escapado tan fácil
al recibir la descarga luego me voy si te vas mientras se produce lo estás
dando ganando ya quitas o ya no confundís porque con el reforzamiento
negativo lo que logramos es un aumento el castigo es para que te estés
quieto para que no hagas algo y el escape es para que lo hagas no son sólo
cuatro la última es ¿cómo? con una consecuencia positiva trabajando en
una consecuencia positiva puedo lograr que alguien deje de hacer algo
premiando cada vez que no hace algo no, premiando cuando hace lo otro
premiando cuando hace lo otro por ejemplo yo como los ministerios tengo
misión que no lo hagan en casa bueno, podría ser lo siento pero lo que
estás haciendo en el reforzamiento positivo es la calle ¿de acuerdo?
¿cómo es la misión? ¿tú qué has dicho? es mantener un premio que ya
tenía si deja de hacer algo quitárselo si no deja de hacerlo a ver,
pensadlo de esta forma ¿cómo lo ha pensado el rey? como los ministerios
que deje de hacer algo ese algo que está haciendo debe ser malo para mí
¿cómo hago que una persona que está haciendo algo malo me está
molestando, me está incordiando está haciendo lo que no debe en casa le
quito la comida si vuelve a hacer eso o te quito el juguete a un niño si
sigues haciendo tonto o haciendo ruido y tú me dejas trabajar eso es
omisión te quito el refuerzo que ya tienes para que dejes de hacer algo
malo o sea, en estos lugares de trabajo normalmente lo que está haciendo
es algo malo que queremos que deje de hacer o lo castigamos porque no lo
deje de hacer o le quitamos un premio y esto desde arriba si estamos
pidiendo que haga algo, dándole un premio o amenazándome con un castigo
si no lo hace y el nombre es el segundo refuerzo negativo tenemos que
evitarlo mejor escape de evitación castigo mejor que refuerzo negativo
consecuencia del éxito y entrenamiento de omisión quitar un premio es la
omisión y dejar de hacer una conducta y ahora me falta el último detalle
que es la contingencia es simplemente una correlación la correlación
entre hacer cosas y las consecuencias simplemente es a más respuesta más
consecuencias contingencia positiva a más a menos respuesta también es
positiva si a menos respuesta menos consecuencia ahora, si es al revés a
más respuesta menos consecuencias la contingencia es negativa la
correlación es negativa y tenemos que verlo en este caso ¿no? a más
respuesta más premio y en el castigo ¿qué pasa? menos menos a más
respuesta ¿qué hay? más consecuencias positiva ¿entendéis ahora? es
positivo porque piénsalo así las otras no son negativas ¿quieres que te
explique las otras por qué son negativas? el escape el escape a más veces
salte menos descargas negativa, a más veces menos negativa porque el
sujeto no lo hará si lo hará, en el escape saltará la respuesta que le
estoy pidiendo es que se escape a más veces se escape menos descargas ¿si
o no? la conducta deseada es el escapar por ejemplo, si estoy en esta banda
se me va a descargar habrá más respuesta pero recibiré menos descargas
por lo tanto la relación entre consecuencias y respuestas negativa a más
respuesta menos descarga lo único que tienes que valorar es la relación
entre el número de respuestas y el número de consecuencias si los dos
aumentan o disminuyen a la vez correlación positiva si uno aumenta y el
otro baja negativa y número de consecuencias da igual que sea positiva es
una correlación, no tiene mayor importancia mira a más veces me escapo
menos castigos me llevo negativo más menos ¿y en este qué ocurre? en la
omisión ¿qué ocurre en este? que pare de hacer algo y si para, ¿qué
tiene? más premio a menos respuestas más premio la respuesta objetiva el
primero es positivo ¿por qué? a más veces lo hagas más consecuencias
recibes a más respuestas más premios el segundo es negativo porque a más
veces te escapes menos descarga recibirás a más respuestas menos el
tercero es positivo positivo, porque a más veces lo hagas más te castigas
más descargas solo tienes que ver el número de respuestas y el número de
descargas en el castigo a más veces lo hagas más veces te castigas más
consecuencias recibirás y el último es omisión a menos veces hagas lo
malo que estás haciendo más premio tendrás y viceversa a más veces
hagas lo malo menos premio tendrás la relación es negativa ¿sí? las
positivas ellas entienden ¿no? el castigo también la consecuencia del
castigo es una descarga cada vez que toques eso te doy más descarga a más
veces los toques más descargas eso es lo único que me cuenta ¿es
positivo porque hay más conducta? claro, más conducta más consecuencia
el más más es positivo solo es la relación entre número de respuestas y
número de consecuencias además en el cuadro es muy fácil pensar si no
has acordado eso se lo diré un poco a más respuestas pero yo veía al
signo y me había mojado por eso yo los signos más o menos de alguna
manera están debidos ¿eh? tú piensas en una relación ah, eso es como la
relación la relación es una multiplicación más menos y menos y ya está
y todo lo demás claro el cuadro básico está ahí ya no le falta más lo
único algunas pequeñas matizaciones por ejemplo ¿por qué un reforzador
positivo lo es? porque o bien cubre una necesidad básica o bien está
asociado con aprendizaje a esa necesidad básica por lo tanto la comida es
un reforzador porque sirve para la supervivencia el cuerpo está preparado
para existir ¿cómo sabemos si un alimento es más o menos reforzador? en
general no es lo mismo tener mucha hambre que poca, según qué animal come
qué cosas pues para igualar para igualar lo que hacemos es tomar alguna
tasa de la necesidad que sea más o menos objetiva por ejemplo el peso que
tiene un animal comparado con el peso que suele tener para igualar todos en
la misma necesidad y que la condición de partida sea la misma pero que
sepáis que un reforzador es muy variable en las situaciones en las
personas y en los animales por supuesto eso es bastante lógico entonces lo
que se hace es dejar al animal al 75% el peso que tendría si pasa la
hambre sí, pero dice que en realidad no pasa la hambre porque si estuviera
libre pesaría menos si le gastaba mucho pues no pasaba nada bueno qué
más las aproximaciones sucesivas que hemos nombrado antes el entrenamiento
complejo se hace haciendo movimientos de aproximación y luego los vas
quitando los refuerzos bien el escape y la dictación ya lo hemos dicho el
primer castigo el castigo tiene un efecto añadido no deseable, que es que
genera una frustración un dolor que se asocia con la situación de
aprendizaje con los estímulos discriminativos y que muchas veces no
conviene por eso porque el reforzo positivo sería fácilmente atendemos
fácilmente a las contingencias del ambiente mientras que en el castigo hay
algo que distorsiona una interferencia, el dolor o la frustración que
puede generar consecuencias al revés, puede generar que el castigo se
asocia a la persona y no a la conducta entonces el castigo se usa menos o
al menos con poca intensidad, con mucho cuidado y nada más la la omisión
es simplemente buscar algo que le guste y quitárselo para que deje de
hacerlo lo malo nada más la extinción en la extinción vimos también un
condicionamiento clásico que cuando yo aprendo algo y luego empieza a
ocurrir sin consecuencias poco a poco ese estímulo discriminativo yo dejo
de emitir la respuesta dejo de darle a la palanca ahora bien hay un par de
fenómenos que responden a la lógica perfectamente ¿qué os ha pasado
cuando habéis aprendido por fin a usar el no sé qué el whatsapp que no
sabíais? pues le das a los tres botes mira ahora funciona, mira ahora
funciona te cambian el código y no funciona nada lo primero que haces
¿qué es? probar al revés eso es lo que ocurre cuando hacemos extinción
hay un momento que se llama estallido de extinción en el que la respuesta
es más intensa incluso hay una variabilidad de respuestas de probar otras
a ver por dónde va y cuando ya ves que no hay manera va bajando esto se
llama estallido de extinción ese pequeño periodo en el que intentamos
volver a lo que teníamos y luego también ocurre como en el
condicionamiento clásico que no hay una desaparición del aprendizaje sino
que luego por el paso del tiempo por ejemplo si lo ponemos en una
situación parecida a la que había pues todo un tiempo sin refuerzo sin
nada, vuelves a la habitación vuelves a tocar un programa y pruebas lo
mismo que la otra vez o sea, no te olvidas del aprendizaje recuperación
espontánea o sea, si he aprendido en una caja y la vengo de esa caja a la
rata vuelvo a hacer lo que hacía aunque en su momento lo hubiera detenido
¿durante cuánto tiempo? depende del momento del animal ¿por cuánto
tiempo dices que hay que dejarlo? si por ejemplo aprendes una cosa si una
cosa la haces diariamente pues a lo mejor el tiempo que hay de pagar es
otro menos a veces bastan dos días depende de la conducta del animal
¿qué más? que por ejemplo durante la extinción hay que hermoso sin
querer un condicionamiento clásico asociado que es la frustración no
ocurre lo que debía ocurrir eso lo llamamos frustración y la frustración
de por sí genera una serie de conductas que tratan de disminuirla por
ejemplo la agresividad otra cosa importante la resistencia a la extinción
¿qué es esto? lo que hemos aprendido se puede medir o sea cuánto ha
aprendido una persona en una situación de reforzamiento se puede medir
viendo cuánto tarda en extinguirse si la asociación es muy débil el
aprendizaje es muy débil en poco tiempo dejaremos de hacerlo se
extinguirá rápidamente pues eso es la medida del aprendizaje la
resistencia a la extinción y curiosamente cuando una cosa se ha aprendido
con reforzamiento continuo es decir siempre que lo has hecho te ha salido
bien es más fácil que se extinga más rápido a las pocas veces que te
salga mal lo dejas de hacer también es lógico si lo piensas ahora una
cosa que se ha reforzado parcialmente 5 o 6 veces tardas más en
extinguirlo en darte cuenta que falla y que no funciona ¿por qué? pues
por muchas razones una de ellas es esa que no sabes distinguir bien si no
funciona porque lo haces mal o porque había muchas veces que no funcionaba
sin embargo cuando siempre te sale bien ya debes analizar bueno eso se
llama efecto de reforzamiento parcial de alguna manera el reforzamiento
continuo dar siempre la consecuencia hace que la extinción sea más fácil
se llama sobreentrenamiento en la extinción bueno esto lo veremos también
más en detalle el efecto de reforzamiento parcial y también veremos
algunas teorías claro una persona hay varias explicaciones les doy un poco
por encima pero son lógicas también las veces que has estado y te han
salido bien las cosas en el condicionamiento continuo y en el otro estás
acostumbrado a que te salgan mal de alguna forma es lo normal la extinción
es más difícil de distinguir y los efectos que vimos bueno hay un par de
cosas también que son también a mayor reforzado y a más inmediato sea en
general mejor aprendizaje si el reforzamiento es parcial también eso es
mejor eso es continuo por lo que hemos dicho porque te obliga a responder
más veces y estás acostumbrado a responder mejor dar un premio de cuando
en cuando ahora si vas a tardar mucho en dar un premio conviene dar
señales o recordatorios intermedios lo que se llama a veces el premio
electrónico cuando tengas tres vales así mantenerla si te pasas de tiempo
a lo mejor consigues la extinción los mismos fenómenos que veríamos en
condicionamiento clásico y con el mismo nombre y así los entenderemos
puede haber olvido pero la extinción no es olvido sino que nos olvidamos
de algo quiere decir que ha pasado el tiempo no ha habido experiencias y es
diferente la extinción la extinción que dijimos en condicionamiento
clásico desapareció otra cosa no sé que desaparecía la huella de
memoria por ejemplo aquello de renovación restauración del
establecimiento que es lo mismo que en el condicionamiento clásico
renovación si cambio de contexto si yo hago la extinción de un contexto y
cambio a otro la restauración cuando y la restauración cuando cambio de
contexto perdón restauración es también cuando cambia de contexto no,
cuando vuelve al contexto original ah renovación cuando cambia de contexto
restauración restauración de la extinción si tu a un animal aprende en
A, olvida en otro contexto B al volver a A y da renovación pero si vuelve
al B restauración de la extinción eso lo llamamos restauración o sea,
vuelve a la extinción restauración es la extinción pero ese es el
contexto no es más complicado que eso restablece va donde se ha extinguido
y luego el restablecimiento aparece el reforzador aunque esta vez no
asociado a la conducta que hacemos sin embargo aparece también la conducta
o sea en el condicionamiento clásico el restablecimiento aparecía el EI
por ahí de alguna manera se restableció la respuesta aquí aparece el
reforzador aunque esta vez ya no es consecuencia de lo que yo hago sino que
aparece ese premio que me daban y vuelvo a la conducta anterior o sea, que
no se olvida simplemente recordaos que la extinción no es olvido hay
cuatro cosas si aparece el reforzador sin asociarse a ninguna cosa luego
hay cuatro fenómenos que tienen que ver con la con las capacidades del
animal es decir hay ciertas conductas que son más favorables que otras
para aprender porque son naturales otras que son casi imposibles de
aprender porque no están en el repertorio luego tenemos también los
efectos del refuerzo, del cambio de refuerzo si se duelen el premio o bajan
el premio que ocurre también es bastante lógico y que ocurre cuando en el
aprendizaje no permitimos que se cuestionen asociaciones que siempre hay
una consecuencia quieras o no si esta consecuencia es negativa se produce
lo que se llama indefensión aprendida hagas lo que hagas te pasa algo malo
y se asocia mucho con la depresión un mecanismo de depresión son cuatro
cosas que son sencillas por eso yo en cierto modo las voy a a dejar para
que las miréis por ejemplo la devaluación del reforzador esto lo vimos en
un cierto momento con el condicionamiento clásico qué ocurre si el
reforzador que estoy utilizando lo condiciono a algo malo lo asocio a algo
malo por ejemplo esa comida o algo que te siente mal también bajará lo
miráis lo que pasa es que aquí no hablamos del condicionamiento clásico
hablamos de la respuesta en el clásico sí pero aquí hablamos de la
respuesta al asociar el reforzador con algo malo la respuesta que se ha
condicionado al reforzador baja os quiero presentar de entrada el
experimento en inglés en castellano está muy fácil vais a tener esto el
artículo lo tenéis en la página no me acuerdo dónde está aquí está
página 188 arriba pone la renovación del condicionamiento operante
consiste en la recuperación de la respuesta extendida ¿me seguís dónde
estoy? en la página 188 arriba la renovación en un contexto diferente
porque se ve con el producto de extinción este es el que estoy leyendo
está aquí nombrado ¿qué vais a ver en este artículo? vamos a ver la
renovación en el condicionamiento operante es decir, cómo se ha aprendido
una conducta hablamos de conductas ahora a través de un refuerzo luego se
ha extinguido es decir, esa conducta se ha dado muchas veces sin refuerzo
ha dejado de hacerse esa conducta ¿cómo se renueva al cambiar el
condicionamiento? entonces tenemos renovación ya nos situamos ahí ya
vimos que también le llamamos renovación en inglés o como sea al mismo
efecto en condicionamiento clásico y estos autores también fueron los que
trabajaron en condicionamiento clásico entonces lo que hacen en este
experimento es aplicar lo mismo al condicionamiento operante ya la
introducción nos dice en este trabajo vamos a ver a comprobar el efecto de
renovación en el condicionamiento operante básicamente el experimento
tiene los siguientes elementos tienen jaula aquí he puesto una palanca de
un poco de comida para que hagáis una idea que los elementos más
importantes de esas jaulas son una palanca y un dispensador de comida
tienen tres fases más la última fase que le doy partes la primera fase es
el aprendizaje propiamente dicho cada X veces que le deis a la palanca de
comida en este caso es apetitivo es refuerzo positivo porque se está
usando antes veréis que pone en inglés como era el entrenamiento al
comedero que se llama en castellano simplemente acostumbrar al animal a
saber que ahí va a haber comida y que se acostumbre al entorno y al
comedero o sea es una serie de ensayos que le pone al animal en la jaula ah
magazine train magazine train entrenamiento al comedero si pero en este
caso se refiere al dispensador de comida a donde se muestra la comida bueno
pues en este caso lo primero que se hace es acostumbrar es que quiero que
veáis también en el experimento un poco del procedimiento científico de
la exactitud con la que describe la jaula de las dimensiones los colores la
intensidad del agujero la intensidad del sonido para que veáis por qué se
hace esto porque nos gusta ser específicos no, para que tú puedas
reproducir el experimento con las mismas medidas y ver si se produce lo
mismo o bien cambiar algunos de esos datos a ver si dependía de esos datos
es más que nada para controlar las variables que extrañan y precisan esta
precisión tenemos una fase después de determinar un parco de dedos
acostumbrarse al animal que hay ahí y ver cómo funciona la primera fase
es una cronología cada X veces que le pones la palanca te pone una
cronología te describe pues qué se hace durante 4 o 5 días durante media
hora cada eso es lo que vemos luego 30 segundos de cada 30 segundos por
término medio se puede producir una respuesta está disponible la
cronología si tú le das a la palanca aparece la cronología por término
medio no cada 30 segundos a veces cada 2 intervalo largo la segunda fase en
las mismas jaulas o a ver en diferentes jaulas en este caso es base 100 se
hace la extinción es decir le dejamos al animal que haga la respuesta que
ha pedido pero esta vez no hay comida durante 3 o 4 sesiones la describen
perfectamente eso podría caber en la pregunta de examen si tú lo has
leído vas a memorizar si tú te lo has leído no es tan complicado te
dirá cuántos experimentos llevo a cabo pues eso la última fase está
así en un contexto que va a ser diferente del anterior luego también se
hace una prueba pero lo que nos interesa es en un contexto diferente de una
extinción para ver si hay renovación o no todos los procedimientos
posibles que caben con este planteamiento y con esto lo dejamos de aquí
los procedimientos que caben contexto A en otro diferente se extiende y
volvemos al A A B y uno en tercero es diferente a ver lo que ve habrá
renovación o no muy bien empezamos con la extinción en A y luego vamos a
ver los procedimientos en la fase de extinción ¿de acuerdo? el último
día veremos los 4 experimentos en detalle las hipótesis y todo bueno
leemos un castellano lo queráis