Bueno chicos, confirmadme que me veis y me oís. Como podéis ver, he
cambiado un poco el setup del despacho. He conseguido por fin una cámara
para mi ordenador de sobremesa. Estaba dando las clases con el portátil
hasta ahora y he conseguido al final una cámara y los drivers. Creo que se
ve mejor y se escuchará mejor. Eso espero, diréis a buenas horas ya, para
la última tutoría. Pero bueno, ¿qué le vamos a hacer? Ahora por lo
menos tengo las dos pantallas grandes y puedo verlo todo bien sin tener que
dejarme la vista intentando ver los numeritos. Un poco tarde, pero bueno,
por lo menos para la última tutoría. Bueno chicos, como veis os he subido
dos enlaces al chat. Son los enlaces de las dos últimas tutorías que
dimos. Uno creo que está subido en el enlace al foro y el otro todavía no
lo subo en cuanto pueda. De todas maneras, siempre tened en cuenta que
aunque yo no os ponga los enlaces en el chat, en el foro, si ponéis mi
nombre o ponéis Psicología del Aprendizaje Antonio Prieto en Inteka, en
el repositorio. No en Inteka, no me sale el nombre ahora de la página.
Bueno, es en Inteka, pero no me va a salir. Bueno, da igual, lo podéis
acceder a través de Inteka. Podéis acceder a las tutorías porque siempre
las dejo libres. Incluso no tenéis ni por qué loguearos como parte de la
UNED porque puede acceder cualquier persona a ellas. O sea que no tenéis
que esperar. No tenéis por qué esperar a que os ponga los UNED Play.
Madre mía, mala memoria tengo. Como lo tenga igual para todos. No tenéis
por qué esperar a que suban los enlaces, sino que si queréis verlas antes
podéis hacerlo. Las tenéis siempre disponibles. Bueno, ahí tenéis, en
el chat tenéis los dos enlaces ya puestos por si queréis ponerlos antes
de que las suba. Creo que solo queda una, la de la semana pasada, los
enlaces al repositorio. Bueno, última tutoría. Vamos a terminar el tema 6
y vamos a continuar con el tema 7. En el tema 7 vamos a ver los dos
apartados más importantes porque bueno, hay partes del tema 7 que se
repiten un poco, ¿vale? Se trata del control aversivo de la conducta, pero
en la última parte habla de cadenas concurrentes y de procedimientos
concurrentes. Es para el castigo que son básicamente lo mismo que vimos
antes. Así que vamos a intentar resumirlo para que nos dé tiempo a lo
más posible. Si al final en el otro centro asociado nos dicen que tenemos
que dar alguna clase más, ya sabéis que aunque no las pueda dar en este
centro sí que voy a dejar las grabaciones, os las pondré también en el
foro por si hay alguna clase más. Por ejemplo, si hacemos algo sobre
prácticas o si grabo algo sobre las prácticas obligatorias, pues siempre
todo lo que ponga lo pondré libre para que lo pueda ver todo el mundo y
eso, por supuesto, os incluya a vosotros y pondré los enlaces en el foro.
Ya sabéis también que hay más tiempo para los exámenes, así que
podéis seguir escribiendo en el foro y yo iré contestando a las preguntas
que tengáis y a cualquier duda. Así que, aunque no tengamos más
tutorías en directo, sí que se pueden seguir viendo contenidos, podéis
seguir repasando las tutorías que ya hay y podemos seguir en contacto a
través del foro, dudas, etcétera. Bueno, vamos a seguir, vamos a
continuar con lo poco que nos queda del tema 6 y con todo lo que podamos
ver del tema 7, que ya es el último, casi no os va a dar tiempo a ver
todo. Sólo tratándose de mí, que reconozco que me he enrollado. Como las
persianas, es casi un milagro porque creo que nunca he terminado una
asignatura de darle entera. No sé si es bueno o malo que me enrollo, pero
bueno, vamos a intentar terminar todo lo que podamos. Estábamos viendo las
interacciones que ocurren entre estímulos excitatorios inhibitorios y lo
que vimos era un fenómeno que se denominaba desplazamiento del máximo.
Cuando entrenamos dos estímulos, un estímulo discriminatorio positivo y
un estímulo discriminatorio negativo, por ejemplo, una luz, roja para, si
se responde ante una luz roja y se apresura una palanca, si se apresura una
palanca ante la aparición de una luz roja, aparece comida. Si es ante una
luz verde, entonces no aparece comida o eso señala la no disponibilidad de
comida, entonces no se responde. Bueno, pues ocurre un fenómeno curioso
cuando hay estos dos tipos de estímulos, discriminativo positivo y
negativo y la discriminación es intradimensional, recordad. Es decir, que
la diferencia entre el estímulo discriminativo positivo y negativo es una
dimensión o están en la misma dimensión, por ejemplo, el color. Bueno,
lo que se produce es un desplazamiento, un alejamiento del máximo de
respuesta que debería de darse ante el discriminativo positivo. Bueno,
pues se produce un desplazamiento en sentido contrario al discriminativo
negativo. Pusimos el ejemplo de luces de diferentes longitudes de onda,
luces de colores y el estímulo discriminativo, imaginad, el estímulo
discriminativo positivo es una luz de 550 nanómetros, que sería,
correspondería más o menos con el verde. Y tenemos un estímulo
discriminativo negativo que en diferentes grupos lo ponemos diferente. Es
una luz que va hacia, del verde va hacia, pongamos que va hacia el azul,
¿vale? Que se va desplazando hacia el azul, cada vez más distinto del
verde. Tenemos en el primer grupo un verde un poquito más azulado, otro
verde un poquito más azulado y ya casi azul. Bueno, pues lo que vemos,
esto sería el discriminativo negativo, el positivo siempre verde. Bueno,
pues lo que vemos cuando entrenamos estos dos estímulos es que cuando
sometemos a los sujetos una prueba de generalización, el máximo de
respuesta no se da ante lo que se tendría que dar, que es el estímulo
discriminativo positivo que hemos entrenado, es decir, la luz ante la que
si responde se da la respuesta, sino que se desplaza el máximo de
respuesta en sentido contrario al estímulo discriminativo negativo. Es
decir, se va hacia el lado contrario. Si este es el positivo 550 y este es
el negativo, pues el máximo de respuesta se va por debajo de 550. Y se
desplaza más cuanto más cerca está el estímulo, el estímulo
discriminativo negativo del positivo. Cuanto más se aleja, veis que se va
separando cada vez menos. Y si no hay discriminativo negativo, si no se
entrena ningún estímulo discriminativo negativo, no se produce
desplazamiento del máximo. Es decir, desplazamiento en sentido contrario
al estímulo delta o estímulo discriminativo negativo y mayor cuanto más
cercanos están el positivo y el negativo uno de otros. ¿Qué decía
Spence sobre esto? Bueno, pues Spence decía que tanto el estímulo, el
positivo, el discriminativo positivo como el estímulo delta, el negativo,
adquieren control sobre el comportamiento. Y esto se expande o se
generaliza a estímulos que son cercanos. Si el positivo negativo y el,
perdón, el discriminativo positivo y el negativo están muy cercanos,
ambos adquieren control y se generalizan otros estímulos. Es decir, se
solapan. La tendencia excitatoria y inhibitoria se generaliza y se solapa y
eso hace que se desplace el máximo hacia un lado. Y la conducta, el global
de la conducta sería la suma de ambas tendencias. Lo vamos a ver mucho
mejor en la siguiente diapositiva. Fijaros, bueno, ya hemos visto algunas
cosas. Se produce en sentido contrario al estímulo discriminativo negativo
mayor cuanto más cercanos están, cuanto mejor se discrimina lógicamente,
cuanto mejor son capaces de discriminar los sujetos, menor es el
desplazamiento y lo mismo ocurre con el mínimo de respuesta que se
desplaza en sentido contrario al estímulo discriminativo negativo. Es
decir, ocurre tanto con estímulos discriminativos positivos como
negativos. El mismo fenómeno. Desplazamiento del máximo y desplazamiento
del mínimo. Bueno, curiosamente hay un procedimiento específico que no
produce desplazamiento del máximo, que es la discriminación sin errores.
¿Os acordáis? Cuando poníamos, entrenábamos de tal manera que el
estímulo delta, el discriminativo negativo era tan poco intenso que casi
no se podía ni responder o no responder ante él. Así que no podían.
Sí, no se podía responder ante él. No se podían producir errores y poco
a poco aumentábamos su intensidad y lográbamos un proceso de aprendizaje
discriminativo en el que nunca se cometían errores y que decíamos que era
muy útil para poblaciones especiales, para personas o cualquier organismo
que tenga ciertos problemas de aprendizaje. Era muy útil porque eliminaba
esa frustración. Lo mismo ocurre cuando se producen periodos de
evaluación largo, aprendizaje largo. Cuanto mejor se discrimina, ya hemos
dicho que menor desplazamiento del máximo. Vamos a verlo aquí, porque yo
creo que lo vais a ver mucho mejor. Fijaros, esto sería un procedimiento
en el que se ha entrenado por separado un estímulo discriminativo positivo
y otro negativo, pero en momentos separados. Es como si lo hubiésemos
hecho por separado. Y luego lo que vamos a hacer es sumar lo que provocan
cada uno de esos estímulos para ver cómo se desplaza el máximo.
Imaginaos que, por un lado, entrenamos a unas ratas para responder a una
luz de 510 nanómetros. Que pongamos que es un verde amarillento. Lo que
sea. Vamos a poner eso. ¿Qué ocurrirá? Bueno, pues lógicamente si solo
entrenamos ese estímulo excitatorio, no hay ningún inhibitorio, el
máximo de respuesta se dará ante esto. Pero lo que decía Spence es que
todos los estímulos son una suma de tendencias. Así que todos los
estímulos tendrán una tendencia excitatoria e inhibitoria en función de
lo parecidos que sean al discriminativo positivo. El estímulo
discriminativo positivo, en este caso, Así que la tendencia excitatoria de
este estímulo será máxima y la inhibitoria mínima cero, ¿no? Hemos
dicho que lo entrenamos por separado. Cogemos otros estímulos con el mismo
grupo de ratitas y vemos a ver cómo generalizan la respuesta. Cuanto más
se separan los estímulos del discriminativo positivo, menos potencial o
potencia excitatoria, es decir, menos hacen que se responda y más potencia
inhibitoria o capacidad inhibitoria tienen. Ves que según nos alejamos del
estímulo, decrece su capacidad excitatoria, es decir, de incitar a la
respuesta y aumenta su capacidad inhibitoria, de inhibir la respuesta.
Bueno, pues ahora imaginaros que con el mismo grupo de ratas pero por
separado, entrenamos con un estímulo inhibitorio, solo un inhibitorio, con
una luz de 495 nm. No aparece aquí, ¿vale? Pero es de 495 nm. Yo que sé,
algo más naranja o rojizo, lo que sea, ¿vale? Vamos a imaginarnos eso. De
nuevo, la máxima, en este caso, inhibición se dará ante 495 nm, es
decir, un poquito más para aquí arriba. Ahí se dará la máxima,
pongamos que es 4. Cuando ponemos estímulos que son diferentes al
estímulo discriminativo negativo, decrece su potencial inhibitorio,
acordaros que este es el delta, este es el negativo, así que lo que hace
es inhibir la respuesta porque en su presencia no hay reforzamiento. Pero
cuanto más nos alejamos, menor es el potencial inhibitorio y mayor el
potencial excitatorio porque cuanto más se diferencia el estímulo, que
indica que no va a haber reforzamiento, más probabilidad hay de que haya
reforzamiento. Veis que cuanto más se aleja, menos inhibición, más
excitación. Bueno, ¿qué pasa ahora si sumamos estas tendencias de manera
global? Las del estímulo excitatorio y las del inhibitorio. Bueno, pues
aquí las tenéis. Sumamos las tendencias excitatorias de ambos, aquí, y
las tendencias inhibitorias de ambos, aquí. Y nos sale el total. Hemos
dicho antes que la respuesta o la conducta del sujeto es la suma de todas
esas tendencias, de todos los estímulos. Bueno, pues vamos haciendo todas
esas sumas. Y recordáis que el estímulo excitatorio era 510, así que se
supone que la máxima respuesta debería darse ante 510. Bueno, pues
fijaros qué ocurre. ¿Ante qué estímulo se da la máxima respuesta? Si
sumamos todas esas tendencias, ya que la máxima respuesta se da ante el
520, separado, es decir, se produce un desplazamiento del máximo hacia un
estímulo superior, porque ¿dónde estaba el estímulo inhibitorio? Aquí
abajo. Es decir, en sentido contrario al estímulo discriminativo negativo
y hacia o más arriba de él. Y tanto más, cuanto más cerca esté. En
este caso se produce un pequeño desplazamiento porque el estímulo, bueno,
está cerca pero no relativamente cerca. ¿Qué nos daría una curva de
este tipo? Bueno, aquí tenéis cómo se produciría esto. Esto es
simplemente el hecho de que los estímulos no producen, o el rango de
activación que produce un determinado estímulo no se limita solamente a
ese propio estímulo, sino que se generaliza a otros, tanto la inhibición
como la excitación. Y la conducta sería el resultado de la suma de todas
esas tendencias y al final se produciría una conducta neta o una suma
neta. Se produciría una activación y produciría un nivel de respuesta y
por esto se produce el desplazamiento del mínimo, del máximo y del
mínimo también. Esta es la explicación del desplazamiento del máximo.
Bueno. Pues ya tenemos esto. Pero ahora vamos a ver otra cosa. Lo que se
denomina efecto de tendencia central. Hasta este momento lo que hemos visto
es una cosa siempre la misma y es una presentación simétrica. Si tenemos
un discriminativo positivo, voy a poner solo el más, lo entrenamos y
después presentamos estímulos para generalizar a un lado y a otro, es
decir, de manera simétrica. ¿No? Valores inferiores y valores superiores.
Y eso nos da la típica curva de generalización. Se responde el máximo
ante el discriminativo positivo o un poco desplazado en función si hay un
negativo, un discriminativo negativo en algún lado. Pero siempre aparece
una curva simétrica. ¿Pero qué ocurre si no hacemos eso? ¿Qué ocurre
si no presentamos los estímulos de esta manera? ¿Qué ocurre si
entrenamos un estímulo para responder ante una luz de 525 nm y luego
generalizamos solo presentando estímulos de menor longitud de onda? Solo
menor, no mayor. ¿O al revés? Entrenamos uno y luego generalizamos solo
con estímulos de mayor longitud de onda. ¿O hacemos lo de siempre, una
presentación simétrica? Este es el experimento que realizaron Thomas y
Jones. Bueno, pues curiosamente la máxima respuesta se da ante el
estímulo original solamente cuando hay una presentación simétrica,
cuando se presentan valores superiores e inferiores igual a los dos lados.
Cuando generalizamos o cuando hacemos una prueba de generalización con
estímulos que están por encima y por debajo. En este caso, longitud de
onda. Sin embargo, en el resto de grupos, si presentamos solo estímulos
con menor longitud de onda, el máximo se desplaza hacia la media de los
estímulos presentados. Lo mismo con los superiores. Si presentamos
estímulos con una mayor longitud de onda, el máximo de respuesta se
desplaza hacia la media de los estímulos presentados. Ya no tiene nada que
ver con el discriminativo negativo, sino con los valores presentados. Se
desplaza hacia la media de estos valores. ¿Qué quiere decir esto? Bueno,
pues para Thomas y Jones esto apoya a lo que se denominó un enfoque
relacional. Las respuestas generalizadas que damos o la forma o cómo
percibimos los estímulos, en este caso los similares o diferentes que nos
parecen y ante qué damos respuesta, no se basa en las características
brutas, en las características absolutas, es decir, en la longitud de
onda, en este caso de la luz, el color de la luz, sino a la escala de la
luz de referencias relativas que tenemos. Si todas las luces que nos ponen
están en un rango que es superior a la que yo he entrenado, yo voy a
generalizar mi respuesta y voy a tender a responder más en el punto medio.
Es decir, calculo dónde está mi punto máximo o hacia dónde respondo
teniendo en cuenta los estímulos o el rango de estímulos con los que
tengo experiencia, los que me han presentado. Si da la casualidad de que
son simétricos, pues me quedaré justo en el que he entrenado. Pero si no
son simétricos, pues buscaré el punto medio de ese rango. Es decir, que
depende de mi experiencia con esos estímulos y lo que yo percibo y la
forma que tengo de discriminar y de realizar este tipo de aprendizaje, no
depende de las características absolutas físicas de los estímulos, sino
de mi experiencia con ellos, el rango de estímulos y la cantidad de
experiencia que tengo con los estímulos con los que he sido entrenado y
con los que luego se me van a presentar. Bueno, esto en cuanto a la
eficacia. Efecto de tendencia central. Pero esto tiene otra interpretación
o mejor aún, tiene una consecuencia. Si aquí hablamos que hacia dónde se
desplace el máximo depende de los estímulos que te han presentado y no de
la presencia de un estímulo discriminativo negativo o delta, ¿qué
pasará si juntamos las dos cosas? Si ponemos un estímulo discriminativo
negativo que lo que hemos visto antes nos dice que el máximo se
desplazará en sentido contrario, pero además sesgamos la presentación de
estímulos y sólo presentamos estímulos en una dirección que nos dice
que ese sesgará o que se desplazará el máximo en el sentido de la media
de los estímulos presentados. ¿Qué pasa si yo presento esta
distribución y resulta que el estímulo discriminativo es este? ¿Hacia
dónde se separará? ¿En sentido contrario al negativo? ¿O en el sentido
que nos dice el efecto de tendencia central? Bueno, pues eso es lo que se
probaron, lo que probaron Thomas y colaboradores en el 91. ¿Y qué
consiguieron? Pues modificar el sentido del desplazamiento del máximo.
Pero ojo, sólo lo consiguieron en humanos. ¿Cómo lo hicieron? Pues fue
muy sencillo. Lo explico muy rápido porque es un experimento muy parecido
a los que ya hemos visto. Imaginaros, tenían que discriminar entre 11
intensidades de luz, desde el 1 hasta el 11, ¿vale? Se presentaban del 1
al 11. En un grupo, el discriminativo positivo era el 2, ¿vale? Y el
negativo, el 4. En otro grupo, el positivo era el 4 y el negativo, es
decir, sí, el estímulo discriminativo negativo era el 2. Veis que hay una
diferencia, ¿no? ¿Qué dice la teoría del desplazamiento del máximo, el
efecto de desplazamiento del máximo, qué ocurrirá aquí? Bueno, pues
según esto, el máximo se debería desplazar hacia el 1, ¿no? Porque se
desplaza en sentido... Esto no es menos 4, ¿vale? Es estímulo
discriminativo negativo igual a 4. Se desplaza en sentido contrario al
discriminativo negativo. Pero tenemos otro efecto. El hecho de que la
presentación está sesgada y casi todos los estímulos son mayores que el
discriminativo positivo. Pues curiosamente se invirtió la dirección del
desplazamiento del máximo. Y el máximo se desplazó hacia el 5. Incluso
más cerca del estímulo discriminativo negativo de lo que ya estaba. Este
no tiene mucho interés porque se cumple lo que dice el supuesto
desplazamiento del máximo. El estímulo positivo era el 4, este el 2, se
desplazó hacia el 7. Estaba igual desesgada hacia este lado, pero aquí
sí que se cumplía porque se separaba del discriminativo negativo. Pero lo
interesante es esto. Lo interesante es que modificando la distribución de
estímulos que se presentaban al sujeto, sesgándolos hacia una dirección,
podíamos incluso cambiar el sentido del desplazamiento del máximo y
acercar ese máximo a valores más cercanos al estímulo delta. Aquel que
señalaba que no hay reforzamiento disponible. Hay que cogerlo un poco con
pinzas. Porque este fenómeno sólo se ha comprobado con humanos y
solamente en algunas ocasiones. No es un fenómeno que se dé siempre. Es
importante cogerlo con cierta prudencia. Hay que experimentar más sobre
él y ver cuáles son las verdaderas razones si realmente es un
desplazamiento del máximo o hay otros factores involucrados. Pero sí que
se ha conseguido un desplazamiento de sentido contrario al esperado. Es
decir, desplazarlo hacia un sitio en el que se supone que responder no va a
dar lugar al reforzamiento. Así que todavía tenemos un fenómeno abierto
que habrá que explorar más. Pero ahí tenéis el dato sobre cómo pueden
incluso variarse los sentidos de desplazamiento del máximo. Bueno, pues
vamos con las explicaciones. Porque hemos visto lo que ocurre. Hemos visto
lo que es la generalización. Es decir, que estímulos que no son los
entrenados tomen control de la conducta y se respondan ante ellos. Y al
revés, la discriminación, el hecho de ser capaz de distinguir entre
estímulos que sí han sido presentados y señalan la presencia de
reforzamiento y estímulos que no han sido presentados y que señalan, o
perdón, estímulos que ante su presencia se señala la ausencia de
reforzamiento. Bueno, pues cómo conseguimos que estímulos generalizados,
es decir, que nunca han participado en una contingencia de aprendizaje. Si
yo entreno con una luz roja, presiono palanca y comida, ¿cómo puede ser
que una luz naranja que nunca se ha presentado también logre que se dé
cierta cantidad de respuestas? Bueno, pues hay varias explicaciones. Las
primeras, pues lo tomaban como una especie de proceso primario,
fisiológico, neurológico, algo relacionado con la forma de nuestro
sistema nervioso y nuestro sistema fisiológico, nuestro sistema de
procesamiento. Por ejemplo, Pavlov utilizaba el concepto de irradiación
como si cada estímulo produjese en nuestro sistema nervioso, en nuestro
cerebro, produjese una activación pero no en una zona concreta asociada a
ese estímulo, sino que se irradíase por otras zonas del córtex dedicadas
al procesamiento de estímulos que compartían características con él. Y
esas zonas hacia las que se irradiaba la estimulación, una especie de
efecto de onda son las que provocaban que también esas zonas dedicadas al
procesamiento de estímulos que compartían características también
adquiriesen parte de ese condicionamiento o parte de esa relación de
contingencia que tenía el estímulo original. Bueno, es una explicación
basada en nuestro sistema o en cómo funciona nuestro cerebro o en un
proceso primario de nuestro cerebro, pero no es muy detallada realmente
cómo se produce eso. Parece que no lo detalla suficiente Pavlov en este
caso. Por lo menos no vamos a ver nosotros cómo lo detalla por supuesto
tiene explicaciones más modernas basadas en investigaciones fisiológicas
sobre el funcionamiento neuronal. Pero ya desde Pavlov empezaban a pensar
en algo así, que esto tenía algo que ver con el sistema nervioso. Hull
decía algo parecido pero se centraba más en la parte psicológica la
parte cognitiva de todo esto. Decía que nuestro cerebro percibía los
estímulos como una horquilla de valores. Es decir, cuando vemos una luz
roja percibimos ese estímulo no como una luz con un determinado valor de
una luz roja sino como una especie de horquilla de valores, como una
especie de rango de valores alrededor de ese color. Y que aquellos lugares
que controlan estímulos o que se dedican a procesar estímulos con valores
cercanos, pues también toman el control. Básicamente lo mismo que dice
Pavlov pero aplicado de otra manera no tanto centrado en cuestiones
fisiológicas sino más en cuestiones psicológicas más en cuestiones de
control cognitivo o de procesamiento de determinados valores y determinadas
dimensiones. Pero bueno, esto no es lo que más nos interesa. Hay otras
teorías que no entienden este fenómeno como un proceso primario, sino que
intentan dar explicaciones más basadas en procesos de aprendizaje en
procesos puramente psicológicos en este caso procesos de aprendizaje.
Vamos a ver tres ejemplos bastante sencillos Ya veréis que no tienen mucha
complicación De hecho vamos a utilizar una diapositiva para cada uno de
ellos. Vamos a empezar con la hipótesis inversa, la hipótesis de Bloch
¿Qué dice? Pues es muy sencillo. Básicamente dice Bloch que los sujetos
generalizan porque fallan al discriminar. Es decir, la generalización el
responder ante muchas cosas que se parecen es un fallo en la
discriminación no son capaces de discriminar entre los estímulos de
prueba y que la capacidad que tienen los sujetos, los organismos para
discriminar un determinado rango de estímulos o un tipo determinado de
estímulos es lo que determina si se generaliza o no se generaliza ¿Apoyo?
Bueno, pues cuando se hacen muchos experimentos o muchos de los
experimentos que se hacen con palomas muestran que ante diferentes
estímulos o ante diferentes rangos de estímulos los gradientes de
generalización son más o menos planos ¿Y de qué depende esto? De lo
sensibles que sea el sistema perceptivo de las palomas a estos estímulos.
Cuantos menos sensibles son esos estímulos más generalización, menos son
capaces de discriminar. Cuanto mejor perciben esos estímulos, por ejemplo
luces que las palomas o longitudes de onda a las que las palomas estén muy
acostumbradas porque su sistema perceptivo sea muy sensible a ese rango de
luces bueno, pues mayor pendiente y mayor discriminación porque son
capaces de discriminarla. La hipótesis inversa del lujo es muy sencilla se
generaliza porque no son capaces de discriminar porque no son capaces de
distinguir entre esos estímulos. Eso depende seguramente del
funcionamiento del sistema perceptivo. De cómo de sensibles son nuestros
sistemas perceptivos a determinados rangos de estímulos Siguiente, la
teoría atencional Hemos visto algo de la teoría atencional de Sutherland
y Macintosh y ya lo hemos visto en otros temas y hemos hablado sobre la
atención a los rasgos pertinentes y las discriminaciones ¿Os acordáis
cuando hablábamos de este tipo de aprendizaje? Bueno, ¿qué dicen ellos?
Pues que cuando no se es capaz de discriminar cuando se generaliza lo que
ocurre es que no atendemos de manera adecuada al rasgo pertinente, es decir
no hemos atendido al rasgo que determina la diferencia entre los dos o
entre los diferentes estímulos y por eso no distinguimos entre ellos y
generalizamos y respondemos igual ante todos ¿Qué dicen? Bueno, pues
¿Cómo lo explican? Pues con dos procesos diferentes que ocurren en
nuestro sistema nervioso Primero, el cerebro procesa la información cada
tipo de información por canales específicos Por ejemplo el color el
tamaño, las diferentes dimensiones de un estímulo se procesan en sitios
diferentes, en sitios específicos esto ya es tema de percepción que
veréis el año que viene, pero cada parte del estímulo a nivel cognitivo
se apoya en diferentes canales que procesan esas cualidades, esas
dimensiones o esas características Antes de que entrenemos nada, cada
parte del estímulo, por ejemplo un círculo de color negro, pues se
procesa por una parte la forma, por otra parte el color y la fuerza de cada
una de esas características depende de su saliencia Cuanto más saliente
sea una dimensión para un organismo determinado más fuerza tiene ese
analizador o más fuerte es el procesamiento de esa característica. ¿Qué
hace el reforzamiento? Bueno, cuando lo sometemos a un proceso de
reforzamiento variaría la fuerza de los analizadores Si el color está
relacionado con el reforzamiento pero no la forma, el color se hará más
saliente Los sujetos atenderán más a esa dimensión porque está
relacionada con el reforzamiento y esa dimensión más saliente que es a la
que se atiende porque es la relacionada con el condicionamiento se
condiciona más porque es la relevante, es la saliente Es decir, se
desarrolla un vínculo entre la respuesta que doy y un analizador
específico de una característica. De claro hay una tecla roja y el
analizador del color Es decir, presionar cuando hay una tecla roja o
presionado la tecla roja y ese analizador. Si yo no presto suficiente
atención a la dimensión relevante o si no atiendo a la dimensión
relevante, sea por lo que sea no se formará este vínculo y en ese caso la
discriminación será peor No seré capaz de discriminar entre diferentes
teclas porque no estoy prestando atención y no está aumentando la fuerza
del aprendizaje y del vínculo entre esa respuesta y esa dimensión
concreta que quiero analizar Bueno, eso es la teoría atencional a grosso
modo, por supuesto esto merecería mucho más tiempo del que le podemos
dedicar pero a grosso modo la teoría atencional de Shatterland y McIntosh
Y por último, la teoría de la respuesta múltiple de Staddon y ya hemos
visto también cosas como esta. ¿Os acordáis también del momento en el
que vimos las respuestas terminales y las respuestas de Interim? ¿Os suena
de la conducta supersticiosa que lo vimos ya hace tiempo? ¿Cómo
funcionaba y qué tipo de conductas había en cada momento y cómo se
podía condicionar ciertas respuestas que no tenían que ver con el
reforzamiento porque aparecían en el momento exacto o concreto cuando
caía o cuando apareció un reforzador? Bueno, no nos vamos a meter ahora
con eso Lo importante de esto es que toma la conducta como algo mucho más
general y además elimina el concepto de inhibición y lo sustituye por
otro concepto que es el de competición entre respuestas En general, ¿qué
hacemos en los experimentos en psicología, en aprendizaje? Pues atendemos
a una sola conducta. La conducta que tratamos de reforzar Esa es nuestra
variable dependiente, es decir presionar una palanca. Si aparece una luz
roja y si aparece una luz roja te dan comida si tú presionas la palanca,
pues nosotros nos dedicamos a ver cuántas veces presiona la palanca o
cómo aumenta la presión de la palanca en presencia de la luz roja Pero la
realidad es que la conducta es mucho más compleja y una ratita o una
paloma en una caja de esquina no solamente está presionando palancas
porque en presencia de la luz roja será más probable la presión de la
palanca ¿Pero qué ocurre cuando hay una luz verde y no hay reforzamiento?
Solemos decir que en presencia de la luz verde lo que se refuerza o lo que
indica es que no hay que responder pero no es verdad En presencia de la luz
verde no se responde pero la rata, la paloma o cualquier organismo está
realizando otras conductas está haciendo otras cosas que también entran
dentro del proceso de aprendizaje así que lo que hay es una competición
entre además esas respuestas también generan ciertos reforzadores es
decir, si ante la luz verde no hay comida pero yo, la paloma por ejemplo
empieza a rascarse rascarse también genera un reforzamiento evita que le
pique algo o quita el picor así que empieza a haber una competición entre
respuestas que se dan cuando no está el estímulo discriminativo positivo
y las respuestas asociadas al estímulo discriminativo positivo Es decir
terminamos la limitación del análisis a una sola conducta incluimos el
resto de conductas del sujeto ¿Qué decía Stadon? Lo mismo que en el otro
porque esto es una teoría general que sirve para muchos tipos de
aprendizaje Dos tipos de conductas las conductas terminales las que están
controladas por la presencia del estímulo discriminativo positivo Una luz
roja nos indica que si pulsamos la palanca aparece comida La conducta
terminal sería la pulsación de la palanca ¿Qué fortalece esta conducta?
¿Qué hace que sea más probable? Pues el que aparece el reforzador, la
comida Pero hay otro tipo de conductas las de interin cuando no está
presente la luz roja o cuando está presente una luz verde que nos indica
que no hay reforzamiento aparecen otras conductas por ejemplo rascarse dar
vueltas sobre un amigo descansar o sentarse cualquier cosa que haga el
organismo en ese momento y esas también son reforzadas son reforzadas por
el mero hecho de que esas conductas, por ejemplo son reforzantes o por
otros eventos que nosotros ni siquiera sabemos que existen porque no los
hemos programado Así que ¿qué ocurrirá cuando presentamos diferentes
luces que no son las originales no son ni la positiva, ni el discriminativo
positivo y el negativo? Pues que se produce una competición entre la
respuesta terminal que hemos entrenado cuando está presente el
discriminativo positivo y el resto de respuestas que han sido reforzadas de
otra manera fuera de nuestro programa que se dan cuando no está ese
estímulo así que compiten en función de la semejanza con un estímulo o
con el resto de estímulos unas conductas, las terminales o las de interin
tendrán más o menos potencia Así que esa combinación de fuerzas hará
que se responda más o menos a la palanca y el resultado serán los
gradientes de generalización es decir, que la competición ya no es entre
responder y no responder es entre responder como quiere el experimentador y
todo el resto de conductas que pueden competir con esa respuesta sobre todo
cuando no está presente el estímulo discriminativo positivo que refuerza
esa conducta concreta ¿De acuerdo? Bueno, pues hasta aquí el tema 6.
Vamos a pasar directamente al tema 7 al último tema del libro Aquí vamos
a hablar sobre todo de control aversivo es decir, de procedimientos en los
que las consecuencias son aversivas, son desagradables y de las
particularidades que tienen estas consecuencias aversivas a la hora de
entrenar o a la hora de desarrollar un aprendizaje, en particular en el
condicionamiento operante nos vamos a centrar en el condicionamiento
operante pero veréis que que nos centremos en el condicionamiento operante
no significa que sólo vayamos a hablar de condicionamiento operante porque
lo primero que vamos a ver es algo que llevamos diciendo durante todo el
cuatrimestre que las contingencias operantes y clásicas se dan a la vez en
todo tipo de aprendizaje no están separadas y vamos a ver lo importante
que es esto en los procedimientos que utilizan estímulos aversivos porque
algo que es el condicionamiento de emociones o las reacciones emocionales
van a condicionar la forma en que adquirimos ciertos aprendizajes Bueno,
veréis que si vais por el libro me salto algunas cosas son las que ya
hemos visto porque en este tema hay incluso al principio un apartado el 1.1
en el que vuelve a repasar todos los procedimientos de condicionamiento
operante el de recompensa, evitación todo eso ya lo vimos así que no me
voy a detener de nuevo solamente en el enfoque de castigo y evitación y
escape que son las partes fundamentales del tema Bueno lo primero que
tenemos que tener en cuenta los individuos estamos adaptados a reaccionar
rápidamente ante peligros, es decir ante estimulaciones aversivas que
pueden ser peligrosas cualquier evento que cause dolor depredadores,
cualquier cosa nociva peligrosa porque es importantísimo para sobrevivir
como reaccionamos ante estímulos peligrosos o estímulos dolorosos o
estímulos desagradables es muy relevante para nuestra supervivencia lo que
suele hacer nuestro organismo ante estímulos peligrosos desagradables o
biológicamente relevantes en el sentido negativo pues una serie de
reacciones fisiológicas básicamente lo que estoy diciendo es que esto se
comporta como un estímulo incondicionado estímulos que generan una
respuesta innata elicitan una respuesta automática que se llama respuesta
incondicionada pues estas reacciones fisiológicas son las más generales
así es como nos preparamos ante las amenazas esto es la base de la
ansiedad el hecho de que nos preparamos ante una amenaza aumentar nuestra
tasa cardíaca y bueno si esto se mantiene en el tiempo durante mucho
tiempo genera un síndrome crónico que es bastante peligroso trastorno por
estrés o trastornos de ansiedad bueno, esto es la preparación de nuestro
organismo ante las amenazas y esto esta reacción fisiológica hace que se
den ciertas respuestas estereotipadas en función de la especie de las
amenazas las clásicas, la huida la paralización si un animal tiene miedo
en muchas ocasiones si puede ir, huye si no se paraliza y como último
recurso si no puede hacer nada de lo anterior la agresión pero siempre
como último recurso en general porque es la más peligrosa de todos
agredir generalmente tiende a tener un riesgo muy grande porque te pueden
agredir a ti también así que es mucho mejor en la naturaleza no se buscan
peleas que intentar agredir a nadie así que esto siempre será una última
opción bueno, estas conductas son específicas de especies de contexto y
también de los diferentes estímulos es decir, no se dan todas ante todos
los estímulos depende de cuál es el estímulo amenazante el contexto en
el que nos encontremos la situación y la especie que sea pues tendrán una
tendencia mayor o menor a diferentes tipos de respuestas bueno, esto parece
más una perspectiva clásica pero ¿qué ocurre desde el punto de vista
operante? ¿qué serán? consideramos estímulos aversivos aquellos que los
organismos evitan o aquellos de los que los organismos escapan esto es una
perspectiva más operante no relacionada con la respuesta que licitan sino
que con lo que hacemos o con la respuesta que damos ante ellos en función
de lo que causen, en función de sus consecuencias lo que hacemos
normalmente ante estímulos aversivos es huir escapar, dar una respuesta de
evitación o de huida bueno, perfecto ¿qué características específicas
tienen estos procedimientos de condicionamiento operante? y ¿qué ocurre
en el caso de los procedimientos de condicionamiento operante que utilizan
estímulos aversivos? bueno, pues que producen estados emocionales
específicos ¿y por qué ocurre esto? porque las contingencias clásicas
lo que hemos dicho, el condicionamiento clásico y el condicionamiento
operante en la vida real se encuentran entremezcladas, por ejemplo un
estímulo incondicionado por ejemplo la comida que provoca salivación
también sirve para reforzar, lo estamos viendo durante todos los temas,
tenemos una luz roja, una palanca y cae comida, la comida sirve como
reforzador de la presión de la palanca pero ¿qué provoca también la
comida? salivación y como respuesta incondicional ¿y a qué es
contingente o con qué es contingente la aparición de comida? pues
curiosamente es contingente con la presión de la palanca y también con la
aparición de la luz roja así que aparte de aumentar la probabilidad de la
presión de la palanca, ¿qué va a provocar la luz roja al final? venga,
alguien lo tiene que saber ¿qué ocurre con la luz roja? voy a esperar a
que me lo diga ese anuncio ¿qué ocurre con la luz roja en un
procedimiento de condicionamiento operante en el que reforzamos con comida?
un estímulo discriminativo positivo ¿en qué se convierte también?
¿qué provoca? me lo doy diez segundos para ello ¿qué provoca? desde el
punto de vista del condicionamiento clásico bueno, se convierte en un
estímulo condicionado es decir, ante la aparición de la luz roja el
organismo va a empezar a salivar va a empezar a dar la respuesta
condicionada porque este estímulo ha aparecido contingentemente siempre
con la comida, así que aumenta la probabilidad de respuesta y encima el
organismo empieza a salivar a producir la respuesta condicionada asociada a
este estímulo incondicional veis como los dos procedimientos están unidos
en la vida real condicionamiento operante y condicionamiento clásico no
son dos cosas distintas y separadas en el mundo, sino que se encuentran
relacionadas y ocurren a la vez cuando estamos realizando un experimento o
cualquier circunstancia o contingencia de aprendizaje así que se
convierten en heces pero cuando utilizamos estímulos negativos, bueno no
solo con los estímulos negativos con cualquier estímulo que produzca una
reacción por sí misma, con cualquier estímulo incondicionado o con
cualquier reforzador se van a generar por condicionamiento también estados
emocionales, es decir no solo vas a salivar, sino que si sabes que después
de la luz roja siempre aparece comida, salivaras y generas un estado
emocional de alegría o de esperanza o de ilusión, como lo queráis llamar
pero este será el estado emocional si ante la luz roja aparece un
estímulo aversivo como una descarga el estado emocional que se va a
generar es el de ansiedad si ante la luz roja retiramos el reforzador es
decir, ya no aparece el reforzador lo que sentiremos es tristeza y si ante
la luz roja lo que retiramos si presionamos la palanca es la comida
perdón, la descarga si retiramos la descarga es decir, retiramos un
estímulo aversivo sentiremos alivio cada uno de estos procedimientos está
asociado al desarrollo de estados o reacciones emocionales en el sujeto que
ocurrirán por condicionamiento clásico a la vez que ocurren las
contingencias del condicionamiento operante que nosotros estamos
programando ocurren a la vez y no las podemos controlar de hecho serán
parte de nuestra contingencia de aprendizaje bueno esto es muy importante
el desarrollo de respuestas emocionales va a determinar la eficacia y
algunos de los efectos secundarios de muchos de los procedimientos que
vamos a ver en particular el castigo el castigo positivo tiene efectos
emocionales el miedo, el desarrollo de miedo que tiene un efecto muy
concreto ¿qué hace el miedo? inhibe la conducta cuando tú haces alguna
acción sea la que sea aunque lo haga mal un niño se porta mal y viene y
además es su padre le pega un azote ¿qué ocurrirá? el niño grita y
siempre que grita llega su padre y le da un azote el niño probablemente
dejará de gritar pero ¿por qué lo hace? lo hace porque ha sido reforzado
negativamente es decir, se le ha castigado por esto y eso reduce la
conducta disminuye la probabilidad de conducta o lo hace porque desarrolla
miedo al padre y eso inhibe la conducta bueno, pues la realidad es que lo
hace por las dos cosas ¿vale? las dos cosas ocurren a la vez se desarrolla
miedo que inhibe la conducta es decir, las consecuencias aversivas inhiben
la conducta se produce una reacción de defensa y de inhibición conductual
pero también tienen efecto las consecuencias operantes es decir, el
reforzamiento esto es lo que decía la teoría de la respuesta emocional
condicionada de Estes, del año ya 1944 ¿qué hace un estímulo
condicionado excitatorio aversivo? pues provoca respuestas emocionales en
este caso el estímulo condicional excitatorio aversivo es el padre que es
el que va asociado al azote siempre que el niño hace algo da un azote
¿quién da el azote? el padre es decir, la presencia del padre es la que
se asocia al dolor en este caso, al que te den un azote y eso desarrolla
respuestas de paralización el miedo desarrollado desarrolla respuestas de
paralización y eso es incompatible con la respuesta del sujeto es decir,
si el niño solía gritar y por eso le pegaban el estar paralizado es
incompatible así que suprime la conducta ¿qué ocurre? pues que
generalmente cuando estamos en estas situaciones no hay un estímulo
condicionado explícito es decir, no ponemos una luz roja al niño para que
sepa que eso va a llevar al azote ¿qué se condiciona en este caso? pues
se condiciona todo lo que hay alrededor se condiciona el padre se
condiciona la casa si es donde le han dado el azote, se condicionan las
otras personas que están allí es decir, todo lo que hay en el contexto,
en la situación acaba siendo un estímulo condicionado, algo que se ha
condicionado al estímulo incondicionado en este caso, el azote es decir,
lo que produce dolor, al estímulo aversivo y todos pasan a cumplir esa
función ¿veis lo peligroso que puede llegar a ser un castigo si no está
bien aplicado si no es adecuado para lo que puede ocurrir con la conducta y
las derivadas que tiene sobre la conducta y sobre lo que va ocurriendo
porque ocurren muchas cosas en un proceso de aprendizaje y no muchas las
tenemos controladas así que podemos organizar un caos constructual
bastante grande si creemos que podemos hacer algo sin que haya unas
consecuencias derivadas o unos efectos secundarios derivados de la
aplicación del determinado proceso así que, una de las cosas que tenemos
que tener muy en cuenta no quiere decir que el castigo no se deba aplicar
nunca en ninguna situación simplemente hay que tener muy en cuenta que
cuando lo estamos aplicando tenemos que tener mucho cuidado con controlar
todas las posibles variables y que van a ocurrir muchas cosas aparte de la
que nosotros queremos entonces da la sensación que la forma más fácil de
suprimir la conducta es un castigo metes en la cárcel a alguien, pegas a
alguien lo que sea, y queremos que así va a funcionar pero eso lleva una
serie de derivadas y muchas veces puede ser lo más fácil pero no siempre
tiene por qué ser lo más útil vamos a seguir con ello y vamos a empezar
con la conducta de evitación evitación barra escape recordáis que era lo
mismo el escape es cuando la respuesta se da una vez que ya había
aparecido el estímulo desagradable y la evitación era cuando la respuesta
se daba antes de que apareciese y por tanto no se llegaba a sufrir el
estímulo desagradable bueno hay una cosa muy interesante en este tipo de
aprendizaje, en el de evitación cuando el escape se convierte en
evitación es el que mayor atención ha recibido por esta misma razón por
la razón que os voy a comentar y es el reto teórico que supone intentar
explicar cómo aparece sobre todo cómo se mantiene una conducta cuya
consecuencia es la ausencia de un estímulo aversivo, imaginaos caja de
esquina tenemos una luz roja que señala la presencia o que va a aparecer
una descarga en el suelo pero si tu pulsas la palanca evitas que la
descarga, al principio no lo sabes así que aparece la luz roja aparece la
descarga y cuando descubres que presionando la palanca desaparece genial la
luz roja se asocia a la descarga así que hay una razón para pulsar la
palanca pero qué pasa cuando aprendes y una vez que ves la luz roja pulsas
la palanca antes de que aparezca la descarga cómo se mantiene esa conducta
sin que haya consecuencias porque ya no tienes acceso a las consecuencias
se está extinguiendo la conducta la luz roja ya no señala o ya no es
contingente a la descarga porque la descarga nunca llega a aparecer la
conducta tampoco está siendo reforzada por evitar la descarga porque la
descarga nunca llega a aparecer cómo se mantiene esa conducta si ya nunca
aparece la descarga si ya nunca aparece la consecuencia todo lo que hemos
visto hasta ahora dependía de la aparición de las consecuencias ahora ya
no aparecen y sin embargo se mantienen, al principio se pensaba que esto
tenía que ver sólo con el condicionamiento clásico es decir este
estímulo, la luz roja señalaba la aparición de una descarga sin embargo
Besterev en el XIII empezó a estudiar esta conducta fuera del
condicionamiento clásico como una parte del condicionamiento pedante, es
decir la descarga, el estímulo incondicionado no aparece si se presenta
una respuesta él lo hizo con una con una descarga que se daba a los dedos
y tenían que dar una especie de respuesta lo curioso es que para evitar lo
que producía la descarga era una una especie de reacción refleja sobre
los dedos entonces cuando hacían esa reacción refleja desaparecía la
descarga poco a poco y lo hizo con varios grupos uno no podía evitar la
descarga uno simplemente recibía la descarga y se producía la respuesta
incondicionada, eso lo asociaba por ejemplo a la aparición de un estímulo
y cada vez que veían el estímulo por ejemplo a la roja se producía la
respuesta condicionada pero lo que vio en este caso Bechberev es que la
capacidad que tenían de adquirir el aprendizaje, es decir de realizar
ellos por sí mismos la respuesta de quitar el dedo era mucho más alta si
se podía evitar la descarga si ellos eran capaces de evitar la descarga,
si veían la luz que anticipaba la descarga, pero podían evitar que
apareciese, la velocidad era mucho más rápida. ¿Qué quiere decir esto?
Que eso no era una respuesta ilicitada, no era una respuesta refleja ante
la aparición de una luz por condicionamiento clásico sino que era una
respuesta operante que se daba de manera voluntaria para evitar una
situación desagradable un estímulo desagradable es decir, la supuesta
respuesta condicionada por condicionamiento entre un estímulo
incondicionado y una luz no era tal respuesta condicionada había un
componente de condicionamiento operante de evitación bueno, pues ese fue
el principio y se han utilizado a partir de ahí se empezaron a utilizar
diferentes procedimientos de evitación vamos a ver varios de ellos varios
procedimientos de evitación desde la perspectiva del condicionamiento
operante el primero es la evitación discriminada bueno, aquí me parece
que os ha salido voy a cambiarlo no sé si os sale en azul a vosotros
porque os sale de color azul la pantalla porque el no sé os lo seguís
viendo bien es que a mí me sale ahora, ya está se me había puesto todo
en azul y no sabía por qué debió ser un fallo porque he pulsado en un
lado de la pantalla vale, ya está perfecto evitación discriminada ¿por
qué se llama así? porque hay claves claves que nos señalan el
acontecimiento todo lo que os he ido diciendo hasta ahora son evitaciones
discriminadas por ejemplo, una luz nos señala que va a aparecer una
descarga y podemos pulsar la palanca para evitarlo esto en general utiliza
ensayos discretos es decir tenemos un evento neutro una señal, una luz
roja si no respondemos nos pegan un chipazo hasta que respondemos hasta que
presionamos el botón o la palanca en los ensayos en los que aparece el
evento la luz roja que nos señala la aparición de la descarga y se
produce una respuesta es decir, respondemos la señal desaparece esto es
importante la luz roja desaparece y nos emite la descarga es decir, dos
posibilidades aparece la luz roja, no respondemos descarga hasta que
respondamos aparece la luz roja, respondemos la luz roja se apaga y la
descarga no llega esto ensayo a ensayo esto es un proceso al principio
suele empezar por escape como no sabes lo que tienes que hacer aparece la
luz roja, te quedan mirándola como un bobo te dan un chipazo y hasta que
descubres que tienes que presionar la palanca no se quita la descarga y
desaparece la luz con el paso del tiempo aprendes eso y cada vez que ves la
luz roja presionas la palanca la luz roja desaparece y no llega nunca a
aparecer la descarga es decir, pasa del escape a la evitación ¿qué
relaciones de contingencia qué contingencias tenemos presentes en este
tipo de situación? tenemos tres elementos tenemos una señal que sería el
estímulo discriminativo que hemos visto antes, pero ahora lo llamamos
señal da igual, la nomenclatura sigue siendo lo mismo tenemos la respuesta
y tenemos la consecuencia las tres términos de siempre del
condicionamiento operativo ¿qué contingencias tenemos? ¿qué estímulos
se relacionan con qué? bueno, pues la respuesta se relaciona con la señal
de aviso si emitimos la respuesta, ¿qué hemos dicho? desaparece la señal
está la luz roja encendida, emitimos la respuesta y se apaga la luz roja
ya tenemos una contingencia contingencia, respuesta y consecuencia cuando
respondemos, presionamos la palanca desaparece o no llega a aparecer la
descarga recordad, luz presión de palanca descarga y tenemos otra
contingencia que es la contingencia que hay entre la señal de aviso y la
consecuencia fijaros muy bien en esto ¿de qué depende esa contingencia?
pues depende de nuestra respuesta si no respondemos, y esto ocurrirá sobre
todo al principio, siempre que aparece la luz roja aparece una descarga os
imagináis que ocurriría en este caso se condicionará la luz roja a la
aparición de la descarga es decir, pasará a ser un estímulo condicionado
pero según vayan pasando los ensayos como respondemos, nunca aparecerán
conjuntamente la luz roja y la descarga porque habrá evitado la descarga
pulsando así que según van avanzando los ensayos se produce un proceso de
extinción al principio se ha condicionado la luz roja a la aparición de
la descarga pero luego nunca aparece la descarga después de la luz roja,
así que empieza a extinguirse ese proceso de condicionamiento fijaros,
esto es lo importante para la explicación que vamos a dar ahora cómo se
mantiene la conducta de evitación si nunca llega a aparecer la descarga
bueno, antes de empezar las explicaciones varias cosas que decir sobre este
procedimiento de evitación, primero es mucho más difícil adquirir este
aprendizaje que un programa de reforzamiento positivo es decir, es mucho
más fácil presionar una palanca para obtener comida que presionar una
palanca ante la presencia de una luz para evitar una descarga mucho más
difícil se necesitan mucho más ensayos ¿por qué? bueno, pues hay dos
posibles explicaciones primero la interferencia de la conducta licitada es
decir, del condicionamiento clásico que licita la presencia de la luz si
se ha condicionado a la descarga la paralización y eso dificulta que tú
puedas realizar cualquier conducta si tú tienes que darle una palanca para
evitar una descarga pero resulta que la luz que te indica que tienes que
presionar una palanca se ha condicionado a la aparición de descarga y
produce una respuesta condicionada de paralización pues estar paralizado
es incompatible con presionar palancas así que te va a costar mucho más
porque entran en conflicto hay una interferencia entre los dos tipos de
condicionamiento que se dan en esta situación segundo la especificidad de
la conducta requerida en función de la especie es decir, cuanto más
parecida sea la respuesta que requerimos a la respuesta condicionada,
automática la respuesta que se da o la respuesta condicionada que se da
ante el estímulo condicionado es decir, cuanto más se parezca a la
respuesta que requerimos a la respuesta innata que daría el sujeto ante la
aparición de la descarga mayor velocidad de aprendizaje es decir, por
ejemplo imaginaros que requerimos pulsar una palanca para evitar la
descarga esto será mucho más lento que si lo que requerimos en la rata
para evitar la descarga es saltar lejos de la descarga esta respuesta de
salto de alejarse del lugar donde está la descarga es mucho más parecida
a la respuesta natural que daría la rata si cree que le van a dar una
descarga así que ese aprendizaje sería mucho más fácil interferencia
del condicionamiento clásico y especificidad o relación o parecido de la
conducta que queremos entrenar con la conducta innata que se daría ante
ese estímulo pues ya tenemos algunas cosas sobre esto ¿y cómo lo
explicamos? vamos a ver dos posibles explicaciones una que tiene que ver
con el miedo el desarrollo de miedo recordad que estamos dando la descarga
y otra que prescinde del miedo vamos a verlo primero, la teoría
bifactorial de Mower es la que ha sido más influyente la más desarrollada
cómo reforzamos una conducta a través de algo o de no cómo reforzamos
presionar una palanca para evitar una descarga si nunca aparece la descarga
bueno, pues vamos a verlo es un proceso como dice él de dos factores o que
están implicados dos procesos el condicionamiento clásico del miedo
recordáis que aparece al principio la descarga cuando todavía ese escape
asociado siempre a la aparición de la señal que nos indica cuando podemos
pulsar la palanca que va a aparecer la descarga porque la descarga da miedo
y si esto se condiciona a la aparición de la descarga este estímulo
condicionado empieza a dar miedo y por otro lado el condicionamiento
operante de la respuesta de habitación ¿por qué? pues porque, de nuevo
en la misma situación tenemos la luz roja, tenemos la palanca y la
descarga cuando aparece la luz roja y nosotros presionamos la palanca
evitamos que aparezca la descarga cuando aparece la luz roja tenemos miedo
así que presionando la palanca que evita la descarga ¿qué hacemos?
reducimos el miedo ¿cuál es el reforzador de la presión de la palanca?
la reducción del miedo porque desaparece recordad que siempre que
presionamos desaparece este estímulo la reducción del miedo derivada de
la desaparición del estímulo que se ha asociado clásicamente o
misacondicionado a la aparición de la descarga proceso la señal, la luz
roja, se condiciona la descarga porque al principio se aparecen juntos así
que al final la luz roja se condiciona y empieza a provocar una respuesta
condicionada de miedo, la misma que provocaría la descarga como la
respuesta no es lo suficientemente rápida para evitar la descarga, es
decir todavía no estamos en evitación sino en escape, esto ocurre se
condiciona la señal a la descarga bien, con el paso de los ensayos el
sujeto emite la respuesta para escapar del miedo así que termina evitando
la aparición de la descarga y ya no aparece esa descarga ¿qué ocurre en
ese caso? como ya no aparece la descarga esta relación clásica entre el
condicionamiento clásico entre la luz la señal y la descarga empieza a
extinguirse, se extingue esa relación porque ya no aparece nunca la luz
seguida de la descarga así que empieza a extinguirse ¿qué ocurre cuando
se extingue esa relación de miedo? pues que empezamos a dejar de dar la
respuesta porque esto nos deja de dar miedo la presión de la palanca deja
de reducir el miedo porque ya no aparece miedo ante esto así que dejamos
de presionar la palanca esto vuelve a aparecer esto vuelve a condicionarse
y vuelve a hacer que presionemos la palanca ¿veis el ciclo? se condiciona,
presionamos la palanca evitamos la descarga, se extingue como eso se
extingue y no se presiona la palanca vuelve a aparecer la descarga y vuelve
a retroalimentarse estaríamos en ese ciclo continuamente bien, esta es la
hipótesis de Mogul la hipótesis bifactorial condicionamiento del miedo y
dos tipos de procesos el condicionamiento del miedo y la reducción del
miedo a través de la presión segundo, la hipótesis de Schoenenfeld de
1950, un poquito posterior bueno, pues elimina el miedo ¿qué adquiere? ya
no habla de miedo es que la señal por su asociación con la descarga
porque cuando aparece la luz roja como todavía al principio no estamos
respondiendo aparece la descarga y por lo tanto esta luz adquiere funciones
de estímulo condicionado aversivo ¿recordáis que cuando hablábamos de
estímulos de condicionamiento clásico decíamos que estímulos que han
sido condicionados suceden a un estímulo incondicionado, por ejemplo
cuando asociamos la aparición de comida a la presencia de bueno, a la
presencia de una luz una luz roja y después aparece comida la luz roja
termina generando la respuesta condicionada a salivación pero a la vez esa
luz roja ahora puede ser utilizada como estímulo incondicionado como
estímulo incondicionado de segundo orden en un condicionamiento de segundo
orden ¿por qué? porque ese estímulo condicionado adquiere las
características del estímulo incondicionado original pasa a ser un
estímulo incondicionado de segundo orden bueno, pues esa sería la
función que adquiere la señal ¿por qué emiten la respuesta de escape
entonces? porque se retira la señal como la señal en sí misma pasa a ser
aversiva porque se ha condicionado la descarga, los sujetos pulsan esta
palanca porque hace desaparecer la señal y hace desaparecer la situación
aversiva es decir, sería una cuestión de reforzamiento negativo
secundario, como esto ya ha adquirido la capacidad de ser un estímulo
incondicionado en sí mismo, no hace falta aludir al miedo se responde para
evitar la consecuencia desagradable que ya proporciona esto por su
asociación con la descarga bueno, pues aquí tenemos las dos explicaciones
para este tipo de conducta pero tenemos más tipos de procedimientos para
la conducta de evitación o para provocar una conducta de evitación o más
situaciones de aprendizaje de evitación es lo que se denomina la
evitación no discriminada de operante libre de Schindler que es el nombre
más largo y más difícil de aprenderse que existe en el mundo y que luego
es algo bastante sencillo ¿qué se hace en este caso? bueno, pues tenemos
una caja de Skinner y aquí prescindimos de las señales, por lo menos de
las señales explícitas, aunque siempre hay señales ahora vamos a ver
algo sobre esto tenemos un suelo electrificado, así que programamos una
descarga cada cierto tiempo cada 10 segundos un chipazo sin previo aviso,
simplemente estás tan tranquilo y de repente te sueltan una descarga cada
cierto tiempo pongamos cada 10 segundos pero ponemos una palanca aquí y
especificamos que si presionas la palanca la la conducta de presionar la
palanca retrasa la aparición de la de la descarga por un tiempo, es decir
si yo no hago nada, cada 10 segundos una descarga eh la descarga se
mantiene hasta que pulso la palanca lógicamente, y luego pasan otros 10
segundos y no pulso, pero si entre descarga y descarga yo pulso hay un
tiempo de seguridad, es decir retrasa la descarga, por ejemplo pongamos 5
segundos no hay descarga, yo no hago nada, descarga hasta que no pulso no
desaparece eso me proporciona un tiempo de seguridad o otro intervalo de
descarga si no hago nada, de nuevo vuelve a aparecer la descarga pero si yo
voy pulsando cada cierto tiempo, voy retrasando la descarga y la descarga
no llega a aparecer nunca veis, al final los sujetos lo que terminan es
aprendiendo a ir pulsando cada cierto tiempo, o pulsar siempre la palanca
para evitar que aparezca la descarga. ¿Cómo se mide todo esto? o
¿cuáles son las características del tipo de aprendizaje? bueno pues se
caracteriza por dos tipos de intervalo, quedaros bien con esto, el
intervalo ee, er, er o dicho de otra manera aquí los nombres son
peleagudos, reloj choque, choque, que viene a ser básicamente el intervalo
entre descargas y no hay respuestas, es decir si yo no respondo y me dan
una descarga cada 10 segundos, el intervalo ee, er, er, er rr, rr o reloj
choque, choque es un intervalo de 10 segundos y otro intervalo que es el
erre, rer o reloj, respuesta choque, que con ese nombre tan complicado no
es nada más que el intervalo entre una respuesta y la descarga programada
es decir, el periodo de seguridad que me da la respuesta, si yo presiono la
respuesta ¿cuánto retraso la aparición de la descarga? aquí hemos dicho
5 segundos, bueno pues esto es lo que define este procedimiento y esto es
operante libre, aquí no hay que hacer varios ensayos, aquí dejamos a la
ratilla dentro y la ratilla va aprendiendo va operando libremente en el
entorno para evitar la descarga ¿qué ocurre con esto? bueno pues primero
son procedimientos mucho más largos, se tarda muchísimo más en aprender,
de hecho muchas veces no aprenden nunca, y por último hay grandes
diferencias entre sujetos, unos aprenden muy rápido otros aprenden más
despacio, y ese aprendizaje depende mucho de estos intervalos, de los
intervalos de seguridad y de los intervalos de respuesta, bueno es otro
procedimiento, el procedimiento de operante libre en el que ya no hay
claves, antes era una invitación discriminada, o sea que habéis aprendido
aprendizaje discriminativo, había unas señales que nos indicaban cuando
iba a aparecer, aquí no lo hay, bueno no lo hay, ¿creéis que no lo hay?
o ¿creéis que hay alguna señal? he dicho que no hay señales explícitas
pero tenemos alguna señal implícita ¿no? porque si fijamos un intervalo,
ese tiempo es una señal en sí mismo el paso del tiempo actúa como señal
para la aparición de descarga por eso vamos a ver una última conducta
vamos a ver primero las hipótesis sobre sobre este tipo de conducta y por
último veremos la última el último procedimiento de evitación con
descargas aleatorias en el que ya sí que no hay ningún tipo de señal,
pero vamos a ver primero las explicaciones que se dan para este tipo de
conductas vamos a empezar con la hipótesis, o sea por qué los sujetos
aprenden este tipo de situaciones en la situación de de evitación no
discriminada vamos a ver por qué ocurre esto tres tipos de explicaciones o
tres diferentes explicaciones, una de ellas bastante moderna además bueno,
¿cuál sería nuestra señal de aviso? pues para Sidman que es el que
desarrolló este procedimiento sería la propia conducta del sujeto ¿por
qué? no sólo el paso del tiempo sino también la conducta del sujeto,
¿por qué? pues porque resulta que todas las conductas que realiza el
sujeto se asocian a la descarga, si el sujeto da vueltas, descarga, si el
sujeto salta, descarga, si el sujeto se sienta, descarga, todas menos una
la presión de la palanca si el sujeto presiona la palanca no ocurre ¿qué
ocurre? pues que todo el resto de conductas que se dan durante el intervalo
generan ansiedad porque se asocian a la aparición de la descarga ¿cómo
se escapa de esa ansiedad? bueno, pues presionando la palanca, es decir
¿cómo se refuerza la presión de la palanca? por la disminución de la
ansiedad que se ha generado por la asociación de todas las conductas que
no eran esas con la aparición de la descarga, de nuevo mezcla de
procedimientos operantes refuerzo de la conducta de presionar la palanca
con procedimientos clásicos, asociación de todas las conductas a la
aparición de una descarga todas las conductas menos una, porque todas las
conductas, haga lo que haga va a acabar en descarga, excepto una así que
cuando presiono la palanca yo ya estoy realizando conductas durante ese
intervalo y todas me producen ansiedad porque todas van a llevar a la
descarga que reduce la ansiedad primera hipótesis, segunda algo de lo que
ya os he hablado, el paso del tiempo ¿qué es lo que dice la hipótesis
interoceptiva de Amgen? pues sustituye la propia conducta por el tiempo lo
que produce ansiedad no es la propia conducta o las conductas que realiza
que se asocian con la descarga, el mero paso del tiempo que acerca la
descarga el mero contaje del paso del tiempo produce ansiedad y responder
reduce esa ansiedad, es lo mismo pero para simbolizarlo por un examen o
para entenderlo por un examen es súper sencillo, porque esta primera nos
habla de que la ansiedad la produce la propia conducta, todas las conductas
no asociadas o todas las conductas que no son objetivos la hipótesis
interoceptiva nos dice que no que esa ansiedad la produce el paso del
tiempo y por último la última de las hipótesis la hipótesis de la
señal de seguridad de Dísmonos esto se basa en el reforzamiento positivo
fijaros, los estímulos asociados a los periodos de seguridad provocados
por la respuesta operante, es decir cuando tú respondes, le das a la
paranca se genera un periodo de seguridad y ese periodo de seguridad está
asociado a una serie de estímulos ya sea tu propia conducta, tu propio
estado interno etc, etc, etc y esos se convierten en estímulos
condicionados inhibitorios aversivos, es decir que se relacionan con la no
aparición de la descarga es decir, se condicionan, se relacionan con que
todos esos estímulos señalan el no aparición de la descarga y eso es lo
que funciona como reforzador para la respuesta es decir, ¿por qué se
presiona a la palanca? pues se presiona a la palanca para obtener todos
esos estímulos que se han relacionado con la ausencia de la descarga
bueno, esta es la que más apoyo empírico tiene la basada en el
reforzamiento positivo es decir, que los sujetos presionan la palanca para
obtener algo positivo que son esos estímulos inhibitorios aversivos, es
decir que se relacionan con la no aparición de la descarga con algo
positivo bueno, pues esto sería las tres hipótesis por las que se
realizaría o cómo se reforzaría la respuesta para evitar la descarga, a
pesar de que en muchas ocasiones la descarga no aparece y vamos con el
último procedimiento el último procedimiento es, bueno yo creo que
Hersten y Hinelein que tienen nombres de comandantes espero que me perdonen
si me han escuchado alguna vez pero es broma tienen nombres de comandantes
de campo de concentración nazi Hersten y Hinelein podrían ser comandantes
de las SS perfectamente y os lo digo para que luego recordéis este
procedimiento porque lo siguiente que os voy a decir es que es quizá el
procedimiento más maquiavélico que yo he visto en mi vida para realizar
este tipo de aprendizaje es macabro casi ¿por qué? pues porque
básicamente se mete al organismo animal o rata o lo que sea en una
máquina con una palanca y dos máquinas diferentes que provocan descargas
pero solo una de ellas está activada a la vez parece una película de show
parece que estoy contando una de las escenas de una película de show en
fin bueno, ¿qué hace cada una de estas máquinas? esta es la máquina A y
la máquina B pues lo que hace es dar descargas en el suelo intensas y
breves son bastante intensas la rata está aquí y una de las dos máquinas
está conectada siempre una de las dos y produce descargas intensas y
además no las puedes predecir porque son irregulares no sabes cuándo van
a aparecer una vez tardan 2 segundos como un reforzamiento de intervalo
variable que nunca sabes cuándo va a aparecer pero sabes que va a aparecer
en un intervalo la única diferencia es que esta da más que esta la
máquina A da más descargas por minuto que esta, en periodos irregulares
las dos pero esta da más así que será mejor estar en esta bueno, pues
esa es la clave ¿qué ocurre? pues cuando se mete la ratita aquí
inicialmente la máquina A está conectada si presionas la palanca se
conecta a la máquina B y entonces recibes menos descargas y se mantiene la
máquina B activa hasta que da la primera descarga y después se desactiva
esta y vuelve a activarse esta y vuelven a darte más descargas ¿qué
quiere decir? si no respondes a la palanca va a estar siempre activo A pero
si tú respondes constantemente a esta, va a estar activa B es decir, vas a
recibir descargas con menos frecuencia lo maquiavélico del asunto es que
tú no respondes para evitar descargas respondes para que te den menos
descargas porque siempre vas a recibir descargas lo único que puedes hacer
es disminuir la tasa total de descargas solo puedes presionar todo lo que
puedas para intentar que esta máquina siempre esté en funcionamiento y el
número de descargas que te den sea menor un poco maquiavélico un poco de
película de terror y encima se llaman Hersten y Himmelheim esto no os vais
a olvidar yo creo bueno, ¿por qué se refuerza la conducta? bueno, pues
por la disminución de la frecuencia total de estimulación no por
retardarla no por omitirla nada de eso, porque además ni siquiera se puede
retardar porque puede ser que pulses y justo en el momento en que pulses se
active la máquina B pues no se da indefensión aprendida porque hay cierto
control sobre las consecuencias indefensión aprendida se da cuando no
tienes ningún control sobre las consecuencias pero aquí sí lo tienes
porque eres capaz de reducir el número de descargas así que sabes que tu
actividad sigue sufriendo, pero menos así que tienes cierto control no se
da indefensión aprendida no se da por tu propio bien porque mientras sigas
pulsando siempre hay consecuencias una cosa es que no se pueda tener
control absoluto sobre las consecuencias y otra cosa es que no se tenga
control sobre las consecuencias control absoluto sería hacer que
desaparezcan o poder manejarlas a tu antojo aquí el control no es absoluto
pero sí hay control es decir, hay un cambio en el entorno derivado de tu
conducta no, pero es un cambio lo mismo nos ocurre en muchas situaciones no
podemos controlar todo lo que nos ocurre pero sí podemos controlarlo en
cierta medida así que tenemos cierta experiencia de control lo mismo
ocurre aquí de hecho lo único que pueden controlar es esa frecuencia
total porque ni siquiera el retardo de las consecuencias porque imaginaros
que yo pulso aquí para que pase a la B pero justo el intervalo se acaba de
terminar nada más pulsar que me darán un chispazo así que incluso puedo
provocar un chispazo por darle a la palanca y en el total de ensayos el
número será menor bueno, pues esta es la explicación y este es el
último procedimiento de evitación que a mí me parece me parece muy
maquiavélico la verdad es que es tremendo pero bueno, lo bueno que va a
tener es que creo que va a ser difícil que se olvide tanto el nombre
Gerson y Hinelein los dos comandantes de las SS para más inri... bueno,
eso ya me lo voy a ahorrar pero fijaros cuáles son las iniciales de los
dos hay una, bueno venga lo cuento hay una entre muchos grupos de neonazis
hay una especie de de mantra o de bueno, de señal que ejemplifican
transformando estas dos letras en números que serían las relacionadas al
saludo que se hace a Hitler en su momento y es todo esto me parece que os
vais a acordar de esto fenomenal en el examen porque el procedimiento es
tremendo bueno, que sirva por lo menos para acordar aunque sea un poco
tétrico seguimos, vamos a continuar vamos a ver las variables que afectan
al reforzamiento negativo al procedimiento a los procedimientos de
evitación vamos a ver cuáles son las diferentes variables vamos a pasar
un poco rápido por ellos que son bastante sencillas y nos ponemos con lo
que nos dé tiempo sobre, nada, 10 minutos sobre el castigo por suerte la
parte de castigo es más sencilla si no nos da tiempo a verla entera
tenéis más fácil estudiarla por vuestra cuenta la parte de evitación
era más difícil bueno, primero cuanto mayor es la intensidad de la
estimulación más rápidamente se aprende es decir, se aprende a palos
básicamente cuanto más intensa es más rápido se adquiere la conducta a
la fuerza órgan la habituación y la extinción reducen la efectividad de
las consecuencias a ver si ambas tanto habituarse al estímulo es decir, la
habituación a la descarga si tú habituas a la pobre rata a la descarga
pues déjate de tener tantos efectos ya no sería tan amenazante y eso
haría que se aprendiese peor y si lo extingues todavía más si juntas la
señal o empiezas a presentar la señal en ausencia de la descarga es
decir, que se extinga esta relación también hace que se tarde más en
aprender esta evitación os acordáis de la evitación libre en el
procedimiento libre no señalado, no discriminativo que había dos
intervalos el reloj choque y el choque-choque la tasa de aprendizaje o
cómo se aprende está determinada por esos dos intervalos por la
diferencia que hay entre el intervalo entre descargas y el intervalo de
seguridad a mayor frecuencia de descargas en ausencia de respuesta es
decir, cuantas más descargas te dé si tú no respondes y mayor sea
también el periodo de seguridad es decir, que si tú no respondes te den
muchas descargas pero que si respondes se retrase mucho la descarga mejor o
mayor probabilidad hay de aprendizaje, es lógico te dan muchas descargas y
tu respuesta tiene mucho efecto porque las pospone mucho aprendes más
rápido las consecuencias de tu conducta se aprenden más rápido y
también ocurre en la descarga aleatoria aunque no se puede evitar del todo
es decir, estos intervalos en la descarga aleatoria que aumentan los
periodos de seguridad porque la máquina A-B te da menos descargas pues
ocurre exactamente lo mismo el mismo efecto de mayor frecuencia de
descargas y mayor intervalo entre descargas una vez que se da la respuesta
aunque no se pueda evitar del todo los dos funcionan exactamente igual más
cosas vamos ya con el castigo nos va a dar tiempo a ver lo justo vamos a
ver tres aproximaciones teóricas diferentes ¿qué decía Zornike? veía
el reforzamiento positivo y el castigo como procesos opuestos uno fortalece
la conducta, el otro debilita la probabilidad de la conducta el otro la
disminuye ¿qué hacen las consecuencias negativas? ¿qué hace que se te
presente una descarga después de pulsar una palanca? recordad que hemos
pasado al castigo ¿qué pasa si después de una pulsación de una palanca
aparece una descarga? pues que se debilita la asociación entre los
estímulos del entorno o la oportunidad de esa respuesta y la respuesta, es
decir la conducta tiene una menor probabilidad esto no lo vamos a ver
porque ya vimos la respuesta emocional condicionada la hemos visto al
principio del tema, así que no vamos a repetirlo la última teoría es la
teoría de las respuestas competitivas reforzadas negativamente teoría de
Binsmore en el 54 bueno, fijaros lo que se adquieren serán respuestas de
evitación incompatibles con la respuesta castigada es decir, para Nismore
no es que se debilite la respuesta castigada no es que la asociación entre
los estímulos del entorno esta respuesta se debilite debido a que la
castigamos y por tanto haya menor probabilidad sino que lo que hace el
organismo es fortalecer la asociación entre otras respuestas alternativas
por ejemplo dar vueltas sobre sí mismo o saltar, que son incompatibles con
esta respuesta que es castigada es decir, el hecho de que realizar otras
conductas no lleve o haga desaparecer la descarga en fin, no lleve a la
descarga, hace que se refuercen y que por tanto la conducta objetivo
desaparezca esas serían las tres variables que afectan perdón, las tres
explicaciones o los tres enfoques teóricos sobre el castigo ¿qué
variables afectan al castigo? bueno, pues tenemos varios tened en cuenta
una cosa los estudios que vamos a ver no parten os acordáis del principio
de Premak lo de que una conducta más probable puede reforzar una menos
probable y una conducta menos probable castiga a una más probable bueno,
la mayoría de los estudios no parten de eso como estamos hablando de
experimentos partimos de una situación diferente porque tenemos más
control sobre la conducta la mayoría de estudios lo que hacen es reforzar
una conducta primeramente es decir, reforzamos la presión de una palanca
con comida y después cambiamos la contingencia y castigamos la presión de
la palanca para ver cómo desaparece esa conducta y sumamos ambos efectos
teniendo en cuenta que así es como se preparan estas contingencias vamos a
ver qué variables afectan a la adquisición de este aprendizaje a través
del castigo primero, la intensidad del estímulo aversivo de nuevo, a palo
se aprende a la fuerza Orkand a mayor intensidad del estímulo aversivo
cuanto más fuerte sea la descarga mayor eficacia para su primera respuesta
si te dan una una descarga por presionar una palanca o por saltar, por
ejemplo cuanto más fuerte sea la descarga antes dejas de presionar de la
palanca o de saltar si no hay contacto con la consecuencia aversiva y esto
es uno de los problemas con el castigo es que en el momento en el que deje
de aparecer la respuesta y por tanto dejan de aparecer las consecuencias
aversivas puede reaparecer la conducta por eso siempre hay dudas sobre una
de las razones por las que hay dudas sobre la eficacia del castigo dejas de
realizar la conducta dejan de aparecer las consecuencias y empieza a
extinguirse el castigo así que puede reaparecer la conducta inmediatez y
demora del estímulo aversivo también muy sencillo cuanto más rápido se
aplique el castigo después de la conducta más eficaz es lo habéis visto
también en ambientes reales con humanos si hay que castigar a alguien hay
que castigarlo en el momento también se dice con las mascotas para
entrenarlas, etc, etc si vas a aplicar un castigo tiene que ser en el mismo
momento cuanto más contiguo, más inmediato mejor segundo, perdón,
tercero cambios graduales en la intensidad del estímulo aversivo esto no
funciona lo mejor es introducir el castigo más intenso desde el principio
es decir, desde el principio la máxima intensidad de castigo cuando
gradualmente el castigo no vale para nada tiene que ser intenso desde el
principio y la experiencia previa para que se pueda castigar una conducta
esa conducta tiene que existir de antes y se ha tenido que reforzar
previamente si el reforzamiento previo o lo que se ha reforzado con esa
conducta previamente es una fase muy larga y se ha reforzado mucho el
castigo es menos efectivo si te has dedicado a premiar los berrinches de tu
hijo durante mucho tiempo prestando la atención y haciendo es decir,
reforzándolos va a ser mucho más difícil que luego empieces a castigar
esos berrinches y desaparezca la conducta va a ser mucho más difícil ¿de
acuerdo? y terminamos con estos últimos estas últimas variables y dejamos
aquí el la tutoría efectos discriminativos del estímulo aversivo vale si
solo castigamos en presencia de un estímulo determinado solamente
funcionará el castigo con ese estímulo, es decir si castigamos una rata
por presionar una palanca en presencia de una luz roja solamente será
efectivo en presencia de esa luz roja es decir, la luz roja toma el control
de la ausencia de conducta si solo castigamos los berrinches en presencia
de el padre o la madre del niño o de un profesor solamente no se darán
berrinches en presencia de esa figura que indica el castigo pero así se
darán en otras situaciones los programas de castigo aquí justo lo
contrario que lo que vimos hace tiempo en los programas de reforzamiento se
puede administrar el castigo de manera intermitente, razón fija, variable
intervalo, etcétera pero aquí funcionan peor los programas que mejor
funcionan en el castigo son los programas continuos cuando se castiga todas
las conductas no algunas conductas justo lo contrario con el reforzamiento
positivo luego tenemos los programas de reforzamiento compuesto es decir,
cómo se aplica ese programa porque todo castigo siempre va a ser una
técnica que incluye varios procedimientos ¿por qué? porque antes de ello
hay que reforzar la conducta para que aparezca primero tiene que haber una
conducta que ha sido reforzada y por eso aparece y luego se quiere eliminar
primero, castigo sobre línea base apetitiva es decir, que se aplica
castigo y reforzamiento sobre la misma respuesta y después se castiga esa
misma respuesta segundo, castigo sobre línea base defensiva es decir,
primero una conducta sirve para escapar de algo malo y después esa misma
conducta se castiga, se le hace o se le da esa consecuencia esa
consecuencia mala, esa consecuencia aversiva y tercero, castigo sobre
línea base de extinción una respuesta puede estar siendo extinguida y
luego puede ser castigada imaginaros que premiamos la conducta de una
palanca con comida ¿vale? pero después la conducta de presionar la
palanca no va a ser vida de comida la estamos extinguiendo bueno, pues
podemos añadirle a esto un castigo es decir, aparte de dejar de aparecer
comida ahora además cada vez que pulses una descarga lo que hará que la
eficacia del castigo aumente dos cosas más, existencia de conducta
alternativa esto es muy importante para que la eficacia del castigo aumente
es muy bueno tener disponible una respuesta alternativa por ejemplo, si
queremos castigar o hacer desaparecer los berrinches de un niño mucho
mejor que solamente castigarlo es proporcionarle una respuesta alternativa
como por ejemplo el premiar el que se exprese de otra manera una respuesta
alternativa e incompatible con el castigo hará que sea mucho más eficaz
el castigo de esa conducta y proporcionar alternativas y después las
manipulaciones motivacionales, mucho mayor eficacia de un castigo si
reducimos la motivación para emitir la respuesta ejemplo clásico si antes
presionamos una palanca para obtener comida vale, y ahora queremos castigar
esta presión de la palanca que no la hagan más si el animal está muy
bien alimentado y no tiene hambre, es decir, no tiene motivación para
responder será más eficaz el castigo bueno chicos, pues hasta aquí hemos
llegado descargaros estos apuntes sí, sí, sí, sí os voy a pasar los
enlaces si avanzo más con ellos os voy a pasar todos los enlaces os voy
informando en los foros de todas maneras todo va a ser a través del foro
de nuestro foro de tutorías y si tenéis preguntas lo mismo podéis
contactar conmigo a través de email por supuesto, pero si queréis para
que lo pueda ver todo el mundo compañeros, estaría bien contestar las
preguntas a través del foro para no responderlas varias veces así todo el
mundo puede tenerlas y además quedan almacenadas y podéis consultarlas
así que nada muchísimas gracias muchísimas gracias a todos por vuestra
atención muchísima suerte en los exámenes preparadlo todo bien ya
sabéis que tenemos una situación excepcional así que cuanta más
preparación llevéis no sólo del examen sino también de las herramientas
que vais a utilizar en el examen y mejor conozcáis todos y más os
aseguráis, muchísimo mejor mucha suerte y espero no volver a veros más
digo esto porque eso quiere decir que vais a aprobar aprendizaje no quiero
volveros a ver más en esta asignatura pero sí en Percepción el año que
viene si alguno ve mis clases o asiste a algún centro asociado de los que
doy clase de Percepción así que nada, muchísimas gracias a todos chicos
y muchísima suerte y nos vemos a través de y hablamos a través de
nosotros