Bueno chicos, confirmadme que me veis y me oís. Como podéis ver, he cambiado un poco el setup del despacho. He conseguido por fin una cámara para mi ordenador de sobremesa. Estaba dando las clases con el portátil hasta ahora y he conseguido al final una cámara y los drivers. Creo que se ve mejor y se escuchará mejor. Eso espero, diréis a buenas horas ya, para la última tutoría. Pero bueno, ¿qué le vamos a hacer? Ahora por lo menos tengo las dos pantallas grandes y puedo verlo todo bien sin tener que dejarme la vista intentando ver los numeritos. Un poco tarde, pero bueno, por lo menos para la última tutoría. Bueno chicos, como veis os he subido dos enlaces al chat. Son los enlaces de las dos últimas tutorías que dimos. Uno creo que está subido en el enlace al foro y el otro todavía no lo subo en cuanto pueda. De todas maneras, siempre tened en cuenta que aunque yo no os ponga los enlaces en el chat, en el foro, si ponéis mi nombre o ponéis Psicología del Aprendizaje Antonio Prieto en Inteka, en el repositorio. No en Inteka, no me sale el nombre ahora de la página. Bueno, es en Inteka, pero no me va a salir. Bueno, da igual, lo podéis acceder a través de Inteka. Podéis acceder a las tutorías porque siempre las dejo libres. Incluso no tenéis ni por qué loguearos como parte de la UNED porque puede acceder cualquier persona a ellas. O sea que no tenéis que esperar. No tenéis por qué esperar a que os ponga los UNED Play. Madre mía, mala memoria tengo. Como lo tenga igual para todos. No tenéis por qué esperar a que suban los enlaces, sino que si queréis verlas antes podéis hacerlo. Las tenéis siempre disponibles. Bueno, ahí tenéis, en el chat tenéis los dos enlaces ya puestos por si queréis ponerlos antes de que las suba. Creo que solo queda una, la de la semana pasada, los enlaces al repositorio. Bueno, última tutoría. Vamos a terminar el tema 6 y vamos a continuar con el tema 7. En el tema 7 vamos a ver los dos apartados más importantes porque bueno, hay partes del tema 7 que se repiten un poco, ¿vale? Se trata del control aversivo de la conducta, pero en la última parte habla de cadenas concurrentes y de procedimientos concurrentes. Es para el castigo que son básicamente lo mismo que vimos antes. Así que vamos a intentar resumirlo para que nos dé tiempo a lo más posible. Si al final en el otro centro asociado nos dicen que tenemos que dar alguna clase más, ya sabéis que aunque no las pueda dar en este centro sí que voy a dejar las grabaciones, os las pondré también en el foro por si hay alguna clase más. Por ejemplo, si hacemos algo sobre prácticas o si grabo algo sobre las prácticas obligatorias, pues siempre todo lo que ponga lo pondré libre para que lo pueda ver todo el mundo y eso, por supuesto, os incluya a vosotros y pondré los enlaces en el foro. Ya sabéis también que hay más tiempo para los exámenes, así que podéis seguir escribiendo en el foro y yo iré contestando a las preguntas que tengáis y a cualquier duda. Así que, aunque no tengamos más tutorías en directo, sí que se pueden seguir viendo contenidos, podéis seguir repasando las tutorías que ya hay y podemos seguir en contacto a través del foro, dudas, etcétera. Bueno, vamos a seguir, vamos a continuar con lo poco que nos queda del tema 6 y con todo lo que podamos ver del tema 7, que ya es el último, casi no os va a dar tiempo a ver todo. Sólo tratándose de mí, que reconozco que me he enrollado. Como las persianas, es casi un milagro porque creo que nunca he terminado una asignatura de darle entera. No sé si es bueno o malo que me enrollo, pero bueno, vamos a intentar terminar todo lo que podamos. Estábamos viendo las interacciones que ocurren entre estímulos excitatorios inhibitorios y lo que vimos era un fenómeno que se denominaba desplazamiento del máximo. Cuando entrenamos dos estímulos, un estímulo discriminatorio positivo y un estímulo discriminatorio negativo, por ejemplo, una luz, roja para, si se responde ante una luz roja y se apresura una palanca, si se apresura una palanca ante la aparición de una luz roja, aparece comida. Si es ante una luz verde, entonces no aparece comida o eso señala la no disponibilidad de comida, entonces no se responde. Bueno, pues ocurre un fenómeno curioso cuando hay estos dos tipos de estímulos, discriminativo positivo y negativo y la discriminación es intradimensional, recordad. Es decir, que la diferencia entre el estímulo discriminativo positivo y negativo es una dimensión o están en la misma dimensión, por ejemplo, el color. Bueno, lo que se produce es un desplazamiento, un alejamiento del máximo de respuesta que debería de darse ante el discriminativo positivo. Bueno, pues se produce un desplazamiento en sentido contrario al discriminativo negativo. Pusimos el ejemplo de luces de diferentes longitudes de onda, luces de colores y el estímulo discriminativo, imaginad, el estímulo discriminativo positivo es una luz de 550 nanómetros, que sería, correspondería más o menos con el verde. Y tenemos un estímulo discriminativo negativo que en diferentes grupos lo ponemos diferente. Es una luz que va hacia, del verde va hacia, pongamos que va hacia el azul, ¿vale? Que se va desplazando hacia el azul, cada vez más distinto del verde. Tenemos en el primer grupo un verde un poquito más azulado, otro verde un poquito más azulado y ya casi azul. Bueno, pues lo que vemos, esto sería el discriminativo negativo, el positivo siempre verde. Bueno, pues lo que vemos cuando entrenamos estos dos estímulos es que cuando sometemos a los sujetos una prueba de generalización, el máximo de respuesta no se da ante lo que se tendría que dar, que es el estímulo discriminativo positivo que hemos entrenado, es decir, la luz ante la que si responde se da la respuesta, sino que se desplaza el máximo de respuesta en sentido contrario al estímulo discriminativo negativo. Es decir, se va hacia el lado contrario. Si este es el positivo 550 y este es el negativo, pues el máximo de respuesta se va por debajo de 550. Y se desplaza más cuanto más cerca está el estímulo, el estímulo discriminativo negativo del positivo. Cuanto más se aleja, veis que se va separando cada vez menos. Y si no hay discriminativo negativo, si no se entrena ningún estímulo discriminativo negativo, no se produce desplazamiento del máximo. Es decir, desplazamiento en sentido contrario al estímulo delta o estímulo discriminativo negativo y mayor cuanto más cercanos están el positivo y el negativo uno de otros. ¿Qué decía Spence sobre esto? Bueno, pues Spence decía que tanto el estímulo, el positivo, el discriminativo positivo como el estímulo delta, el negativo, adquieren control sobre el comportamiento. Y esto se expande o se generaliza a estímulos que son cercanos. Si el positivo negativo y el, perdón, el discriminativo positivo y el negativo están muy cercanos, ambos adquieren control y se generalizan otros estímulos. Es decir, se solapan. La tendencia excitatoria y inhibitoria se generaliza y se solapa y eso hace que se desplace el máximo hacia un lado. Y la conducta, el global de la conducta sería la suma de ambas tendencias. Lo vamos a ver mucho mejor en la siguiente diapositiva. Fijaros, bueno, ya hemos visto algunas cosas. Se produce en sentido contrario al estímulo discriminativo negativo mayor cuanto más cercanos están, cuanto mejor se discrimina lógicamente, cuanto mejor son capaces de discriminar los sujetos, menor es el desplazamiento y lo mismo ocurre con el mínimo de respuesta que se desplaza en sentido contrario al estímulo discriminativo negativo. Es decir, ocurre tanto con estímulos discriminativos positivos como negativos. El mismo fenómeno. Desplazamiento del máximo y desplazamiento del mínimo. Bueno, curiosamente hay un procedimiento específico que no produce desplazamiento del máximo, que es la discriminación sin errores. ¿Os acordáis? Cuando poníamos, entrenábamos de tal manera que el estímulo delta, el discriminativo negativo era tan poco intenso que casi no se podía ni responder o no responder ante él. Así que no podían. Sí, no se podía responder ante él. No se podían producir errores y poco a poco aumentábamos su intensidad y lográbamos un proceso de aprendizaje discriminativo en el que nunca se cometían errores y que decíamos que era muy útil para poblaciones especiales, para personas o cualquier organismo que tenga ciertos problemas de aprendizaje. Era muy útil porque eliminaba esa frustración. Lo mismo ocurre cuando se producen periodos de evaluación largo, aprendizaje largo. Cuanto mejor se discrimina, ya hemos dicho que menor desplazamiento del máximo. Vamos a verlo aquí, porque yo creo que lo vais a ver mucho mejor. Fijaros, esto sería un procedimiento en el que se ha entrenado por separado un estímulo discriminativo positivo y otro negativo, pero en momentos separados. Es como si lo hubiésemos hecho por separado. Y luego lo que vamos a hacer es sumar lo que provocan cada uno de esos estímulos para ver cómo se desplaza el máximo. Imaginaos que, por un lado, entrenamos a unas ratas para responder a una luz de 510 nanómetros. Que pongamos que es un verde amarillento. Lo que sea. Vamos a poner eso. ¿Qué ocurrirá? Bueno, pues lógicamente si solo entrenamos ese estímulo excitatorio, no hay ningún inhibitorio, el máximo de respuesta se dará ante esto. Pero lo que decía Spence es que todos los estímulos son una suma de tendencias. Así que todos los estímulos tendrán una tendencia excitatoria e inhibitoria en función de lo parecidos que sean al discriminativo positivo. El estímulo discriminativo positivo, en este caso, Así que la tendencia excitatoria de este estímulo será máxima y la inhibitoria mínima cero, ¿no? Hemos dicho que lo entrenamos por separado. Cogemos otros estímulos con el mismo grupo de ratitas y vemos a ver cómo generalizan la respuesta. Cuanto más se separan los estímulos del discriminativo positivo, menos potencial o potencia excitatoria, es decir, menos hacen que se responda y más potencia inhibitoria o capacidad inhibitoria tienen. Ves que según nos alejamos del estímulo, decrece su capacidad excitatoria, es decir, de incitar a la respuesta y aumenta su capacidad inhibitoria, de inhibir la respuesta. Bueno, pues ahora imaginaros que con el mismo grupo de ratas pero por separado, entrenamos con un estímulo inhibitorio, solo un inhibitorio, con una luz de 495 nm. No aparece aquí, ¿vale? Pero es de 495 nm. Yo que sé, algo más naranja o rojizo, lo que sea, ¿vale? Vamos a imaginarnos eso. De nuevo, la máxima, en este caso, inhibición se dará ante 495 nm, es decir, un poquito más para aquí arriba. Ahí se dará la máxima, pongamos que es 4. Cuando ponemos estímulos que son diferentes al estímulo discriminativo negativo, decrece su potencial inhibitorio, acordaros que este es el delta, este es el negativo, así que lo que hace es inhibir la respuesta porque en su presencia no hay reforzamiento. Pero cuanto más nos alejamos, menor es el potencial inhibitorio y mayor el potencial excitatorio porque cuanto más se diferencia el estímulo, que indica que no va a haber reforzamiento, más probabilidad hay de que haya reforzamiento. Veis que cuanto más se aleja, menos inhibición, más excitación. Bueno, ¿qué pasa ahora si sumamos estas tendencias de manera global? Las del estímulo excitatorio y las del inhibitorio. Bueno, pues aquí las tenéis. Sumamos las tendencias excitatorias de ambos, aquí, y las tendencias inhibitorias de ambos, aquí. Y nos sale el total. Hemos dicho antes que la respuesta o la conducta del sujeto es la suma de todas esas tendencias, de todos los estímulos. Bueno, pues vamos haciendo todas esas sumas. Y recordáis que el estímulo excitatorio era 510, así que se supone que la máxima respuesta debería darse ante 510. Bueno, pues fijaros qué ocurre. ¿Ante qué estímulo se da la máxima respuesta? Si sumamos todas esas tendencias, ya que la máxima respuesta se da ante el 520, separado, es decir, se produce un desplazamiento del máximo hacia un estímulo superior, porque ¿dónde estaba el estímulo inhibitorio? Aquí abajo. Es decir, en sentido contrario al estímulo discriminativo negativo y hacia o más arriba de él. Y tanto más, cuanto más cerca esté. En este caso se produce un pequeño desplazamiento porque el estímulo, bueno, está cerca pero no relativamente cerca. ¿Qué nos daría una curva de este tipo? Bueno, aquí tenéis cómo se produciría esto. Esto es simplemente el hecho de que los estímulos no producen, o el rango de activación que produce un determinado estímulo no se limita solamente a ese propio estímulo, sino que se generaliza a otros, tanto la inhibición como la excitación. Y la conducta sería el resultado de la suma de todas esas tendencias y al final se produciría una conducta neta o una suma neta. Se produciría una activación y produciría un nivel de respuesta y por esto se produce el desplazamiento del mínimo, del máximo y del mínimo también. Esta es la explicación del desplazamiento del máximo. Bueno. Pues ya tenemos esto. Pero ahora vamos a ver otra cosa. Lo que se denomina efecto de tendencia central. Hasta este momento lo que hemos visto es una cosa siempre la misma y es una presentación simétrica. Si tenemos un discriminativo positivo, voy a poner solo el más, lo entrenamos y después presentamos estímulos para generalizar a un lado y a otro, es decir, de manera simétrica. ¿No? Valores inferiores y valores superiores. Y eso nos da la típica curva de generalización. Se responde el máximo ante el discriminativo positivo o un poco desplazado en función si hay un negativo, un discriminativo negativo en algún lado. Pero siempre aparece una curva simétrica. ¿Pero qué ocurre si no hacemos eso? ¿Qué ocurre si no presentamos los estímulos de esta manera? ¿Qué ocurre si entrenamos un estímulo para responder ante una luz de 525 nm y luego generalizamos solo presentando estímulos de menor longitud de onda? Solo menor, no mayor. ¿O al revés? Entrenamos uno y luego generalizamos solo con estímulos de mayor longitud de onda. ¿O hacemos lo de siempre, una presentación simétrica? Este es el experimento que realizaron Thomas y Jones. Bueno, pues curiosamente la máxima respuesta se da ante el estímulo original solamente cuando hay una presentación simétrica, cuando se presentan valores superiores e inferiores igual a los dos lados. Cuando generalizamos o cuando hacemos una prueba de generalización con estímulos que están por encima y por debajo. En este caso, longitud de onda. Sin embargo, en el resto de grupos, si presentamos solo estímulos con menor longitud de onda, el máximo se desplaza hacia la media de los estímulos presentados. Lo mismo con los superiores. Si presentamos estímulos con una mayor longitud de onda, el máximo de respuesta se desplaza hacia la media de los estímulos presentados. Ya no tiene nada que ver con el discriminativo negativo, sino con los valores presentados. Se desplaza hacia la media de estos valores. ¿Qué quiere decir esto? Bueno, pues para Thomas y Jones esto apoya a lo que se denominó un enfoque relacional. Las respuestas generalizadas que damos o la forma o cómo percibimos los estímulos, en este caso los similares o diferentes que nos parecen y ante qué damos respuesta, no se basa en las características brutas, en las características absolutas, es decir, en la longitud de onda, en este caso de la luz, el color de la luz, sino a la escala de la luz de referencias relativas que tenemos. Si todas las luces que nos ponen están en un rango que es superior a la que yo he entrenado, yo voy a generalizar mi respuesta y voy a tender a responder más en el punto medio. Es decir, calculo dónde está mi punto máximo o hacia dónde respondo teniendo en cuenta los estímulos o el rango de estímulos con los que tengo experiencia, los que me han presentado. Si da la casualidad de que son simétricos, pues me quedaré justo en el que he entrenado. Pero si no son simétricos, pues buscaré el punto medio de ese rango. Es decir, que depende de mi experiencia con esos estímulos y lo que yo percibo y la forma que tengo de discriminar y de realizar este tipo de aprendizaje, no depende de las características absolutas físicas de los estímulos, sino de mi experiencia con ellos, el rango de estímulos y la cantidad de experiencia que tengo con los estímulos con los que he sido entrenado y con los que luego se me van a presentar. Bueno, esto en cuanto a la eficacia. Efecto de tendencia central. Pero esto tiene otra interpretación o mejor aún, tiene una consecuencia. Si aquí hablamos que hacia dónde se desplace el máximo depende de los estímulos que te han presentado y no de la presencia de un estímulo discriminativo negativo o delta, ¿qué pasará si juntamos las dos cosas? Si ponemos un estímulo discriminativo negativo que lo que hemos visto antes nos dice que el máximo se desplazará en sentido contrario, pero además sesgamos la presentación de estímulos y sólo presentamos estímulos en una dirección que nos dice que ese sesgará o que se desplazará el máximo en el sentido de la media de los estímulos presentados. ¿Qué pasa si yo presento esta distribución y resulta que el estímulo discriminativo es este? ¿Hacia dónde se separará? ¿En sentido contrario al negativo? ¿O en el sentido que nos dice el efecto de tendencia central? Bueno, pues eso es lo que se probaron, lo que probaron Thomas y colaboradores en el 91. ¿Y qué consiguieron? Pues modificar el sentido del desplazamiento del máximo. Pero ojo, sólo lo consiguieron en humanos. ¿Cómo lo hicieron? Pues fue muy sencillo. Lo explico muy rápido porque es un experimento muy parecido a los que ya hemos visto. Imaginaros, tenían que discriminar entre 11 intensidades de luz, desde el 1 hasta el 11, ¿vale? Se presentaban del 1 al 11. En un grupo, el discriminativo positivo era el 2, ¿vale? Y el negativo, el 4. En otro grupo, el positivo era el 4 y el negativo, es decir, sí, el estímulo discriminativo negativo era el 2. Veis que hay una diferencia, ¿no? ¿Qué dice la teoría del desplazamiento del máximo, el efecto de desplazamiento del máximo, qué ocurrirá aquí? Bueno, pues según esto, el máximo se debería desplazar hacia el 1, ¿no? Porque se desplaza en sentido... Esto no es menos 4, ¿vale? Es estímulo discriminativo negativo igual a 4. Se desplaza en sentido contrario al discriminativo negativo. Pero tenemos otro efecto. El hecho de que la presentación está sesgada y casi todos los estímulos son mayores que el discriminativo positivo. Pues curiosamente se invirtió la dirección del desplazamiento del máximo. Y el máximo se desplazó hacia el 5. Incluso más cerca del estímulo discriminativo negativo de lo que ya estaba. Este no tiene mucho interés porque se cumple lo que dice el supuesto desplazamiento del máximo. El estímulo positivo era el 4, este el 2, se desplazó hacia el 7. Estaba igual desesgada hacia este lado, pero aquí sí que se cumplía porque se separaba del discriminativo negativo. Pero lo interesante es esto. Lo interesante es que modificando la distribución de estímulos que se presentaban al sujeto, sesgándolos hacia una dirección, podíamos incluso cambiar el sentido del desplazamiento del máximo y acercar ese máximo a valores más cercanos al estímulo delta. Aquel que señalaba que no hay reforzamiento disponible. Hay que cogerlo un poco con pinzas. Porque este fenómeno sólo se ha comprobado con humanos y solamente en algunas ocasiones. No es un fenómeno que se dé siempre. Es importante cogerlo con cierta prudencia. Hay que experimentar más sobre él y ver cuáles son las verdaderas razones si realmente es un desplazamiento del máximo o hay otros factores involucrados. Pero sí que se ha conseguido un desplazamiento de sentido contrario al esperado. Es decir, desplazarlo hacia un sitio en el que se supone que responder no va a dar lugar al reforzamiento. Así que todavía tenemos un fenómeno abierto que habrá que explorar más. Pero ahí tenéis el dato sobre cómo pueden incluso variarse los sentidos de desplazamiento del máximo. Bueno, pues vamos con las explicaciones. Porque hemos visto lo que ocurre. Hemos visto lo que es la generalización. Es decir, que estímulos que no son los entrenados tomen control de la conducta y se respondan ante ellos. Y al revés, la discriminación, el hecho de ser capaz de distinguir entre estímulos que sí han sido presentados y señalan la presencia de reforzamiento y estímulos que no han sido presentados y que señalan, o perdón, estímulos que ante su presencia se señala la ausencia de reforzamiento. Bueno, pues cómo conseguimos que estímulos generalizados, es decir, que nunca han participado en una contingencia de aprendizaje. Si yo entreno con una luz roja, presiono palanca y comida, ¿cómo puede ser que una luz naranja que nunca se ha presentado también logre que se dé cierta cantidad de respuestas? Bueno, pues hay varias explicaciones. Las primeras, pues lo tomaban como una especie de proceso primario, fisiológico, neurológico, algo relacionado con la forma de nuestro sistema nervioso y nuestro sistema fisiológico, nuestro sistema de procesamiento. Por ejemplo, Pavlov utilizaba el concepto de irradiación como si cada estímulo produjese en nuestro sistema nervioso, en nuestro cerebro, produjese una activación pero no en una zona concreta asociada a ese estímulo, sino que se irradíase por otras zonas del córtex dedicadas al procesamiento de estímulos que compartían características con él. Y esas zonas hacia las que se irradiaba la estimulación, una especie de efecto de onda son las que provocaban que también esas zonas dedicadas al procesamiento de estímulos que compartían características también adquiriesen parte de ese condicionamiento o parte de esa relación de contingencia que tenía el estímulo original. Bueno, es una explicación basada en nuestro sistema o en cómo funciona nuestro cerebro o en un proceso primario de nuestro cerebro, pero no es muy detallada realmente cómo se produce eso. Parece que no lo detalla suficiente Pavlov en este caso. Por lo menos no vamos a ver nosotros cómo lo detalla por supuesto tiene explicaciones más modernas basadas en investigaciones fisiológicas sobre el funcionamiento neuronal. Pero ya desde Pavlov empezaban a pensar en algo así, que esto tenía algo que ver con el sistema nervioso. Hull decía algo parecido pero se centraba más en la parte psicológica la parte cognitiva de todo esto. Decía que nuestro cerebro percibía los estímulos como una horquilla de valores. Es decir, cuando vemos una luz roja percibimos ese estímulo no como una luz con un determinado valor de una luz roja sino como una especie de horquilla de valores, como una especie de rango de valores alrededor de ese color. Y que aquellos lugares que controlan estímulos o que se dedican a procesar estímulos con valores cercanos, pues también toman el control. Básicamente lo mismo que dice Pavlov pero aplicado de otra manera no tanto centrado en cuestiones fisiológicas sino más en cuestiones psicológicas más en cuestiones de control cognitivo o de procesamiento de determinados valores y determinadas dimensiones. Pero bueno, esto no es lo que más nos interesa. Hay otras teorías que no entienden este fenómeno como un proceso primario, sino que intentan dar explicaciones más basadas en procesos de aprendizaje en procesos puramente psicológicos en este caso procesos de aprendizaje. Vamos a ver tres ejemplos bastante sencillos Ya veréis que no tienen mucha complicación De hecho vamos a utilizar una diapositiva para cada uno de ellos. Vamos a empezar con la hipótesis inversa, la hipótesis de Bloch ¿Qué dice? Pues es muy sencillo. Básicamente dice Bloch que los sujetos generalizan porque fallan al discriminar. Es decir, la generalización el responder ante muchas cosas que se parecen es un fallo en la discriminación no son capaces de discriminar entre los estímulos de prueba y que la capacidad que tienen los sujetos, los organismos para discriminar un determinado rango de estímulos o un tipo determinado de estímulos es lo que determina si se generaliza o no se generaliza ¿Apoyo? Bueno, pues cuando se hacen muchos experimentos o muchos de los experimentos que se hacen con palomas muestran que ante diferentes estímulos o ante diferentes rangos de estímulos los gradientes de generalización son más o menos planos ¿Y de qué depende esto? De lo sensibles que sea el sistema perceptivo de las palomas a estos estímulos. Cuantos menos sensibles son esos estímulos más generalización, menos son capaces de discriminar. Cuanto mejor perciben esos estímulos, por ejemplo luces que las palomas o longitudes de onda a las que las palomas estén muy acostumbradas porque su sistema perceptivo sea muy sensible a ese rango de luces bueno, pues mayor pendiente y mayor discriminación porque son capaces de discriminarla. La hipótesis inversa del lujo es muy sencilla se generaliza porque no son capaces de discriminar porque no son capaces de distinguir entre esos estímulos. Eso depende seguramente del funcionamiento del sistema perceptivo. De cómo de sensibles son nuestros sistemas perceptivos a determinados rangos de estímulos Siguiente, la teoría atencional Hemos visto algo de la teoría atencional de Sutherland y Macintosh y ya lo hemos visto en otros temas y hemos hablado sobre la atención a los rasgos pertinentes y las discriminaciones ¿Os acordáis cuando hablábamos de este tipo de aprendizaje? Bueno, ¿qué dicen ellos? Pues que cuando no se es capaz de discriminar cuando se generaliza lo que ocurre es que no atendemos de manera adecuada al rasgo pertinente, es decir no hemos atendido al rasgo que determina la diferencia entre los dos o entre los diferentes estímulos y por eso no distinguimos entre ellos y generalizamos y respondemos igual ante todos ¿Qué dicen? Bueno, pues ¿Cómo lo explican? Pues con dos procesos diferentes que ocurren en nuestro sistema nervioso Primero, el cerebro procesa la información cada tipo de información por canales específicos Por ejemplo el color el tamaño, las diferentes dimensiones de un estímulo se procesan en sitios diferentes, en sitios específicos esto ya es tema de percepción que veréis el año que viene, pero cada parte del estímulo a nivel cognitivo se apoya en diferentes canales que procesan esas cualidades, esas dimensiones o esas características Antes de que entrenemos nada, cada parte del estímulo, por ejemplo un círculo de color negro, pues se procesa por una parte la forma, por otra parte el color y la fuerza de cada una de esas características depende de su saliencia Cuanto más saliente sea una dimensión para un organismo determinado más fuerza tiene ese analizador o más fuerte es el procesamiento de esa característica. ¿Qué hace el reforzamiento? Bueno, cuando lo sometemos a un proceso de reforzamiento variaría la fuerza de los analizadores Si el color está relacionado con el reforzamiento pero no la forma, el color se hará más saliente Los sujetos atenderán más a esa dimensión porque está relacionada con el reforzamiento y esa dimensión más saliente que es a la que se atiende porque es la relacionada con el condicionamiento se condiciona más porque es la relevante, es la saliente Es decir, se desarrolla un vínculo entre la respuesta que doy y un analizador específico de una característica. De claro hay una tecla roja y el analizador del color Es decir, presionar cuando hay una tecla roja o presionado la tecla roja y ese analizador. Si yo no presto suficiente atención a la dimensión relevante o si no atiendo a la dimensión relevante, sea por lo que sea no se formará este vínculo y en ese caso la discriminación será peor No seré capaz de discriminar entre diferentes teclas porque no estoy prestando atención y no está aumentando la fuerza del aprendizaje y del vínculo entre esa respuesta y esa dimensión concreta que quiero analizar Bueno, eso es la teoría atencional a grosso modo, por supuesto esto merecería mucho más tiempo del que le podemos dedicar pero a grosso modo la teoría atencional de Shatterland y McIntosh Y por último, la teoría de la respuesta múltiple de Staddon y ya hemos visto también cosas como esta. ¿Os acordáis también del momento en el que vimos las respuestas terminales y las respuestas de Interim? ¿Os suena de la conducta supersticiosa que lo vimos ya hace tiempo? ¿Cómo funcionaba y qué tipo de conductas había en cada momento y cómo se podía condicionar ciertas respuestas que no tenían que ver con el reforzamiento porque aparecían en el momento exacto o concreto cuando caía o cuando apareció un reforzador? Bueno, no nos vamos a meter ahora con eso Lo importante de esto es que toma la conducta como algo mucho más general y además elimina el concepto de inhibición y lo sustituye por otro concepto que es el de competición entre respuestas En general, ¿qué hacemos en los experimentos en psicología, en aprendizaje? Pues atendemos a una sola conducta. La conducta que tratamos de reforzar Esa es nuestra variable dependiente, es decir presionar una palanca. Si aparece una luz roja y si aparece una luz roja te dan comida si tú presionas la palanca, pues nosotros nos dedicamos a ver cuántas veces presiona la palanca o cómo aumenta la presión de la palanca en presencia de la luz roja Pero la realidad es que la conducta es mucho más compleja y una ratita o una paloma en una caja de esquina no solamente está presionando palancas porque en presencia de la luz roja será más probable la presión de la palanca ¿Pero qué ocurre cuando hay una luz verde y no hay reforzamiento? Solemos decir que en presencia de la luz verde lo que se refuerza o lo que indica es que no hay que responder pero no es verdad En presencia de la luz verde no se responde pero la rata, la paloma o cualquier organismo está realizando otras conductas está haciendo otras cosas que también entran dentro del proceso de aprendizaje así que lo que hay es una competición entre además esas respuestas también generan ciertos reforzadores es decir, si ante la luz verde no hay comida pero yo, la paloma por ejemplo empieza a rascarse rascarse también genera un reforzamiento evita que le pique algo o quita el picor así que empieza a haber una competición entre respuestas que se dan cuando no está el estímulo discriminativo positivo y las respuestas asociadas al estímulo discriminativo positivo Es decir terminamos la limitación del análisis a una sola conducta incluimos el resto de conductas del sujeto ¿Qué decía Stadon? Lo mismo que en el otro porque esto es una teoría general que sirve para muchos tipos de aprendizaje Dos tipos de conductas las conductas terminales las que están controladas por la presencia del estímulo discriminativo positivo Una luz roja nos indica que si pulsamos la palanca aparece comida La conducta terminal sería la pulsación de la palanca ¿Qué fortalece esta conducta? ¿Qué hace que sea más probable? Pues el que aparece el reforzador, la comida Pero hay otro tipo de conductas las de interin cuando no está presente la luz roja o cuando está presente una luz verde que nos indica que no hay reforzamiento aparecen otras conductas por ejemplo rascarse dar vueltas sobre un amigo descansar o sentarse cualquier cosa que haga el organismo en ese momento y esas también son reforzadas son reforzadas por el mero hecho de que esas conductas, por ejemplo son reforzantes o por otros eventos que nosotros ni siquiera sabemos que existen porque no los hemos programado Así que ¿qué ocurrirá cuando presentamos diferentes luces que no son las originales no son ni la positiva, ni el discriminativo positivo y el negativo? Pues que se produce una competición entre la respuesta terminal que hemos entrenado cuando está presente el discriminativo positivo y el resto de respuestas que han sido reforzadas de otra manera fuera de nuestro programa que se dan cuando no está ese estímulo así que compiten en función de la semejanza con un estímulo o con el resto de estímulos unas conductas, las terminales o las de interin tendrán más o menos potencia Así que esa combinación de fuerzas hará que se responda más o menos a la palanca y el resultado serán los gradientes de generalización es decir, que la competición ya no es entre responder y no responder es entre responder como quiere el experimentador y todo el resto de conductas que pueden competir con esa respuesta sobre todo cuando no está presente el estímulo discriminativo positivo que refuerza esa conducta concreta ¿De acuerdo? Bueno, pues hasta aquí el tema 6. Vamos a pasar directamente al tema 7 al último tema del libro Aquí vamos a hablar sobre todo de control aversivo es decir, de procedimientos en los que las consecuencias son aversivas, son desagradables y de las particularidades que tienen estas consecuencias aversivas a la hora de entrenar o a la hora de desarrollar un aprendizaje, en particular en el condicionamiento operante nos vamos a centrar en el condicionamiento operante pero veréis que que nos centremos en el condicionamiento operante no significa que sólo vayamos a hablar de condicionamiento operante porque lo primero que vamos a ver es algo que llevamos diciendo durante todo el cuatrimestre que las contingencias operantes y clásicas se dan a la vez en todo tipo de aprendizaje no están separadas y vamos a ver lo importante que es esto en los procedimientos que utilizan estímulos aversivos porque algo que es el condicionamiento de emociones o las reacciones emocionales van a condicionar la forma en que adquirimos ciertos aprendizajes Bueno, veréis que si vais por el libro me salto algunas cosas son las que ya hemos visto porque en este tema hay incluso al principio un apartado el 1.1 en el que vuelve a repasar todos los procedimientos de condicionamiento operante el de recompensa, evitación todo eso ya lo vimos así que no me voy a detener de nuevo solamente en el enfoque de castigo y evitación y escape que son las partes fundamentales del tema Bueno lo primero que tenemos que tener en cuenta los individuos estamos adaptados a reaccionar rápidamente ante peligros, es decir ante estimulaciones aversivas que pueden ser peligrosas cualquier evento que cause dolor depredadores, cualquier cosa nociva peligrosa porque es importantísimo para sobrevivir como reaccionamos ante estímulos peligrosos o estímulos dolorosos o estímulos desagradables es muy relevante para nuestra supervivencia lo que suele hacer nuestro organismo ante estímulos peligrosos desagradables o biológicamente relevantes en el sentido negativo pues una serie de reacciones fisiológicas básicamente lo que estoy diciendo es que esto se comporta como un estímulo incondicionado estímulos que generan una respuesta innata elicitan una respuesta automática que se llama respuesta incondicionada pues estas reacciones fisiológicas son las más generales así es como nos preparamos ante las amenazas esto es la base de la ansiedad el hecho de que nos preparamos ante una amenaza aumentar nuestra tasa cardíaca y bueno si esto se mantiene en el tiempo durante mucho tiempo genera un síndrome crónico que es bastante peligroso trastorno por estrés o trastornos de ansiedad bueno, esto es la preparación de nuestro organismo ante las amenazas y esto esta reacción fisiológica hace que se den ciertas respuestas estereotipadas en función de la especie de las amenazas las clásicas, la huida la paralización si un animal tiene miedo en muchas ocasiones si puede ir, huye si no se paraliza y como último recurso si no puede hacer nada de lo anterior la agresión pero siempre como último recurso en general porque es la más peligrosa de todos agredir generalmente tiende a tener un riesgo muy grande porque te pueden agredir a ti también así que es mucho mejor en la naturaleza no se buscan peleas que intentar agredir a nadie así que esto siempre será una última opción bueno, estas conductas son específicas de especies de contexto y también de los diferentes estímulos es decir, no se dan todas ante todos los estímulos depende de cuál es el estímulo amenazante el contexto en el que nos encontremos la situación y la especie que sea pues tendrán una tendencia mayor o menor a diferentes tipos de respuestas bueno, esto parece más una perspectiva clásica pero ¿qué ocurre desde el punto de vista operante? ¿qué serán? consideramos estímulos aversivos aquellos que los organismos evitan o aquellos de los que los organismos escapan esto es una perspectiva más operante no relacionada con la respuesta que licitan sino que con lo que hacemos o con la respuesta que damos ante ellos en función de lo que causen, en función de sus consecuencias lo que hacemos normalmente ante estímulos aversivos es huir escapar, dar una respuesta de evitación o de huida bueno, perfecto ¿qué características específicas tienen estos procedimientos de condicionamiento operante? y ¿qué ocurre en el caso de los procedimientos de condicionamiento operante que utilizan estímulos aversivos? bueno, pues que producen estados emocionales específicos ¿y por qué ocurre esto? porque las contingencias clásicas lo que hemos dicho, el condicionamiento clásico y el condicionamiento operante en la vida real se encuentran entremezcladas, por ejemplo un estímulo incondicionado por ejemplo la comida que provoca salivación también sirve para reforzar, lo estamos viendo durante todos los temas, tenemos una luz roja, una palanca y cae comida, la comida sirve como reforzador de la presión de la palanca pero ¿qué provoca también la comida? salivación y como respuesta incondicional ¿y a qué es contingente o con qué es contingente la aparición de comida? pues curiosamente es contingente con la presión de la palanca y también con la aparición de la luz roja así que aparte de aumentar la probabilidad de la presión de la palanca, ¿qué va a provocar la luz roja al final? venga, alguien lo tiene que saber ¿qué ocurre con la luz roja? voy a esperar a que me lo diga ese anuncio ¿qué ocurre con la luz roja en un procedimiento de condicionamiento operante en el que reforzamos con comida? un estímulo discriminativo positivo ¿en qué se convierte también? ¿qué provoca? me lo doy diez segundos para ello ¿qué provoca? desde el punto de vista del condicionamiento clásico bueno, se convierte en un estímulo condicionado es decir, ante la aparición de la luz roja el organismo va a empezar a salivar va a empezar a dar la respuesta condicionada porque este estímulo ha aparecido contingentemente siempre con la comida, así que aumenta la probabilidad de respuesta y encima el organismo empieza a salivar a producir la respuesta condicionada asociada a este estímulo incondicional veis como los dos procedimientos están unidos en la vida real condicionamiento operante y condicionamiento clásico no son dos cosas distintas y separadas en el mundo, sino que se encuentran relacionadas y ocurren a la vez cuando estamos realizando un experimento o cualquier circunstancia o contingencia de aprendizaje así que se convierten en heces pero cuando utilizamos estímulos negativos, bueno no solo con los estímulos negativos con cualquier estímulo que produzca una reacción por sí misma, con cualquier estímulo incondicionado o con cualquier reforzador se van a generar por condicionamiento también estados emocionales, es decir no solo vas a salivar, sino que si sabes que después de la luz roja siempre aparece comida, salivaras y generas un estado emocional de alegría o de esperanza o de ilusión, como lo queráis llamar pero este será el estado emocional si ante la luz roja aparece un estímulo aversivo como una descarga el estado emocional que se va a generar es el de ansiedad si ante la luz roja retiramos el reforzador es decir, ya no aparece el reforzador lo que sentiremos es tristeza y si ante la luz roja lo que retiramos si presionamos la palanca es la comida perdón, la descarga si retiramos la descarga es decir, retiramos un estímulo aversivo sentiremos alivio cada uno de estos procedimientos está asociado al desarrollo de estados o reacciones emocionales en el sujeto que ocurrirán por condicionamiento clásico a la vez que ocurren las contingencias del condicionamiento operante que nosotros estamos programando ocurren a la vez y no las podemos controlar de hecho serán parte de nuestra contingencia de aprendizaje bueno esto es muy importante el desarrollo de respuestas emocionales va a determinar la eficacia y algunos de los efectos secundarios de muchos de los procedimientos que vamos a ver en particular el castigo el castigo positivo tiene efectos emocionales el miedo, el desarrollo de miedo que tiene un efecto muy concreto ¿qué hace el miedo? inhibe la conducta cuando tú haces alguna acción sea la que sea aunque lo haga mal un niño se porta mal y viene y además es su padre le pega un azote ¿qué ocurrirá? el niño grita y siempre que grita llega su padre y le da un azote el niño probablemente dejará de gritar pero ¿por qué lo hace? lo hace porque ha sido reforzado negativamente es decir, se le ha castigado por esto y eso reduce la conducta disminuye la probabilidad de conducta o lo hace porque desarrolla miedo al padre y eso inhibe la conducta bueno, pues la realidad es que lo hace por las dos cosas ¿vale? las dos cosas ocurren a la vez se desarrolla miedo que inhibe la conducta es decir, las consecuencias aversivas inhiben la conducta se produce una reacción de defensa y de inhibición conductual pero también tienen efecto las consecuencias operantes es decir, el reforzamiento esto es lo que decía la teoría de la respuesta emocional condicionada de Estes, del año ya 1944 ¿qué hace un estímulo condicionado excitatorio aversivo? pues provoca respuestas emocionales en este caso el estímulo condicional excitatorio aversivo es el padre que es el que va asociado al azote siempre que el niño hace algo da un azote ¿quién da el azote? el padre es decir, la presencia del padre es la que se asocia al dolor en este caso, al que te den un azote y eso desarrolla respuestas de paralización el miedo desarrollado desarrolla respuestas de paralización y eso es incompatible con la respuesta del sujeto es decir, si el niño solía gritar y por eso le pegaban el estar paralizado es incompatible así que suprime la conducta ¿qué ocurre? pues que generalmente cuando estamos en estas situaciones no hay un estímulo condicionado explícito es decir, no ponemos una luz roja al niño para que sepa que eso va a llevar al azote ¿qué se condiciona en este caso? pues se condiciona todo lo que hay alrededor se condiciona el padre se condiciona la casa si es donde le han dado el azote, se condicionan las otras personas que están allí es decir, todo lo que hay en el contexto, en la situación acaba siendo un estímulo condicionado, algo que se ha condicionado al estímulo incondicionado en este caso, el azote es decir, lo que produce dolor, al estímulo aversivo y todos pasan a cumplir esa función ¿veis lo peligroso que puede llegar a ser un castigo si no está bien aplicado si no es adecuado para lo que puede ocurrir con la conducta y las derivadas que tiene sobre la conducta y sobre lo que va ocurriendo porque ocurren muchas cosas en un proceso de aprendizaje y no muchas las tenemos controladas así que podemos organizar un caos constructual bastante grande si creemos que podemos hacer algo sin que haya unas consecuencias derivadas o unos efectos secundarios derivados de la aplicación del determinado proceso así que, una de las cosas que tenemos que tener muy en cuenta no quiere decir que el castigo no se deba aplicar nunca en ninguna situación simplemente hay que tener muy en cuenta que cuando lo estamos aplicando tenemos que tener mucho cuidado con controlar todas las posibles variables y que van a ocurrir muchas cosas aparte de la que nosotros queremos entonces da la sensación que la forma más fácil de suprimir la conducta es un castigo metes en la cárcel a alguien, pegas a alguien lo que sea, y queremos que así va a funcionar pero eso lleva una serie de derivadas y muchas veces puede ser lo más fácil pero no siempre tiene por qué ser lo más útil vamos a seguir con ello y vamos a empezar con la conducta de evitación evitación barra escape recordáis que era lo mismo el escape es cuando la respuesta se da una vez que ya había aparecido el estímulo desagradable y la evitación era cuando la respuesta se daba antes de que apareciese y por tanto no se llegaba a sufrir el estímulo desagradable bueno hay una cosa muy interesante en este tipo de aprendizaje, en el de evitación cuando el escape se convierte en evitación es el que mayor atención ha recibido por esta misma razón por la razón que os voy a comentar y es el reto teórico que supone intentar explicar cómo aparece sobre todo cómo se mantiene una conducta cuya consecuencia es la ausencia de un estímulo aversivo, imaginaos caja de esquina tenemos una luz roja que señala la presencia o que va a aparecer una descarga en el suelo pero si tu pulsas la palanca evitas que la descarga, al principio no lo sabes así que aparece la luz roja aparece la descarga y cuando descubres que presionando la palanca desaparece genial la luz roja se asocia a la descarga así que hay una razón para pulsar la palanca pero qué pasa cuando aprendes y una vez que ves la luz roja pulsas la palanca antes de que aparezca la descarga cómo se mantiene esa conducta sin que haya consecuencias porque ya no tienes acceso a las consecuencias se está extinguiendo la conducta la luz roja ya no señala o ya no es contingente a la descarga porque la descarga nunca llega a aparecer la conducta tampoco está siendo reforzada por evitar la descarga porque la descarga nunca llega a aparecer cómo se mantiene esa conducta si ya nunca aparece la descarga si ya nunca aparece la consecuencia todo lo que hemos visto hasta ahora dependía de la aparición de las consecuencias ahora ya no aparecen y sin embargo se mantienen, al principio se pensaba que esto tenía que ver sólo con el condicionamiento clásico es decir este estímulo, la luz roja señalaba la aparición de una descarga sin embargo Besterev en el XIII empezó a estudiar esta conducta fuera del condicionamiento clásico como una parte del condicionamiento pedante, es decir la descarga, el estímulo incondicionado no aparece si se presenta una respuesta él lo hizo con una con una descarga que se daba a los dedos y tenían que dar una especie de respuesta lo curioso es que para evitar lo que producía la descarga era una una especie de reacción refleja sobre los dedos entonces cuando hacían esa reacción refleja desaparecía la descarga poco a poco y lo hizo con varios grupos uno no podía evitar la descarga uno simplemente recibía la descarga y se producía la respuesta incondicionada, eso lo asociaba por ejemplo a la aparición de un estímulo y cada vez que veían el estímulo por ejemplo a la roja se producía la respuesta condicionada pero lo que vio en este caso Bechberev es que la capacidad que tenían de adquirir el aprendizaje, es decir de realizar ellos por sí mismos la respuesta de quitar el dedo era mucho más alta si se podía evitar la descarga si ellos eran capaces de evitar la descarga, si veían la luz que anticipaba la descarga, pero podían evitar que apareciese, la velocidad era mucho más rápida. ¿Qué quiere decir esto? Que eso no era una respuesta ilicitada, no era una respuesta refleja ante la aparición de una luz por condicionamiento clásico sino que era una respuesta operante que se daba de manera voluntaria para evitar una situación desagradable un estímulo desagradable es decir, la supuesta respuesta condicionada por condicionamiento entre un estímulo incondicionado y una luz no era tal respuesta condicionada había un componente de condicionamiento operante de evitación bueno, pues ese fue el principio y se han utilizado a partir de ahí se empezaron a utilizar diferentes procedimientos de evitación vamos a ver varios de ellos varios procedimientos de evitación desde la perspectiva del condicionamiento operante el primero es la evitación discriminada bueno, aquí me parece que os ha salido voy a cambiarlo no sé si os sale en azul a vosotros porque os sale de color azul la pantalla porque el no sé os lo seguís viendo bien es que a mí me sale ahora, ya está se me había puesto todo en azul y no sabía por qué debió ser un fallo porque he pulsado en un lado de la pantalla vale, ya está perfecto evitación discriminada ¿por qué se llama así? porque hay claves claves que nos señalan el acontecimiento todo lo que os he ido diciendo hasta ahora son evitaciones discriminadas por ejemplo, una luz nos señala que va a aparecer una descarga y podemos pulsar la palanca para evitarlo esto en general utiliza ensayos discretos es decir tenemos un evento neutro una señal, una luz roja si no respondemos nos pegan un chipazo hasta que respondemos hasta que presionamos el botón o la palanca en los ensayos en los que aparece el evento la luz roja que nos señala la aparición de la descarga y se produce una respuesta es decir, respondemos la señal desaparece esto es importante la luz roja desaparece y nos emite la descarga es decir, dos posibilidades aparece la luz roja, no respondemos descarga hasta que respondamos aparece la luz roja, respondemos la luz roja se apaga y la descarga no llega esto ensayo a ensayo esto es un proceso al principio suele empezar por escape como no sabes lo que tienes que hacer aparece la luz roja, te quedan mirándola como un bobo te dan un chipazo y hasta que descubres que tienes que presionar la palanca no se quita la descarga y desaparece la luz con el paso del tiempo aprendes eso y cada vez que ves la luz roja presionas la palanca la luz roja desaparece y no llega nunca a aparecer la descarga es decir, pasa del escape a la evitación ¿qué relaciones de contingencia qué contingencias tenemos presentes en este tipo de situación? tenemos tres elementos tenemos una señal que sería el estímulo discriminativo que hemos visto antes, pero ahora lo llamamos señal da igual, la nomenclatura sigue siendo lo mismo tenemos la respuesta y tenemos la consecuencia las tres términos de siempre del condicionamiento operativo ¿qué contingencias tenemos? ¿qué estímulos se relacionan con qué? bueno, pues la respuesta se relaciona con la señal de aviso si emitimos la respuesta, ¿qué hemos dicho? desaparece la señal está la luz roja encendida, emitimos la respuesta y se apaga la luz roja ya tenemos una contingencia contingencia, respuesta y consecuencia cuando respondemos, presionamos la palanca desaparece o no llega a aparecer la descarga recordad, luz presión de palanca descarga y tenemos otra contingencia que es la contingencia que hay entre la señal de aviso y la consecuencia fijaros muy bien en esto ¿de qué depende esa contingencia? pues depende de nuestra respuesta si no respondemos, y esto ocurrirá sobre todo al principio, siempre que aparece la luz roja aparece una descarga os imagináis que ocurriría en este caso se condicionará la luz roja a la aparición de la descarga es decir, pasará a ser un estímulo condicionado pero según vayan pasando los ensayos como respondemos, nunca aparecerán conjuntamente la luz roja y la descarga porque habrá evitado la descarga pulsando así que según van avanzando los ensayos se produce un proceso de extinción al principio se ha condicionado la luz roja a la aparición de la descarga pero luego nunca aparece la descarga después de la luz roja, así que empieza a extinguirse ese proceso de condicionamiento fijaros, esto es lo importante para la explicación que vamos a dar ahora cómo se mantiene la conducta de evitación si nunca llega a aparecer la descarga bueno, antes de empezar las explicaciones varias cosas que decir sobre este procedimiento de evitación, primero es mucho más difícil adquirir este aprendizaje que un programa de reforzamiento positivo es decir, es mucho más fácil presionar una palanca para obtener comida que presionar una palanca ante la presencia de una luz para evitar una descarga mucho más difícil se necesitan mucho más ensayos ¿por qué? bueno, pues hay dos posibles explicaciones primero la interferencia de la conducta licitada es decir, del condicionamiento clásico que licita la presencia de la luz si se ha condicionado a la descarga la paralización y eso dificulta que tú puedas realizar cualquier conducta si tú tienes que darle una palanca para evitar una descarga pero resulta que la luz que te indica que tienes que presionar una palanca se ha condicionado a la aparición de descarga y produce una respuesta condicionada de paralización pues estar paralizado es incompatible con presionar palancas así que te va a costar mucho más porque entran en conflicto hay una interferencia entre los dos tipos de condicionamiento que se dan en esta situación segundo la especificidad de la conducta requerida en función de la especie es decir, cuanto más parecida sea la respuesta que requerimos a la respuesta condicionada, automática la respuesta que se da o la respuesta condicionada que se da ante el estímulo condicionado es decir, cuanto más se parezca a la respuesta que requerimos a la respuesta innata que daría el sujeto ante la aparición de la descarga mayor velocidad de aprendizaje es decir, por ejemplo imaginaros que requerimos pulsar una palanca para evitar la descarga esto será mucho más lento que si lo que requerimos en la rata para evitar la descarga es saltar lejos de la descarga esta respuesta de salto de alejarse del lugar donde está la descarga es mucho más parecida a la respuesta natural que daría la rata si cree que le van a dar una descarga así que ese aprendizaje sería mucho más fácil interferencia del condicionamiento clásico y especificidad o relación o parecido de la conducta que queremos entrenar con la conducta innata que se daría ante ese estímulo pues ya tenemos algunas cosas sobre esto ¿y cómo lo explicamos? vamos a ver dos posibles explicaciones una que tiene que ver con el miedo el desarrollo de miedo recordad que estamos dando la descarga y otra que prescinde del miedo vamos a verlo primero, la teoría bifactorial de Mower es la que ha sido más influyente la más desarrollada cómo reforzamos una conducta a través de algo o de no cómo reforzamos presionar una palanca para evitar una descarga si nunca aparece la descarga bueno, pues vamos a verlo es un proceso como dice él de dos factores o que están implicados dos procesos el condicionamiento clásico del miedo recordáis que aparece al principio la descarga cuando todavía ese escape asociado siempre a la aparición de la señal que nos indica cuando podemos pulsar la palanca que va a aparecer la descarga porque la descarga da miedo y si esto se condiciona a la aparición de la descarga este estímulo condicionado empieza a dar miedo y por otro lado el condicionamiento operante de la respuesta de habitación ¿por qué? pues porque, de nuevo en la misma situación tenemos la luz roja, tenemos la palanca y la descarga cuando aparece la luz roja y nosotros presionamos la palanca evitamos que aparezca la descarga cuando aparece la luz roja tenemos miedo así que presionando la palanca que evita la descarga ¿qué hacemos? reducimos el miedo ¿cuál es el reforzador de la presión de la palanca? la reducción del miedo porque desaparece recordad que siempre que presionamos desaparece este estímulo la reducción del miedo derivada de la desaparición del estímulo que se ha asociado clásicamente o misacondicionado a la aparición de la descarga proceso la señal, la luz roja, se condiciona la descarga porque al principio se aparecen juntos así que al final la luz roja se condiciona y empieza a provocar una respuesta condicionada de miedo, la misma que provocaría la descarga como la respuesta no es lo suficientemente rápida para evitar la descarga, es decir todavía no estamos en evitación sino en escape, esto ocurre se condiciona la señal a la descarga bien, con el paso de los ensayos el sujeto emite la respuesta para escapar del miedo así que termina evitando la aparición de la descarga y ya no aparece esa descarga ¿qué ocurre en ese caso? como ya no aparece la descarga esta relación clásica entre el condicionamiento clásico entre la luz la señal y la descarga empieza a extinguirse, se extingue esa relación porque ya no aparece nunca la luz seguida de la descarga así que empieza a extinguirse ¿qué ocurre cuando se extingue esa relación de miedo? pues que empezamos a dejar de dar la respuesta porque esto nos deja de dar miedo la presión de la palanca deja de reducir el miedo porque ya no aparece miedo ante esto así que dejamos de presionar la palanca esto vuelve a aparecer esto vuelve a condicionarse y vuelve a hacer que presionemos la palanca ¿veis el ciclo? se condiciona, presionamos la palanca evitamos la descarga, se extingue como eso se extingue y no se presiona la palanca vuelve a aparecer la descarga y vuelve a retroalimentarse estaríamos en ese ciclo continuamente bien, esta es la hipótesis de Mogul la hipótesis bifactorial condicionamiento del miedo y dos tipos de procesos el condicionamiento del miedo y la reducción del miedo a través de la presión segundo, la hipótesis de Schoenenfeld de 1950, un poquito posterior bueno, pues elimina el miedo ¿qué adquiere? ya no habla de miedo es que la señal por su asociación con la descarga porque cuando aparece la luz roja como todavía al principio no estamos respondiendo aparece la descarga y por lo tanto esta luz adquiere funciones de estímulo condicionado aversivo ¿recordáis que cuando hablábamos de estímulos de condicionamiento clásico decíamos que estímulos que han sido condicionados suceden a un estímulo incondicionado, por ejemplo cuando asociamos la aparición de comida a la presencia de bueno, a la presencia de una luz una luz roja y después aparece comida la luz roja termina generando la respuesta condicionada a salivación pero a la vez esa luz roja ahora puede ser utilizada como estímulo incondicionado como estímulo incondicionado de segundo orden en un condicionamiento de segundo orden ¿por qué? porque ese estímulo condicionado adquiere las características del estímulo incondicionado original pasa a ser un estímulo incondicionado de segundo orden bueno, pues esa sería la función que adquiere la señal ¿por qué emiten la respuesta de escape entonces? porque se retira la señal como la señal en sí misma pasa a ser aversiva porque se ha condicionado la descarga, los sujetos pulsan esta palanca porque hace desaparecer la señal y hace desaparecer la situación aversiva es decir, sería una cuestión de reforzamiento negativo secundario, como esto ya ha adquirido la capacidad de ser un estímulo incondicionado en sí mismo, no hace falta aludir al miedo se responde para evitar la consecuencia desagradable que ya proporciona esto por su asociación con la descarga bueno, pues aquí tenemos las dos explicaciones para este tipo de conducta pero tenemos más tipos de procedimientos para la conducta de evitación o para provocar una conducta de evitación o más situaciones de aprendizaje de evitación es lo que se denomina la evitación no discriminada de operante libre de Schindler que es el nombre más largo y más difícil de aprenderse que existe en el mundo y que luego es algo bastante sencillo ¿qué se hace en este caso? bueno, pues tenemos una caja de Skinner y aquí prescindimos de las señales, por lo menos de las señales explícitas, aunque siempre hay señales ahora vamos a ver algo sobre esto tenemos un suelo electrificado, así que programamos una descarga cada cierto tiempo cada 10 segundos un chipazo sin previo aviso, simplemente estás tan tranquilo y de repente te sueltan una descarga cada cierto tiempo pongamos cada 10 segundos pero ponemos una palanca aquí y especificamos que si presionas la palanca la la conducta de presionar la palanca retrasa la aparición de la de la descarga por un tiempo, es decir si yo no hago nada, cada 10 segundos una descarga eh la descarga se mantiene hasta que pulso la palanca lógicamente, y luego pasan otros 10 segundos y no pulso, pero si entre descarga y descarga yo pulso hay un tiempo de seguridad, es decir retrasa la descarga, por ejemplo pongamos 5 segundos no hay descarga, yo no hago nada, descarga hasta que no pulso no desaparece eso me proporciona un tiempo de seguridad o otro intervalo de descarga si no hago nada, de nuevo vuelve a aparecer la descarga pero si yo voy pulsando cada cierto tiempo, voy retrasando la descarga y la descarga no llega a aparecer nunca veis, al final los sujetos lo que terminan es aprendiendo a ir pulsando cada cierto tiempo, o pulsar siempre la palanca para evitar que aparezca la descarga. ¿Cómo se mide todo esto? o ¿cuáles son las características del tipo de aprendizaje? bueno pues se caracteriza por dos tipos de intervalo, quedaros bien con esto, el intervalo ee, er, er o dicho de otra manera aquí los nombres son peleagudos, reloj choque, choque, que viene a ser básicamente el intervalo entre descargas y no hay respuestas, es decir si yo no respondo y me dan una descarga cada 10 segundos, el intervalo ee, er, er, er rr, rr o reloj choque, choque es un intervalo de 10 segundos y otro intervalo que es el erre, rer o reloj, respuesta choque, que con ese nombre tan complicado no es nada más que el intervalo entre una respuesta y la descarga programada es decir, el periodo de seguridad que me da la respuesta, si yo presiono la respuesta ¿cuánto retraso la aparición de la descarga? aquí hemos dicho 5 segundos, bueno pues esto es lo que define este procedimiento y esto es operante libre, aquí no hay que hacer varios ensayos, aquí dejamos a la ratilla dentro y la ratilla va aprendiendo va operando libremente en el entorno para evitar la descarga ¿qué ocurre con esto? bueno pues primero son procedimientos mucho más largos, se tarda muchísimo más en aprender, de hecho muchas veces no aprenden nunca, y por último hay grandes diferencias entre sujetos, unos aprenden muy rápido otros aprenden más despacio, y ese aprendizaje depende mucho de estos intervalos, de los intervalos de seguridad y de los intervalos de respuesta, bueno es otro procedimiento, el procedimiento de operante libre en el que ya no hay claves, antes era una invitación discriminada, o sea que habéis aprendido aprendizaje discriminativo, había unas señales que nos indicaban cuando iba a aparecer, aquí no lo hay, bueno no lo hay, ¿creéis que no lo hay? o ¿creéis que hay alguna señal? he dicho que no hay señales explícitas pero tenemos alguna señal implícita ¿no? porque si fijamos un intervalo, ese tiempo es una señal en sí mismo el paso del tiempo actúa como señal para la aparición de descarga por eso vamos a ver una última conducta vamos a ver primero las hipótesis sobre sobre este tipo de conducta y por último veremos la última el último procedimiento de evitación con descargas aleatorias en el que ya sí que no hay ningún tipo de señal, pero vamos a ver primero las explicaciones que se dan para este tipo de conductas vamos a empezar con la hipótesis, o sea por qué los sujetos aprenden este tipo de situaciones en la situación de de evitación no discriminada vamos a ver por qué ocurre esto tres tipos de explicaciones o tres diferentes explicaciones, una de ellas bastante moderna además bueno, ¿cuál sería nuestra señal de aviso? pues para Sidman que es el que desarrolló este procedimiento sería la propia conducta del sujeto ¿por qué? no sólo el paso del tiempo sino también la conducta del sujeto, ¿por qué? pues porque resulta que todas las conductas que realiza el sujeto se asocian a la descarga, si el sujeto da vueltas, descarga, si el sujeto salta, descarga, si el sujeto se sienta, descarga, todas menos una la presión de la palanca si el sujeto presiona la palanca no ocurre ¿qué ocurre? pues que todo el resto de conductas que se dan durante el intervalo generan ansiedad porque se asocian a la aparición de la descarga ¿cómo se escapa de esa ansiedad? bueno, pues presionando la palanca, es decir ¿cómo se refuerza la presión de la palanca? por la disminución de la ansiedad que se ha generado por la asociación de todas las conductas que no eran esas con la aparición de la descarga, de nuevo mezcla de procedimientos operantes refuerzo de la conducta de presionar la palanca con procedimientos clásicos, asociación de todas las conductas a la aparición de una descarga todas las conductas menos una, porque todas las conductas, haga lo que haga va a acabar en descarga, excepto una así que cuando presiono la palanca yo ya estoy realizando conductas durante ese intervalo y todas me producen ansiedad porque todas van a llevar a la descarga que reduce la ansiedad primera hipótesis, segunda algo de lo que ya os he hablado, el paso del tiempo ¿qué es lo que dice la hipótesis interoceptiva de Amgen? pues sustituye la propia conducta por el tiempo lo que produce ansiedad no es la propia conducta o las conductas que realiza que se asocian con la descarga, el mero paso del tiempo que acerca la descarga el mero contaje del paso del tiempo produce ansiedad y responder reduce esa ansiedad, es lo mismo pero para simbolizarlo por un examen o para entenderlo por un examen es súper sencillo, porque esta primera nos habla de que la ansiedad la produce la propia conducta, todas las conductas no asociadas o todas las conductas que no son objetivos la hipótesis interoceptiva nos dice que no que esa ansiedad la produce el paso del tiempo y por último la última de las hipótesis la hipótesis de la señal de seguridad de Dísmonos esto se basa en el reforzamiento positivo fijaros, los estímulos asociados a los periodos de seguridad provocados por la respuesta operante, es decir cuando tú respondes, le das a la paranca se genera un periodo de seguridad y ese periodo de seguridad está asociado a una serie de estímulos ya sea tu propia conducta, tu propio estado interno etc, etc, etc y esos se convierten en estímulos condicionados inhibitorios aversivos, es decir que se relacionan con la no aparición de la descarga es decir, se condicionan, se relacionan con que todos esos estímulos señalan el no aparición de la descarga y eso es lo que funciona como reforzador para la respuesta es decir, ¿por qué se presiona a la palanca? pues se presiona a la palanca para obtener todos esos estímulos que se han relacionado con la ausencia de la descarga bueno, esta es la que más apoyo empírico tiene la basada en el reforzamiento positivo es decir, que los sujetos presionan la palanca para obtener algo positivo que son esos estímulos inhibitorios aversivos, es decir que se relacionan con la no aparición de la descarga con algo positivo bueno, pues esto sería las tres hipótesis por las que se realizaría o cómo se reforzaría la respuesta para evitar la descarga, a pesar de que en muchas ocasiones la descarga no aparece y vamos con el último procedimiento el último procedimiento es, bueno yo creo que Hersten y Hinelein que tienen nombres de comandantes espero que me perdonen si me han escuchado alguna vez pero es broma tienen nombres de comandantes de campo de concentración nazi Hersten y Hinelein podrían ser comandantes de las SS perfectamente y os lo digo para que luego recordéis este procedimiento porque lo siguiente que os voy a decir es que es quizá el procedimiento más maquiavélico que yo he visto en mi vida para realizar este tipo de aprendizaje es macabro casi ¿por qué? pues porque básicamente se mete al organismo animal o rata o lo que sea en una máquina con una palanca y dos máquinas diferentes que provocan descargas pero solo una de ellas está activada a la vez parece una película de show parece que estoy contando una de las escenas de una película de show en fin bueno, ¿qué hace cada una de estas máquinas? esta es la máquina A y la máquina B pues lo que hace es dar descargas en el suelo intensas y breves son bastante intensas la rata está aquí y una de las dos máquinas está conectada siempre una de las dos y produce descargas intensas y además no las puedes predecir porque son irregulares no sabes cuándo van a aparecer una vez tardan 2 segundos como un reforzamiento de intervalo variable que nunca sabes cuándo va a aparecer pero sabes que va a aparecer en un intervalo la única diferencia es que esta da más que esta la máquina A da más descargas por minuto que esta, en periodos irregulares las dos pero esta da más así que será mejor estar en esta bueno, pues esa es la clave ¿qué ocurre? pues cuando se mete la ratita aquí inicialmente la máquina A está conectada si presionas la palanca se conecta a la máquina B y entonces recibes menos descargas y se mantiene la máquina B activa hasta que da la primera descarga y después se desactiva esta y vuelve a activarse esta y vuelven a darte más descargas ¿qué quiere decir? si no respondes a la palanca va a estar siempre activo A pero si tú respondes constantemente a esta, va a estar activa B es decir, vas a recibir descargas con menos frecuencia lo maquiavélico del asunto es que tú no respondes para evitar descargas respondes para que te den menos descargas porque siempre vas a recibir descargas lo único que puedes hacer es disminuir la tasa total de descargas solo puedes presionar todo lo que puedas para intentar que esta máquina siempre esté en funcionamiento y el número de descargas que te den sea menor un poco maquiavélico un poco de película de terror y encima se llaman Hersten y Himmelheim esto no os vais a olvidar yo creo bueno, ¿por qué se refuerza la conducta? bueno, pues por la disminución de la frecuencia total de estimulación no por retardarla no por omitirla nada de eso, porque además ni siquiera se puede retardar porque puede ser que pulses y justo en el momento en que pulses se active la máquina B pues no se da indefensión aprendida porque hay cierto control sobre las consecuencias indefensión aprendida se da cuando no tienes ningún control sobre las consecuencias pero aquí sí lo tienes porque eres capaz de reducir el número de descargas así que sabes que tu actividad sigue sufriendo, pero menos así que tienes cierto control no se da indefensión aprendida no se da por tu propio bien porque mientras sigas pulsando siempre hay consecuencias una cosa es que no se pueda tener control absoluto sobre las consecuencias y otra cosa es que no se tenga control sobre las consecuencias control absoluto sería hacer que desaparezcan o poder manejarlas a tu antojo aquí el control no es absoluto pero sí hay control es decir, hay un cambio en el entorno derivado de tu conducta no, pero es un cambio lo mismo nos ocurre en muchas situaciones no podemos controlar todo lo que nos ocurre pero sí podemos controlarlo en cierta medida así que tenemos cierta experiencia de control lo mismo ocurre aquí de hecho lo único que pueden controlar es esa frecuencia total porque ni siquiera el retardo de las consecuencias porque imaginaros que yo pulso aquí para que pase a la B pero justo el intervalo se acaba de terminar nada más pulsar que me darán un chispazo así que incluso puedo provocar un chispazo por darle a la palanca y en el total de ensayos el número será menor bueno, pues esta es la explicación y este es el último procedimiento de evitación que a mí me parece me parece muy maquiavélico la verdad es que es tremendo pero bueno, lo bueno que va a tener es que creo que va a ser difícil que se olvide tanto el nombre Gerson y Hinelein los dos comandantes de las SS para más inri... bueno, eso ya me lo voy a ahorrar pero fijaros cuáles son las iniciales de los dos hay una, bueno venga lo cuento hay una entre muchos grupos de neonazis hay una especie de de mantra o de bueno, de señal que ejemplifican transformando estas dos letras en números que serían las relacionadas al saludo que se hace a Hitler en su momento y es todo esto me parece que os vais a acordar de esto fenomenal en el examen porque el procedimiento es tremendo bueno, que sirva por lo menos para acordar aunque sea un poco tétrico seguimos, vamos a continuar vamos a ver las variables que afectan al reforzamiento negativo al procedimiento a los procedimientos de evitación vamos a ver cuáles son las diferentes variables vamos a pasar un poco rápido por ellos que son bastante sencillas y nos ponemos con lo que nos dé tiempo sobre, nada, 10 minutos sobre el castigo por suerte la parte de castigo es más sencilla si no nos da tiempo a verla entera tenéis más fácil estudiarla por vuestra cuenta la parte de evitación era más difícil bueno, primero cuanto mayor es la intensidad de la estimulación más rápidamente se aprende es decir, se aprende a palos básicamente cuanto más intensa es más rápido se adquiere la conducta a la fuerza órgan la habituación y la extinción reducen la efectividad de las consecuencias a ver si ambas tanto habituarse al estímulo es decir, la habituación a la descarga si tú habituas a la pobre rata a la descarga pues déjate de tener tantos efectos ya no sería tan amenazante y eso haría que se aprendiese peor y si lo extingues todavía más si juntas la señal o empiezas a presentar la señal en ausencia de la descarga es decir, que se extinga esta relación también hace que se tarde más en aprender esta evitación os acordáis de la evitación libre en el procedimiento libre no señalado, no discriminativo que había dos intervalos el reloj choque y el choque-choque la tasa de aprendizaje o cómo se aprende está determinada por esos dos intervalos por la diferencia que hay entre el intervalo entre descargas y el intervalo de seguridad a mayor frecuencia de descargas en ausencia de respuesta es decir, cuantas más descargas te dé si tú no respondes y mayor sea también el periodo de seguridad es decir, que si tú no respondes te den muchas descargas pero que si respondes se retrase mucho la descarga mejor o mayor probabilidad hay de aprendizaje, es lógico te dan muchas descargas y tu respuesta tiene mucho efecto porque las pospone mucho aprendes más rápido las consecuencias de tu conducta se aprenden más rápido y también ocurre en la descarga aleatoria aunque no se puede evitar del todo es decir, estos intervalos en la descarga aleatoria que aumentan los periodos de seguridad porque la máquina A-B te da menos descargas pues ocurre exactamente lo mismo el mismo efecto de mayor frecuencia de descargas y mayor intervalo entre descargas una vez que se da la respuesta aunque no se pueda evitar del todo los dos funcionan exactamente igual más cosas vamos ya con el castigo nos va a dar tiempo a ver lo justo vamos a ver tres aproximaciones teóricas diferentes ¿qué decía Zornike? veía el reforzamiento positivo y el castigo como procesos opuestos uno fortalece la conducta, el otro debilita la probabilidad de la conducta el otro la disminuye ¿qué hacen las consecuencias negativas? ¿qué hace que se te presente una descarga después de pulsar una palanca? recordad que hemos pasado al castigo ¿qué pasa si después de una pulsación de una palanca aparece una descarga? pues que se debilita la asociación entre los estímulos del entorno o la oportunidad de esa respuesta y la respuesta, es decir la conducta tiene una menor probabilidad esto no lo vamos a ver porque ya vimos la respuesta emocional condicionada la hemos visto al principio del tema, así que no vamos a repetirlo la última teoría es la teoría de las respuestas competitivas reforzadas negativamente teoría de Binsmore en el 54 bueno, fijaros lo que se adquieren serán respuestas de evitación incompatibles con la respuesta castigada es decir, para Nismore no es que se debilite la respuesta castigada no es que la asociación entre los estímulos del entorno esta respuesta se debilite debido a que la castigamos y por tanto haya menor probabilidad sino que lo que hace el organismo es fortalecer la asociación entre otras respuestas alternativas por ejemplo dar vueltas sobre sí mismo o saltar, que son incompatibles con esta respuesta que es castigada es decir, el hecho de que realizar otras conductas no lleve o haga desaparecer la descarga en fin, no lleve a la descarga, hace que se refuercen y que por tanto la conducta objetivo desaparezca esas serían las tres variables que afectan perdón, las tres explicaciones o los tres enfoques teóricos sobre el castigo ¿qué variables afectan al castigo? bueno, pues tenemos varios tened en cuenta una cosa los estudios que vamos a ver no parten os acordáis del principio de Premak lo de que una conducta más probable puede reforzar una menos probable y una conducta menos probable castiga a una más probable bueno, la mayoría de los estudios no parten de eso como estamos hablando de experimentos partimos de una situación diferente porque tenemos más control sobre la conducta la mayoría de estudios lo que hacen es reforzar una conducta primeramente es decir, reforzamos la presión de una palanca con comida y después cambiamos la contingencia y castigamos la presión de la palanca para ver cómo desaparece esa conducta y sumamos ambos efectos teniendo en cuenta que así es como se preparan estas contingencias vamos a ver qué variables afectan a la adquisición de este aprendizaje a través del castigo primero, la intensidad del estímulo aversivo de nuevo, a palo se aprende a la fuerza Orkand a mayor intensidad del estímulo aversivo cuanto más fuerte sea la descarga mayor eficacia para su primera respuesta si te dan una una descarga por presionar una palanca o por saltar, por ejemplo cuanto más fuerte sea la descarga antes dejas de presionar de la palanca o de saltar si no hay contacto con la consecuencia aversiva y esto es uno de los problemas con el castigo es que en el momento en el que deje de aparecer la respuesta y por tanto dejan de aparecer las consecuencias aversivas puede reaparecer la conducta por eso siempre hay dudas sobre una de las razones por las que hay dudas sobre la eficacia del castigo dejas de realizar la conducta dejan de aparecer las consecuencias y empieza a extinguirse el castigo así que puede reaparecer la conducta inmediatez y demora del estímulo aversivo también muy sencillo cuanto más rápido se aplique el castigo después de la conducta más eficaz es lo habéis visto también en ambientes reales con humanos si hay que castigar a alguien hay que castigarlo en el momento también se dice con las mascotas para entrenarlas, etc, etc si vas a aplicar un castigo tiene que ser en el mismo momento cuanto más contiguo, más inmediato mejor segundo, perdón, tercero cambios graduales en la intensidad del estímulo aversivo esto no funciona lo mejor es introducir el castigo más intenso desde el principio es decir, desde el principio la máxima intensidad de castigo cuando gradualmente el castigo no vale para nada tiene que ser intenso desde el principio y la experiencia previa para que se pueda castigar una conducta esa conducta tiene que existir de antes y se ha tenido que reforzar previamente si el reforzamiento previo o lo que se ha reforzado con esa conducta previamente es una fase muy larga y se ha reforzado mucho el castigo es menos efectivo si te has dedicado a premiar los berrinches de tu hijo durante mucho tiempo prestando la atención y haciendo es decir, reforzándolos va a ser mucho más difícil que luego empieces a castigar esos berrinches y desaparezca la conducta va a ser mucho más difícil ¿de acuerdo? y terminamos con estos últimos estas últimas variables y dejamos aquí el la tutoría efectos discriminativos del estímulo aversivo vale si solo castigamos en presencia de un estímulo determinado solamente funcionará el castigo con ese estímulo, es decir si castigamos una rata por presionar una palanca en presencia de una luz roja solamente será efectivo en presencia de esa luz roja es decir, la luz roja toma el control de la ausencia de conducta si solo castigamos los berrinches en presencia de el padre o la madre del niño o de un profesor solamente no se darán berrinches en presencia de esa figura que indica el castigo pero así se darán en otras situaciones los programas de castigo aquí justo lo contrario que lo que vimos hace tiempo en los programas de reforzamiento se puede administrar el castigo de manera intermitente, razón fija, variable intervalo, etcétera pero aquí funcionan peor los programas que mejor funcionan en el castigo son los programas continuos cuando se castiga todas las conductas no algunas conductas justo lo contrario con el reforzamiento positivo luego tenemos los programas de reforzamiento compuesto es decir, cómo se aplica ese programa porque todo castigo siempre va a ser una técnica que incluye varios procedimientos ¿por qué? porque antes de ello hay que reforzar la conducta para que aparezca primero tiene que haber una conducta que ha sido reforzada y por eso aparece y luego se quiere eliminar primero, castigo sobre línea base apetitiva es decir, que se aplica castigo y reforzamiento sobre la misma respuesta y después se castiga esa misma respuesta segundo, castigo sobre línea base defensiva es decir, primero una conducta sirve para escapar de algo malo y después esa misma conducta se castiga, se le hace o se le da esa consecuencia esa consecuencia mala, esa consecuencia aversiva y tercero, castigo sobre línea base de extinción una respuesta puede estar siendo extinguida y luego puede ser castigada imaginaros que premiamos la conducta de una palanca con comida ¿vale? pero después la conducta de presionar la palanca no va a ser vida de comida la estamos extinguiendo bueno, pues podemos añadirle a esto un castigo es decir, aparte de dejar de aparecer comida ahora además cada vez que pulses una descarga lo que hará que la eficacia del castigo aumente dos cosas más, existencia de conducta alternativa esto es muy importante para que la eficacia del castigo aumente es muy bueno tener disponible una respuesta alternativa por ejemplo, si queremos castigar o hacer desaparecer los berrinches de un niño mucho mejor que solamente castigarlo es proporcionarle una respuesta alternativa como por ejemplo el premiar el que se exprese de otra manera una respuesta alternativa e incompatible con el castigo hará que sea mucho más eficaz el castigo de esa conducta y proporcionar alternativas y después las manipulaciones motivacionales, mucho mayor eficacia de un castigo si reducimos la motivación para emitir la respuesta ejemplo clásico si antes presionamos una palanca para obtener comida vale, y ahora queremos castigar esta presión de la palanca que no la hagan más si el animal está muy bien alimentado y no tiene hambre, es decir, no tiene motivación para responder será más eficaz el castigo bueno chicos, pues hasta aquí hemos llegado descargaros estos apuntes sí, sí, sí, sí os voy a pasar los enlaces si avanzo más con ellos os voy a pasar todos los enlaces os voy informando en los foros de todas maneras todo va a ser a través del foro de nuestro foro de tutorías y si tenéis preguntas lo mismo podéis contactar conmigo a través de email por supuesto, pero si queréis para que lo pueda ver todo el mundo compañeros, estaría bien contestar las preguntas a través del foro para no responderlas varias veces así todo el mundo puede tenerlas y además quedan almacenadas y podéis consultarlas así que nada muchísimas gracias muchísimas gracias a todos por vuestra atención muchísima suerte en los exámenes preparadlo todo bien ya sabéis que tenemos una situación excepcional así que cuanta más preparación llevéis no sólo del examen sino también de las herramientas que vais a utilizar en el examen y mejor conozcáis todos y más os aseguráis, muchísimo mejor mucha suerte y espero no volver a veros más digo esto porque eso quiere decir que vais a aprobar aprendizaje no quiero volveros a ver más en esta asignatura pero sí en Percepción el año que viene si alguno ve mis clases o asiste a algún centro asociado de los que doy clase de Percepción así que nada, muchísimas gracias a todos chicos y muchísima suerte y nos vemos a través de y hablamos a través de nosotros