Bueno chicos, no, no eres tú, es que estaba parada la imagen, siempre dejo congelada la imagen antes de empezar. Comentadme si se ve y se oye bien, si está todo correcto. A ver que... toco la cámara, a ver si está todo bien y en cuanto me confirméis empezamos, ¿de acuerdo? Todo ok, ¿no? Vale, perfecto. Ya sabéis, si la imagen no aparece, reiniciáis el... refrescáis la página, perdón, y ya aparezco, ¿vale? Porque cuando paro el vídeo hay veces que se deja de ver. No se deja de oír, pero se deja de ver por alguna razón. Pero debería funcionar en cuanto volváis a entrar. Bueno, y si ya he empezado a grabar... Así que si ya está todo correcto, empezamos. Cosas buenas, buenas noticias. Bueno, relativamente buenas o malas, según se mire. En el C1 nos han dicho que podemos continuar las tutorías hasta la semana de los exámenes, así que vamos a tener esta tutoría y otras dos más. Así que nos va a dar tiempo a ver todo con bastante tranquilidad. Hoy vamos a terminar el tema 7, lo que nos queda del tema 7 es bastante parte del tema 7, pero nos va a dar tiempo, yo creo. Y todavía... Y todavía vamos a tener dos tutorías más. La tutoría de la semana que viene va a ser para hablar de los contenidos prácticos, los que quedan, los que van a entrar, los obligatorios, los que entran en examen. Y la última de las tutorías, pues para preguntas de repaso y para hablar un poquillo del examen y de cómo va a ser todo esto y también comentar un poquillo la aplicación y todas esas cosas. También os pondré... Lo veremos aquí en diapositivas y os pasaré los materiales. Aunque seguramente ya lo habréis visto casi todo, pero bueno, así podemos consultar dudas. Y también resolver algunas preguntas, bueno, lo que surja en ese caso. ¿De acuerdo? Y nada más. Así que como tenemos todavía las tutorías, vamos a seguir con esto. ¿Cómo se ve mejor, por cierto? ¿Así más cerca o...? Sí, yo creo que es el mejor, que queda un poco más cercano. Bueno, pues vamos allá. Nos quedamos en el último tema, en el que hablamos de los procedimientos en los que se utilizan estímulos aversivos. Procedimientos operantes. Mejor dicho, el control por el estímulo, como ciertos estímulos del entorno adquieren control de la conducta en procedimientos en los que se utilizan estímulos aversivos o consecuencias aversivas. Ya sea para aumentar la frecuencia de una conducta o sea para disminuir la frecuencia de una conducta. Bueno, recordad que con estímulos aversivos se puede aumentar y disminuir la frecuencia de una conducta. Las dos cosas. Porque si la conducta nos sirve para evitar una consecuencia aversiva, bueno, pues entonces la frecuencia de esa conducta o la probabilidad de que esa conducta va a aumentar. Si la conducta hace aparecer la consecuencia aversiva, entonces la frecuencia o la probabilidad de esa conducta pues va a disminuir. Nos quedamos en los procedimientos de evitación, si no recuerdo mal. Y empezamos con la evitación discriminada. En los procesos de evitación, recordad que hablamos un poco en la diapositiva anterior sobre por qué tienen interés, por qué se han estudiado tanto los procesos o las formas de... de aprendizaje relacionado con la evitación o los procesos de condicionamiento operante de evitación. Y es porque, sobre todo por el interés teórico que despierta el hecho de que se mantenga una conducta a pesar de que la consecuencia no aparece. Porque ya sabéis que si se evita quiere decir que al realizar la conducta no aparece la consecuencia negativa. ¿Cómo se mantiene esto? Bueno, pues eso es lo que vamos a ver. Vamos a repasar un poquito desde aquí y continuamos con los tres procedimientos de evitación que tenemos y luego pasamos directamente al castigo. Bueno, primer procedimiento, evitación discriminada, en la que hay señales que indican o que señalan cuándo va a aparecer el acontecimiento a ver si lo vamos a imaginarnos que va a ser una descarga. Entonces, primero tenéis que tener claro que en este tipo de procedimientos se utilizan ensayos discretos. Recordad que en la mayoría de cajas de Skinner se utiliza el procedimiento típico de Skinner, que es de operante libre. Es decir, que los sujetos pueden presionar la palanca o hacer la actividad que tengan que hacer de manera continua y todas las veces que quieran. Es decir, no existe ningún tipo de descarga. Bueno, con este procedimiento sí se utilizan ensayos. Entonces, se realiza un ensayo, se para y se vuelve a realizar otro ensayo. ¿Cómo ocurre esto? Bueno, vamos a imaginarnos los elementos que tenemos. Tenemos, por ejemplo, una... Se ve en una página aquí que está hablando porque tengo puesto el ventilador, que en este descarga no tengo aire acondicional y se ve una hoja pasando. Voy a intentar que no pase porque es muy incómodo. Bueno, tenemos los elementos. Imaginaros una luz que se encierra. Se enciende, ¿vale? Una palanca, por ejemplo, y un suelo electrificado. Un suelo electrificado. Entonces, cuando se enciende la luz, aparece una descarga. Cuando pulsas la palanca, la descarga desaparece. Ahí vamos a imaginarnos que hay un pequeño retraso entre la aparición de la luz y el inicio de la descarga. Por ejemplo, un par de segundos. Entonces, si eres capaz de pulsar lo suficientemente rápido, la descarga nunca llega a aparecer. Bueno, pues ¿en qué consistiría esto? Pues bastante sencillo. Primero. Un evento neutro, que es una señal, una luz roja, por ejemplo. Una luz roja no indica absolutamente nada. Pero siempre aparece antes de la descarga. Si no se realiza la respuesta, bueno, pues descarga hasta que el sujeto realice la respuesta. Esos son ensayos de escape. Todavía estamos en un procedimiento de escape. Recordad que todos los procedimientos de evitación en un inicio, casi siempre, o por no decir siempre, son de escape. Es decir, cuando el sujeto todavía no sabe lo que tiene que hacer para que no le den la... la descarga, recibe la descarga hasta que realiza la respuesta. Así que al principio escapa de la descarga. Bueno, una vez que va aprendiendo este evento neutro, es decir, este estímulo que se ha convertido en un estímulo discriminativo, y vamos a ver también que se va a convertir en otra cosa de la que ya hablamos en la anterior tutoría. Pero esto se convierte en un estímulo discriminativo positivo, que señala cuándo va a aparecer la descarga. Bueno, pues ese evento neutro, que ahora es un discriminativo positivo, si se da la respuesta, hace que se apague. El estímulo discriminativo, es decir, se apaga la luz, esto es importante, y no se emite el... Bueno, la recompensa, no es una recompensa, no se emite la consecuencia. ¿Y por qué pongo aquí EI? Bueno, pues porque vais a ver ahora que esta consecuencia, que es una descarga, perdón, esta consecuencia, no, esto no es una... Aquí, esta descarga, que es la consecuencia, también funciona o es un estímulo incondicionado en el condicionamiento clásico. Recordáis esto, ¿no?, que produce una respuesta automática. Bueno. Esto es lo que se llama, o esto es lo que se denomina una evitación exitosa. Cuando no llega a aparecer la descarga, cuando el sujeto ya ha aprendido y ante la aparición de la señal, emite una respuesta y nunca llega a aparecer la descarga. Es decir, pasamos del escape a la evitación. Bueno, pues el primer paso. El primer paso es saber qué tipo de relaciones tenemos en esta situación. Porque, sí, siempre se apaga, ¿vale? Sí se realiza la respuesta. El discriminativo se apaga y cesa la descarga si ha empezado o no aparece si no ha empezado, ¿vale? Pero siempre cesa el discriminativo. Siempre se apaga, desaparece el estímulo discriminativo. También es lógico porque el estímulo discriminativo... A ver, siempre hay un aprendizaje de escape antes de la evitación. Es que son un continuo. Podría haber evitación sin escape, pero sería muy raro porque, fijaros, sería algo realmente extraño. Porque si empezamos desde una... Un aprendizaje o desde un procedimiento de evitación que simplemente quiere decir que el sujeto ha respondido antes de que aparezca la consecuencia, quiere decir que nunca ha tenido experiencia de la consecuencia. ¿Cómo vas a aprender algo? Es decir, ¿cómo vas a aprender a evitar una descarga? Que si empiezas desde el principio con evitación, nunca has llegado a sufrir. Evitación significa que no aparece. Es decir, nunca habría aparecido. ¿Qué quiere decir esto? Que para que aprendan, primero tienen que tener experiencia. ¿Qué quiere decir esto? Y solo con el aprendizaje aprenden a evitarlo. Es el mismo procedimiento. Es exactamente lo mismo. Es solamente el momento en que se da la respuesta. Y normalmente el escape se da en los primeros momentos cuando todavía no se ha aprendido a dar la respuesta. Así que desde ese punto de vista sí es necesario que haya escape antes de evitación. Pero no porque sea un requisito del procedimiento, sino porque es una situación que no se puede evitar desde el principio porque necesitas tener experiencia con ese estímulo. Eso, les van unidos. Pero es que son el mismo procedimiento. Es como si alguien, imaginaros que vosotros en vuestra vida diaria, se enciende una luz roja y de repente alguien os pega un bofetón. Es la primera vez en la vida que os ocurre. No sabéis de qué va la cosa. Simplemente os encontráis con un bofetón. A la siguiente vez que se encienda la luz roja seguramente algo os extrañará. Y cuando lleguéis ya a cuatro o cinco luces rojas y después un bofetón, ya habréis aprendido a agachar la cabeza para que nos dé. Es exactamente el mismo procedimiento, solo que uno va aprendiendo y aprende a evitarlo. Pero el primero no lo puede evitar. El primero te viene... Te viene en la cara sin que puedas hacer absolutamente nada. Eso me refiero, ¿no? Que son el mismo procedimiento, solo que son diferentes fases del mismo procedimiento. Bueno, vamos a analizar primero las contingencias presentes. Y ahora quiero que tengáis muy en cuenta lo que hablamos durante este tema de cómo están unidos el condicionamiento clásico y el condicionamiento operante en todo este tipo de contingencias. Porque va a ser una clave de las explicaciones de este fenómeno. Bueno, primero, relación o contingencia entre la... Respuesta y la señal de aviso. ¿Qué relación de contingencia tienen? Bueno, pues que la emisión de la respuesta hace de que desaparezca la señal. La luz roja desaparece cuando emite la respuesta. Es decir, es una especie de relación de escape. Cuando haces algo, desaparece esa señal. Esa es la relación que tienes. Siempre que pulsas la palanca, desaparece la señal. Bien, perfecto. Bueno, pero en sí mismo la luz roja no es desagradable, ¿no? Entonces es una luz roja, así que tampoco tendrían por qué escapar de ella. Pero vamos a ver ahora qué ocurre. Segundo tipo de relación o segundo tipo de contingencia que ocurre en este tipo de procedimiento. La respuesta o la relación o la contingencia entre la respuesta y la consecuencia. Cuando uno emite una respuesta, una de dos. O desaparece la consecuencia, desaparece la descarga, o directamente no aparece cuando consigues evitarla. Es decir, o escapas de la consecuencia o evitas la consecuencia. Esa es la relación que va entre... La respuesta o que hay la contingencia entre la respuesta y la consecuencia, la descarga en este caso. O cesa o no llega a aparecer. Bueno, ya tenemos dos relaciones de contingencia entre estos tres elementos que teníamos aquí. Pero nos queda una más. Y la tercera es la relación o la contingencia que hay entre la señal de aviso y la consecuencia. Y esto depende del momento en el que nos encontremos. Depende de cuándo y cómo demos nuestra respuesta. Si no respondemos, entonces, siempre que aparece la luz roja, después que aparece la descarga. Sin embargo, si respondemos y respondemos lo suficientemente rápido, después de la luz roja ya no aparecerá la descarga porque la estamos evitando. Pero ¿qué ocurre al principio entonces cuando todavía estamos en un procedimiento de escape, no de evitación? Y todavía no hemos aprendido. Bueno, pues que después de la luz roja siempre aparece la descarga. Así que la descarga, hemos dicho que es una consecuencia en el condicionamiento operante. Es un reforzador, en este caso es un reforzador aversivo, pero es una consecuencia. Y esto es un estímulo discriminativo positivo. Pero si esto siempre ocurre, si la descarga siempre aparece, sobre todo al inicio, cuando todavía no es capaz de evitarse la descarga a través de la respuesta, siempre aparece la luz roja seguida de la descarga, tenemos otra relación. Y es que la descarga, además de ser una consecuencia, es un estímulo incondicionado que provoca una respuesta por sí mismo. Miedo, paralización, etc. Y esta luz roja, que es un estímulo discriminativo, también se va a convertir en un estímulo condicionado excitatorio aversivo. Es decir, que nos va a señalar o nos va a indicar la presencia o se va a asociar con la aparición de la descarga. Pero ¿qué pasa cuando aprendemos la respuesta? Cuando aprendemos a evitar, pues que esta relación, que al principio se va a fortalecer, se va a extinguir. ¿Por qué? Porque después de la luz roja nunca va a aparecer la descarga, porque mi pulsación de la palanca va a evitar que aparezca. Así que mientras que al principio se produce, se empieza a producir una relación muy fuerte entre la luz y la descarga, es decir, la luz se convierte en un estímulo condicionado, esa relación luego se va a debilitar a través de la extinción porque mi respuesta va a evitar que aparezca la descarga. Bueno, pues ya tenemos la respuesta. Ya tenemos las tres relaciones y aquí le están pasando muchísimas cosas. Está ocurriendo en nuestro aprendizaje operante, estamos aprendiendo a evitar una descarga a través de la respuesta, pero a la vez estamos generando diferentes asociaciones entre diferentes cosas a través de condicionamiento clásico, entre estímulos muy potentes biológicamente como una descarga que provoca dolor y por tanto reacciones o respuestas incondicionadas y estímulos que aparecen en el entorno que quedan condicionados a esto. Y además esa relación varía a lo largo del tiempo. Bueno, cosas importantes de este procedimiento antes de meternos en las explicaciones. Primero, el número de ensayos para adquirir la evitación condicionada es mucho mayor que en un programa de reforzamiento positivo, es decir, aprender a pulsar una palanca para obtener comida es mucho más rápido que aprender a pulsar una palanca para evitar una descarga. Se tarda muchísimo menos aquí que aquí. ¿Por qué? Bueno, pues hay varias posibles explicaciones. Os cito dos que son las que aparecen en vuestro libro. Primero, el hecho de que la conducta que licita la señal, recordad que la señal se está asociando a la descarga porque aparecen conjuntamente, sobre todo al inicio. Así que cuando aparezca la luz roja, ¿qué va a provocar la luz roja? Igual que la aparición del experimentador o el sonido que provocaba Pavlov hacía que los animales salivasen por su asociación con la comida, la asociación de la luz roja con la descarga va a provocar que la luz roja de esa operación... provoque la misma reacción, una reacción parecida que la descarga. Lo que llamábamos respuesta acondicionada, es decir, paralización. Porque esa es la respuesta habitual, por ejemplo, en una rata cuando se asocia un estímulo con otra estimulación aversiva, es decir, la parálisis. Bueno, pues eso interfiere con la emisión de la conducta. Si nosotros le estamos pidiendo a una rata que pulse una palanca para evitar una descarga, pero a la vez hay una luz que se ha asociado con esa descarga que produce la misma reacción de miedo o de ansiedad, que produce la descarga y que produce paralización, eso interfiere con responder a la pregunta. Quedarse paralizado es incompatible con responder y eso hace que se retrase el aprendizaje por la incompatibilidad o la interferencia entre diferentes conductas, una que es operante y lo que yo quiero emitir, y otra que es elicitada y que es incompatible con la que yo quiero emitir. Bueno, segundo, en un reforzamiento también suceden estos condicionamientos. Es lo que vimos al principio del tema. Por eso vimos las cuestiones emocionales en el reforzamiento negativo o en el reforzamiento en general, porque diferentes procedimientos evocan diferentes emociones. Por ejemplo, cuando uno recibe un premio, los estímulos del contexto y los estímulos discriminativos también se asocian con ese premio. Es decir, al final, por ejemplo, no es la única razón, pero ¿por qué le gusta enormemente mucho a los niños ir con sus abuelos? Porque asocian eso a... a premios, a que les dejen hacer más cosas o a que se vean muy bien o reciban mucha atención y mucho juego. Bueno, pues aparte, cualquier conducta que hagan con los abuelos de cariño obtendrá una recompensa, pero a la vez no solamente será esa recompensa, también se asociará a los estímulos del entorno, por ejemplo, a la casa de los abuelos o al ambiente en el que están, lo que hará que quieran ir allí o que en ese ambiente se sientan más alegres, se sientan mejor, tengan una reacción emocional positiva que también influya en las conductas. Es decir, influye de otra manera, pero influye también, por supuesto, las emociones son de sentido contrario, pero en el condicionamiento positivo o en las situaciones de reforzamiento positivo también influye. Más cosas. Segundo, perdón, que pierde el hilo. La especificidad de la conducta requerida, ¿cuál es el problema aquí? Bueno, pues que la conducta que licita la asociación entre el estímulo discriminativo, en este caso estímulo condicionado y la descarga, es de un tipo... En las ratas, por ejemplo, una de las reacciones que ocurre no solo es la asociación entre el estímulo discriminativo y la descarga, sino que es saltar para escapar, saltar a un lugar seguro. Bueno, pues siguen siendo reacciones que no son las que le estamos pidiendo a la rata. A la rata le estamos pidiendo pulsar una palanca, mientras que lo que le pide el cuerpo es otra cosa. Bueno, pues cuanto más parecida sea la respuesta que le pedimos a, por ejemplo, a la rata para escapar de la descarga, a la que ella tendría de una manera natural o que sea específica de su especie ante ese estímulo, más fácil se va a adquirir. Es decir, si estamos en un lugar donde no hay ninguna asociación, es decir, si estamos en una caja de skinner con el suelo electrificado y ante la luz roja le pedimos a la rata que pulse una palanca para escapar o para que no aparezca la descarga, vamos a tardar más. Pero si a la rata en vez de eso le pedimos que salte a una plataforma que está aquí a la izquierda, vamos a tardar menos porque esa conducta de salto es mucho más parecida a lo que una rata haría de verdad en su hábitat natural si se encontrase con un estímulo doloroso. Es decir, saltar para escapar de él, alejarse de él. Bueno, pues eso hace que... Que aparezca más rápido. Es decir, que hay varias cosas. Por un lado los procesos de condicionamiento que interfieren con la respuesta y por otro lado el hecho de que las respuestas que pedimos sean muy diferentes a las que de modo natural los organismos harían en esa situación o realizarían en esa situación. Bueno, ¿y cómo explicamos los resultados o qué ocurre en un procedimiento de evitación discriminativa como el que hemos visto? Bueno, pues hay dos tipos. Hay dos tipos o dos explicaciones mayoritarias. Realmente son muy parecidas. La única diferencia fundamental es que la explicación de Schoenfeld elimina la alusión al miedo. ¿Vale? Vamos a verlo ahora con detenimiento, pero elimina la alusión al miedo. Es decir, básicamente explica lo mismo, pero uno dice, bueno, pero es que no hace falta que aludamos una emoción que no podemos medir directamente o que estamos, bueno, que estamos intentando inferir. ¿Vale? Entonces, podemos explicarlo directamente. Vamos a verlo punto por punto. Vamos a empezar con la teoría bifactorial de Mauer y ya os aviso que tiene mucho que ver con esa interacción entre condicionamiento operante y condicionamiento clásico que estábamos viendo. Bueno, la pregunta clave es ¿cómo se refuerza una conducta que tiene como resultado la ausencia de un evento? Es decir, ¿cómo aumenta la probabilidad de una pulsación de palanca que tiene como consecuencia el que no aparezca el evento? Porque yo estoy pulsando una palanca para evitar una descarga, pero una vez que ha aprendido ya no aparece nunca la descarga. ¿Cómo se mantiene esa conducta si ya nunca aparece la descarga? Bueno, pues esto sería el fenómeno que hay que explicar. ¿Qué dice Mauer? Bueno, pues que hay dos procesos implicados. El condicionamiento clásico de miedo, del miedo, es decir, que un estímulo adquiera el poder de evocar miedo. Y el condicionamiento operante. El condicionamiento operante de la respuesta, de responder a la palanca o de darle a la palanca para evitar que aparezca la descarga y que estaría reforzado por la reducción del miedo. Vamos a verlo. Tres pasos. La señal. Acordaros. ¿Qué ocurre en los primeros momentos de una señal? Aparece la luz roja y todavía no he aprendido a pulsar lo suficientemente rápido como para que no aparezca la descarga, así que la descarga aparece. Así que la señal se condiciona a la aparición de la descarga. Es decir, pasa a ser un estímulo clave. Un estímulo condicionado que provoca una respuesta condicionada que es similar a la que provocaría la descarga. En este caso, miedo. Provoca miedo. Provoca ansiedad. Bueno. Esa es la primera parte. Segundo. ¿Qué hace el sujeto? Pues empieza a aprender a emitir la respuesta y ¿para qué emite o cómo queda reforzada la respuesta? Bueno. Pues según la teoría de Mower, la respuesta queda reforzada porque reduce el miedo que produce la señal. Es decir, si siempre aparece una luz roja seguida de una descarga, al final cuando aparezca la luz roja nos va a dar miedo. Es el mismo ejemplo de la bofetada de antes. Si después de una luz roja siempre viene alguien a darte una bofetada, que aparezca una luz roja te termina dando miedo. Así que si tú tienes algo a tu alcance que sabes que si realizas esa acción vas a poder escapar de la bofetada, cuando vea la luz roja vas a darle. ¿Para qué? Para reducir el miedo. Es decir, ¿cuál es el reforzamiento aunque ya nunca aparezca la bofeta, aunque nunca vaya seguido de la consecuencia? ¿Por qué se mantiene esa conducta? Porque la luz roja provoca miedo y la conducta hace que se reduzca el miedo. Acordaos que cuando pulsa en la palanca desaparece el discriminativo, desaparece la luz roja. Así que dándole a la palanca desaparece la luz roja, como la luz roja provoca miedo disminuye el miedo. La disminución del miedo es lo que refuerza, seguimos pulsando la palanca porque reduce nuestro miedo. Bueno. Pues eso es lo que ocurre, impide además de esto, porque si pulsamos la palanca para reducir el miedo ¿qué se impide? Ya no aparece la descarga. ¿Y qué ocurre en esa situación? Bueno pues que se extingue esa relación, porque esto que es lo que está reforzando la conducta tiene una consecuencia secundaria, no deseada en este caso, que es que se extingue la conducta entre la descarga y la luz, porque ya nunca aparece la descarga, así que estamos en un procedimiento de extinción. Así que el F, la luz, se extingue y deja de dar miedo. Así que si deja de dar miedo yo ya no tengo, ya no me refuerza esta respuesta, ya no voy a responder para reducir el miedo porque me deja de dar miedo porque se ha dejado de asociar a la descarga. Pero ¿qué pasa si yo dejo de responder y se deja de asociar, porque se ha dejado de asociar el F a la descarga porque se ha extinguido? Pues si yo dejo de responder vuelve a aparecer la descarga, se puede, vuelve a generar esta asociación y yo vuelvo a responder para reducir el miedo que me vuelve. A generar, es decir, es un círculo vicioso. Aparece una luz roja, yo no sé qué hacer, me dan una descarga. Aparece una luz roja, no sé qué hacer, me dan una descarga. La luz roja se va condicionando, ahora sé que esa luz roja va seguida de una descarga. Pero estoy aprendiendo una cosa y es que si pulso una palanca ya no aparece la descarga. Así que cada vez que aparece la luz roja siento mucho miedo y pulso rápido la palanca para evitar la descarga. Pero ahora la luz roja ya no va a ser evitada de la descarga, así que cada vez la relación entre la luz roja y la descarga es más difícil. Y cada vez voy teniendo menos miedo y como voy perdiendo el miedo ya no necesito pulsar la palanca para reducir el miedo. Y como ya no necesito pulsar la palanca para reducir el miedo, vuelve a aparecer la descarga. Así que se vuelve a condicionar la luz roja y el círculo se repite manteniendo la conducta. Esa es la hipótesis de Mower. Bueno, pues la hipótesis de Schoenfeld básicamente viene a decir lo mismo pero elimina la variable de miedo. ¿Qué es lo que dice? Bueno, pues que la luz roja lo que adquiere es una función de estímulo condicionado aversivo. Que por su asociación con la descarga no es que la luz roja empiece a dar miedo, una reacción emocional de miedo, sino que adquiere las mismas propiedades que la propia descarga. Y pulsamos la palanca para escapar de esa luz roja, para escapar de las consecuencias negativas que la luz roja ha adquirido por condicionamiento clásico. Es decir, la retirada de la señal es el refuerzo o el escape de la luz roja. Eso es lo que refuerza la señal. Y al escapar de la luz roja que ha adquirido connotaciones negativas, aversivas por su asociación. ¿Veis que es exactamente lo mismo? Solo que uno lo llama miedo y otro lo llama asociación o adquirir las propiedades aversivas de la descarga. ¿Cuál es la diferencia? Bueno, pues que el primero tiene que aludir a un constructo, al miedo, a algo inferido, a una emoción inferida. El segundo no. El segundo dice, bueno, si se establece una asociación entre ambos, lo que quiere decir es que el estímulo condicionado, la luz roja ha adquirido las propiedades del otro. No necesito... Eh... Acudir a una sensación interna o a inferir algo que no puedo manipular o que no puedo ver directamente en el experimento. ¿Qué cambia? Bueno, pues en este caso sería un reforzamiento negativo secundario. Es decir, se retira al pulsar la palanca, se retira la señal y eso quiere decir que un reforzador secundario que adquirió sus propiedades de manera secundaria por asociación con un estímulo incondicionado desaparece, es decir, cuando desaparece una consecuencia o algo negativo, como lo llamamos, reforzamiento negativo. Y no nos hace falta aludir emociones, pero en esencia el proceso es exactamente el mismo. Solo cambiamos el nombre de miedo por el de reforzamiento negativo secundario, por adquirir las propiedades del estímulo incondicionado original. Eh... Bueno, ya tenemos el primer procedimiento. Vamos a por el segundo procedimiento. En el primero lo que hemos visto es que había una señal que nos indicaba cuando iba a aparecer el estímulo negativo, el estímulo aversivo. Bueno, pues en este procedimiento vamos a quitar esas señales. Es lo que se denomina evitación no discriminada, ojo con esto, ¿vale? No discriminada, no hay ningún estímulo discriminativo, de operante libre de SIDDAN. ¿Cómo lo podéis distinguir del otro? Acordaros, el otro era discriminada y de ensayo único, ensayos individuales y separados. Esta es no discriminada y aquí sí que es operante libre. El bicho que metemos en la... En la caja de Skinner puede operar libremente todas las veces que quiera. Bueno, ¿cómo realizamos este procedimiento? Pues lo primero, vamos a especificar una conducta como respuesta de evitación. Así que la de siempre para no complicar las cosas. Si pulsas la palanca, no aparece la descarga o se elimina la descarga, dependiendo si estamos todavía en escape o habitación, iba a decir, o evitación. Bueno. Pero antes de eso, o después de elegir la conducta como queráis, metemos aquí a la ratita y programamos una descarga para que ocurra periódicamente, sin aviso. Es decir, tenemos aquí un reloj que además no lo hace, bueno, no le va a dar ninguna señal al sujeto. Simplemente hay un reloj fuera de la caja que cada cierto tiempo, pongamos 10 segundos, ¿vale? Cada cierto tiempo da una descarga y la descarga sigue durante un tiempo, el tiempo que sea. Por ejemplo, durante dos segundos se da la descarga. Así que si el sujeto no hace nada, cada 10 segundos va a recibir una descarga de 2 segundos. Pero, si pulsa, la descarga se retrasa, es decir, si durante el intervalo de 10 segundos que hay entre descarga y descarga, el sujeto pulsa, imaginaros que la siguiente descarga se retrasa 30 segundos, es decir, yo ¿qué obtengo con la respuesta? Pues un intervalo o un periodo de seguridad. Bueno, pues eso es lo que va a definir el procedimiento. Estos dos intervalos. El primer intervalo, los nombres son finos, ya os aviso, ¿vale? Son nombres horrorosos para acordarse de ellos, pero bueno, quedaros con, yo me quedaría con EE y RE, que son los dos intervalos, ¿vale? Si os acordáis de estas dos iniciales, os acordaréis, porque RE es de respuesta, aunque el choque no coincide con esto, ¿vale? Pero es R de respuesta, como solo hay uno de los dos intervalos que tiene una R, pues ya sabéis que es el de respuesta, choque. Y el otro es, los que son iguales, choque, choque. Bueno, primer intervalo. EE, o también llamado ERER, es decir, reloj, choque, choque. El reloj entre dos choques, entre dos descargas. ¿Qué es? Pues muy sencillo, es simplemente el intervalo que hay entre descargas y no hay respuesta. Si hemos programado una descarga cada 10 segundos, el intervalo o reloj, choque, choque, son los 10 segundos que transcurren entre ambas descargas si yo no doy ninguna respuesta. Segundo intervalo. El intervalo o reloj, respuesta, choque. Entre que doy una respuesta, choque. Y que aparece la siguiente descarga, entre la respuesta y la descarga programada. O dicho de otra manera, el periodo de seguridad que me proporciona la respuesta. Si yo no doy ninguna respuesta cada 10 segundos, descarga. Pero si yo aquí doy una respuesta, la descarga se retrasa 30 segundos. Así que en vez de dármela aquí, va hasta aquí. Si yo en este periodo vuelvo a pulsar, vuelve a retrasarse. Bien. Pues este es el procedimiento. ¿Qué aparecen los sujetos aquí? Aprenden a dar respuestas de manera secuencial para evitar las descargas, para ir retrasando las descargas. Y como veis es de operante libre. Puedes responder en cualquier momento. Y si aprendes y aumentas la probabilidad de tu respuesta, nunca llegarás a sufrir la descarga. ¿Cosas malas? Bueno, pues es una evitación no discriminada. No hay señales que te indiquen cuando va a aparecer la descarga. Así que los procedimientos son mucho más largos. Porque realmente, imaginaros, con esto para ser un poco lógico, sobre todo en los exámenes, conviene imaginarse cómo es esto. Porque a veces se os pueden preguntar ¿cómo se tarda más?, ¿cuál es más complejo?, ¿cuándo tardan más los sujetos en aprender la asociación?, ¿en una evitación discriminada o no discriminada? Bueno, pues imaginaros la situación. En la anterior hay una señal que te indicaba cuándo iba a aparecer la descarga. En esta no hay ninguna señal. Te meten dentro y de repente empiezan a darte descargas. Y lo único que ves es una palanca. Un lagartijo. Y no sabes para qué funciona ni sabes qué es. Simplemente notas que te dan descargas. Y desaparece la descarga y al cabo de un tiempo vuelve a aparecer y así constantemente. Y tienes que aprender que pulsando esa palanca desaparece o la descarga se retrasa. Pero solo se retrasa porque aunque tú pulses la palanca una vez, tarde o temprano va a volver a aparecer la descarga. Fijaros que el procedimiento, lo que tienen que aprender, la situación que tienen que aprender los sujetos es mucho más complicada. Luego va a ser mucho más largo. Luego, aprender este tipo de contingencias es mucho más largo. De hecho, muchos sujetos no llegan a aprenderlo nunca. Ni siquiera son capaces de aprender, dependiendo del tipo de organismo, incluso del tipo de sujeto o de sujetos individuales, se aprende o no se aprende. Hay muchas diferencias individuales entre sujetos y también entre especies a la hora de aprender este tipo de procedimientos. Si ya de hecho una habitación cuesta mucho más que un aprendizaje positivo, un reforzamiento positivo. Imaginaros en una situación en la que ni siquiera hay señales. No hay señales externas. Explicaciones para este tipo de conducta o cómo se aprende este tipo de conducta. Bueno, pues la primera la dio Sidman y la llamó hipótesis proprioceptiva. ¿Qué decía? Bueno, no hay estímulos externos que nos indiquen. Tiene que ver algo con la indefensión. A ver, no es que tenga que ver con la indefensión. Puede ocurrir. A ver. ¿Cómo se percibe? Recordad que la indefensión se genera cuando uno percibe que no tiene control sobre las consecuencias, no tiene control sobre el entorno. Su conducta no puede evitar el entorno aquí. Si se aprende, sí tienes control sobre ello. Pero sí puede ocurrir que los sujetos no aprendan y a largo plazo, como los sujetos no aprenden a evitar la descarga y no perciben ninguna contingencia en la situación, tenderán a sufrir indefensión aprendida. A la larga, si no aprenden, seguramente aparezca indefensión. Es decir, dejen de actuar. Dejen de actuar porque no perciben que haya ninguna contingencia o que haya ningún control por su parte de la situación. Es decir, un procedimiento de aprendizaje en el que los sujetos no aprenden las contingencias de aprendizaje y que hay, en el que hay estímulos aversivos, puede dar lugar a indefensión aprendida. A que los sujetos dejen de actuar porque no tienen control sobre lo que ocurre. Puede ocurrir. Los sujetos que no aprenden, puede ocurrir que haya indefensión aprendida. ¿Vale? Es decir, lo que la indefensión sería la consecuencia de una situación de aprendizaje en los que los sujetos no son capaces de aprender las contingencias y tienen consecuencias negativas. ¿Vale? Sería, sería algo así. Bueno, ¿qué dice Sidman en, eh, qué dice Sidman en, o como explicación? Bueno, como no hay señales externas, la señal de aviso, el estímulo discriminativo sería la propia conducta del sujeto. Fijaros, en esta situación pasa algo curioso. Hemos elegido un estímulo discriminativo. Es una conducta que sirve para escapar de la descarga. Pero hemos hablado mil veces que los sujetos siempre están actuando, ¿no? La única conducta, incluso estar parado es una, es una conducta. Sentarse es una conducta, moverse o andar es una conducta. Es decir, si los sujetos no están pulsando la palanca, están actuando. ¿Qué ocurre con todas las conductas del sujeto, excepto la respuesta que hemos elegido y que sirve para retrasar la descarga? Pues que todas, absolutamente todas, tienen como consecuencia. La aparición de una descarga. Si yo estoy andando por la jaula, descarga. Si yo me siento, descarga. Si salto, descarga. Si rasco las paredes, descarga. Si rasco el suelo, descarga. Si pulso la palanca, no descarga. Así que si todas mis conductas dan como resultado descarga, excepto una, todas esas conductas se van a asociar con la descarga. Se van a asociar clásicamente. Mi propia conducta se convierte en un estímulo condicionado. ¿Qué significa? La aparición de descarga. Es decir, que el mero hecho de que yo actúe, de cualquier manera, que no sea pulsar la palanca me va a provocar ansiedad porque lo relaciono con la aparición de la descarga. Así que ¿cómo puedo escapar o reducir el sentimiento de ansiedad o miedo que produce toda mi conducta que se ha asociado con la descarga? Pues realizando la única conducta que retrasa la aparición de la descarga y que reduce el miedo. Porque escapamos de la ansiedad. La ansiedad que nos produce nuestra otra conducta. Estamos realizando de todo y todo lo que hacemos nos produce a nosotros ansiedad porque hemos realizado con la descarga. Pero hay una conducta que puede eliminar esa sensación y que no está asociada con la aparición de la descarga, que es la presión de la palanca. Otra hipótesis. La hipótesis interoceptivo temporal, la hipótesis de Anker de 1950. Para este autor es el propio paso del tiempo el que sirve como señal. Los sujetos serían capaces de estimar el paso del tiempo. Si hay diez segundos entre una descarga y otra, según va pasando el tiempo, y es algo que los animales pueden medir, va aumentando el nivel de ansiedad porque se va acercando la descarga. Así que esa ansiedad que va aumentando según va pasando el intervalo es la que hace que se mantenga la respuesta. Porque al responder reducimos la ansiedad que nos produce el propio paso del tiempo. Estas dos son muy parecidas. La única diferencia es que esto achaca. Acá el aumento de ansiedad a la conducta del sujeto que ha quedado condicionada y aquí es el propio tiempo, el que queda con el propio paso del tiempo, el que queda condicionado a la aparición de la descarga que produce la ansiedad. Pero unos son estímulos internos del sujeto y otros el simple paso del tiempo que medido por el propio sujeto, que también es capaz de estimar el paso en tiempo bien esto por un lado. Y luego tenemos otra hipótesis que parte de algo un poco diferente. Los dos anteriores habéis visto que son muy similares y que se basa en el reforzamiento. Bueno, fijaros. Lo que tenemos aquí es que cuando uno presiona la palanca no aparece la descarga y una vez que presiona la palanca hay unos ciertos estímulos asociados a ese periodo de seguridad. Es decir, igual que antes había unos estímulos antes de realizar la conducta, hay ciertos estímulos. Puede ser tu propia conducta, puede ser cualquier situación o cualquier cambio en el entorno que se asocia con la descarga. El periodo de seguridad que va después de la pulsación de la palanca también se asocia con los estímulos del entorno. Así que esos estímulos, que se asocian con la ausencia de descarga, se convierten también por condicionamiento clásico en estímulos condicionados inhibitorios aversivos, es decir, que nos indican la ausencia, por eso son inhibitorios, de un resultado o de un estímulo negativo. Así que... La palanca, ¿qué es lo que obtengo? Obtengo la ausencia de algo negativo, obtengo los estímulos, que ahora funcionan como reforzadores porque señalan la ausencia de un estímulo aversivo. Esta es la explicación de Dismore, que se diferencia en que en vez de basarse en la reducción del miedo, se basa en el reforzamiento positivo, es decir, que ciertos estímulos se condicionan de manera positiva, tienen un valor positivo, ¿por qué? Porque se asocian a periodos en los que no hay descarga, es decir, funcionan como un reforzador para la respuesta de la palanca. ¿Cómo se refuerza la respuesta de la palanca? Porque después de la respuesta de la palanca aparecen los estímulos que están asociados al periodo de seguridad. Esto tiene bastante apoyo empírico, de hecho es la teoría con más apoyo empírico de las que hemos visto. ¿Por qué? Pues fijaros, hay un ejemplo bastante bueno en el libro y bastante curioso. Si nosotros hacemos este proceso de descarga, ¿por qué? Si nosotros hacemos este procedimiento y justo después de la aplicación de la palanca, o sea, de la aplicación, no, perdón, de la respuesta del sujeto encendemos una lucecita roja, fijaros, no está relacionada con la descarga sino que está relacionado con la ausencia de la descarga porque cuando presionamos la palanca la descarga se demora. Y ese periodo de seguridad se condiciona a una luz roja que nosotros hacemos aparecer no antes sino después de la pulsación. Bueno, pues si nosotros cogemos esta luz roja y la pasamos o la utilizamos en el proceso en otro procedimiento nos vale como reforzador, es decir, podemos hacer que aumente otra conducta poniendo como refuerzo la aparición de la luz roja. ¿Veis? Se condiciona, adquiere las propiedades de evitación de la descarga así que tiene una connotación positiva, así que sirve de reforzador, fijaros qué curioso es el fenómeno. Bueno, ya tenemos dos procedimientos de evitación y nos queda el más cruel de todos, yo no sé si os llegué a hablar de esto. Creo que sí os llegué a hablar de esto. De los dos estos que parecen señores de las SS, Genstein y Hinelein, que por cierto no son ni alemanes, pero bueno. El procedimiento que a mí me parece especialmente cruel, siempre lo he dicho, además repetirlo mucho es una manera que tengo para que os acordéis de este procedimiento. Evitación hemos visto, evitaciones discriminadas con señales, evitaciones no discriminadas pero que puede haber señales implícitas aunque no estén puestas por el experimentador. Bueno. Pues vamos a ver la evitación con descargas totalmente aleatorias, ya no solo es que no haya señales que nos indiquen cuando aparece una descarga sino que ni siquiera puedes predecirlo a través del tiempo porque las señales aparecen de manera aleatoria o por lo menos en intervalos irregulares que no se pueden predecir con facilidad. ¿Cómo funciona esto? Esto bueno pues vamos a verlo aquí. Tenemos una caja de esquina y un suelo electrificado y tenemos dos máquinas. La máquina A. Son máquinas de dar descargas, no son otro tipo de máquinas. Y la máquina B. Y las dos dan descargas y siempre hay una en funcionamiento. Aquí está la ratita o lo que sea, es que es cruel hasta contarlo. Estas dos máquinas de dar descargas, bueno ¿qué hacen? Bueno pues ambas máquinas dan descargas en periodos irregulares, siempre hay una encendida así que siempre estás recibiendo descargas y tampoco sabes cuándo van a aparecer por qué. Porque una vez tardan tres segundos, otra vez cuatro, otra vez dos, otra vez diez. Lo que sí hay es que esta máquina, la máquina A, las da de manera más frecuente. Es decir, aunque aparecen en periodos irregulares, esta te da por ejemplo 40 descargas por minuto y esta te da 20 descargas por minuto, la mitad. Pero no te da una cada tres segundos, no, te da a lo mejor dos seguidas, luego una a los cinco segundos, no puedes evitarlo. Bien. Metemos a la ratita. Y por defecto y sin que la rata, por cierto aquí tiene la rata su palanquita, por defecto y sin que la rata haga nada está conectada a la caja A, la que da una mayor cantidad de descargas. Bueno, si la rata pulsa la palanca conecta a la B, es decir, la A deja de dar descargas y empieza a dar la B y esta B se mantiene activa hasta que da una descarga y vuelve a la A. Así que si tú no das la respuesta siempre funciona la caja A, así que te llevas el doble de chipazos por minuto que si das la respuesta. Pero fijaros, por mucho que tú des la respuesta y disminuya, que es lo único que puedes hacer, disminuir la cantidad de descargas, no puedes eliminar la descarga, es decir, lo único que puedes hacer es disminuir la tasa total de descargas. Pero. Siempre van a aparecer descargas. Fijaros, antes hablabais de la indefensión aprendida y fijaros en esta situación porque uno puede pensar esto puede causar indefensión, pero fijaros, si se aprenden las contingencias no causa indefensión porque aunque el control sobre lo que ocurre no es completo, tu conducta si está controlando lo que ocurre a través de tu conducta puedes reducir a la mitad el número de descargas. Recordad que la indefensión se produce. Cuando no tienes ningún tipo de control sobre las contingencias, sobre lo que ocurre en el entorno, sobre las consecuencias de la conducta o sobre lo que está ocurriendo, pero aquí si tienes control, que no puedas hacer desaparecer, que no seas omnipotente y puedas hacer desaparecer las descargas, no quiere decir que no puedas controlar en cierta medida su frecuencia. Puedes controlar algo, pero no lo puedes todo. Así que solo puedes disminuir la tasa total de descargas. ¿Cuál es el resultado? Al final las ratas aprenden. ¿Cuál es el resultado? Al final las ratas aprenden a pulsar continuamente la palanca para que la caja B esté siempre en funcionamiento. Fijaros, ¿por qué se refuerza la conducta? Porque antes hemos visto que una pulsación de la palanca retrasaba la aparición de una descarga. Pero es que aquí ni siquiera ocurre eso porque las descargas son aleatorias y regulares así que puede ser que yo pulse la palanca y justo en el momento en el que pulse la palanca me den una descarga. Luego es todavía más difícil de aprender porque esto emite descargas irregulares y a lo mejor justo cuando pulso, en ese momento estaba programada una descarga en B y me da un chistazo nada más pulsar, justo contingente con la presión de la palanca. Pero según va pasando el tiempo y el sujeto va aprendiendo las relaciones globales en la situación, fijaros que esto apoya las teorías molares del aprendizaje, es decir, que los sujetos son capaces de estimar el grado total de descarga. Por lo tanto, los sujetos son capaces de estimar la frecuencia total o la frecuencia total con la que dos sistemas o dos situaciones alternativas están dando una cantidad de reforzamiento o la frecuencia de reforzamiento de dos alternativas diferentes. Porque aquí no pulsas para retrasar una descarga, es decir, no es que pulses y evites la descarga durante un tiempo. A lo mejor pulsas y aparece la descarga. Pero lo que sí consigues es la disminución de la frecuencia total a largo plazo en general dentro de la situación. Y así los sujetos son capaces de estimar la frecuencia total. Es decir, favorece explicaciones molares de la conducta, que los sujetos son capaces de entender la situación global en la que están y saber cuáles de las dos situaciones le están dando más o menos descarga. Es decir, no por omitirla o retardarla, sino por disminuir la frecuencia. Bueno, pues ya tenemos el procedimiento de Herzen-Hinnelein, que habéis visto como la pobre rata aquí sí que no tiene escapatoria. Solamente puede elegir entre recibir más o recibir menos. No puede evitar las descargas del todo. Así que aquí solamente habríamos de escape, aunque lo llamemos evitación, lo único que estamos evitando es una mayor frecuencia, pero siempre recibimos descargas. Lo que evitamos realmente es la máquina A, porque pulsando solamente recibimos descargas de B. Así que lo que evitamos es a una de las máquinas, no las descargas. Bueno. Continuamos. Variables que afectan al reforzamiento negativo. ¿Qué cosas pueden afectar al aprendizaje de reforzamiento negativo, al aprendizaje de evitación en particular? Bueno, pues varias cosas. Vamos a ver brevemente, más brevemente que en el castigo. Muy fácil. Cuanto mayor es la intensidad de la estimulación aversiva, más rápidamente se adquiere la conducta. A la fuerza Orkan o con la letra, con sangre entra, ¿no? Cuanto más fuerte es la descarga, pues más rápido vas a... vas a aprender a pulsar la palanca para evitar la descarga. Cuanto más fuerte sea el bofetón que te dan ante la aparición de la luz, más rápidamente vas a aprender a agachar la cabeza o hacer la conducta que sea para evitar que te lo den. Si es muy flojito, bueno, pues puede aguantar. Tampoco pasa nada. Muy sencillo. La letra con sangre entra. No es así, ¿eh? La letra no entra con sangre, pero sí que es cierto que en los procedimientos de evitación, cuanto más intenso es la estimulación aversiva, más rápido se adquiere el condicionamiento. Segundo. Eh... Habituación y extinción reducen la efectividad de las consecuencias aversivas. Es decir, si habitu... Si nos habituamos a un estímulo desagradable, es decir, si yo antes de poner la descarga en esta situación he sometido habituación al sujeto, es decir, le he sometido o metí una caja de Skinner a someterle a descargas sin que haya ningún tipo de conducta que pueda realizar simplemente, descargas. Bueno, pues en esa situación de habituación que se va habituando y cada vez responde más, menos. Ya sabéis que la descarga tiene una respuesta estereotipada, que suele ser el saltar o el paralizarse o el huir o intentar escapar de ella. Pero si te la dan mucha... Igual que con cualquier estímulo doloroso, te vas habituando y algo que al principio te dolía más, pues te vas acostumbrado... Igual que con los sonidos, que son desagradables. Si tenéis obras cerca de casa, al principio parece que te van a volver loco, pero luego empiezan a ser menos desagradables, eso se llama habituación. Bueno. Pues en ese caso... Eso reduce la efectividad de este tipo de entrenamiento. ¿Por qué? Porque si el estímulo desagradable no te resulta tan desagradable, pues bueno, entonces no tendrás tantas ganas de responder. Lo mismo ocurre con los procedimientos de extinción, ya sabéis, los procedimientos de extinción cuando el estímulo no va seguido o la respuesta no va seguida de una consecuencia. Bueno, pues cuando extinguimos, por ejemplo, las señales que aparecen... Cuando ya, por ejemplo, en este caso sabéis que la luz roja aparece seguida de la descarga siempre. Bueno, pues si en otro procedimiento presentamos la luz roja que no vaya seguida ya de la descarga, es decir, extinguimos esa relación, bueno, pues de nuevo va a ser más difícil adquirir la evitación porque no va a ser más difícil que esa luz roja adquiera la relación con la descarga que es necesario para que ocurra el fenómeno. Bueno. Más cosas. En la evitación libre, la tasa, la última que hemos visto, la evitación libre, las dos últimas. ¿Por qué está determinada la tasa de respuesta? Bueno, por los intervalos que hemos visto, es decir, cuanto mayor sea o mejor dicho, cuanto menor sea el intervalo entre descargas si yo no doy una respuesta y mayor sea el intervalo entre descargas si doy una respuesta, es decir, el tallero de seguridad, mejor se va a prender. En el fondo es diferenciar entre las circunstancias, entre las contingencias. Si no doy una respuesta recibo muchas descargas, si doy la respuesta muy pocas, pues aprenderé bien. Sin embargo, si recibo muy pocas descargas cuando no doy respuesta y alguna menos cuando sí la doy, bueno, pues las contingencias no están muy claras y me costará más. Básicamente esto es lo que dice aquí, ¿vale? Mayor frecuencia de descarga en ausencia de R, es decir, cuanto más juntitos, más cortos, sea este intervalo. Es decir, más descargas reciba por unidad de tiempo y mayor periodo de seguridad, es decir, esto cuanto más largo sea, mayor probabilidad de aprendizaje. Diferenciación entre las dos situaciones, entre para qué sirve mi respuesta o cuáles son las consecuencias de mi respuesta. Esto también ocurre en descarga aleatoria, pero recordad, el último que hemos visto, pero recordad que no se puede evitar del todo las descargas, que lo único que podemos hacer es reducirlas, ¿vale? Pero estos intervalos vienen a ser lo mismo en los dos procedimientos. En el segundo que hemos visto, de evitación no discriminada y en el otro. Lo único que la caja A, esto es importante, la caja A, la que da respuesta o la que da descargas con más frecuencia, sería el intervalo EE, ¿vale? Que es el que hay entre dos descargas en ausencia de respuesta y el intervalo, o la caja B, sería el intervalo RE, es decir, el intervalo que hay entre descargas si doy una respuesta. Son equivalentes. Son equivalentes en ambos, ¿vale? Los hemos llamado EE, RE en el de evitación no discriminada, pero esos mismos intervalos se van en el procedimiento de Hersten y Hinelein que hemos visto, solo que se dan, no puedes evitar del todo las descargas, pero serían exactamente los mismos, esos dos procedimientos. Bueno pues cambiamos de tercio y ahora vamos a pasar al castigo y hasta ahora lo que hemos visto es cómo utilizar estímulos aversivos para aumentar la probabilidad de la respuesta. Ahora está. Estábamos aumentando la probabilidad de que ocurra una respuesta. Ahora vamos a hacer lo contrario, vamos a disminuir la probabilidad de que ocurra una respuesta. ¿Cómo se ha explicado el castigo desde diferentes opciones teóricas o de diferentes visiones teóricas? Bueno, pues vamos a ver tres de ellas, realmente dos porque una ya la hemos visto. ¿Os acordáis de la respuesta emocional condicionada? Que la vimos en el primer tema, si os acordáis es buen momento para repasarlo. Y si todavía no os acordáis la semana que viene es buen momento para decírmelo y que lo repasemos en la última semana. Pero recordad que tenía que ver con las respuestas de paralización y cuáles son las respuestas que ocurren ante estímulos aversivos en el condicionamiento clásico. Os lo dejo ahí para que lo podáis ver de nuevo. Primera explicación, la explicación de Thorndike. Thorndike veía refuerzo y castigo como cosas opuestas, además simétricamente opuestas, como dos caras de la misma moneda. Procesos que no se pueden dar a la vez, que son incompatibles, que están en lados opuestos de un continuo. Uno fortalece la conducta y el otro la debilita. El reforzamiento fortalece, el otro la debilita. ¿Qué es lo que ocurre? Bueno, pues igual que un reforzador aumenta o fortalece la asociación entre el estímulo y la consecuencia, lo que hace el castigo es debilitar esa asociación entre los estímulos y las respuestas. Debilita esa asociación. Lo otro fortalece una asociación entre estímulos y las respuestas. Esto debilita la asociación entre estímulos y respuestas. Es decir, el mismo gato en la caja de Thorndike, que lo que le espera afuera no es comida sino un cocodrilo para comérselo, le espera un cocodrilo para comérselo, eso debilitará la asociación entre el hecho de estar dentro de la caja problema y responder para poder salir de la caja problema. No querrá salir de la caja problema. Por eso, perdón, pocas palabras. ¿Veis? Es una relación opuesta. Mientras que una cosa fortalece esa asociación y hace que aumente la conducta, la otra lo disminuye. la teoría de las respuestas competitivas reforzadas negativamente. Esto es curioso porque de lo que habla es que no disminuiría la respuesta o no se debilita la respuesta castigada. Es decir, si yo pongo una caja de Skinner y veo que la respuesta castigada es negativa, y pulso una palanca, y si pulso la palanca me dan una descarga, esto ya no es evitación, es castigo. Pulso la palanca, me dan una descarga. Lo normal es que deje de pulsar la palanca. Lo que dice Bismore es que no se debilita, debida a las consecuencias, no se debilita la conducta de presionar una palanca, sino que se fortalecen aquellas respuestas que son incompatibles con presionar la palanca y que van seguidas de la ausencia de descarga, que evitan la estimulación adversiva. Es decir. Si yo me quedo aquí dando vueltas sobre mí mismo, no voy a poder presionar la palanca y eso queda reforzado positivamente porque evitan que aparezca esa descarga. Bueno, estas son las tres explicaciones o tres maneras de ver el castigo, de explicar el castigo desde un punto de vista teórico. Vamos a ver qué variables afectan al castigo. Una cosa importante antes de ver las variables que afectan al castigo y es que os acordáis que vimos... En el capítulo anterior, el principio pre-MAC, esto de que una conducta más probable puede reforzar una menos probable. Jugar a videojuegos puede reforzar el hecho de que se hagan los deberes. Si haces los deberes puedes jugar a videojuegos y lo mismo ocurre al revés, o perdón, lo mismo ocurre para castigar. Para castigar puedes decir, bueno, si juegas a videojuegos vas a tener que hacer más deberes, entonces ¿qué ocurrirá? Disminuirá la frecuencia de juego o de conducta. La conducta de jugar a los videojuegos, si tú le dices a un pobre chaval que si se le ocurre coger la consola luego a cambio va a tener que dedicarle más tiempo a estudiar, seguramente disminuya algo su conducta de jugar a videojuegos para evitar lo otro. Bueno, es el principio pre-MAC que vimos que era e iba en los dos sentidos, es decir, tanto para el reforzamiento como el castigo. Pero tened en cuenta que esto sirve para ambientes reales, en situaciones de laboratorio los estímulos están mucho más controlados, así que no nos hace falta recurrir a este tipo de conductas que ya se dan o analizar qué conductas se dan con mayor o menor probabilidad para poder establecer cuáles son reforzadores o cuáles pueden funcionar como castigo, sino que generalmente se hace de una manera mucho más simple. Es decir, para poder estudiar el castigo lo que hacemos es primero adquirir una conducta, le damos comida a una rata por pulsar una palanca y así aumentamos la probabilidad de que pulse la palanca. Una vez que ya se ha adquirido esa conducta pasamos a castigarla y empezamos el procedimiento de castigo. Es decir, a partir de ese momento cada vez que pulse la palanca ya no recibe comida, sino chispazo y vemos a ver qué ocurre con la conducta. Veis, es una manera más simple, no tienen que recurrir al principio de pre-MAC para analizar la conducta de la rata, sino que simplemente primero, es decir, siempre vamos a estudiar el castigo en un contexto de reforzamiento. Primero reforzamos una conducta para adquirirla y después la castigamos. ¿Vale? Simplemente esa particularidad de cómo se realizan los experimentos, generalmente es así. Primero para poder castigar una conducta se tiene que dar, si no aparece la conducta no se puede castigar y para que se dé primero tenemos que adquirirla, así que primero la reforzamos en un experimento. Esto en la vida real no ocurre así porque ya hay conductas adquiridas de antes que queremos castigar o que queremos evitar o que queremos reducir su probabilidad, pero sí que ocurre en los experimentos. A partir de aquí ¿qué variables influyen? En la eficacia del castigo, que afectan a la eficacia de los procedimientos de castigo. Procedimientos de castigo que por cierto ya vimos en otro tema, tampoco vamos a ver mucho más aquí, solamente este tipo de controles por el estímulo y de factores que influyen. Bueno, pues lo primero la intensidad del estímulo aversivo. Cuanto más intenso mayor eficacia. Igual con la evitación, cuanto más intenso sea el castigo más eficacia para reducir la conducta. De hecho, esto es algo que también se ha comentado, lo tenéis también en el libro, que se ha comentado la eficacia real del castigo. Los primeros estudios indicaban que el castigo no era muy bueno para reducir conductas, aunque estudios ya posteriores y después de bastante investigación sí que se vio que el problema del castigo es que hay que ser muy bueno aplicándolo, es decir, tienes que tener mucho cuidado con todas las contingencias, con todas las situaciones que se dan. Y saber aplicarlo de una manera muy pautada y de acuerdo a unos factores muy determinados, porque si se hace bien es capaz de reducir la conducta, incluso de suprimirla y hacer muy difícil que vuelva a aparecer. Pero si se hace mal, a veces no es efectivo e incluso puede hacer que la conducta se reorganice de otro modo y que desaparezca una conducta que no quieres pero aparezcan otras que tampoco quieren. De hecho, relacionado con la intensidad, cuando hay una falta de contacto con la consecuencia aversiva. Es decir, si se deja de castigar la conducta, tú estás castigándola con un estímulo aversivo muy potente, pero si dejas de castigarla puede reaparecer la conducta y esto hace que surjan dudas sobre su eficacia, aunque ya veremos que se puede aplicar y de una manera exitosa. Aunque también vamos a ver que tiene unas ciertas, pues ya lo hemos visto también en otros apartados, ciertos efectos secundarios que van unidos siempre al castigo y que pueden hacer que no sea la manera más eficaz de eliminar una conducta. La inmediatez o demora, es decir, si el castigo se da en el momento o se da demorado. Esto es algo que es bastante obvio y que seguramente todos tendréis en la cabeza. Cuanto más contiguo sea, cuanto más inmediato sea el castigo, más eficaz es el castigo. Lo ideal para... Siempre se ha dicho, por ejemplo, los que tenemos perros sabemos que si queremos castigar o regañar al perro porque, por ejemplo, se ha hecho pis en casa, tienes que hacerlo en el momento en el que lo está haciendo y si le ves haciéndolo, de nada sirve que cuatro horas después llegues a casa y te pongas a pegar gritos al perro porque el perro ni siquiera sabe. De hecho, va a ocurrir otra cosa, ¿a qué va a asociar el perro tus gritos? Bueno, pues lo va a asociar con lo que pasa en ese momento, no con el haber hecho pis hace cuatro horas y también con tu llegada y con todo lo que tiene que ver contigo, así que va a generar miedo. Bueno, pues tenerlo en cuenta que esto sirve para todas las situaciones de castigo, la contigüedad favorece la eficacia. Esto es algo que se comenta mucho con las multas, por ejemplo, el hecho de que se pagase en el momento o de que no pase mucho tiempo entre que tienes una penalización y el castigo que conlleva hace que sea mucho más eficaz para evitar la conducta. Siempre que lo que quieras es evitar la conducta y no recaudar, si lo único fin es recaudatorio entonces da igual, pero si lo que quieres es evitar que eso suceda en el futuro es mucho más eficaz si aparecen de manera contigua. Cambios graduales en la intensidad del estímulo aversivo, es decir, ir aumentando poco a poco la intensidad del castigo. Es decir, la primera vez que lo haces un azote, la segunda un bofetón, la tercera más, eso no funciona bien. Lo mejor, es decir, ir amenazando cada vez más con castigos cada vez mayores no funciona bien, es una barbaridad, no es una forma buena de educar, tened en cuenta que son ejemplos. Pero... Aumentar poco a poco la intensidad del estímulo aversivo. La intensidad según se va realizando la conducta es algo que a lo mejor desde la perspectiva del que el castiga funciona muy bien, pero no funciona muy bien desde la perspectiva del castigo. Es mucho mejor que el castigo sea el mismo e intenso desde el principio. Incrementarlo no es bueno siempre. Si vas a castigar, si hay que castigar, si se va a realizar un procedimiento de castigo que sea intenso y contiguo desde el principio y hasta el final. Otras cuestiones que afectan. La experiencia previa. Por ejemplo, si la fase de reforzamiento previo es muy larga y se ha recibido mucho reforzamiento pues el castigo tiene menor efecto y es más difícil de aplicar. Si ante los berrinches de un niño le hemos prestado atención y mucha atención durante mucho tiempo y le cogemos en brazos para que se calle y se le apresenta mucha mucha mucha mucha atención nos podemos tirar toda la vida castigando eso que debido al volumen de reforzamiento y la gran cantidad de reforzamiento que ha recibido pues va a ser difícil que el castigo tenga un efecto potente por lo menos a corto plazo. Se va a necesitar mucho más ensayo y es un castigo mucho más duro con lo cual a lo mejor no es un procedimiento adecuado. Vamos a ver más cosas sobre esto. Efectos discriminativos del estímulo aversivo. Bueno, esto es algo que puede ocurrir o que tiene que ver con lo que hemos estado viendo aquí que es el control por el estímulo. Ya sabéis que hay situaciones en las que solo se castiga en presencia del estímulo. Por ejemplo, si un niño está en casa, siempre pongo ejemplos con este tipo de conductas porque son además muy llamativas y muchos hemos tenido mucho o habéis tenido mucho contacto con ellas. Si por ejemplo un niño está en casa y por ejemplo imaginaros que está con sus abuelos se queda todo el día con ellos y no le suelen castigar, no le suelen regañar o castigar más o menos hace lo que quiere y cuando llegan los padres es cuando recibe castigos. Bueno pues ¿cuál es el estímulo discriminativo para el estímulo? Los castigos, bueno pues los padres ¿no? La aparición de los padres es un discriminativo positivo para recibir estimulación aversiva para que ciertas conductas tengan una consecuencia aversiva. Ciertas conductas en su presencia, estimulación aversiva. Ciertas conductas en ausencia, es decir cuando no están los padres, no tienen consecuencias aversivas. ¿Resultado? Pues que el castigo solo va a funcionar en presencia de esos estímulos, es decir cuando estén los padres. Es decir la conducta solo se va a eliminar si los padres están delante porque son el estímulo discriminativo. El estímulo tiene el control de la conducta que es lo que hemos estado viendo hasta ahora. Los diferentes programas ¿os acordáis cuando hablábamos en el reforzamiento positivo de los programas de razón fija, razón variable, intervalo fijo, intervalo variable? Bueno que es decir que no hace falta reforzar todas las conductas. Que puedes reforzar una conducta de cada cuatro o puedes reforzar una conducta que se dé cada cierto tiempo, es decir la primera conducta después de cierto tiempo y que curiosamente en el reforzamiento positivo estos programas serán más efectivos que el reforzamiento continuo siempre igual de las conductas. Bueno pues esto no ocurre con el castigo. Los programas continuos en el castigo son mucho más efectivos que los intermitentes. Establecer un programa de razón fija en el que una conducta es castigada, una de cada cuatro conductas es castigada no es nada efectivo. Sí lo es para el reforzamiento positivo. Pero no lo es para el castigo. Tenerlo en cuenta. En el castigo, el castigo continuo es más eficaz. Ojo con esto. Yo sé que lo repito mucho ¿vale? Pero estamos hablando de eficacia, no de ética ¿vale? Que algo sea eficaz no quiere decir que sea algo que deba hacerse. Hay que tener mucho cuidado con los procedimientos de castigo y con el tipo de contingencias y evaluar siempre qué alternativas hay, cuáles son las mejores alternativas para eliminar una conducta. Así que que algo sea efectivo o eficaz. No quiere decir siempre que sea la mejor opción. De hecho muchas veces, en la mayoría de las veces el castigo no es la mejor opción. Es la más fácil, pero no es la mejor. Que sea fácil hace que se aplique mucho, pero eso no quiere decir que sea lo que mejor se puede hacer o lo mejor que se pueda hacer en cada caso. Bueno, más cosas que afectan. El programa de reforzamiento compuesto. ¿Qué quiere decir esto? Lo que hemos hablado antes. Para que podamos reducir la emisión de una conducta primero la hemos tenido que adquirir, la hemos tenido que reforzar. Bueno, pues el programa de reforzamiento que viene antes del de castigo, dado que es una técnica mixta que requiere reforzamiento previo, nos da lugar a tres diferentes situaciones. Primero, castigo sobre línea base apetitiva. Esto es lo más sencillo. Entrenamos a una raza para que pulse una palanca para que le den comida y después ponemos la misma situación, pero si pulsan la palanca te dan una descarga. ¿Vale? Segundo, castigo sobre línea base apetitiva. Es decir, primero entrenamos a una rata para que pulse la palanca y desaparezca una descarga y luego esa misma palanca no hace desaparecer la descarga sino que la hace aparecer. ¿Veis? En el primer caso aumenta la probabilidad de aparición y en el segundo la disminuye. Tercero, sobre línea base de extinción. En este caso metemos una rata en una caja de Skinner, la entrenamos para que dando una palanca... ¿Vale? Obtenga comida y después retiramos la comida y ahora si pulsa la palanca no se le castiga sino que simplemente no se le da comida. Eso es extinción, ¿no? Se está extinguiendo la relación entre la respuesta y la aparición del reforzado. Y una vez que la estamos extinguiendo entonces añadimos el castigo y ahora no sólo no aparece la comida sino que además se le da una descarga. Bueno, como podréis imaginaros cuando a los efectos de la extinción se han enloquecido, en el caso del castigo la supresión es más rápida que en estas dos situaciones. Aquí se unen los efectos de la extinción, derecho de que pulsar la palanca ya no daba lugar a comida porque estamos extinguiendo esa relación y además la castigamos luego el nivel de conducta va a bajar más rápidamente y en mayor medida. Otra cosa importante, existencia de una conducta alternativa reforzada. Esto es muy importante. A ver... Imaginaros... No, no vamos a hacer ejemplo con trato, lo vamos a hacer con seres humanos que es más interesante. Imaginaros una situación en la que estáis castigando, por ejemplo un niño, un niño que grita para llamar la atención, ¿vale? Suele gritar mucho y los padres lo han reforzado pues con su atención, es decir, le cogen o le echan la bronca pero al final también le dan cariño, le prestan atención y queremos evitar esa respuesta, ¿vale? Queremos evitar los berrinches. Entonces podemos enseñar a los padres a que... ¿Castiguen esa conducta? O no enseñarles sino que los padres simplemente deciden que la van a castigar y la pueden castigar no sería no hacerle caso, que eso sería evitar la consecuencia positiva, sino castigar darle una foto en el culo. Por ejemplo, ¿vale? Deciden los padres hacer eso. Bien, como ahora cada vez que tiene un berrinche se le da una foto en el culo, se supone que la conducta disminuirá. ¿Qué pasa? estamos haciendo y es que le estamos evitando una respuesta, pero ¿qué ocurrirá en este caso? Pues que el niño va a seguir queriendo y eso tiene que ver con lo que vamos a ver después, que son las manipulaciones motivacionales. El niño tiene un berrinche o grita para obtener atención, es decir, la motivación de la respuesta sigue estando allí, el niño sigue queriendo atención, ya no lo hace de esa manera, así que ¿qué hará? Va a empezar a realizar conductas de otro tipo para llamar la atención, es decir, a lo mejor deja de gritar, pero a lo mejor coge y se va a pegar a su hermana o a su hermano pequeño. ¿Para qué? Para llamar la atención, para obtener ese reforzamiento. ¿Cuál es la mejor manera de o hacer que, o cómo se puede hacer que el castigo sea más eficaz? Bueno, no solo castiguemos esa conducta, sino que reforzamos. Reforcemos conductas alternativas que sean incompatibles con esa y que tengan como resultado el conseguir el reforzador que está motivando esa conducta, y aquí estoy uniendo los dos puntos. Es decir, no solo darle un azote cuando el niño grita para llamar nuestra atención, sino que reforzar que el niño lo diga de manera educada o realice una conducta que sea adecuada y que nosotros queramos y que nosotros le premiemos con nuestra atención y nuestro tiempo. Se reducirá el nivel de gritos y berrinches, no aparecerán conductas inadecuadas y además desaparecerá la motivación para realizar ese berrinche y además obtendrá los reforzadores que necesita canalizando su conducta hacia otras actividades que sí son adecuadas. Porque la conducta no va a desaparecer. Si te prohíben hacer algo, vas a realizar otras acciones. Así que lo ideal es que reforcemos las conductas. No pretendamos que alguien deje de actuar de todas maneras y que además desaparezca la motivación por sí sola que lleva esa conducta. Es como comer. Por ejemplo, imaginaros que tenemos esta situación en la que la persona tiene mucha hambre. Ahora sí que vamos a por ejemplo una ratita. Entonces puso una palanca y obtiene comida. Pero pongamos que tenemos rata deprivada al 85% de su peso, que es muy poco. Tiene muchísima hambre. Bueno, pues ahora dejamos de darle comida cada vez que pulsa la palanca. Entonces ya no obtiene comida sino una descarga. Muy bien. Seguramente quizás seamos capaces de reducir la conducta, pero no hemos quitado la motivación. La rata sigue hambrienta. Así que una de dos. O va a seguir pulsando por mucho que intentemos castigarla o va a buscar otras conductas alternativas que tengan que ver con la conducta. Yo que sé, rascar las paredes, cualquier cosa que se os ocurra. Así que si reforzamos una conducta alternativa que satisfaga esa necesidad o ese impulso, será mucho más sencillo. Una cosa importante antes de seguir. Bueno, no con seguir con lo siguiente, sino ya enlazando directamente con lo siguiente. Y es que es el castigo. Os lo iba a decir en la otra diapositiva, pero mejor me lo digo ya aquí porque es justo de lo que vamos a hablar ahora mismo, sobre la eficacia relativa. Y antes de hablar de la eficacia relativa hay que hablar sobre lo que es un castigo. Porque a veces confundimos la topografía de una conducta con su función, ¿os acordáis? Cuando hablamos de tipografía de una conducta hablamos de su forma, de la forma que tiene. Cuando hablamos de la función hablamos de para qué sirve. Cuando a veces decimos voy a castigar al niño y el castigo al niño es un azote. Estamos hablando del castigo desde una manera o desde una perspectiva topográfica por la forma, es decir, parece que darle un azote como duele pues es una consecuencia aversiva. Bueno, pues no. Un azote es un castigo si sirve a una función, es decir, si consigue disminuir la conducta. Por ejemplo, si el niño tiene un berrinche o grita y yo le doy un azote y deja de gritar en el futuro y cada vez lo hace menos, es un castigo. Esa conducta, dar un azote, tiene una función y esa función es reducir o ha tenido una función o ha conseguido reducir la conducta. Luego es un castigo. Pero si yo le doy un azote y la frecuencia del berrinche no disminuye o incluso lo hace más porque además hay algún reforzador secundario como la tensión, eso no es un castigo. Quizás sí desde el punto de vista topográfico, es decir, parece que un azote siempre tiene que ser castigo porque tiene la connotación de malo. Pero desde luego no está funcionando como un castigo. Eso no es un castigo. Un castigo sólo lo es si suprime o disminuye la conducta. Si no, no es un castigo. Es que le castigamos sin ver la tele, pero sigue haciendo lo mismo, sigue haciendo lo mismo. Pues no lo habéis castigado. No habéis hecho ningún castigo, no habéis tenido ningún efecto sobre la conducta. Es importante distinguir entre lo que uno cree que es un castigo y lo que realmente funciona como castigo. ¿A qué viene? Bueno, pues que las consecuencias aversivas y sobre todo las consecuencias secundarias relacionadas con los castigos llevan a que haya, cuando se aplican ese tipo de procedimientos, un gran riesgo de que sean ineficaces, de que no valgan para absolutamente nada. Y eso a pesar de que en nuestra sociedad el castigo ocupa un papel muy importante. ¿Por qué? Pues porque, como os he dicho antes, es el método de control más sencillo de aplicar. Castigar es muy fácil, es facilísimo, pero no tiene por qué ser lo mejor o tiene que ser lo más eficaz. De hecho, ya os he hablado de estos primeros estudios que hablaban de la falta de eficacia. Pero bueno, si somos capaces de controlar todo, si somos capaces de controlar muy bien lo que hacemos, entonces sí podemos obtener castigos eficaces. Cosas buenas y malas, hemos hablado sobre ellas a lo largo del todo el tema. Los castigos bien aplicados suelen llevar a una reducción inmediata de la conducta. Muy rápido, muy rápida. Además, se puede mantener en el largo plazo también si se aplica de manera adecuada. Y además, una vez que se elimina la conducta mediante un castigo, son muy resistentes al contracondicionamiento o al recondicionamiento. Es decir, una vez que has eliminado una conducta es muy difícil que esa conducta vuelva a aparecer porque se asocia a algo positivo. Tarda más, ¿vale? Tiene que contracondicionarse o recondicionarse. Pero ¿qué ocurre? Que tienen efectos colaterales muy importantes. Ya hemos visto algunos, ¿no? Agresión, ansiedad, neurosis, redistribuciones imprevistas de la conducta. ¿Os acordáis de lo que hablaba antes de buscar una alternativa para poder conseguir el origen o lo que pretendía en un principio el niño cuando no lo consigue a través de la conducta? Bueno, pues todo esto son efectos secundarios de los castigos. ¿Cómo funcionan? Ya hemos visto algo sobre esto, ya os he hablado algo como esto. Y aquí volvemos otra vez a la relación entre condicionamiento clásico y operante. En cualquier contingencia operante, antecedentes se convierten en discriminativos. Esto también lo hemos visto. Los estímulos que aparecen antes, la luz roja que aparece antes de la descarga, se convierte en un discriminativo positivo. Pero también en estímulos condicionados que indican la presencia de estimulación aversiva y que producen ansiedad, miedo, incertidumbre, preocupación. Bueno, eso no tanto, pero sobre todo ansiedad y miedo. ¿Y qué es lo que ocurre en estas situaciones? Bueno, pues que cuanto más el estímulo aversivo, mayor probabilidad de que todos los estímulos del contexto terminen provocando miedo y ansiedad. Y además esto se generaliza a situaciones muy amplias y que nosotros no podemos controlar. ¿Os acordáis el ejemplo de que un niño, por ejemplo, sea... o por ejemplo ya pongamos otro niño que se mete con él o que... cuando habla se ríe de él? Eso sería un proceso de castigo, ¿no? Realizas una conducta que va seguido de una consecuencia negativa. Por ejemplo, que se rían de ti o que te insulten en el cole, un compañero. Y eso hace que tú hables menos en clase o que digas menos cosas porque no quieres que se rían de ti. Reduces tu conducta. Pero no sólo pasa eso. La presencia de ese niño que antecede a la propia conducta de ese niño, que es la consecuencia, actúa como negativo positivo, pero también hay otros estímulos en el cole. Está el propio cole, están los profesores, los compañeros, la situación de aprendizaje que se está condicionando clásicamente a la consecuencia negativa que es que se rían de ti. ¿Qué ocurre al final? Pues que toda la situación escolar, todos los estímulos de la situación escolar, todas las cosas que te recuerdan al colegio por generalización o cualquier cosa que tenga que ver lugar, persona, tus propias sensaciones internas cuando vas al colegio. Acaban provocando una reacción de miedo o de ansiedad. Es decir, empieza a aumentar la probabilidad de que aparezca un trastorno del comportamiento porque empiezan a producirse o a dejar de producirse respuestas ante estímulos, ante todos los estímulos que han sido condicionados a esa situación. A ver si va. Cosas también importantes que ya hemos visto antes. Con el castigo no alteramos la motivación del comportamiento. Podemos estar castigando toda la vida, pero como decíamos, con la rata. Pero si tiene hambre, tiene hambre. Así que si una rata tiene hambre y nosotros le castigamos por presionar la palanca que antes le daba comida, van a aparecer otras conductas para intentar saciar ese instinto o esa necesidad que tenía. Así que lo que vamos a tener que hacer es eliminar la motivación causal. En el caso de la rata es fácil darle de comer, dejarle comida al lado. Pero en el caso de los humanos vamos a tener que saber cuál es la causa de ese comportamiento para satisfacer esa necesidad. Si un niño tiene un berrín, si quiere atención, tendremos que verlo. Tendremos que ver cómo gestionar el tiempo para darle la atención y el cariño que necesita en vez de solo castigar una conducta que tiene el berrín. Y por último, quizás el efecto más grave, la conducta agresiva. El castigo genera agresión, ya sea como conducta ilicitada o dirigida. Fijaros, un ejemplo rápido. También lo tenéis en el libro. Si nosotros ponemos dos ratas dentro de una caja juntas, les ponemos dos electrodos. Uno a uno, lógicamente. Y les damos descargas, con el tiempo van a tender a agredirse. No hace falta nada más. Dos personas, o dos ratas en este caso encerradas, recibiendo estímulos agresivos, se terminan agrediendo como respuesta ilicitada por el simple hecho de poner un estímulo agresivo. Pero también puede ocurrir con una operante dirigida. Si el niño es castigado siempre por su padre o siempre le da un azote a su padre, también pueden generarse reacciones de agresión. Hacia su padre, como estímulo discriminativo o estímulo condicionado, y hacia los estímulos que estén relacionados con esa situación. Así que empezará o podrá aparecer agresión de esas dos maneras. Tanto como respuesta refleja, por el condicionamiento clásico, como una respuesta operante dirigida hacia los estímulos relacionados con esa situación. Vamos a ver rápidamente algunos fenómenos paradójicos en el castigo. ¿Qué quiere decir fenómeno paradójico en el castigo? Bueno, pues que cuando aplicamos un castigo... ...en vez de disminuir la probabilidad de la conducta, aumente la probabilidad de la conducta. Es decir, que en determinadas ocasiones parece que los organismos quieren el castigo. Cosa que parece muy raro. Esto es, vamos a ver, la conducta masoquista, ¿no? Esto es muy teleológico, lo de quieren el castigo. No vamos a utilizar esas palabras. Simplemente el hecho de que lo que parecería que debería ser una consecuencia aversiva que redujiese la conducta, aumenta sin embargo la conducta. ¿Por qué? ¿Por qué es debido a esto? Bueno, pues de nuevo, porque las relaciones de contingencia reales, lo que ocurre en el mundo, todas las cosas que hay involucradas en un procedimiento de aprendizaje en el mundo real, son muchísimo más complejas de lo que nosotros introducimos o creemos en un experimento. Hay mucho más eventos relacionados, mucho más reforzadores secundarios, muchas más situaciones que tenemos que tener en cuenta o que aparecen en el mundo real y que llevan estos fenómenos paradójicos. El primero, la conducta masoquista. Bueno, ¿qué es? Pues buscar el castigo. Bueno, pues esto puede aparecer en situaciones o estar relacionado con situaciones en el que el reforzamiento sólo está disponible si se castiga la conducta o para conductas que están castigadas. Si la única manera que tienes de que tus padres te hagan caso es haciendo algo malo para que, aunque te peguen o te den un azote o te castiguen, por lo menos estén contigo, pues uno puede parecer que el niño es masoquista y que está buscando que le peguen. O que le está buscando que le castiguen. No, el niño lo que quiere es el reforzador que aparece y que sólo está disponible si antes pasa por el castigo. Es lo mismo que ocurriría si la única manera que tiene una ratita en una caja de Skinner de acceder a la comida es soportar una descarga. Si está hambrienta y para poder acceder a la comida tiene que soportar una descarga lo va a hacer. Eso sería el círculo masoquista o la conducta masoquista. Básicamente ocurre porque hay un reforzador secundario que está manteniendo la conducta y que es más potente que el propio castigo. También puede ocurrir con contracondicionamiento. Por ejemplo, en caso de animales. Si yo asocio una descarga pequeña a la aparición de comida, doy una descarga y después aparece comida. Bueno, pues si hago esa asociación muy fuerte, puede ocurrir que si yo luego intento utilizar la descarga como estímulo aversivo, como castigo, no funcione así porque como ha sido asociado a la comida los sujetos quieran la descarga porque se ha asociado en otro procedimiento con la comida. Más cosas. El círculo vicioso que es un fenómeno relacionado con el refuerzo negativo. Fijaros, vamos a imaginar la situación. Se entra en una conducta de escape, ¿vale? Salto, por ejemplo, ante un estímulo aversivo aparece una descarga y si yo salto fuera de la zona escapó de la descarga. ¿Qué ocurre con ese evento? Bueno, pues que adquiere funciones discriminativas para la conducta. ¿Qué ocurre si utilizo ese estímulo como consecuencia aversiva? Bueno, pues que... Es decir, como castigo. Pues que aumentará la conducta en lugar de disminuirla, ¿veis? Se forma un círculo vicioso. Otras estrategias de supresión de la conducta. Hay más formas de suprimir la conducta que no tienen por qué estar relacionados o que no tiene por qué ser el castigo y que además tienen un efecto beneficioso y es que evitan los efectos colaterales que el castigo tiene. Ya hemos visto el entrenamiento de visión, ¿os acordáis? Cuando realizar una conducta te retira un refuerzo positivo. Tienes algo, algo positivo, un reforzador y si haces algo malo te lo quitan. No te dan la paga ese fin de semana si te portas mal o no te dejan jugar a la videoconsola. Esos son ejemplos de omisión. Te quitan un reforzador si realizas una conducta que no es adecuada. Bueno, las variables que lo afectan son las mismas que ya hemos visto, ya lo hemos visto, ¿de acuerdo? Son las mismas variables que afectan al escape y a la evitación. Y también hemos visto todo este procedimiento. De hecho se vio en el capítulo 4, en la página 182 tenéis todo lo que vimos sobre omisión. También tenéis algún vídeo que os pasé. ¿Qué ocurre normalmente? ¿Qué ocurre normalmente con la omisión? Un efecto particular. Es que a veces se mantiene un nivel residual de respuesta. ¿Por qué? Pues porque está asociada a la aparición del reforzador. Es decir, cuando no realizas la conducta aparece el reforzador. Eso hace que se pueda mantener un nivel residual de respuesta dado que tienes mucho contacto con los reforzadores. Aunque en general dura poco. Al final se termina eliminando rápidamente la respuesta. Más formas. Ya hemos visto esto. Modificación de la fuerza de conductas alternativas. Es decir, dar alternativas de comportamiento. Cuando queremos que una conducta no se realice ofrecer alternativas reforzadas. Si queremos que un niño no tenga berrinches ofrecerles otra alternativa para conseguir lo que pretende con ese berrinche. O conductas que sean incompatibles con ese berrinche. Por ejemplo, hablar de manera normal y que eso se refuerce. Así que eso como efecto, como efecto colateral va a tener la reducción de la conducta que nosotros no queremos. Sin necesidad de castigar. ¿Por qué? Pues porque son incompatibles. Es decir, hablar normal y hablar bajo de manera educada es incompatible con gritar. Así que si uno aumenta su frecuencia el otro lo va a disminuir. ¿Cuál es el objeto? Pues que convertir el resto de conductas en más atractivas. En que sea mejor hablar de esa manera porque lleve a mejores consecuencias que realizar esa conducta que no queremos porque lleva a peores consecuencias. Y la extinción. Es decir, extinción de la respuesta operante. ¿Cómo hacemos esto? Pues rompemos las contingencias con la consecuencia. Por ejemplo, si un niño tiene un berrinche ¿qué es lo que hacemos? Pues dejamos de prestarle cualquier tipo de atención. Ya no obtiene la atención que queremos. Ya no obtiene el reforzador. Se rompe la contingencia. Se rompe la contingencia de la respuesta con el reforzador. Se rompe la contingencia que tiene con la consecuencia que aparecía. ¿Qué es importante? Pues poder controlar los reforzadores. En el caso de los niños y los berrichos es un caso muy clásico. Ya lo sé, se ha visto mil veces. ¿Cómo puede funcionar esto? Bueno, esto funciona si extinguimos la conducta. Funciona si nadie le va a hacer caso. Pero si uno de la familia sí le hace caso y otro no tenemos que tener un control absoluto sobre el reforzamiento. Tenemos que retirar completamente la contingencia entre la respuesta que se da y la obtención del reforzador. Extinguir la conducta. Y ya sabemos que esto puede dar lugar a apariciones explosivas de la conducta, agresión, etc. al principio que pueden ser difíciles de controlar. Hay que tener mucho control sobre las situaciones para poder aplicar la extinción. Y ojo, tener en cuenta que no es desaprendizaje ni olvido que tiene sus propios fenómenos. Acordaros de esto. La extinción no quiere decir que se desaprenda. No se olvida lo que ya se ha aprendido. De hecho, el mero hecho de que pase el tiempo puede hacer que vuelvan a surgir, por ejemplo, los berrinches. O el que vuelva a aparecer una conducta de atención al niño puede volver a hacer que aparezcan los berrinches simplemente por el contacto con el reforzamiento. Y tampoco es olvido. No se olvida lo que ocurre. Es decir, el aprendizaje sigue existiendo. La extinción, recordadlo, sigue sus propios fenómenos. Y, por último, las modificaciones motivadoras. Ya terminamos, ¿vale? Que ya no me he pasado el tiempo. Modificaciones motivacionales. Es decir, controlar las causas del comportamiento. Investigar qué es lo que está manteniendo esa conducta. Qué es lo que hay detrás. Qué necesidad o qué... ¿Cómo lo podría decir? Qué necesidad o qué impulso hay detrás de la conducta y que mantiene esa conducta. Por ejemplo, en el caso... Ya lo hemos visto. El caso más sencillo de la rata. Pues el grado de privación de comida. Si queremos que... Ya lo hemos dicho muchas veces. Si queremos que una rata deje de pulsar para obtener comida, pues lo mejor que podemos... Queremos eliminar esta conducta. Lo mejor que podemos hacer es dejar la comida de libre acceso aquí para que no tenga que pulsar para obtener la comida. Va a desaparecer la conducta. Así que podemos suprimir la conducta modificando la motivación. Eliminando la motivación. Para realizar esa conducta. Esto sería un caso de reforzador primario. En el caso de los secundarios, por ejemplo, el dinero, bueno, pues podemos sobreexponer. En el caso del dinero es difícil porque es muy difícil saciar al sujeto de todas las cosas que están relacionadas con el dinero. Poder, comida, alimentos, ropa... Hay muchas cosas. Es decir, es muy difícil si es un reforzador generalizado saciarlo. Pero en caso de otros reforzadores secundarios que no están tan generalizados, pues lo que habría que eliminar es la necesidad del reforzador primario y así evitar que se realice la conducta. Bueno, pues aquí acabamos. Hasta aquí el tema 7. Recordad, la semana que viene, prácticas. Vamos a ver todo lo relativo de prácticas y ya me podéis ir mandando preguntas para ir viendo para la última de las tutorías. ¿De acuerdo? Nos quedan dos. La siguiente, prácticas. Y si nos da tiempo y me mandáis alguna pregunta, pues también pongo las diapositivas aquí y vemos algunas de las preguntas que me mandéis. Mandármelas directamente, por favor. Por correo, ¿vale? Me mandáis las preguntas por correo y así las dejo preparadas en diapos y las vamos viendo durante. Y me las podéis ir mandando ya. Todas las que me vayáis mandando las vamos a ir viendo a partir de ahora. Y nada más. Último tema. Ya hemos terminado toda la parte teórica y nos vemos la semana que viene con lo que nos queda. Así que tenemos dos semanas todavía para preparar. Así que nada, muchas gracias chicos y hasta la semana que viene.