En la anterior tutoría nos quedamos justo, terminamos el capítulo número 3, así que vamos a cambiar un poquito de tercio. Vamos a empezar con algo relativamente distinto. Ya veréis que hay bastantes diferencias entre lo que hemos visto hasta ahora y lo que vamos a ver, pero también hay cuestiones comunes y sobre todo interacciones entre ambos procesos. Vamos a pasar del condicionamiento clásico, de los procesos de condicionamiento descubiertos o desarrollados por Pavlov en el aprendizaje respondiente, en lo que se asociábamos dos clases de estímulos, un estímulo condicionado y un estímulo incondicionado. El estímulo incondicionado, recordad que era aquel estímulo biológico, biológicamente relevante, que producía una respuesta por sí mismo. Y el estímulo condicionado, aquel que a través de su asociación con el estímulo incondicionado lograba generar o se asociaba a él y por lo tanto generaba una respuesta por sí mismo. Una respuesta que normalmente era similar a la que provocaba el mismo estímulo incondicionado. Bien, pues vamos a cambiar de tercio. Vamos a ver algo distinto, un tipo de aprendizaje en el que la conducta voluntaria del sujeto va a ser mucho más importante. Hasta ahora casi todo lo que hemos visto son condicionamientos de conductas que no son voluntarias, simplemente la aparición de un estímulo provocaba de manera automática la aparición de la respuesta. Vamos a ver cómo cambia todo esto en el condicionamiento. Bueno, empecemos con lo básico, con las fundamentaciones, con los antecedentes del condicionamiento operante. Algo vimos en el primer tema cuando vimos los antecedentes históricos del conductismo y las influencias científicas de las distintas escuelas y sobre todo de la escuela conductista. Ya sabéis que la principal escuela que influyó, la principal influencia del condicionamiento operante fue la escuela conductista. El condicionamiento operante, en particular en el conductismo, sobre todo en el conductismo, también el condicionamiento clásico, pero sobre todo en la escuela conductista, es la teoría evolutiva de Darwin. Esa es la principal influencia de los procesos de aprendizaje por condicionamiento operante. Acordamos de algo esencial. Cuando hablamos de evolución, cuando hablamos de selección natural, hablamos de dos cosas importantes. Hablamos de que los caracteres de los individuos pueden variar, ya sea por ciertas mutaciones, ya sea... por alguna otra característica. Las diferentes características de los individuos, de los organismos, varían. Lo tenemos ahora muy presente, ¿verdad? Con un virus que ha mutado para saltar a nuestra especie y se ha adaptado al ambiente para poder infectar a otra especie. Así que una mutación de un virus ha hecho que ahora todos lo podamos coger y por eso se está organizando todo esto. Así que fijaros, es importante la variación de las características o de los fenotipos de los individuos. Bueno, y es el ambiente el que selecciona estas adaptaciones, estos cambios que se ocurren de manera aleatoria. De nuevo, otra vez, esta modificación de ese virus ha persistido porque le permite infectar a otros huéspedes. Y como le permite infectar a otros huéspedes, se mantiene en el tiempo, hace que pueda replicarse mejor, hace que pueda generar más copias de sí mismo. Es evolutivamente o en cuanto a la supervivencia beneficioso y se mantiene en el tiempo. Bueno, pues lo mismo van a aplicar o el mismo principio es el que va a guiar a los conductistas a la hora de explicar la conducta. También la conducta tiene diferentes variaciones. Todos nos podemos comportar de diferente manera. La conducta es variable. La conducta no es rígida y estereotipada y en diferentes individuos, incluso en el mismo individuo, puede cambiar en función del contexto, en función de la situación o también en función del azar. Y será el ambiente el que se encargue de seleccionar aquellas conductas. Que sean más adaptativas. Así que va a ser el propio ambiente, van a ser los acontecimientos, van a ser los reforzadores, es decir, van a ser las consecuencias de nuestros actos, de nuestras conductas, las que seleccionarán las conductas que se mantendrán en el tiempo y cuáles se eliminarán. Así que lo que tenemos en este tipo de aprendizaje es una relación entre dos tipos de eventos, un estímulo y una respuesta. Aunque luego veremos que añadiremos algo más. ¿Cómo ocurre esto? Bueno, pues tenemos que ante una respuesta, en una situación determinada, ocurren ciertas consecuencias. Si esas consecuencias son agradables o son beneficiosas, se hará más probable la aparición de esa misma respuesta en el futuro. Si esas consecuencias no son beneficiosas o son perjudiciales, se hará menos probable. Esta va a ser la base del condicionamiento operante, de lo que vamos a ver en este capítulo. Y como veis tiene mucho que ver con los conceptos de variación y selección de la teoría evolucionista de Darwin. Y que todos estamos viviendo desde hace unos días en nuestras propias carnes las consecuencias de toda esta teoría o de las predicciones de esta teoría. Bueno, vamos con lo siguiente. Ya hemos visto esto. ¿Quiénes fueron los dos principales investigadores o los dos principales referentes sobre el condicionamiento operante o el condicionamiento instrumental, como se llamaba en un principio? Bueno, vamos a ver dos. Son Thorndike y Skinner. Vamos a empezar con Thorndike. Ya conocéis algo sobre él. Ya hemos visto también algo en el primer capítulo. Fue el primero que empezó a abordar experimentalmente este tipo de aprendizaje, lo que él llamaba condicionamiento instrumental. Y lo llamaba condicionamiento instrumental porque en este caso la conducta era un instrumento para conseguir algo. Y se centró en un tipo de aprendizaje específico o en el efecto de ciertas cosas sobre el aprendizaje en particular, en el efecto de los aciertos y los fracasos sobre la conducta. ¿Qué pasa cuando aciertas y cuando fallas? Cuando consigues lo que quieres y cuando no consigues lo que quieres. Es una especie de conexionismo, la conexión entre la conducta y los resultados asociados a esa conducta, sobre la conducta y la falta de resultados de esa conducta. Es decir, entre los estímulos que van después de nuestra conducta y la respuesta, es decir, nuestra propia conducta. Lo que toda la vida hemos llamado el aprendizaje por ensayo y error. ¿Y cómo lo hizo? Pues utilizó un dispositivo creado por él mismo, lo que denominaba cajas problema. Una caja en la que, en este caso, el experimento típico de... ...de Thorndike era bastante sencillo. Creó una caja de madera, la diseñó él mismo. En la Facultad de Psicología, si vais alguna vez, tenéis algunos ejemplos de estas cajas problema. Eran bastante más rudimentarias que la que aparece aquí en este dibujo. Bueno, metía un gato en una caja de madera y la caja de madera tenía un dispositivo. Un dispositivo que si se accionaba abría una puerta. Fuera de la caja, Thorndike comía comida o alguna otra cosa que le gustase al gato y que fuese agradable para él, que fuese reforzante generalmente comida o bebida. Lo que fuese. Pero lo ponía. Normalmente el gato no, y como es lógico, no sabía qué tenía que hacer para salir de la caja. Se tiraba bastante tiempo dentro, iba paseando y generalmente por casualidad, sin querer, accionaba de manera casual la palanca que accionaba el mecanismo. La palanca o el mecanismo que en ese caso tuviese. Bueno, el gato salía, tomaba la comida. Y Thorndike volvía a introducir al gato en la caja problema. De nuevo, todavía no se había perdido nada. Fue el mismo proceso. Lo que ocurría es que según iban sucediéndose los ensayos, cuanto más ensayos había, la velocidad por lo que tardaba el gato de salir de la caja cada vez era menor. Es decir, el gato iba aprendiendo una asociación, una asociación entre su respuesta, entre una conducta concreta y una consecuencia. La consecuencia era que se abría la puerta pero sobre todo la consecuencia es que tenía el acceso a la comida que estaba fuera de la caja. Así que lo que dijo Thorndike o lo que pensó Thorndike es que cuando una conducta particular va seguido de algo agradable es más probable que se repita. Una primera forma, lo que él denominó la ley del efecto. Cuando el efecto de la conducta es positivo hay una mayor probabilidad de que se repita. Esto es una explicación basada en el hedonismo. Recordad que, lo vamos a ver ahora cuando veamos a Skinner, que los conductistas no se llevaban bien con los procesos mentales, con los procesos internos. Les gustaba explicar todo en base a... Fenómenos observables. Aquí Thorndike todavía intenta explicar el aprendizaje, todavía intenta explicar estos fenómenos refiriéndose a variables que son internas. Lo que es agradable o desagradable, lo que es placentero o no es placentero, no es algo que sea observable. Se basa en concepciones sobre procesos mentales o sobre procesos internos que no son observables. Algo parecido al hedonismo. Ya veremos que esto acaba con Skinner. Pero, en este caso lo que tenemos es el primer acercamiento experimental al condicionamiento operante, llamado por Thorndike condicionamiento instrumental. Una caja solamente puede realizar un ensayo y lo que ocurre es que la velocidad a la que es capaz de salir de la caja disminuye. Es decir, ¿qué se mide en este caso? La latencia de respuesta. ¿Cuánto se tarda en dar la respuesta adecuada? Que va disminuyendo cada vez más hasta que al final el dato aprende la asociación entre pulsar una palanca, de la forma que sea, y salir. Esto desde la aproximación de Thorndike. La primera de las aproximaciones. Una aproximación desde el condicionamiento instrumental. Fijaros en el procedimiento que utiliza, que es bastante rudimentario. Tiene que estar metiendo al gato en la caja cada ensayo. Solo se puede realizar un ensayo. Se tarda mucho tiempo. En esta diapositiva no la podemos ver porque la plataforma no permite subir vídeos. Tengo que subir las diapositivas en PDF, pero en las diapositivas que os he mandado, en el enlace que os he mandado, si lo tenéis ya, podéis ver todos los vídeos que contiene el tema. La idea era verlos en clase, no vamos a poder, pero bueno, por lo menos podéis verlo. También tenéis muchos ejemplos en internet que podéis utilizar si queréis. Pero bueno, lo podéis ver en casa, incluso si queréis podéis estar viéndolo ahora mismo porque voy a explicaros un poco sobre el vídeo. Y en este vídeo lo único que se ve es cómo era la caja de Zorda y la caja problema de Zorda y cómo era su procedimiento, más o menos cómo sería su laboratorio, una dramatización de cómo sería esto y cómo sería el procedimiento sencillo de meter al gato, esperar a que dé a la palanca y conseguir su reforzador. Bien, ya tenemos la primera aproximación. Vamos con lo siguiente y vamos con el análisis experimental del comportamiento. La aproximación desde el conductismo, desde el conductismo radical de Skinner. Vamos a hacer un análisis específicamente experimental, vamos a dejar de lado todas las variables intermedias, todas las variables internas y vamos a explicar el comportamiento sólo desde aquello que es observable, como función de sus consecuencias, como las funciones que existen o las relaciones que existen entre. La conducta de los individuos y los estímulos que hay en el entorno, tanto los que anteceden como los que ocurren después de la conducta. Bueno, Skinner realizó su tesis doctoral sobre este tipo de aprendizaje y dedicó gran parte de su vida a estudiar este tipo de aprendizaje y por supuesto sus bases y lo que primero entró en su vida fue el condicionamiento pauloviano, que era una rama que llevaba estudiándose muchos años cuando Skinner, unos cuantos años cuando Skinner empezó a interesarse por este tema de investigación. Y lo primero que hace es establecer una distinción, una distinción entre el condicionamiento respondiente, lo que sería el condicionamiento clásico pauloviano y el condicionamiento operante. Esta es la base del, este es el porqué del nombre que le damos a este tipo de aprendizaje. En el condicionamiento respondiente, en el condicionamiento pauloviano, los sujetos no tienen que llevar a cabo ninguna actividad voluntaria, no tienen que responder ante nada, no tienen que realizar ninguna conducta. La conducta o la respuesta es elicitada automáticamente por el estímulo. Primero por el estímulo incondicionado y una vez que se ha asociado, también por el estímulo condicionado. Por eso se llama condicionamiento respondiente, porque es una respuesta automática ante un estímulo. En el caso de Skinner y en el caso de lo que él empezó a estudiar, que era su antecedente más directo, que fue Zordaic, denomina al tipo de aprendizaje en el que está interesado condicionamiento operante. ¿Por qué? Porque el sujeto... El sujeto opera sobre el entorno. Lo vamos a ver ahora abajo en algunas de las características fundamentales y en los términos fundamentales de este tipo de condicionamiento. ¿Qué es importante para Skinner? Para Skinner no le importan las variables intermedias que ocurren, no le importan los procesos mentales, no le importa el placer o no placer y desde luego no quiere describir la conducta en términos de si algo es agradable o no agradable para el sujeto. Así que se va a centrar en lo que puede medir y lo que puede medir son las relaciones funcionales que existen entre la conducta y las consecuencias, es decir, cómo se relaciona la conducta de un individuo y la aparición de ciertos estímulos que en este caso serán los reforzadores y también con los estímulos que anteceden a la respuesta. Eso es lo que le interesa, ¿cuál es la relación funcional? Es decir, cómo se relaciona la conducta con... las consecuencias o, dicho de otra manera, qué efecto tienen las consecuencias los reforzadores sobre la conducta y cómo se relacionan matemáticamente porque al final esto consiste en establecer una relación matemática experimental, una relación lógica entre las consecuencias y la conducta. Así que sólo nos podemos centrar en los eventos observables. ¿Por qué el condicionamiento es operante? Porque el individuo puede operar. ¿Por qué es instrumental? Porque la conducta es un instrumento para conseguir algo. No es simplemente una respuesta automática. Y su principal innovación, el principal cambio, por lo menos en el ámbito práctico, en el día a día de investigación, fue lo que él denominó operante libre. Un operante libre que estaba muy relacionado con el tipo de estructura, con el tipo de dispositivo que creó. Lo vamos a ver ahora. Lo que él llama operante libre es simplemente un tipo de experimento en el que el sujeto puede realizar todas las conductas que quiera dentro del mismo. Dentro de la misma situación. Con lo que vamos a cambiar la variable dependiente. Vamos a pasar de medir la latencia de respuesta a medir la tasa de respuestas. Es decir, el número de respuestas por unidad de tiempo. Vamos a ver algo sobre esto. Hay una diferencia clara entre el condicionamiento clásico y el condicionamiento operante. La primera, ya lo hemos visto, es que las conductas en el condicionamiento clásico son elicitarias. No son emitidas. Sin embargo, en el condicionamiento operante las conductas son emitidas por el sujeto. Y esto lleva a una cosa fundamental, a una cuestión muy importante. En el condicionamiento clásico las conductas, todo lo que hace el individuo, generalmente tienen un estímulo que las provoca. Un estímulo muy claro además. Cuando yo intentaba asociar un tono a la aparición de una descarga, la reacción de miedo tenía como antecedente claro a uno de estos dos estímulos. O bien a la descarga cuando todavía no había asociación, el estímulo incondicionado, o bien al tono cuando ya se había establecido la asociación. Había estímulos evocadores, estímulos que directamente hacían que saltase la respuesta. La respuesta ocurría cuando aparecía el estímulo. Sin embargo, en el condicionamiento operante no existe normalmente ese tipo de estímulo evocador. No hay un estímulo claro que provoque directamente la respuesta. Imaginaros cualquier situación en un humano. Por ejemplo, si os gusta, como he puesto aquí el ejemplo, si os gusta la música y sabéis tocar algún instrumento, por ejemplo el piano. Si alguna vez queréis tocar el piano, os daréis cuenta de que no hay ningún estímulo evocador. Claro, será porque os apetece, pero ese os apetece incluye muchas cosas. Muchos estímulos contextuales, muchas situaciones, muchas variables diferentes. No hay un estímulo que aparezca y de repente uno empiece a tocar automáticamente el piano. Vamos a ver otros muchos ejemplos a lo largo de este capítulo y de los siguientes. Pero os daréis cuenta de que en casi todas las situaciones de condicionamiento operante, si no en todas, no hay estímulos que provoquen directamente la respuesta. Por eso la conducta es emitida. Porque a pesar de que hay estímulos que anteceden, la conducta no ocurre de manera automática. Pero ya veremos que si ocurre algo. Si ocurre que puede estar controlado por esos estímulos. ¿Cuál es la clave de este tipo de aprendizaje? Pues, la clave es que la conducta que ocurrirá en el futuro queda determinada por las consecuencias de lo que ha ocurrido. Y aquí también ocurre o pasa otra cosa muy importante. Skinner se desmarca del hedonismo. Skinner se desmarca de las explicaciones basadas en variables internas. Todo lo que nos interesa es cómo las consecuencias varían la probabilidad. La probabilidad de aparición de una conducta. Así que las consecuencias no serán ni agradables, ni desagradables. Serán simplemente consecuencias. Y el hecho de que sean reforzadores o no lo sean. O el hecho de que sean positivas o negativas. Tiene que ver con el efecto que tienen sobre la conducta. No sobre aquello que pensamos sobre ella. ¿De acuerdo? ¿En qué consiste, por tanto, el condicionamiento por ante? Pues en un proceso. Y ese proceso consiste solamente en cambiar o modificar la probabilidad de que se dé una respuesta en función de sus consecuencias. De nuevo, el efecto del ambiente sobre la conducta. La selección del ambiente sobre la conducta. Las consecuencias son ambientales. Lo que ocurre después de una conducta es ambiental. Es el ambiente, son las consecuencias de esa conducta la que modifica la probabilidad de aparición en el futuro de esa conducta. ¿Qué hacemos en este caso? Pues ponemos al sujeto en una situación. Una situación en la que alguna de sus conductas, por casualidad, o porque lo hemos elegido así, en una situación experimental, da lugar a la aparición de un evento. Y ese evento es el que se supone que cambiará la probabilidad de emisión de esa conducta en el futuro. Así que primero pondremos las circunstancias adecuadas, después elegiremos una respuesta a reforzar y serán las consecuencias de esa conducta o de esa respuesta la que hará más probable o menos probable la conducta en el futuro. De nuevo, el sujeto opera en el medio. Y es el medio el que modifica el organismo, el que modifica la situación. Es el medio el que modifica las conductas del organismo. El elemento seleccionador es el medio. ¿Qué intentamos los organismos? Pues obtener consecuencias que nos son favorables, ya sea desde el punto de vista evolutivo o desde cualquier otro punto de vista. Y eliminar aquellas que no son desfavorables o que pueden tener algún perjuicio para nosotros. ¿Veis la similitud que hay entre la teoría de la evolución de Darwin, de las teorías evolucionistas, y las teorías de aprendizaje desde el punto de vista del condicional? Bueno, aquí tenéis otro vídeo. Tampoco lo podemos ver, es una pena, pero lo podéis ver desde casa. Esto es una clásica caja de Skinner. ¿Veis que tiene ese suelo de rejilla? Que es el suelo electrificado del que os he hablado algunas veces. Y bueno, y todos los aparatos típicos de una caja de Skinner. Palancas para que la rata pueda realizar pulsaciones, luces que se encienden, etcétera, etcétera. Para señalar cuando está disponible el reforzador. También para procedimientos de condicionamiento clásico. Son... Se utilizan en un grupo. Un montón. Muy diferentes procedimientos. Lo podéis ver en casa. Veréis cómo la rata puso una palanca y cae comida en la parte del comedero, que es esta de aquí. Y cada vez que lo pulsa obtiene una bolita de comida. Por supuesto, no todos los procedimientos de condicionamiento operante son tan sencillos. En los siguientes temas veremos procedimientos que son bastante más complejos. Procedimientos de reforzamiento diferencial, control por el estímulo, etcétera, etcétera, etcétera. Pero de momento lo que nos interesa es ver esa relación entre la conducta y sus consecuencias y cómo las consecuencias modifican la probabilidad de aparición de una conducta. Bueno, vamos con lo siguiente. Vamos a definir exactamente. Ya hemos visto los dos principales antecedentes, los antecedentes teóricos y también los dos principales investigadores y desarrolladores del condicionamiento operante. Y vamos a ver ahora algo bastante importante. La contingencia de tres términos. Pues hasta ahora hemos hablado solamente de dos términos. Un estímulo, que vamos a hacerlo al revés para que quede más claro. Una respuesta que da lugar a un estímulo, que es el reforzador. Así que lo que tenemos es que en el condicionamiento operante debe existir contingencia, es decir, una relación entre la aparición de la respuesta y la aparición de la consecuencia del reforzador. Recordad que R es para respuesta y cuando ponemos S se refiere a las consecuencias o estímulos, ¿vale? A consecuencias o reforzadores. ¿Vale? Aunque no coincida con la letra. ¿Qué es lo importante o qué hemos visto hasta ahora? Que tiene que haber una relación, una relación entre la aparición de uno y la aparición de otro. Como en el condicionamiento clásico tenía que haber una contingencia entre la aparición del estímulo condicionado y el estímulo incondicionado para que ocurriese el proceso de asociación. Aquí lo mismo. Si no hay relación o no hay contingencia, si no hay una correlación entre que yo respondo y obtengo algo agradable, no se va a producir la asociación. Sin embargo, esto no es toda la historia. Esto no es todo lo que podemos tener porque toda esta relación se puede poner bajo el control de otros estímulos, estímulos antecedentes, estímulos que aparecen antes de la respuesta. ¿Qué quiere decir esto? Esto quiere decir que en presencia de determinados estímulos la consignación o el realizar determinada respuesta o determinada conducta tiene determinadas consecuencias. Y en otras situaciones, en otro contexto. De otros estímulos, llevar a cabo la misma respuesta o la misma conducta no lleva a las mismas consecuencias. Imaginaros, vamos a imaginarnos una situación humana que es más fácil de ver en estas situaciones. Imaginaros una persona que es cantante de ojo. que es su trabajo y es a lo que se dedica y, por supuesto, le gusta mucho ser cantante de ópera. De acuerdo, imaginaros la situación de que está en su trabajo o está en un auditorio, un auditorio de música, y todo ese estímulo contextual es el que le indica que está en la situación de cantar. Así que, ¿qué es lo que hace? Como está en el auditorio, sabe que ha ido al trabajo, están los músicos, está todo el público, canta. ¿Qué obtiene a cambio? A cambio, generalmente, si lo hace bien, por supuesto, lo que obtendrá será el aplauso de la gente. También le pagarán por ello y muchas más cosas, pero lo que obtiene es una consecuencia agradable. Ahora imaginémonos otra situación, una situación en la que la misma o el mismo cantante de ópera está en un partido de tenis y, de repente, en ese partido de tenis, justo antes de que saque uno de los jugadores, empieza a cantar ópera, empieza a gritar en mitad del campo y empieza a cantar, por muy bonita que sea la ópera que cante y lo que ocurra. Lo que ocurrirá, seguramente, es que la gente le abuche el público, le reproche los jugadores también y el árbitro le llame a orden e incluso le eche de aquí. ¿Qué quiere decir esto? Pues que la respuesta, que en ambos casos es la misma, obtiene diferentes consecuencias y las obtiene porque hay estímulos contextuales diferentes. Es decir, ante una serie de estímulos antecedentes, una serie, ya sean contextuales o de otro tipo, lo que nos indica es que la respuesta, porque podemos dar la respuesta, es una respuesta para obtener una determinada consecuencia. Sin embargo, en presencia de otros estímulos, el realizar la respuesta no llevará a la consecuencia que deseamos. Resumido de otra manera, en presencia de un estímulo específico, el reforzador se presenta sólo si la respuesta ocurre. Así que la respuesta tiene que ocurrir para obtener el reforzador, pero queda bajo control de los estímulos específicos que nos indican si el reforzador está disponible o no está disponible. En este caso, el estímulo antecedente, que es el antes de la respuesta, que sería el Auditorio Nacional o cualquier otro auditorio, o el Teatro Real, sería un estímulo discriminativo que nos indica que el reforzador está disponible. Obtendremos aplausos y nos pagarán por esto. Si el estímulo antecedente, el estímulo que aparece antes, es el campo de tenis, nos indica que por mucho que cantemos, lo más que vamos a obtener es una consecuencia desagradable. Bien, vamos a ir uno por uno con esta contingencia de tres términos. Vamos a empezar con el estímulo discriminativo. Ya hemos visto bastante sobre él. Bueno, Lo importante del estímulo discriminativo es que es un estímulo que aparece antes de la conducta y que nos señala cuando está disponible un reforzador, una consecuencia particular. Ya hemos visto el ejemplo de la ópera. Podemos ver otro bastante sencillo. Imaginaros, este es un ejemplo que también pongo bastante, una máquina de refrescos. En una máquina de refrescos generalmente suele haber una serie de pulsadores para obtener diferentes bebidas y esos pulsadores suelen tener distintas luces para indicarnos si queda todavía ese refresco o no. Normalmente es una luz verde y una luz roja. En este caso el estímulo discriminativo, el antecedente sería la luz. Si la luz está verde nos indica que ante una respuesta nuestra, que sería echar dinero y pulsar el pulsador, va a caer lo que nosotros queremos. Vamos a obtener la consecuencia, el reforzador que nosotros queremos. Sin embargo, una luz roja nos indica que por mucho que realicemos una conducta concreta no vamos a conseguir el reforzador que queremos. No está disponible el reforzador. ¿Qué está haciendo el estímulo discriminativo? No está provocando la conducta, está controlando la conducta. Ahora lo vemos. Fijaros, lo que tenemos aquí son dos tipos de estímulos antecedentes y en condicionamiento operante estos estímulos antecedentes reciben dos nombres distintos en función de qué señalen. Si señalan la aparición de un reforzador. El reforzador se llamará estímulo discriminativo, ED. Si señala la no aparición del reforzador, la no disponibilidad del reforzador, se llamarán estímulos delta. Esto es una nomenclatura arbitraria, pero esta es la que tenéis que aprender. Estímulo discriminativo cuando el estímulo antecedente señala la disponibilidad del reforzador, es decir, la luz verde en el caso de la máquina que hemos visto antes. Y estímulo delta cuando señala la no disponibilidad. Fijaros en una cosa importante que os he dicho antes, estos estímulos ejercen el control sobre la respuesta, pero no desatan la respuesta de manera automática, no provocan la aparición automática de la respuesta. Vamos a verlo también en el mismo ejemplo. Los estímulos o en una máquina de refrescos, el que haya luz verde y luz roja me indica la disponibilidad del reforzador, me dice cuándo, si yo realizo la respuesta, voy a obtener algo. Pero eso no quiere decir que ante la aparición del reforzador no tenga la disponibilidad del reforzador. Si yo realizo la aparición de esa lucecita verde, yo voy a pulsar siempre, yo solo voy a pulsar el pulsador para obtener el refresco si tengo sed. si necesito hacerlo o si tengo la intención de hacerlo, pero no por el hecho de ver una luz verde en un pulsador en una máquina voy a ir pulsando, ni cada vez que veo una luz verde por la calle voy a ir pulsando lo que tenga cerca. ¿Veis? No provocan la aparición de una conducta. Solamente indican la disponibilidad del reforzador. Toman control de la conducta, nos dicen cuándo podemos realizarla y obtener lo que queremos, pero no la provocan como en el condicionamiento clásico, de una manera automática. Las respuestas no son elicitadas, son emitidas. A este tipo de reforzamiento, en el que diferentes señales previas nos indican cuándo podemos realizar la conducta para obtenerlo y cuándo no, se le denomina reforzamiento diferencial. Lo veremos un poquito más adelante en este tema y en los otros temas posteriores. Bien, esto es todo el estímulo discriminativo. Vamos ahora con la respuesta. ¿Cómo se define la respuesta? Pues la respuesta se define de manera diferente. De manera funcional. Eso es. En este caso, el estímulo delta es la luz roja porque delta nos indica que no está disponible el reforzador. Eso es. Delta sería la luz roja y la luz verde sería el estímulo discriminativo, el ED. A partir de ahora lo llamamos ED. ED para el discriminativo indica la disponibilidad del reforzador y delta para cuando no tenemos disponible el reforzador. En el caso de la respuesta, fijaros en Skinner, pretendía definir todo como una relación funcional entre la conducta del individuo y las consecuencias que tiene. Así que las respuestas también se van a definir de esta manera. Se define por los cambios que provoca en el ambiente. Así que lo importante de una respuesta no es cómo sea la respuesta. Lo importante es para qué sirve la respuesta. Si seguimos con el ejemplo de la máquina de refrescos, lo importante no es cómo yo pulso el pulsador. Si lo hago con la mano derecha, si lo hago con la mano izquierda, si lo hago con el codo. Si lo hago con la nariz. Da exactamente igual. Lo importante es qué cambios en el ambiente provoca, qué consecuencias provoca. Así que definimos la conducta por su función. Pulse como pulse el pulsador. Si su consecuencia es que aparece el bote de refresco, será exactamente la misma respuesta, con independencia de su topografía. Así que según esto definimos qué es una clase de respuestas. Una clase de respuesta es... Cualquier forma, cualquier topografía de una conducta, es decir, cualquier forma de ejecutar una conducta... Que lleva a un resultado similar o que tiene una función similar. Otro ejemplo, si vamos a pedir un taxi lo podemos pedir de muchas maneras, pero la consecuencia final es parar un taxi. Podemos silbar, podemos levantar la mano, podemos hacer otro tipo de gestos o incluso podemos hacerlo a través de una aplicación. Fijaros la diferencia en las conductas, desde coger el móvil y utilizar una aplicación a silbar, a levantar la mano, pero todas son la misma respuesta porque todas tienen el mismo objetivo y todas tienen la misma función y todas provocan los mismos cambios o las mismas consecuencias en el ambiente. Es parar un taxi. Así que lo que nos interesa en este caso es la función. Ya veremos algo sobre la topografía porque también podemos estar interesados en modificar la topografía de la respuesta y en este caso habrá algún tipo de condicionamiento que nos sirva para... ...que las respuestas se ejecuten de una manera. Pero lo importante en este caso es qué función tiene la respuesta, qué se llega a la respuesta. Porque si dos respuestas con diferente topografía dan lugar a diferentes consecuencias, sí se pueden considerar diferentes respuestas. Aunque físicamente, perdón, aunque funcionalmente pareciesen iguales, pareciesen. ¿De acuerdo? Vamos a ver luego algo más sobre esto. Vamos con lo siguiente. El reforzador. Aquí hay la última parte. La última parte de nuestra contingencia de tres términos, ya sabéis. Estímulos antecedentes, respuesta y reforzador. Vamos a ponerle también porque es el estímulo que aparece después de la respuesta. Bueno, aquí tenemos un problema y es definir qué es un reforzador. Porque un reforzador puede ser una gran cantidad de cosas. Es difícil que digamos un reforzador es un estímulo, un reforzador es comida, un reforzador... ...lo que es un reforzador depende de cada caso concreto y depende de cada individuo concreto. La comida puede ser un reforzador o no en función de nuestro estado de hambre, la cantidad de hambre que tengamos. Así que no podemos decir si es un reforzador a priori. Lo mismo para cualquier otro estímulo. Pero es que también ciertas conductas pueden ser reforzadores. La conducta de jugar a la videoconsola puede ser un reforzador para la conducta de estudiar. Así que un reforzador puede ser un estímulo, puede ser un evento o puede ser incluso una conducta. Y además no tienen por qué serlo siempre. Puede serlo o lo son en función de las circunstancias de cada sujeto. Así que de nuevo... Primero definimos lo que es el reforzador igual que la conducta, lo definimos por sus efectos sobre la conducta. Antes definíamos la conducta por sus consecuencias o por lo que ocurría después, bueno pues ahora definimos el reforzador por el efecto que tiene sobre la conducta. Así cualquier cosa que modifique la probabilidad de una conducta será un reforzador con independencia de lo que sea, así que cualquier suceso, evento o incluso conducta que se hace contingente con una respuesta y cambia su probabilidad de aparición en el futuro es un reforzador. Y esto también funciona justo al revés, si algo que nosotros pensamos que es un reforzador no funciona para cambiar la probabilidad de una respuesta en el futuro no es un reforzador. Ni es un castigo ni es un reforzador, no es absolutamente nada. Es decir, por ejemplo, luego vamos a verlo también cuando veamos el condicionamiento con estímulos aversivos y los castigos. Si yo castigo a un niño para reducir un tipo de conducta pero ese castigo no modifica la probabilidad de conducta en el futuro, se sigue comportando igual, no estoy castigando a nadie, eso no es un castigo, no es un reforzador aversivo, no está funcionando. Así que solo lo será si modifica la probabilidad. La probabilidad de la conducta. Esto es muy importante porque la única definición que tenemos para esto, la única manera de saber si algo es un reforzador es saber qué efecto tiene sobre la conducta. Si no tiene efecto, déjale ser un reforzador. No podemos decir que la comida es un reforzador. La comida es un reforzador en determinadas situaciones y para determinados sujetos. Y según la condición en la que se encuentre el mismo reforzador, que puede serlo para un sujeto, puede no serlo para otro o en distintas situaciones para el mismo sujeto. Algo relacionado con este tipo de reforzador es algo que hemos visto también en el condicionamiento. El condicionamiento clásico, que es el reforzamiento condicionado o reforzamiento secundario. Bueno, como habéis visto y como hemos visto también en el condicionamiento clásico, muchas veces no hace falta utilizar reforzadores primarios o como veíamos en el condicionamiento clásico, no hace falta utilizar estímulos incondicionados que tengan una fuerza biológica per se, es decir, que tengan fuerza biológica o que sean estímulos relevantes biológicamente. Vimos que en el caso del condicionamiento clásico, estímulos condicionados que habían sido previamente asociados con esos estímulos adquirían cierta fuerza biológica. Bueno, pues lo mismo va a poder ocurrir aquí y el caso claro lo tenemos en el dinero. Si podemos reforzar con dinero es porque el dinero ha tenido una previa historia de reforzamiento que hace que sea valioso para el sujeto. Dependiendo del valor que tenga para el sujeto, podemos reforzar con dinero o no, pero por sí mismo el dinero no tiene ningún tipo de valor reforzante, ni tiene tampoco ninguna fuerza biológica, sino que primero ha debido ser asociado con algún estímulo relevante o reforzante y así adquiere su capacidad. Y además, en función de la situación del sujeto y de su escala de valores, de otras muchas situaciones o características que dependen de su historia de reforzamiento, funcionará mejor o peor como reforzado. Es el mismo concepto que vimos en el condicionamiento clásico. Ciertos estímulos adquieren valor por asociación. Y después pueden utilizarse como reforzadores, como reforzadores que se llaman secundarios. Y su valor como refuerzo depende de esta asociación y también de la situación y de las características específicas de cada sujeto o de cada individuo. Bueno, ya tenemos la contingencia de tres términos. Vamos a ir ahora con algunas aclaraciones de términos sobre el condicionamiento operante. Para empezar ya con los procedimientos usuales, con las clases de procedimientos que vamos a ver en este tema. Primero, la diferencia entre el reforzador y el reforzamiento. Esta es muy sencilla. Un reforzador es el evento. Es lo que aparece después de una conducta. Yo realizo una respuesta y aparece el evento, el estímulo. Pulso en la máquina de refrescos y me cae una Coca-Cola o una Fanta o lo que sea. Ese es el reforzador. Es un evento concreto. El reforzamiento es el proceso. El reforzamiento son toda la serie de ensayos que va produciendo incrementos en la conducta. Un proceso de reforzamiento sería todo ese proceso. Experimental o todo ese proceso conductual en el que yo voy respondiendo, voy obteniendo un reforzador y se va aumentando la probabilidad de la conducta. Se va generando una asociación entre mis respuestas, entre mi conducta y lo que yo obtengo. Esto sería la diferencia entre reforzador y reforzamiento. Uno sería un evento y otro sería un proceso. Después, diferencias entre una respuesta discreta y una operante libre. Esta es la misma diferencia que hemos visto. Entre los procedimientos de Thorndike y los procedimientos de Skeeter. En los procedimientos de Thorndike tenemos un solo ensayo, una respuesta única a un experimento. Y la variable dependiente, lo que medimos es la latencia. Cuando solo tenemos un ensayo, solo podemos medir una respuesta, solo podemos medir el tiempo que se tarda en dar esa respuesta. Sin embargo, en la operante libre, el procedimiento inventado por Skinner, lo que tenemos son múltiples ensayos o dentro de un mismo ensayo, la posibilidad de realizar muchas respuestas, de realizar muchas operantes, respuestas operantes. Por eso se llama operante libre. Muchas emisiones de conducta. Y en este caso, ya no tengo que medir lo que se tarda en dar una respuesta. Sí, perdón, lo que se tarda en dar una respuesta. Lo que tengo que medir es cuántas respuestas por unidad de tiempo serán. Cuanto mayor sea la asociación entre la respuesta y la consecuencia que obtengo, el reforzador, mayor será la tasa de respuesta. Si una rata pulsa muchas veces una palanca para obtener comida, lo hará porque la fuerza... La fuerza de la asociación entre pulsar la palanca y obtener la comida es mayor que si no lo hace nunca. En ese caso, la asociación todavía no estará establecida. Así que en este caso, la tasa de respuesta nos sirve como una medida de la asociación. De la misma manera que nos servía antes la latencia. La mayoría de los experimentos que se realizan en la actualidad son experimentos de operante libre. Esto de respuesta discreta, a no ser que sea estrictamente necesario y no se pueda hacer de otra manera, no se realiza porque es mucho más trabajo, es mucho más lento y es mucho más preciso utilizar la tasa de respuesta. Nos permite muchas más medidas y mucho menos errores en la medida. Así que la mayoría de los experimentos que veremos utilizan la tasa de respuesta como medida de la cantidad de asociación. Más aclaraciones. La diferencia entre topografía y función. Ya hemos visto esto, ya lo hemos visto antes. Hemos visto que Skinner intentaba definir las conductas por su función. Por la función o por las consecuencias que generan. ¿Qué ocurre? ¿A qué consecuencias o qué se obtiene con ellas? Cuando ponemos el énfasis en la estructura de la respuesta, en la forma de la respuesta, estamos hablando de la topografía. Una respuesta puede tener muchas formas, muchas diferentes. Ya lo hemos hablado de cómo llamar un taxi. Pensad en cómo podemos saludar a un amigo. Si vemos a un amigo por la calle, podemos saludarle con el brazo en alto, podemos saludarle a gritos, podemos hacer muchas cosas. Podemos darle un abrazo, podemos hacer diferentes cosas, pero todas llevan a lo mismo. Todas llevan a obtener el mismo reforzador, luego son la misma respuesta. Pero ojo, como habíamos dicho antes. las consecuencias o podemos planificar las consecuencias para que modifiquemos la forma de respuesta. Imaginaros una situación, imaginaros una caja de Skinner en la que tenemos una ratilla que pulsa una palanca para obtener comida. Yo puedo hacer otra cosa, puedo utilizar este reforzamiento o las contingencias de reforzamiento, es decir, la relación entre la respuesta y la aparición de comida para que la respuesta se dé de una determinada manera. Por ejemplo, si yo recompenso a la rata solamente cuando pulsa la palanca con la patita derecha, estaré modificando la forma de la respuesta porque le estoy exigiendo una forma específica de respuesta para obtener la consecuencia. Es decir, las contingencias de reforzamiento modifican la forma de la respuesta, un reforzamiento diferencial de una respuesta concreta. Ahora reforzamos diferencialmente, reforzamos sólo una forma específica. ¿Qué pasa tener una función específica? Ahora, a pesar de que las dos son pulsaciones de palanca, a pesar de que pulsar con la derecha y con la izquierda parecerían ser iguales, no lo son. Tienen funciones diferentes porque con una se consigue una cosa y con otra no se consigue, así que pasan a ser respuestas diferentes. Cuando nos centramos en la función, bueno, pues en este caso lo que nos interesa, como decía Skinner, son las consecuencias de nuestras respuestas. Y en este caso, tenemos que dos respuestas con diferentes topografías pueden tener la misma función, pero también al revés. Así que nos podemos encontrar con dos respuestas diferentes, levantar el brazo derecho y levantar el brazo izquierdo, por ejemplo, que tengan la misma función, saludar a un amigo. Y dos respuestas diferentes que tengan funciones también diferentes, como por ejemplo en el caso que hemos visto en la palanca. Entonces, tenemos dos respuestas con la misma función, dos funciones para una misma respuesta. Siguiendo con esto, instancia de respuesta y clase de respuesta. Otra distinción bastante sencilla. Tenemos instancia de respuesta que es simplemente la ocurrencia particular de una respuesta, es decir, el momento concreto y la situación concreta en la que se da una respuesta. Por ejemplo, en el ejemplo de la caja de Skinner, de la ratita. Cuando la rata en el ensayo 35 pulsa la palanca con el brazo izquierdo, podemos describir esa respuesta concreta. Sería una ocurrencia particular, una respuesta concreta. Se describe atendiendo a su topografía, a su forma. Es decir, es la unidad mínima, es la respuesta específica que se da en un ensayo. La clase de respuesta se refiere a todas las respuestas que tienen una función similar de lo que hemos hablado ya antes. Cualquier respuesta que lleve a lo mismo se toma en un experimento como una misma respuesta. De nuevo, en un experimento como este de la caja de Skinner con la rata, imaginaros que no estamos reforzando diferencialmente respuestas, sino que solamente tiene que responder para obtener comida. Mira, unas veces la rata ha pulsado la palanca de una manera y otras de otra. Pero como todo lleva a lo mismo, nosotros no hacemos distinción entre esas respuestas. Para nosotros son la misma respuesta, a pesar de que haya variaciones en cada uno de los ensayos. Cuando aprendemos a la forma o cuando queremos describir una respuesta particular, hablaríamos de instancia de respuesta y en ese caso sí que podríamos describir exactamente cómo es la respuesta. Bueno, ya tenemos varias... aclaraciones respecto a conceptos sobre el condicionamiento operante. Y nos queda por ver algo bastante importante, algo que también os he recordado en otras tutorías. Y es la importancia de las interacciones o de las relaciones que hay entre los diferentes tipos de condicionamiento. Antes de empezar con la diapositiva, os he dicho muchas veces, os he hablado bastantes veces, de que en cualquier situación experimental, en cualquier situación en la que nos encontremos desarrollando, en cualquier experimento, están presentes muchas más variables que únicamente las que nosotros pretendemos. Es decir, cuando estamos en un experimento y nosotros queremos, en el condicionamiento clásico por ejemplo, asociar una descarga a un tono, no solamente están presentes las descargas y el tono, hay un contexto, hay una situación, hay un organismo que también tiene estados mentales o puede tener estados mentales. Hay una situación muy compleja con muchas variables. Así que hacer una distinción clara entre condicionamiento clásico, y operante, es bastante difícil y quizás bastante artificial, porque en muchas ocasiones están ocurriendo a la vez. Luego vamos a ver algo sobre esto cuando veamos el castigo y veréis las interacciones clásicas y operantes que se dan en una misma situación. Y lo importante que puede ser a la hora de establecer asociaciones o de utilizar un procedimiento u otro. Pero es importante que tengáis claro que siempre están interrelacionadas. A la hora de investigar es muy útil diferenciarlas, porque se supone que están basadas en procesos diferentes, en procesos mentales y en procesos psicológicos. En procesos cerebrales y fisiológicos diferentes. Así que nos sirve para delimitar cada una de ellas, describirlas y ser capaces de predecir ciertas conductas y desarrollar teorías y modelos que expliquen cada una de ellas. Pero a la hora de la verdad en la vida real están muy interrelacionadas y ambos procesos ocurren a la vez en todos los procesos de aprendizaje. Luego vemos algún ejemplo. Más allá de esto, ya hemos visto que el condicionamiento clásico es un aprendizaje más pasivo. Un aprendizaje que solo depende de exponerse a determinados estímulos. Aparecen estímulos, unos provocan respuestas de manera innata, otros no, pero cuando aparecen asociados o cuando aparecen juntos termina asociándose a ese nuevo estímulo la respuesta que ocurrió en el anterior. O una respuesta parecida a la respuesta condicionada similar a la que provocaba el estímulo incondicionado. Sin embargo, el condicionamiento operante es activo y aquí los sujetos ya no vale con que se expongan estímulos, sino que tienen que dar una respuesta. Y aquí viene el problema. Para poder dar una respuesta o para que ocurra el condicionamiento operante es necesario que aparezca la respuesta. Y para que aparezca la respuesta es necesario que el sujeto tenga esa respuesta dentro de su repertorio conductual o por lo menos que haya cierta probabilidad de que ocurra. Si yo quiero que una paloma dé palmas para poder darle comida, lo voy a tener bastante difícil. Porque las palomas en general no... No dan palmas. Ni siquiera sé si son capaces de dar palmas con las alas. Así que me puedo tirar toda la vida esperando aquí una paloma de palmas para reforzarle esa conducta. Va a ser muy difícil. Así que una de dos. O utilizo una conducta. Más bien una de tres. O utilizo una conducta que está en el repertorio del sujeto y que es bastante probable. En ese caso, bueno, no pasaría nada. O puedo hacer otra cosa. Una respuesta de muy baja ocurrencia y simplemente esperar a que por azar ocurra. Esto sería otra aproximación, pero sería bastante difícil. Si tengo que esperar aquí una paloma por casualidad de palmas para yo poder darle comida y así reforzar esa conducta, seguramente me tiene mucho. Otra posibilidad, o una tercera posibilidad, es el automoldeamiento. Se denomina automoldeamiento, que ya lo hemos visto en el condicionamiento clásico. Recordáis ese procedimiento, ¿no? Ese procedimiento en el que se mete una paloma en una caja de Skinner y tenemos un comedero del que sale comida automáticamente cada 20 segundos. Por ejemplo. Y justo antes de que aparezca la comida, aparece siempre, o durante los segundos anteriores, aparece una luz roja. ¿Os acordáis de lo que ocurría aquí? En este caso, la paloma terminaba yendo a picotear la luz roja y la picoteaba y iba justo al lado de ella e intentaba interactuar con ella como si esa conducta tuviese algún efecto sobre la aparición del reforzador cuando realmente no tenía ningún efecto. Realmente la conducta estaba apareciendo automáticamente cada 20 segundos. Podemos utilizar este procedimiento para poder reforzar respuestas en el condicionamiento operante. Imaginaos la situación en la que yo quiero que una paloma picotee una tecla de color rojo para obtener comida. Quizás si la meto en la caja de Skinner va a ser muy difícil que la paloma por sí misma, por casualidad, picotee esa tecla roja. Pero si utilizo este procedimiento, lo que voy a conseguir es que aparezca... ...la paloma asocie esta luz roja, es decir, pasa a ser un estímulo condicionado ante la aparición de comida y provoque la respuesta que ya conocemos de acercamiento y de picoteo. Y después puedo cambiar el procedimiento y empezar a reforzar las pulsaciones de la tecla y que la comida sólo caiga cuando se pulsa la tecla. Así me he ahorrado mucho tiempo porque como ya he conseguido que esta conducta sea muy probable, ahora la hago contingente... ...con la respuesta del sujeto. Ahora ya no depende solamente del tiempo, es decir, ya no es un procedimiento de condicionamiento clásico, sino que lo he convertido en un procedimiento de condicionamiento operante. Y ahora lo que antes era un EFE, la luz que era un estímulo condicionado que se había asociado a la aparición de comida, pasa a ser un estímulo discriminativo. ¿Veis? Ahora la luz señala la disponibilidad del reforzador. Y sólo si yo realizo... ...la respuesta, aparecerá el reforzador. He transformado un estímulo condicionado, que era la luz asociado directamente a la aparición de la comida, en un estímulo discriminativo que me señala cuando está disponible el reforzador. Y mi respuesta condicionada, que era una respuesta de picoteo o acercamiento por simple asociación entre estímulos, pasa a ser una respuesta operante, que es necesaria para la obtención del reforzador... ...y que se da... ...o que tendrá más probabilidad de ocurrencia cuando aparece la luz roja, que es el estímulo discriminativo que me señala la disponibilidad del reforzador. Y fijaros que la topografía de ambas es igual. tanto de la RC como de la RO y que los estímulos antecedentes son los mismos, sin embargo el procedimiento y la asociación que hay detrás son distintas y se transforman de una en otra. Esa es una manera de hacer interaccionar los procedimientos clásicos o de condicionamiento clásico con los procedimientos operantes o de condicionamiento operante. Bien, vamos con lo siguiente, vamos con algo diferente. Vamos a pasar a los procedimientos básicos del condicionamiento operante. En este tema vamos a ver cosas bastante sencillas, luego la cosa empezará a complicarse un poco más adelante cuando veamos sobre todo los capítulos 5 y 6, en menor medida el 7, pero sobre todo 5 y 6. Y vamos a ver en este caso solamente los cuatro procedimientos, los cuatro fenómenos básicos del condicionamiento operante. En general y también incidiendo un poco más en lo que es el condicionamiento operante, lo que hemos visto antes, la conducta es muy compleja. Las situaciones conductuales de los individuos tienen un montón de variables diferentes y influyen en ello un montón de situaciones, de contextos, de estímulos, pero podemos reducir esa complejidad y desarrollar una serie de fenómenos o describir una serie de fenómenos que tienen un patrón muy identificable. Es decir, nos abstraemos de todo lo que aparece en el entorno e identificamos una serie de fenómenos que podemos reproducir, que en los que están involucrados una serie de estímulos, de respuestas y de consecuencias que son muy fácilmente identificables y que siempre dan lugar al mismo patrón. Eso es lo que llamamos procesos conductuales reproducibles y van a ser esencialmente los procesos experimentales que vamos a estudiar, estos cuatro procesos diferentes. ¿Y de qué dependen estos cuatro procesos? Pues dependen dos cosas, del tipo de contingencia que se da entre la respuesta, y la consecuencia, es decir, si yo respondo, ¿qué ocurre? ¿Aparece el reforzador o desaparece el reforzador? Es decir, ¿aparece algo después? Y cuando hablo de reforzador no estoy hablando de algo positivo, solamente estoy hablando de algo apetitivo o aversivo, simplemente estoy hablando de una consecuencia. Para decirlo en otros términos para que no haya confusión. Cuando yo respondo, ¿aparece la consecuencia o no aparece la consecuencia? Ese será el tipo de contingencia. Pero también depende del... ...tipo de consecuencia, porque... En función de que yo responda puede aparecer una consecuencia agradable o desagradable. Así que de aquí aparecen las cuatro diferentes contingencias, perdón, las cuatro diferentes fenómenos o procedimientos del condicionamiento operante. Las situaciones en que mi respuesta da lugar a una consecuencia, que serían dos, cuando esa consecuencia es positiva o apetitiva y cuando esa consecuencia es aversiva o negativa. Y dos situaciones en las que mi respuesta da lugar a la no aparición de una consecuencia y esa consecuencia puede ser positiva o puede ser aversiva o negativa. Estas son las cuatro situaciones. ¿Qué tenemos aquí? Bueno, pues nos salen en el caso de una contingencia positiva con consecuencia apetitiva, reforzamiento positivo, escape a habitación, castigo y omisión. Vamos a verlos punto por punto y por separado cada uno de ellos. Vamos a empezar con los dos primeros, con aquellos procedimientos que incrementan la fuerza de respuesta, que incrementan la probabilidad de que aparezca una respuesta. Y fijaros que involucran los cuatro términos que hemos visto. Por un lado podemos incrementar. Incrementar la fuerza de una respuesta presentando algo agradable o algo bueno después de la conducta. Pero también tenemos otra forma de incrementar la respuesta, que es retirando algo negativo cuando se dé la respuesta. Vamos a ver estos primeros y después pasamos a los procedimientos para disminuir las conductas. El primero, el más conocido, lo conocéis todos, es muy sencillo, el reforzamiento positivo. ¿Qué ocurre en este procedimiento? Algo tan sencillo como que cuando realizamos una respuesta o la respuesta... ...que queremos que se haga más probable en el futuro, cuando realizamos la conducta, después de eso aparece una consecuencia positiva. Un reforzador positivo contingente a esa respuesta. Si estudias, te doy, pongamos, un caramelo. Bueno, esta sería la situación. Una situación en la que das una conducta y obtienes una consecuencia positiva. Resultado, la conducta se hace más probable en el futuro. Hay muchos posibles reforzadores. Ya hemos visto, no nos vamos a meter ahora en cómo funcionarían los diferentes reforzadores. Solamente una salvedad y una cosa importante. Para algunos reforzadores hace falta, como hemos visto antes también, un estado especial. Es decir, que sea un reforzador para ese sujeto en ese momento. Por ejemplo, con la comida. La comida solo será reforzante para un sujeto si tiene hambre. Así que para que podamos utilizarlo como reforzador necesitamos una moderada deprivación de comida. Es decir, que tenga suficiente hambre para que la comida funcione como reforzador. Si utilizamos, por ejemplo, una rata que ha comido muchísimo, da igual cuánta comida le ofrezcamos. No va a modificar la probabilidad de la conducta. Hay que tener esto en cuenta. Es decir, elegir bien el reforzador y asegurarse de que ese elemento, ese estímulo, ese evento, esa conducta funciona como reforzador para el sujeto. Importante también, por mucho que queramos reforzar algo o que lo reforcemos y encontremos un reforzador estupendo, solo se va a reforzar esa conducta si existe. Si no existe, en el repertorio del sujeto. Y si no existe, pues tendremos que moldearla, tendremos que conseguirla mediante un procedimiento que se denomina de aproximaciones sucesivas. ¿Qué quiere decir esto? Antes hemos visto el ejemplo del automoldeamiento. No os lo he dicho antes, pero hay otros procedimientos más. Hay más procedimientos para conseguir que aparezca una conducta determinada en un sujeto. Imaginaros la situación. También la tenéis, creo que, no sé si lo tengo en un bimbo. O lo tenéis en el libro. Un ejemplo clásico es la situación en la que yo quiero que una paloma, para que obtenga comida, quiero que dé dos vueltas sobre sí misma. O que dé una vuelta completa sobre sí misma. Hay varias formas de hacerlo. La primera, ya os he dicho, es esperar a que la paloma dé una vuelta sobre sí misma de manera aleatoria y en el momento en que lo dé, lo refuerzo. Pero si tengo que hacer eso, conseguir esa asociación, me voy a tirar mucho tiempo. Hay una solución, que es cuando esa conducta no está en el sujeto. En el repertorio usual, utilizar lo que se denominan aproximaciones sucesivas. Es decir, primero refuerzo, si yo quiero que gire a la izquierda para dar el reforzador, primero cualquier pequeño giro del cuello, cualquier gesto hacia ese lado, lo refuerzo. Una vez que se ha aprendido esa asociación, dejo de reforzar eso y empiezo a reforzar algo un poco más avanzado. Cuando la paloma gira un poquito hacia la izquierda. Una vez que lo he conseguido, de nuevo dejo de reforzar eso y empiezo a reforzar un giro más pronunciado. Algo más. Dejo de reforzar lo que es esta asociación. Hasta que al final consiga que la paloma dé una vuelta sobre sí misma y ya solamente refuerzo eso. Por eso son aproximaciones sucesivas. Se van reforzando aproximaciones cada vez mejores a la conducta objetiva. Es algo que se utiliza, por ejemplo, mucho en mascotas para conseguir que hagan determinada conducta. Al principio no conseguirás la conducta completa, pero puedes ir reforzando ciertas conductas que se parezcan a esa o que se aproximen a esa. Luego las dejas de reforzar y empiezas a reforzar solo lo que es un poquito más parecido. Esas son las salvedades respecto al reforzamiento positivo, el procedimiento más conocido de todos, junto con el castigo, pero quizás el procedimiento más conocido y el más utilizado en general. Seguimos. Otro método... Ah, perdón, antes de seguir con ello, no lo podemos ver aquí tampoco porque, bueno, ya sabéis, no se pueden ver vídeos, pero este es un ejemplo muy visual en el comportamiento humano de lo que sería el reforzamiento positivo. Es una escena de Big Bang Theory, lo tenéis en los vídeos que os he mandado, lo tenéis también en YouTube. Es un capítulo, si algunos de vosotros seguís Big Bang Theory, es un capítulo en el que Sheldon utiliza el reforzamiento positivo para reforzar conductas. Conductas, ciertas conductas que él considera adecuadas de Penny. En este caso, cada vez que Penny hace algo que le gusta o que él cree adecuado, va siempre con una caja de bombones y le ofrece un bombón, le da un bombón. Así que si Penny recoge los platos, si Penny se va a hablar con el teléfono fuera para no molestarles, si Penny se levanta del sitio de Sheldon en el sofá cuando él se está acercando para sentarse, entonces siempre le premia con un bombón. ¿Lo gracioso de la situación? La situación en la serie es que Leonard se da cuenta de ello y, por supuesto, le echa la bronca a Sheldon por intentar condicionar a la que en ese momento era su novia, que es Penny. Podéis verlo, es un ejemplo bastante práctico y bastante curioso sobre cómo funciona el reforzamiento positivo. Un ejemplo, además, muy sencillo. Bueno, vamos con lo siguiente. Vamos a ver otra manera de reforzar, de fortalecer, de hacer más probable una conducta. En este caso, utilizando una contingencia negativa con estímulos aversivos. Es decir, que la conducta elimine la aparición o haga desaparecer un estímulo que es desagradable. Y en eso consiste una respuesta operante, aquella que queremos que se mantenga, perdón, que aumente su probabilidad en el futuro, da como resultado la desaparición o el hecho de que se detenga un evento que no es agradable. Por ejemplo, si una rata está en una caja de Skinner. Y está recibiendo una descarga del suelo electrificado y tiene aquí una palanca, si cada vez que pulsa la palanca. la descarga se detiene, esa conducta será más probable en el futuro. No porque esté siendo reforzada positivamente, sino porque elimina un evento aversivo. Por eso se llama escape o evitación. Y son dos modalidades diferentes. El escape es cuando el evento aversivo está presente y la evitación es cuando la respuesta evita la aparición de ese evento aversivo. Es decir, si yo le estoy dando la descarga a la rata y pulsa la palanca en ese momento, eso será un procedimiento de escape. Escapa de una descarga que ya está presente. Si yo todavía no le he dado la descarga, pero la rata pulsa y no aparece la descarga, lo llamaremos evitación. Evita la descarga. Y suelen aparecer juntas, lógicamente. Los experimentos, estos dos fenómenos suelen aparecer juntos. ¿Cómo? Bueno, pues porque generalmente lo que suele ocurrir es que en un procedimiento experimental al principio... Al principio damos la descarga a la rata, la rata pulsa la palanca y la descarga se detiene. Pero con el tiempo la rata aprende que la palanca hace desaparecer la descarga. Así que se adelanta a la aparición de la descarga y pulsa antes de que aparezca, convirtiendo el escape en un procedimiento de evitación. Estos procedimientos son procedimientos de refuerzo negativo. Ojo, esto no es un castigo. De hecho, el castigo tiene una consecuencia contraria. Los castigos disminuyen la probabilidad de conductas, no aumentan la probabilidad de conductas. Así que cuando yo estoy haciendo algo de esto, cuando yo estoy evitando o escapando de un estímulo aversivo, lo que estoy haciendo es un aprendizaje de refuerzo negativo. Y su consecuencia es el aumento de probabilidad de una conducta. Así que veis que podemos aumentar la probabilidad de una conducta, no solo con eventos positivos, con consecuencias positivas, sino también eliminando consecuencias negativas. Las dos son válidas, las dos se pueden hacer exactamente igual. Bien, vamos a ver un ejemplo, de nuevo no podemos ver el vídeo, pero os lo puedo contar, sobre el escape o evitación. Y este vídeo contiene un error. Y lo había elegido por eso, porque quería que lo viese, pero bueno, lo podéis ver en casa, voy a explicarlo un poco y luego lo podréis ver. Y el siguiente vídeo, que también es de Big Bang Theory, o sea, el vídeo sobre el castigo, habla del error que se comete en este vídeo. Así que en el siguiente vídeo, también podréis ver por qué los guionistas de Cazafantasmas se equivocaron. a la hora de ejemplificar el escape-evitación. Pero sí nos vale como un ejemplo también para ver algunos de los errores que hay y porque parte de ello sí que es un aprendizaje por escape-evitación. Os cuento en qué consiste. En este vídeo, que es el vídeo o la parte inicial de la primera película de cazafantasmas, sale Bill Murray en su despacho de la universidad, el doctor Beckman, realizando un experimento con dos personas. Y él lo que pretende es, según dice él, estudiar los efectos del refuerzo negativo en la percepción extrasensorial. Bueno, no se me recuerda exactamente. Lo que sí recuerdo es el experimento. Y el experimento consiste en que él pone unas tarjetas, dabas la vuelta con una serie de dibujos, los sujetos no pueden ver los dibujos y él les pide que adivinen qué hay dibujado en esas tarjetas que ellos no pueden ver. Hay dos sujetos, hay un chico y una chica. Lógicamente, el doctor Beckman, lo que quiere es caerle bien a la chica y le da igual el otro. Así que lo que hace es manipular el experimento. Cuando el chico contesta, aunque acierte, siempre le da una descarga. Cuando la chica contesta, aunque no acierte, no le enseña la tarjeta, le dice que ha acertado y no le da la descarga. Fijaros, hay un error en esto porque lo que está administrando el doctor Beckman realmente es un castigo. Y la cosa funciona distinta para el chico y para la chica. Para la chica. Escape o evitación. Para el chico es un castigo. ¿Qué aprende el chico? El chico lo que aprende es que cada vez que responde recibe una descarga. Así que, ¿qué aprenderá? A responder cada vez menos. De hecho, a mitad del vídeo el chico se va. Eso sería un procedimiento de castigo. Lo vamos a ver ahora. Pero para la chica sí funciona como escape o evitación porque como siempre acierta, como responder siempre es un acierto, en este caso la respuesta hace que evite la descarga. Un ejercicio de evitación. Y fijaros que es muy interesante. Porque en este caso la evitación es un tipo de evitación que solo se puede dar o que pensamos que solo se puede dar en humanos que es una especie de aprendizaje vicario. Porque la chica no ha tenido experiencia de la descarga en ningún momento. Solo la ha tenido a través de ver al chico recibir descargas. Así que aprende a evitarlas respondiendo pero nunca las ha recibido. Así que en este procedimiento, en este vídeo, se mezclan varias cosas. Si hay errores a la hora de escribir el procedimiento porque funciona el castigo, en realidad es un castigo porque está administrando Y de una conducta está administrando castigos en el caso del chico y eso hace que se reduzca la probabilidad de conducta. Pero sirve muy bien para ver esos dos extremos, el del chico que funcionaría como un castigo y el de la chica y sería un escape de evitación con algunas cosas más. En este caso la chica responde y esa respuesta, que en este caso da igual si es correcta o no porque nunca lo llega a saber, hace que evite esa descarga. Lo podéis ver ahí, es bastante curioso. Vamos con los procedimientos para disminuir conductas. Aquello que se utiliza para eliminar conductas que no son deseadas, disminuir la probabilidad de ciertas conductas. Vamos con el primero, el castigo, también uno de los más famosos. Quizás uno de los más utilizados. Tanto el primero, el refuerzo positivo, como el castigo. Son los dos. Son los dos más utilizados porque quizás sean los más sencillos en cuanto a paradigma, en cuanto a número de estímulos involucrados. Los más sencillos en principio o aparentemente de aplicar. ¿En qué consiste? Bueno, pues cuando se da una respuesta, la respuesta la que se quiera en este caso eliminar, tiene como resultado una consecuencia desagradable. ¿Qué ocurre? Disminución de la probabilidad de respuesta. Y hay que tener en cuenta una cosa. Ya lo hemos hablado durante toda la tutoría, durante todo este tema. Pero hay que tener en cuenta que el castigo se define por su función. No se define de otra manera. Un castigo no es algo que nosotros creemos que es un castigo. Un castigo es algo, o es un castigo, si disminuye la probabilidad de una conducta. Si nosotros utilizamos algo como castigo y no disminuye la probabilidad de una conducta, no es de hecho un castigo. Le puedes dar un azote a un niño por portarse mal, pero si sigue portándose mal con la misma frecuencia, el azote no es un castigo. Luego tendré otras connotaciones. Hay otras connotaciones éticas, pero el azote solo es un castigo si hace lo que pretende hacer, que es disminuir la conducta. Lógicamente, para poder castigar una respuesta que se da, una conducta que se da, esta antes ha tenido que aparecer porque ha sido reforzada. Si queremos eliminar una conducta, por ejemplo, berrinchos en los niños, esta conducta se da porque previamente ha sido reforzada. Y ahora habrá que, si queremos eliminarla, dejamos no solo de reforzarla, sino que además la castigamos. Luego vamos a ver... las dificultades que tienen estos métodos y por qué no son adecuados. De hecho, Skinner era un firme defensor de utilizar solamente estímulos positivos, no aversivos. Y se posicionó muy en contra de la utilización de cualquier tipo de aprendizaje con elementos aversivos, en particular del castigo y del escape y la irritación. Y ya veremos las consecuencias y las derivadas secundarias que tiene, porque tiene muchos efectos que no podemos controlar y por lo que no se recomienda demasiado su utilización. Y si se hace hay que hacerlo bajo unas situaciones muy específicas, tanto éticas como de control experimental. Bueno, el ejemplo que había seleccionado para esto es otra escena de Big Bang Theory. En este caso, la escena es bastante curiosa y además bastante sencilla. Están reunidos los cuatro protagonistas en el laboratorio, quieren diseñar un experimento, creo que era sobre física cuántica, no recuerdo ahora mismo, acoplamiento cuántico, creo que era, no recuerdo. Pero bueno, quieren diseñar un experimento, se reúnen los cuatro y el problema que tienen es que como están los cuatro cada vez que alguien dice algo se salen por la tangente. Alguien habla sobre algún tema y empiezan a sacar nuevos temas hasta que al final se van del procedimiento que quieren analizar o de lo que quieren hacer y terminan hablando de otra cosa. Y a uno de ellos creo que se le ocurre utilizar un procedimiento de castigo para no irse del tema. Y lo que idean es ponerse unas tiras de velcro o de cinta americana en los brazos para que cada vez que alguien diga algo fuera de tópico, fuera del tema, tiran de ello para que les duela, para que le arranquen los pelos del brazo. Eso funciona como castigo y así se reduce esa conducta que es irse del tópico, irse del tema. Bueno, la cuestión por supuesto se deriva en otras cosas más graciosas como por ejemplo que empiezan a tirarse y arrastrarse. Arrastrarse los pelos cada vez por cosas más ridículas. Pero lo importante de esto es que la idea es reducir una conducta a base de un estímulo que es desagradable. En este caso pues el dolor que produce depilarte con cinta americana. En mitad del vídeo también podéis ver el momento en el que hablan sobre el vídeo anterior, el de los cazafantomas y donde dicen que el procedimiento que describen no es realmente un refuerzo negativo sino un procedimiento desagradable. Lo podéis ver tranquilamente en casa y luego si queréis podemos comentarlo en los foros o podemos verlo cuando volvamos a tener, esperemos que pronto, tutorías presenciales podemos volver a comentarlo ahí o en alguna de las tutorías que podamos hacer si nos da tiempo de repaso. Bueno, y por último, el procedimiento de omisión o castigo negativo. Recordad que teníamos refuerzo positivo y refuerzo negativo. Y ahora tenemos castigo positivo, el procedimiento de castigo que acabamos de ver, o la omisión o castigo negativo. ¡Gracias por ver el vídeo! En este caso el resultado es el mismo, se disminuye la fuerza de una conducta, se disminuye la probabilidad de aparición de una conducta. ¿Cómo? Bueno, pues cuando una conducta, que es la que queremos eliminar, le sigue la desaparición de un reforzador, de algo agradable, es decir, la consecuencia agradable se retira. Por ejemplo, si no estudias o si no sacas buenas notas, no te dejo jugar a la videoconsola. En este caso podría parecer un castigo, pero no lo es, porque no estoy utilizando ningún estímulo aversivo. Lo que estoy utilizando es retirar un estímulo agradable. Siempre decimos que eso es castigar a alguien sin hacer algo, pero no es cierto. Es un castigo negativo, es una omisión. Si no haces algo o si haces algo, si te portas mal, por ejemplo, para que sea una conducta en positivo, no sea una conducta en negativo. Si te portas mal, no te dejo jugar a la videoconsola. Una cierta conducta que queremos eliminar lleva a la retirada de un reforzador, que por cierto es otra conducta, como hemos visto antes que podría ser. Así que la consecuencia final es que la conducta se reduce, la probabilidad de esa conducta se reduce. O eso esperamos, porque acordaros que los reforzadores o los estímulos que ponemos o quitamos se definen por su función y se definen por sus consecuencias. Así que lo que pongamos o lo que retiremos solo será... ...una conducta de verdad útil si reduce, en este caso, la conducta que queremos reducir. Así que asumimos que tiene que ser un reforzador. El ejemplo que os había puesto, el vídeo de ejemplo que os había puesto en este caso es de Doraemon. Un capítulo de Doraemon. En este capítulo, la madre de Novita les lleva unos pasteles a Novita y a Doraemon que están jugando en la habitación. Y la madre, yo creo que lo hace aposta. Nunca lo sabremos, pero es algo que... Esto es muy de madre lo de hacer estas cosas aposta. Un número impar de pasteles. No les lleva un número par. Y todo va fenomenal. Y se comen los pasteles, muy a gusto, les encantan, hasta que llegan al último. Cuando llegan al último no se ponen de acuerdo sobre quién se lo tiene que comer. Así que lo que hacen es empezar a pelearse. Empiezan a oírse gritos, pelearse, un montón de escándalos. Y entonces llega la madre y lo que hace la madre de Novita es quitarles el último pastel. Se queda con el último pastel. Este es el procedimiento de omisión. La madre lo que pretende es reducir la conducta no deseada. En este caso, la pelea. Los gritos. Esa conducta que están teniendo los dos. ¿Y qué hace para ello? No les castiga. Le retira un reforzador que previamente les había dado. Así que de esta manera... elimina el reforzador y la probabilidad de la conducta disminuye en el futuro. También lo podéis ver en casa y si no habéis descargado las diapositivas todavía incluso lo tenéis en YouTube o lo podéis ver en cualquier sitio a través de YouTube. Bueno, ya tenemos los cuatro procedimientos, así que para terminar hoy vamos a ver algunas de las consecuencias o algunos de los efectos colaterales, las derivadas que tienen los procedimientos aversivos. Los procedimientos aversivos son dos, el escape-evitación y el castigo. Veis que uno sirve para aumentar la probabilidad de una conducta y otro sirve para disminuir la probabilidad de una conducta. Pero no son los procedimientos más útiles y hay varias razones para esto. La primera razón es ética. Hay que tener mucho cuidado cuando se utilizan este tipo de procedimientos. Tanto en escape-evitación como en castigos se utilizan procedimientos aversivos, estímulos desagradables o dolorosos o que pueden ser muy desagradables o incluso pueden tener efectos negativos para el sujeto. Así que cuando vamos a utilizar este tipo de procedimientos hay que tener muy en cuenta si es éticamente aceptable lo que vamos a hacer. Eso por un lado, eso es algo que va a priori. Con independencia del procedimiento tenemos que tener en cuenta la ética de nuestro experimento o la ética de nuestro procedimiento. La ética de nuestra intervención, en el caso de que estemos en una situación de intervención real con personas, con niños, con mayores, con cualquier tipo de población, incluso con población reclusa, por ejemplo, donde el castigo se utiliza más. Bueno, pues es algo que tenemos que tener muy en cuenta. Las cuestiones éticas de lo que vamos a hacer. Y eso es una priori, una priori antes de nuestro experimento. Pero además, además de la cuestión ética, hay cuestiones de procedimiento, hay cuestiones sobre el propio proceso de castigo y escape-evitación. Es decir, de procedimientos aversivos. Que los hace un procedimiento poco fiable, poco confiable para lograr los resultados que queremos. En cuanto al castigo, que es el más usual y el que hace disminuir las conductas o el que se utiliza para disminuir la probabilidad de una conducta. Pues tenemos varios problemas. Primero, los efectos emocionales. Cuando se castiga algo no solamente hay una reacción de disminución de la conducta, sino que suele haber una reacción emocional. Ya sea por el dolor, ya sea por la frustración, ya sea por un... una serie de, ya sea porque el castigo tiene alguna consecuencia para el individuo, hay efectos emocionales, es decir, se generan emociones fuertes. No suelen ser efectos duraderos dependiendo de cómo sea el castigo y de qué procedimiento estemos, hay que hacer muchas distinciones en esto. Pero sí se generan efectos emocionales que no son los que nosotros deseamos. Nosotros lo que deseamos es disminuir una conducta, no generar una asociación con ciertas emociones de ese castigo. Eso por una parte. Por otra parte, y hemos hablado de ello antes cuando hablamos de las interacciones y de la complejidad de las situaciones de aprendizaje. Cuando estamos en cualquier tipo de aprendizaje o en una situación de aprendizaje, no solamente está, así lo fui más sencilla de caja de Skinner, no solamente está nuestro sujeto, su conducta y la consecuencia. No solamente está esto, está todo el contexto y un montón de variables o otro montón de elementos. Que están asociados a esa situación de aprendizaje. Cuando nosotros aplicamos un castigo, cuando castigamos algo, cuando le damos un azote a un niño, por ejemplo, no solamente está presente la conducta que queremos eliminar, hay otras cosas presentes. Y el castigo tiende a asociarse, por condicionamiento clásico, con los elementos, con otros elementos de la conducta o con otros elementos que sí son deseados. ¿Qué es lo que se hace? Si se hace un castigo por portarse mal, hay otros elementos del contexto que sí están presentes. En particular, y fijaros, este es quizás el ejemplo más relevante sobre esto. Cuando nosotros castigamos algo, cuando, de nuevo, a un niño le das un azote porque se ha portado mal, no solamente asocia el castigo, el azote, a la conducta y deja de emitirla, sino que por condicionamiento clásico, el azote, que es un estímulo incondicionado porque provoca una respuesta, porque provoca dolor y, por tanto, provoca una respuesta, una respuesta incondicionada, se asocia, por condicionamiento clásico, a un estímulo que inicialmente era neutro que pasa a ser condicionado por su aparición repetida respecto al estímulo incondicionado. ¿Quién es el estímulo condicionado? La persona que castiga. Así que la persona que castiga suele asociarse, por condicionamiento clásico, al propio azote, al dolor, al castigo. Y eso es una derivada, eso es un efecto secundario. Un efecto secundario indeseable que nosotros no queremos y que ocurre en muchas situaciones. Si un niño es castigado en el colegio no solamente lo asocia a que él se porte mal en el colegio, lo asocia al propio colegio y al final lo que no querrá es ir al colegio o no ir con la persona que lo ha castigado. También otras cosas como que si una persona castiga una conducta de otra, por ejemplo en el caso que estamos viendo de un azoteo de un niño, lo que hará el niño no es disminuir su conducta sino evitar a la persona que le castiga. Así que hay que tener mucho cuidado con estos procedimientos aversivos porque hay muchos efectos colaterales y hay muchas asociaciones que están ocurriendo por debajo de lo que estamos haciendo. A pesar de que nosotros no nos tengamos en cuenta o a pesar de que no sea nuestra intención, hay muchas más variables interviniendo por debajo, muchas más asociaciones que se están llevando a cabo y que pueden terminar siendo muy problemáticas. Así que hay que tenerlo muy en cuenta y sobre todo, y como decía Skinner, y Skinner fue un firme defensor de esto, intentar utilizar siempre procedimientos positivos que además son los más eficaces porque los castigos, si no se acompañan además de una alternativa de conducta, si no se acompañan de otras conductas alternativas e incompatibles que sean deseables y que vayan a ser premiadas, no suelen ser eficaces para disminuir o para hacer desaparecer la conducta. Bueno y en este caso nos vamos a quedar aquí porque lo siguiente en lo que nos vamos a meter es... ¿Qué es la extinción del reforzamiento positivo? Ya la vimos en el condicionamiento clásico, vimos que cuando el estímulo condicionado dejaba de aparecer en presencia del estímulo condicionado, poco a poco la respuesta ante el estímulo condicionado iba desapareciendo. Pues aquí lo que vamos a hacer es algo muy similar. Cuando una respuesta es reforzada, por ejemplo la presión de la palanca de la rata, y deja de reforzarse, cuando deja de presentarse la consecuencia, en este caso la comida, poco a poco la fuerza de la respuesta irá disminuyendo. ¿Qué es la extinción del reforzamiento positivo? Pues que ejecutarán menos respuestas. Como ya vimos en el condicionamiento clásico, esto es algo diferente al desaprendizaje. Esto no es desaprendizaje, es un aprendizaje de una manera distinta y algunos de los fenómenos asociados tendrán que ver con esto. Vais a ver que es muy similar a lo que vimos en el condicionamiento clásico, pero ya nos meteremos con ello en la próxima tutorial donde espero terminar ya el tema 4. Quedará ya hecho para luego empezar también antes de Semana Santa con el capítulo 5. Bueno pues hasta aquí chicos. Muchas gracias por haber estado presentes y por haber aguantado la tutoría entera y que vaya muy bien, que aguantéis muy bien el confinamiento y la cuarentena. Que estéis todos bien y sanos, espero, y que acabe lo antes posible y nos veamos las caras en las uterias. Así que nada, muchísimas gracias.