Así que sí, ya sí que podemos empezar. Bueno, nos quedamos viendo los procedimientos, los efectos colaterales que podían tener y que de hecho tienen los procedimientos que utilizan estímulos adhesivos tanto para aumentar las conductas como para disminuir las conductas, es decir, el castigo y el escape-evitación. Bien, vimos problemas éticos, también el hecho de que hay consecuencias emocionales y posibles asociaciones que se establecen que no son deseables, por ejemplo, el hecho de que se asocie el castigo no solo a la conducta sino también a la persona que castiga. Bueno, esto ya terminamos de verlo, así que vamos a pasar a lo siguiente. El procedimiento de extinción en el reforzamiento positivo, en el condicionamiento operante. Ya hemos visto algo de esto, bastante de esto, en el condicionamiento clásico. De hecho, allí vimos el mismo procedimiento de extinción. Si recordáis, en el condicionamiento clásico el procedimiento de extinción consistía en que tras crear una asociación excitatoria entre un estímulo condicionado y un estímulo incondicionado, pongamos una relación entre la aparición de comida, perdón, sí, entre la, entre, ay, no me sale ahora, por ejemplo, los perros de Pavlov entre el tono, en este caso, el tono y la comida. Una vez que siempre aparece un tono, después aparece la comida, el tono termina siendo un señalizador o termina prediciendo la aparición de la comida. Una vez hecho esto, cuando presentamos el tono en ausencia de la comida, es decir, sin que aparezca el estímulo incondicionado, en esta situación tenemos... que tras bastantes ensayos el tono deja de provocar la respuesta condicionada. Esto era en el condicionamiento clásico, vamos a ver la misma situación en el condicionamiento operante. ¿En qué consiste en el caso del condicionamiento operante el procedimiento de extinción? Bueno, pues una vez que hemos asociado una respuesta a la obtención de un premio, de una consecuencia, voy a llamarlo C para no repetir R de reforzador sino con C, una vez que hemos asociado una respuesta a la aparición de una consecuencia, ahora lo que vamos a hacer es dejar de reforzar esa respuesta que va a tener la consecuencia de que se dejará de ejecutar la respuesta operante. La ausencia de la consecuencia que previamente ocurría da como lugar la disminución y al final la desaparición de la respuesta operante. Es algo para lo que, igual que en el condicionamiento clásico, son necesarias muchas repeticiones, son necesarios muchos ensayos. Y además... Tienen algunos fenómenos o consisten en algunos fenómenos o aparecen algunos fenómenos que son similares a los que ocurrían en el condicionamiento clásico. También tienen algunas diferencias y vamos a ver ahora cuáles son. Y aunque algunos son bastante parecidos, otros tienen que ver con la peculiaridad del condicionamiento operante en el que las respuestas son emitidas por parte del sujeto de una manera voluntaria y con el hecho de que aparece un reforzador. Vamos a ver alguno de ellos. Algunos de los efectos esenciales. Vamos a hacerlo con un ejemplo. Un ejemplo que además os será bastante familiar. Es un ejemplo que suelo utilizar siempre para... para explicar los efectos de la extinción y porque seguramente la mayoría de vosotros os habréis encontrado en situaciones similares en muchas ocasiones. Imaginaros que vais al trabajo, vais a la facultad, vais a cualquier sitio y hay una máquina expendedora, ¿de acuerdo? O en el metro, que también hay máquinas expendedoras, una máquina expendedora de refrescos. Y a vosotros siempre os gusta antes de, o cuando vais a coger el metro, o cuando vais hacia el trabajo, lo que sea, tomaros un refresco, el que sea. Bueno, la asociación usual en este caso es que vosotros metéis el dinero, dais una respuesta y obtenéis una consecuencia. Esa consecuencia es obtener el refresco que vosotros queréis, obtenéis un reforzador. Algo que en el futuro hace que sea más probable vuestra conducta. Cuando volváis a encontraros con la máquina de refrescos volveréis a tener la misma respuesta porque sabéis que está disponible la consecuencia. Esto ya lo hemos visto, es el reforzamiento positivo de toda la vida. Bien, pero ¿qué ocurre si un día... Vais a la misma máquina de refrescos, echáis una monedita y no cae vuestro refresco? Bueno, pues seguramente cuando no caiga vuestro refresco, ahora nos encontramos en un procedimiento de extinción. La respuesta no va seguida de la consecuencia. La máquina puede estar rota, puede estar agotado el producto, cualquier cosa. Pero nos encontramos en un procedimiento de extinción. Y tenemos la suerte además que como podéis pulsar todas las veces que queráis, nos encontramos en algo muy similar a lo que sería un procedimiento operante. Como los de Skinner. ¿Qué ocurre en esas situaciones? Pues ocurren fenómenos que son comunes a todos los procedimientos de extinción. En primer lugar, y vamos a empezar por el final, es un fenómeno que no se elimina del todo. ¿Por qué? Imaginaros que no conseguís vuestro refresco y os vais a casa. Seguramente, a lo mejor al día siguiente cuando volváis tampoco, por miedo a perder más dinero, no pulséis o no cojáis un refresco allí o vayáis a otra máquina. Pero ¿qué pasará con el paso del tiempo? Cuando pasen 10 días, 15 días, 20 días, seguramente muchos de vosotros volveréis a probar pensando que puede estar ya arreglada, que era simplemente que faltaban refrescos o que fue un fallo puntual. Así que en algunas ocasiones ocurre un fenómeno que se denomina recuperación espontánea. El simple paso del tiempo hace que volváis a ejecutar la conducta sin que haya habido una asociación de nuevo, sin que la respuesta se haya dado junto con la consecuencia en ningún momento. Simplemente por el paso del tiempo puede volver a aparecer la respuesta. Pero vamos a verlo un poquito más. Imaginaros que volvemos al primer día, el día en el que no obtenéis vuestro refresco porque la máquina estaba rota o porque no había producto o cualquier cosa. ¿Qué es lo que pasa? ¿Qué es lo que ocurre en esta situación? Cuando echáis la moneda y pulsáis el pulsador para obtener el refresco, no obtenéis nada. La cosa no suele quedar ahí, sino que ocurre o suele ocurrir un fenómeno que se denomina estallido de extinción. Esto es un aumento de la tasa de respuesta justo tras el primer ensayo o una vez que se deja de obtener el reforzador. Es decir, no lo obtienes y no te quedas tan tranquilo. Normalmente empiezas a pulsar mucho más rápido, empiezas a pulsar más veces. Empiezas a realizar más conductas. Esto es algo que nos ha pasado muchas veces. Empezamos a darle a la máquina hasta que, o para ver si conseguimos algo. Bien, pero sigue sin salir nada. Así que ¿cuál es el siguiente paso en un procedimiento de extinción? Bueno, pues un aumento de la variabilidad de la respuesta, una exploración de diferentes respuestas. Cuando no obtenemos lo que queremos dando al pulsador empezaremos a realizar otras conductas. Empezaremos a pulsar en otros pulsadores para ver si es el nuestro que no funciona. Empezaremos a darle al botón de recuperar monedas para ver si podemos por lo menos recuperar el dinero. O incluso empezaremos a darle más fuerte o hacer alguna otra conducta o incluso meter la mano por debajo. Es decir, explorar conductas alternativas que tengan relación con la conducta que estamos acostumbrados a que sea reforzada. ¿Y qué ocurre en última instancia cuando vemos que nada de eso funciona? Pues algo que también ocurre bastante en la extinción. Las respuestas emocionales incondicionadas. La frustración, incluida la agresividad. Seguramente también os habrá pasado en alguna ocasión que cuando todo esto no funciona empecéis a darle golpes a la máquina. Hasta que una vez que uno se harta de darle golpes y ve que no cae nada, pues ya se va y la conducta disminuye y desaparece. Esto sería un procedimiento de extinción. Esto que nos ha ocurrido a muchos en muchas ocasiones es lo que se denomina un procedimiento de extinción. Y estos son los fenómenos que suelen ocurrir. Y que nos ocurren igual a nosotros y también en ratas u otros animales cuando se prueba en laboratorio. Es una de las situaciones en las que podemos vernos reflejados en procedimientos de condicionamiento operante y que nos pueden hacer ver que las mismas reglas que valen para animales de laboratorio, las mismas reglas de aprendizaje son aplicables a los humanos. Las reglas de aprendizaje... o los mecanismos que determinan cómo establecemos asociaciones, se supone que son universales para todos los seres. No cambian, son leyes universales. O por lo menos se cumplen en la mayoría de ocasiones, como podéis ver. Bueno, esto en cuanto a los efectos de la extinción. ¿A qué cosas ocurren cuando empezamos un procedimiento de extinción? Una cosa importante que no os he dicho. Exactamente igual que en el procedimiento de extinción que vimos para el condicionamiento clásico, en el procedimiento de extinción en condicionamiento operante lo que ocurre es algo distinto al olvido. No es un desaprendizaje. Recordad que cuando hablábamos de olvido, de lo que hablábamos, era de que el paso del tiempo hacía que la respuesta no estuviese disponible. Se olvidaba qué es lo que había que hacer. Eso es en la definición de olvido. Ya no tienes disponible ese aprendizaje. Cuando estamos en un proceso de extinción, el aprendizaje sí está disponible. Pero se aprende algo distinto. Se aprende algo que no es lo mismo que habías aprendido antes. Pero el aprendizaje sigue disponible. El mero hecho de la recuperación espontánea es un ejemplo de ello. Luego en las siguientes diapositivas vamos a ver algo más sobre esto. Está un poquito más especificado. Pero me adelanto para que lo veáis desde aquí. Para que tengáis en cuenta que lo mismo que dijimos para el experimento, el hecho de que desaprendizaje y extinción son fenómenos distintos, lo mismo vale para lo que estamos viendo en esta situación. Bueno, ¿qué cosas importantes hay también en los procedimientos de extinción? Pues algo que se denomina resistencia a la extinción. Es decir, cuánto nos cuesta que el organismo que ha aprendido una conducta deje de realizar esa conducta. Y eso depende de una serie de parámetros. Por ejemplo, vamos a ver algunos de ellos y algunos bastante curiosos incluso de alguna manera contraintuitivos. Las respuestas que han sido poco reforzadas son más resistentes a la extinción. ¿Qué quiere decir esto? Bueno, pues que cuando hemos ofrecido pocos reforzadores o cuando, y eso lo vamos a ver en el tema siguiente aunque os voy a adelantar algo aquí, cuando hemos reforzado de manera parcial la conducta, esto quiere decir que no se refuerza la conducta cada vez que hay una extinción. Que hay una conducta en sí misma, sino que se refuerza cada cierto número de veces o cada cierto tiempo. Bueno, pues cuando eso ocurre, cuando se refuerza menos veces o se refuerza de manera parcial, tal como vemos aquí, de manera parcial intermitente, hay una mayor resistencia a la extinción. Sin embargo, si se refuerza muchas veces o hay muchos ensayos, muchísimos ensayos de asociación, de condicionamiento operante, entonces la resistencia es menor. Esto es lo que se ha denominado el efecto. El efecto del sobreentrenamiento en la extinción. Una mayor cantidad de entrenamiento resulta en una menor resistencia a la extinción. Y esto podría parecer un poco contraintuitivo, ¿no? Se supone que cuanto más entrenamos algo, cuanto más lo asociamos con un reforzador, más fuerte es la respuesta, más fuerte es la asociación y se supone que más difícil debería ser eliminar esa asociación o cambiar el sentido de esa asociación, ¿no? Bueno, pues eso es lo que se refuerza. Esto tiene que ver con algo que vamos a ver, como os digo, en el siguiente capítulo, que son los programas parciales o intermitentes. Es decir, cuando no reforzamos todas las respuestas, cuando solo reforzamos unas determinadas respuestas en función de una serie de criterios. Y fijaros, en el fondo tiene bastante lógica. Cuando nosotros reforzamos todas las respuestas, cuando se da una respuesta y siempre hay una consecuencia, es mucho más fácil que ocurra una serie de cosas durante la fase de extinción. Cuando pasamos a la fase de extinción, tenemos unas situaciones que varían entre un tipo de programa y otro. Fijaros, cuando tenemos un programa o una situación de asociación en la que reforzamos todas las respuestas, la discriminación entre esa fase de reforzamiento y la fase de extinción es mucho más sencilla. Mirad de nuevo, cuando reforzamos todas las respuestas, siempre que obtenemos una conducta, obtenemos una consecuencia. Sin embargo, cuando no hacemos eso, solamente pongamos una de cada diez respuestas. Eso sería un programa de razón fija 10. Luego estudiaremos qué es esto. Seguramente la semana que viene, no creo que nos dé tiempo hoy, pero lo veremos en los siguientes temas. Razón fija 10. Esto es que de cada diez respuestas se refuerza una. Fijaros, cuando llegamos a la extinción, alguien que ha estado en un programa continuo, en cuanto entra en el programa de extinción, entra en contacto con algo nuevo. ¿Qué es esto? Con una situación en la que no hay reforzador. Es muy fácil discriminar entre la fase anterior y la fase nueva, porque antes siempre había reforzador. Ahora desde el primer ensayo no hay reforzador. Sin embargo, si tienes un programa de este tipo, 9 de cada 10 respuestas aparecen sin reforzador. Así que cuando entramos en un programa de extinción va a ser muy difícil para el organismo diferenciar entre el programa anterior en el que se reforzaban las respuestas y este, porque 9 de cada 10 respuestas son exactamente iguales, no dan lugar al reforzador. El resto de cosas que vamos a ver están muy relacionadas con esto. Por ejemplo, la generalización del reforzamiento parcial a la extinción. De nuevo, en un programa de extinción, perdón, en un programa de reforzamiento parcial, por ejemplo este que tenemos aquí, 9 de cada 10 respuestas no son reforzadas. Cuando pasamos un procedimiento de extinción, el hecho de que no haya reforzamiento se generaliza o se generalizan los ensayos sin reforzamiento de la parte de adquisición a la parte de extinción. Así que tardamos mucho más en darnos cuenta de la situación en la que estamos, en aprender la nueva contingencia. Porque el contacto con las contingencias en un programa parcial es menor. Parte de exactamente lo mismo. Si 9 de cada 10 respuestas no son reforzadas, cuando entremos en el programa de extinción, al menos las 9 primeras respuestas, al menos los 9 primeros ensayos, no notaremos ninguna diferencia. Así que para entrar en contacto con una nueva contingencia, que es el que no hay reforzamiento, el que no aparece nada, necesitamos esperar. Por lo menos hasta el décimo ensayo. Y ahí tendremos un contacto con la contingencia. Pasarán otros 9 ensayos en los que damos por hecho que no va a haber reforzador porque es lo que hemos aprendido en la fase de adquisición. Y después volveremos a tener contacto con una nueva contingencia. Fijaros, para entrar dos veces en contacto con la nueva contingencia, con la nueva relación entre respuesta y consecuencia, hemos necesitado 20 ensayos. 20 ensayos para entrar dos veces en contacto con ella. En un programa continuo, en 20 ensayos, entramos en contacto 20 veces con la nueva contingencia. Así que es lógico pensar que en 20 ensayos de contacto con la nueva contingencia se aprenda más que en dos ensayos. Y por último, también la teoría de la frustración, que en el fondo parte de lo mismo. Es otra manera de explicar el hecho de que durante los programas parciales se tiene menos contacto con el reforzador. ¿Qué se aprende durante los programas parciales? Pues una de las cosas que se aprende es a no tener el reforzador, porque como os digo aquí, en 9 de cada 10 ensayos en este tipo de programa, por ejemplo, podría ser incluso RF100 o otro tipo de programa, ya lo veremos, pero en 9 de cada 10 ensayos no hay... No hay reforzador. Así que lo que uno aprende durante la fase de adquisición no es solo a que le van a dar reforzadores, sino también a no esperar reforzadores durante la mayor parte de los ensayos. Cuando llega a la fase de extinción está acostumbrado a no recibir reforzadores. Sabe que eso es parte del programa. Así que aprender algo nuevo también le costará más. Porque parte del programa ha sido y... Bueno, parte no. El 90% del programa de adquisición ha sido no tener reforzadores. Bien, esto en cuanto a los... Algunas de las características y de las situaciones que ocurren, de las variables que influyen en los programas de extinción. Tenemos algunas más, algunas que están relacionadas con el propio reforzador. En particular, con dos características, la magnitud y la demora. Bueno, en esto es bastante fácil cuanto... Vamos a empezar con lo más sencillo. Cuanto mayor es la demora del reforzador, menor es la resistencia a la extinción. Es decir, cuando los reforzadores son inmediatos, cuando se dan justo después de la conducta, es más difícil eliminar esta conducta. Esto sí es bastante intuitivo. Es bastante fácil pensar que si el reforzador se da de inmediato, será más difícil extinguir la conducta puesto que la asociación va a ser más fuerte. En cuanto a la magnitud, en este caso depende, y veréis que en el libro lo explica de una forma un poco confusa, porque habla de la magnitud en función de cómo se ha realizado el programa de entrenamiento. En función de si el programa es continuo, es decir, se refuerza siempre o si el programa es parcial, es decir, se refuerzan solo algunas respuestas. Y cuando la magnitud es alta y el programa continuo, hay una menor resistencia a la extinción. Cuando la magnitud es alta y el programa es parcial, hay una mayor resistencia. Que básicamente lo que está diciendo es que lo que ocurra con la magnitud depende de cómo sea el programa, cosa que también depende cuando la magnitud es baja. Así que el efecto de la magnitud depende de cómo hayamos enfrentado. Por ejemplo, si hemos establecido el programa en general, la magnitud de un premio, el efecto que tiene es hacer más fuerte la asociación. Cuanto mayor es el premio, mejor se aprende algo en general. También depende del valor de reforzador que tiene para ese sujeto. Pero en este caso, el valor de la magnitud va asociado a lo que ocurre con el tipo de programa, es decir, a cómo se refuerza el programa. Bueno y aquí tenéis las tres cosas que hemos hablado antes y una nueva, algo que ya vimos también en el condicionamiento clásico. En primer lugar, la disminución de la respuesta no se debe al olvido, es algo distinto, es un nuevo aprendizaje. La respuesta continúa disponible. Y si os acordáis de lo que vimos, la recuperación espontánea, es decir, el fenómeno de recuperación espontánea y también fenómenos como la renovación, la restauración y el restablecimiento indican que el aprendizaje es algo diferente, que no es simplemente un desaprendizaje. La renovación es algo que vimos ya en el condicionamiento clásico, el que la respuesta vuelva a aparecer cuando cambiamos de contexto. De nuevo volvemos a lo que vimos. Y es que la extinción es algo que es dependiente de contexto, es particular del contexto. Cuando se cambia el contexto, cuando se cambian los estímulos, que en este caso son discriminativos, que nos indican que no está disponible el deforzador, cuando cambiamos esos estímulos puede volver a aparecer la respuesta. La restauración, cuando ocurre en el mismo contexto. Hay situaciones en las que simplemente, como hemos visto antes, en la recuperación espontánea por el paso del tiempo o simplemente porque volvemos a... presentar un estímulo discriminativo o porque volvemos a presentar, como en el restablecimiento, el reforzador sin que ni siquiera aparezca la respuesta, vuelve a aparecer de nuevo la respuesta. Bueno, todas estas situaciones que son análogas a las que vimos en la extinción en el condicionamiento clásico nos indican dos cosas en particular, esto quizás sea lo más importante. El hecho de que la extinción es un aprendizaje diferente, no es un desaprendizaje de lo ya adquirido, sino que se aprende a no emitir una respuesta cuando el reforzador no está disponible, no es que se deje de aprender la respuesta. Y también que el aprendizaje es dependiente de contexto, que hay variables en el contexto que nos indican cuando estamos en un procedimiento de extinción o cuando está o no está disponible el reforzador y que por lo tanto cambiando esas variables o simplemente dejando pasar el tiempo o cambiando de contexto podemos volver a obtener la respuesta. Bueno, esto en cuanto a la extinción. Vamos con algunos otros fenómenos bastante interesantes. Este resumen. Pues va a resultar bastante curioso. Además es un fenómeno que se da en humanos, que es bastante común y usual en humanos. Y es curioso ver como los animales en los experimentos se comportan de una manera bastante similar a lo que hacen los humanos en otras situaciones. Fijaros, vamos con ello. La conducta supersticiosa. ¿En qué consiste? En un experimento la conducta supersticiosa, que no es exactamente lo mismo que lo que nosotros estamos acostumbrados a ver o a hablar sobre ello. Bueno. Es un procedimiento que inventó Skinner. Fue el que desarrolló este tipo de procedimiento y era bastante sencillo. Se metía un animal en una caja de Skinner, como la que hemos visto hasta ahora. Y cada, digamos, cada 15 segundos... Se soltaba un reforzador, pongamos que es comida. Cada 15 segundos un reforzador, pero sin que la paloma pongamos o el animal. Vamos a poner una paloma que creo que Skinner además lo hizo con palomas, sin que la paloma tuviese que hacer absolutamente nada. Simplemente cada 15 segundos que hay un reforzador. Esto es lo que se llama reforzamiento accidental o adventicio. Os recordará a otro procedimiento que vimos en el condicionamiento clásico. No sé si alguno se acuerda, si alguno se acuerda me lo puede poner en el chat. Si no os lo digo ahora mismo. Bueno, como os digo, recordará a un procedimiento que ya vimos, pero no es lo mismo. Es el automoldeamiento. No sé si lo recordáis. En el automoldeamiento había una señal, una luz que aparecía. Antes, o justo antes, o de forma contingente a la aparición de un reforzador. En este caso la comida. Aquí lo que ocurría es que la paloma terminaba picoteando la luz como si su conducta tuviese algo que ver con la aparición del reforzador cuando realmente no tenía absolutamente nada que ver. Solamente caía asociado a la aparición de la luz. Esto era un tipo de condicionamiento clásico, pero que daba una respuesta condicionada que era muy similar a la que ocurre con la conducta de las palomas. Cuando hay comida, es decir, una especie de picoteo sobre el estímulo condicional. En este caso lo único que ocurre, no hay luz ni nada que lo señale, no se asocia a nada, simplemente cae una bolita de comida cada 15 segundos. Reforzamiento accidental o adventicio, es decir, caen de manera accidental sin que haya ningún patrón. Bueno, en este caso lo que... Lo que ocurría es que los animales empezaban a comportarse según diferentes pautas, es decir, metías varios palomas en una caja, hacías este procedimiento y cuando volvías a cabo de unas horas te encontrabas con que cada paloma había desarrollado una conducta diferente. Empezaba a hacer cosas cuando aparecía el reforzador y cada una lo hacía de una manera diferente. Lo que decía Skinner es que cualquier comportamiento que hubiese tenido lugar justo antes de la aparición del reforzador quedaba por la propia aparición del reforzador reforzado, es decir, tenía más probabilidad de aparición en el futuro. Si la paloma por un casual estaba, digamos, levantando las alas en el momento anterior a que apareciese el reforzador, empezaría a asociar ese movimiento a la aparición del reforzador. Como todo reforzador, la primera consecuencia que tiene es inmediatamente. Es el incremento de la probabilidad de aparición de una conducta, así que esa conducta que había aparecido por casualidad ahora es más probable. Como es más probable, es también más probable que aparezca justo antes de que aparezca el reforzador, es decir, que aparezca acompañando antes de que aparezca el reforzador. Así que la propia superstición se va retroalimentando, va haciéndose cada vez más probable hasta que queda establecida la asociación. Así que, como nos contamos, pasa a los humanos, la superstición se retroalimenta. Seguramente muchos de vosotros tendréis algún tipo de superstición, pongamos una de las más típicas en el ámbito universitario, que es tener algún amuleto para los exámenes o utilizar siempre un mismo boli, etcétera, etcétera. Si cuando vosotros habéis desarrollado esa conducta o habéis utilizado un boli, por ejemplo, o ya habéis llevado una prenda de ropa o un amuleto, habéis obtenido un buen resultado, eso hace que esa conducta, hacer eso, vaya a ser más probable en el futuro. Como lo vais a volver a hacer en el futuro, si volvéis a obtener un buen resultado al final, es decir, si desactiváis el reforzador, eso hace que sea mucho más fácil que esa conducta se vuelva a dar en presencia del reforzador porque lo vais a hacer más veces. Así que la propia superstición se va retroalimentando, haciendo que la asociación sea cada vez más fuerte. Esta es la explicación que daba Skinner, lo daba como una situación accidental, un reforzamiento que tenía que ver con la casualidad, con el hecho de que determinadas conductas, conductas se diesen en un determinado momento y no en otro, que coincidiesen exactamente y que por eso había tanta variabilidad o él observaba variabilidad en los comportamientos de las diferentes palomas. Cada una lo que había hecho en ese momento. Sin embargo, otros, bueno, en este vídeo, por cierto, esto no se puede ver aquí lógicamente, pero lo tenéis en los documentos que os he pasado. Por cierto, en la parte de documentos de este mismo aula virtual tenéis no solo el PDF, Sino también el PowerPoint del tema 5, si no me equivoco. Si lo tenéis, el del tema 5, por si queréis descargarlo, ¿vale? Tenéis el del tema 5 con todos los vídeos. El del tema 4 ya os lo di. Bueno, en este vídeo simplemente aparece una representación del comportamiento supersticioso de la paloma. Lo podréis ver, si no lo habéis visto ya, lo podéis ver tranquilamente en casa. No es un vídeo muy bueno, pero sí, bueno, sí por lo menos es un ejemplo de cómo más o menos se realizaba este tipo de experimentos. Que en el fondo son muy sencillos. Solamente hay que dejar... Comida cayendo sin parar y un organismo que empieza a imaginar cosas. También habréis visto este tipo de comportamientos en, bueno, pues por ejemplo en los casinos, en todos los juegos de azar. Son muy típicos de las situaciones en las que no hay control. Luego vamos a ver algo de esto. Bueno, otros investigadores, sin embargo, en este caso ha estado Nishimelag, dieron una explicación algo diferente. Ellos lo que hicieron fue hacer un procedimiento muy similar al que desarrolló Skinner. Básicamente era lo mismo, pero hicieron algo nuevo y es hacer una anotación, estudiar de una manera mucho más minuciosa cada una de las respuestas que daban los animales en la situación de conducta supersticiosa, de asociaciones supersticiosas o de reforzamiento adventicio. Y se dieron cuenta de que había dos tipos de conductas, dos categorías de conductas en los animales. Conductas que dependían del momento, del intervalo entre reforzadores en el que se encontraban. Recordad que tenemos un intervalo de 15 segundos. Así que dependiendo si estamos cerca de cuando aparece el reforzador o estamos en esos momentos intermedios en los que no va a aparecer reforzador, aparecían dos conductas diferentes. A las primeras la llamó conductas de interim. Son conductas que ocurren en mitad del intervalo de reforzamiento, cuando todavía no va a aparecer ningún reforzador, cuando falta tiempo para ello. Y son conductas innatas, conductas propias de la especie, conductas que sirven para pasar el tiempo. Conductas que hacen o que sirven incluso como reforzadores para el paso del tiempo. De este tipo de conductas os habréis dado cuenta que muchos tenemos o nos hemos encontrado en situaciones en las que hay muchas de éstas. Cuando estáis esperando algo, generalmente no estáis parados. Generalmente uno no está sin hacer absolutamente nada. Si está esperando que le llamen, si tiene algo en el horno y está esperando que se haga, si está esperando una llamada o, bueno, una llamada o que venga alguien a casa. Normalmente empezamos a hacer cosas que no tienen mucho sentido. Es decir, vamos a la cocina, empezamos a mirar cosas, nos levantamos, dando paseos. Estos conductas que son muy similares en todos los humanos y que también se dan en otros animales. Eso es lo que se denominan las conductas de interín. Es decir, conductas que se dan en mitad de los intervalos de reforzamiento. Conductas que rellenan ese tiempo de intervalo. Y en segundo lugar, conductas terminales. Que son las que aparecen al final del intervalo y muy próximas al reforzador. ¿Qué decían Stadon y Simenac? Bueno, pues cuando se va a dar el reforzador, cuando el momento de que aparezca el reforzador se acerca, entonces aparecen este tipo de conductas. Y estas conductas tienen mucho que ver con el tipo de reforzador. Si es comida, tendrá mucho que ver con la conducta del animal a la hora de comer. Si es bebida, lo mismo. Si es una descarga o si es algún otro tipo de estímulo aversivo, también tendrá que ver con ello. Así que ellos se dieron cuenta de que ocurrían estos dos tipos. Así que pensaban que no era una cuestión accidental, sino que en este tipo de situaciones los animales siguen un tipo de patrón muy específico, muy pautado, que tiene que ver con conductas innatas. Son conductas que tienen que ver con el reforzador. Para ellos, además, la entrega del reforzador, es decir, el momento en que aparece el reforzador, solo influye sobre las respuestas terminales. sobre las respuestas que se dan en ese momento y que están relacionadas con el reforzador. Así que da una explicación totalmente diferente. Dice, no, no, esto no es un reforzamiento o una conducta aleatoria, sino que son conductas muy pautadas que tienen que ver o bien con la parte innata, con la parte de las conductas que suele realizar una especie de manera innata, o sin embargo tienen que ver con conductas que tienen que ver con lo que harían esos sujetos o que tienen que ver con el propio reforzador que se va a administrar. Así que tenemos dos posibles mecanismos y estos dos mecanismos se piensa que actúan de manera conjunta, aunque en algunas ocasiones actúan unos y otros otros y que los dos dan lugar a la conducta supersticiosa. Por un lado, el reforzamiento accidental que Skinner postulaba y por otro lado, el hecho de que haya determinadas conductas innatas unido al paso del tiempo. Ciertas conductas innatas que aparecen para pasar el tiempo o que ocurren en el tiempo. O que ocurren hasta que aparece el reforzador y que luego se transforman en otro tipo de conductas, las conductas terminales. Estas son las dos explicaciones que tenemos sobre la conducta supersticiosa. En realidad ambas ocurren, ambas cosas pueden ocurrir. Y como siempre os he dicho, la cantidad de variables que hay alrededor de una situación de aprendizaje influirán mucho en que ocurra una u otra o en el tipo de aprendizaje que vaya ocurriendo. Recordad siempre que por mucho que intentemos controlar las variables que hay en una situación de aprendizaje, son muchas las que se nos escapan y muchas asociaciones están ocurriendo en el mismo momento o a la vez que nuestra situación o que nuestra pretendida situación experimental controlada, aunque la controlemos todo lo que podamos. Siempre ocurrirán varias cosas. Vamos con otro fenómeno. Algo distinto. Bueno, perdón, nos queda algo más sobre conducta supersticiosa. Ya os he dicho que es un comportamiento muy típico de humanos. Si hay un tipo de humanos o una clase de personas en los que es todavía más exacerbado, que son personas que necesitan mucho control o que tienen una gran intolerancia a la incertidumbre, las personas que toleran muy mal el hecho de no conocer las causas o de no controlar las situaciones, tienen más tendencia a generar conductas supersticiosas. Porque dan algo que es muy atrayente, que es una falsa ilusión de control. Esto es algo que se ha estudiado bastante. De hecho, en la facultad, entre el equipo docente de aprendizaje, hay parte del equipo que ha dedicado gran parte de su carrera investigadora a la ilusión de control, a lo que se denomina ilusión de control en particular, a la ilusión de control en jugadores de azar o en los juegos de azar. Esas conductas y esas explicaciones que desarrollan los jugadores de juegos de azar que intentan deshacerse. Intentan dar explicación a lo que no la tiene o intentan buscar causa a lo que no lo tiene. Como intentando ganar control sobre situaciones sobre las que no se puede ganar control porque son totalmente azarosas. Esto es lo que se llama de toda la vida ilusión de control, la creencia de que uno tiene control sobre algo. Por eso la conducta supersticiosa suele ser más acusada en personas con una alta necesidad de control o al revés, con una baja tolerancia a la incertidumbre. Bueno, en humanos además, Hennstein dice, hay una distinción entre dos tipos o dos formas de adquirir estas conductas supersticiosas. Os sonarán ambas. En general, los humanos tenemos dos tipos de supersticiones. La primera es la que Hennstein denominó supersticiones idiosincráticas. Son las nuestras propias, las que tienen que ver con nuestra historia con los reforzadores. Las que tienen que ver con el hecho de que llevemos amuletos a... a un examen pensando que como antes se ha asociado ese amuleto a un buen resultado, pues la conducta de llevarlo más veces hará que vuelva a obtener la misma consecuencia o el mismo reforzador o con algún otro tipo de supersticiones como por ejemplo los deportistas salir siempre con el pie derecho o con el pie izquierdo o bueno, toda la larga lista, solo tenéis que ver un vídeo de Nadal antes de sacar y podéis ver una larga lista de conductas aunque ahí realmente se mezclan muchas cosas, no os quiero confundir con esto porque aparte de superstición también hay una parte de rutina de ejecutar ciertas rutinas para que los movimientos se automaticen pero bueno, por ejemplo los deportistas, los futbolistas el hecho de entrar con el pie derecho o el pie izquierdo todo el tema de amuletos, etcétera, besos al campo, al larguero, etcétera tiene que ver con este tipo de conductas supersticiones idiosincráticas propias de uno mismo pero también tenemos las supersticiones, lo que Herstein llamó supersticiones sociales típicas estas no tienen que ver con nuestra experiencia con lo que nosotros hemos vivido con nuestra experiencia con los reforzadores, con nuestro propio aprendizaje sino con el aprendizaje social, con el aprendizaje cultural son todas esas supersticiones que hemos heredado en nuestra cultura que en origen generalmente tenían que ver con contingencias que si eran efectivas con situaciones que no eran efectivas con situaciones en las que sí tenían sentido pero que han ido perdiéndolo poco a poco y se han quedado como un reducto, como un reducto cultural en el libro tenéis algunas hay otras también muy famosas el hecho de que el viernes 13 sea una fecha de mala suerte tiene que ver con ciertas cosas que ocurrían o que ocurrieron en su momento no las recuerdo ahora si os digo la verdad en el libro tenéis explicado lo de los tres cigarros con una misma cerilla El hecho de que la primera guerra mundial, o se piense que encender varios cigarros con una misma cerilla trae mala suerte, porque durante la primera guerra mundial si encendías varios cigarros con una cerilla por la noche había más posibilidades de que el enemigo te diese y por lo tanto de que te matase. Así que era mejor apagar enseguida, no encender varios cigarros con una cerilla, sino ir encendiendo en diferentes momentos y durante un corto periodo de tiempo. Es que son cosas que se han ido heredando y que se han quedado como un pozo cultural y que hemos heredado esas supersticiones culturalmente, no a través de nuestra experiencia con el reforzamiento adventicio o con el reforzamiento supersticioso en este caso. Bueno, vamos con lo siguiente, vamos con otro de los fenómenos. En este caso, si quiere pasar la diapositiva, que tarda un poquito, a ver si pasa, espero que nos haya quedado... clavado, me imagino que el otro día me pasó con otra de las clases, mira ya ha aparecido aquí, me pasó con otra de las clases, que di un error, se me colgó la plataforma y ya no se podía volver a conectar hasta el final de la clase, así que espero que no pase. Bueno, vamos con la deriva instintiva. Este también es un fenómeno bastante curioso, os explico algo sobre ello. Bueno, lo primero tiene que ver con el hecho de la universalidad del condicionamiento operante. Es decir, la pregunta de si se puede condicionar cualquier respuesta, ¿se puede condicionar cualquier respuesta a través de la aparición de cualquier reforzador? O dicho de otra manera, ¿es necesaria que haya cierta pertinencia o cierta relevancia entre la respuesta que damos y el reforzador que obtenemos? Si recordáis cuando hablábamos del condicionamiento clásico, hablábamos de que no todas las situaciones eran igual de fáciles de condicionar. Cuando teníamos como estímulo incondicionado una descarga, era más fácil condicionar ciertos estímulos que otros. Es decir, para condicionar o para generar una asociación entre un estímulo condicionado y una descarga era mucho más fácil con una luz que, por ejemplo, con un estímulo gustativo o con un olor. Era mucho más sencillo porque generalmente en el mundo real, en el mundo de la luz, en el mundo del animal, es mucho más fácil que una descarga sea producida por un estímulo audiovisual o que tenga que ver con algo audiovisual. Sin embargo, un malestar es mucho más fácil que sea producido por la ingestión de comida. Así que cuando intentas condicionar un malestar a la aparición de una luz es mucho más difícil o viceversa. Así que era necesaria cierta pertinencia. Había cosas que eran más fáciles de condicionar que otras. Bueno, pues lo mismo ocurre aquí. No todas las respuestas son igualmente asociables a la aparición de distintos reforzadores porque hay algunas respuestas que se relacionan de manera natural con un reforzador. Y hay veces que cuando presentamos un reforzador no se refuerza o no aumenta la probabilidad de la respuesta que nosotros queremos, sino de la respuesta asociada o similar a la que produciría en la situación natural ese reforzador. Esto es muy similar al condicionamiento clásico. Recordáis que los estímulos incondicionados, como la comida, producen unas respuestas que son innatas. Bueno, pues algo tendría que ver con esto. No es lo mismo, ¿vale? Pero algo tendría que ver con esto, con el hecho de que ante la presentación de ciertos reforzadores es más fácil condicionar ciertas respuestas que tienen que ver con las que produce ese reforzador en la vida real, en la vida del organismo. Bueno, ¿quién desarrolló este tipo de experimentos? ¿O quién descubrió este fenómeno, el fenómeno de deriva estímula? Pues un matrimonio, el matrimonio de los Breland. Los Breland eran alumnos de Skinner. Fueron sus alumnos de doctorado. Y una vez que terminaron su formación, dejaron la vida académica y montaron una empresa. Montaron una empresa que se dedicaba a maestrar, a enseñar ciertas conductas animales. Para circos, para ferias, bueno, pues para diferentes actividades. Y la verdad es que les iba muy bien. Ellos, como tenían alma de investigadores, seguían haciendo ciertos experimentos. Y lo que se dieron cuenta es que cuando ellos intentaban realizar ciertos... O asociar... O asociar determinadas respuestas a la obtención de reforzadores, cuando intentaban enseñar ciertas cosas a los animales, hay veces que les resultaba muy difícil en determinadas situaciones. Por ejemplo, el ejemplo que pone en el libro, y lo tenéis, luego os enseño, os cuento cómo es el vídeo que os he puesto. En los materiales. El experimento, bueno el experimento, la situación que ellos encontraron, porque ellos se lo encontraron de frente cuando intentaban amaestrar a un animal, en este caso un mapache. Bueno pues ellos encontraron, ellos lo que querían hacer era enseñar a un mapache a coger monedas y llevarlas a una hucha. Una hucha, una especie de forma de casita o una hucha grande y lo que tenía que hacer el mapache era coger las monedas, llevarlas, introducirlas por la ranura de la hucha y se les daba comida, obtenía un premio. Bueno y se dieron cuenta de que al principio el mapache lo hacía, cogía y llevaba a la hucha y obtenía reforzamiento. Pero que con el tiempo empezaban a ocurrir cosas raras. El mapache dejaba de ir a la hucha y empezaba a manosear las monedas, empezaba a manosearlas, a frotarlas, a lamerlas, a mordisquearlas como si aquello fuese comida. Bueno esto es lo que ellos denominaron con deriva instintiva. Era una competición entre la conducta que ellos querían. Que es reforzar, que ellos querían asociar a la obtención del premio y otras conductas innatas que están relacionadas con el reforzador. Así que se dieron cuenta de que cuando intentaban reforzar una cierta conducta esta competía con otras que eran muchas más fuertes. Y al final terminaban ocurriendo aquellas conductas que eran más fuertes. Este es el concepto de deriva instintiva. Y de aquí se deriva la cuestión de que no es igual de fácil reforzar cualquier conducta. La pertinencia. La pertinencia entre la conducta y el reforzador es esencial. En la siguiente diapositiva, entre comillas, porque aquí solo queda la foto de ello, pero en las diapositivas que os he mandado lo tenéis. Tenéis un vídeo precisamente de un mapache introduciendo monedas en una hucha y veréis que con el paso del tiempo el mapache deja de hacer lo que debería hacer y empieza a manosear las monedas, a realizar una deriva instintiva, a realizar conductas que tienen que ver con la manipulación de los alimentos que realizan los mapaches. Solo que en vez de hacerlo con la comida, lo hace con el reforzador que se ha asociado a la aparición de comida. Es un fenómeno bastante interesante, lo veréis, es bastante curioso. Bueno, vamos con algunos otros fenómenos, vamos con algo un poquito distinto. El fenómeno de contraste conductual. Seguramente a algunos de vosotros ya os suene. Si habéis hecho psicología de la motivación, si ya habéis terminado motivación, os sonará porque esto además se explica con un poquito más de detenimiento en motivación. De hecho, es un fenómeno típico de la psicología motivacional, de cómo afectan las recompensas y el cambio de las recompensas o la historia de las diferentes recompensas a la conducta de los individuos. Bueno, una cosa importante sobre los reforzadores, algo que ya hemos visto, que veremos y que seguramente ya os hayan contado, aparte de haberlo contado yo en las tutorías, es que el efecto de los reforzadores no tiene un efecto absoluto, porque su efecto depende de la experiencia o del aprendizaje pasado de los sujetos. ¿Qué experiencia han tenido los sujetos con esos reforzadores? En particular de la historia del reforzamiento, de lo que les ha ocurrido antes con el reforzamiento. ¿A qué se refiere el contraste conductual? Bueno, pues al hecho de que una misma magnitud y un reforzador no tiene el mismo efecto sobre diferentes organismos en función de la historia de reforzamiento de esos organismos o de lo que ha ocurrido con el reforzador en esos organismos. En particular, con la magnitud o con la calidad, pero vamos a llamarlo magnitud, con la cantidad de premio que han recibido antes. El caso más sencillo, y ahora nos metemos con el experimento, pero yo creo que es el caso más sencillo para que lo entendáis. Imaginaros una situación en la que tenemos varias personas trabajando en una empresa. Y en esa empresa tenemos una persona que cobra 1.800 euros, otra persona que cobra 1.100. Y de repente... Y de repente un día le subimos... Perdón, una 1.800 y otra 1.200, para que así coincida más fácil. Y de repente un día a la persona que cobra 1.800 le bajamos el sueldo 300 euros y pasa a cobrar 1.500. Sin embargo, a la persona que cobra 1.200 le subimos el sueldo también 300 euros y pasa a cobrar 1.500 euros. Seguramente en los momentos previos, si por el mismo trabajo uno le paga 1.800 y otro 1.200, el rendimiento de la persona que cobra 1.800 euros sea mayor que el de la persona que cobra 1.800 euros. O sea, de 1.200 eso es algo que suele ocurrir cuando tienes una mayor valoración de lo que haces. Suele trabajar más a gusto, suele trabajar mejor, suele ser más cómodo. Vale, una vez que tenemos esto, bajamos a uno el sueldo y se lo subimos. Pasan a cobrar los dos lo mismo. Se supone que el rendimiento de los dos será el mismo. Sin embargo, esto no sucede así. Lo que suele ocurrir en estos casos es que el rendimiento de la persona que cobra 1.500 euros pero viene de que le bajen el sueldo es bastante peor que el de la persona que se lo han subido, a pesar de que el reforzador es el mismo. Esto es un ejemplo clásico de cómo la historia de reforzamiento, la historia previa de reforzadores, la magnitud, la experiencia que tenemos con la magnitud de reforzamiento, con la calidad de reforzamiento afecta por encima de lo esperado a nuestro desempeño. En este caso a la calidad de nuestra conducta, en este caso a la calidad de nuestro trabajo. Vamos a verlo en un experimento donde queda más claro y donde se ve exactamente el fenómeno de contraste porque el contraste no es sólo un cambio en el rendimiento, es un cambio en el rendimiento. Por encima de lo esperado, por encima de lo que uno debería esperar. Vamos a verlo aquí. Bueno, en primer lugar tengo una errata, ¿vale? Os corrijo la errata aquí mismo. Esto sería el grupo C y esto sería el grupo D. He puesto tres grupos A. Bueno, esto es A, B, C, D. Bueno, tenemos cuatro grupos. Fijaros, en los dos primeros, tenemos dos fases además, dos fases de entrenamiento. En los dos primeros grupos, durante la primera fase de entrenamiento, reciben una recompensa pequeña. Por pulsar, perdón, por pulsar una palanca, no. Esto os explico un poco mejor aquí en la situación. Lo que tienen que hacer las ratas es correr por un corredor recto para obtener comida, ¿vale? La velocidad a la que corren es un indicativo de la magnitud del premio. Es decir, la mayor cantidad de premio corren más rápido. Una magnitud, un indicador de la magnitud de la asociación. Bueno, pues para el grupo A y el grupo B tenemos que en la primera fase empiezan recibiendo un premio de dos bolitas. Ambos grupos corren y obtienen dos bolitas. Bien, perfecto. En esta primera fase los grupos C y D cuando corren obtienen 22 bolitas, un premio muchísimo más grande. Os podéis imaginar que durante esta primera fase los dos últimos grupos corren bastante más rápido a través del corredor para obtener la comida. La magnitud del premio es muchísimo mayor. Bueno, vamos a la segunda fase donde algunas cosas van a cambiar. Para el grupo A en la segunda fase se mantiene el mismo premio pequeño. Así que el grupo A recorre el corredor a la misma velocidad que lo hacía antes. No ha cambiado nada, la primera y la segunda fases son exactamente las mismas, así que misma velocidad. El grupo B sin embargo hacemos algo y es que voy a borrar un segundo para que lo podáis ver mejor. Y así lo vemos en términos de velocidades de ejecución. Tenemos el grupo A. El grupo A, tanto en la primera como en la segunda fase, tiene el mismo premio, así que tiene este nivel de ejecución. Pongamos que aquí hay unos ejes de coordenadas. Tiene ese nivel de ejecución. Bien, empezamos justo aquí. Segundo, el grupo B cambia de pequeño a grande. Así que durante la primera fase empezará exactamente igual que el grupo A. Pero en la segunda fase le hemos dado un premio más grande. Así que su ejecución, la magnitud de ejecución, va a cambiar. La velocidad a la que corre va a ser mayor durante la segunda fase. Ya tenemos el grupo A y el grupo B. Vamos a ver el grupo C y el grupo D. En el grupo C tenemos una ejecución alta porque han empezado con un premio de 22 bolitas y en el grupo C no cambia así que su ejecución va a ser la misma, empezará alta y seguirá alta. Fijaros, aquí tenemos los dos grupos ya de línea base, el A que tiene una ejecución igual en todos porque siempre tiene el mismo premio pequeño. No me digas, no se ve si dibujo algo o es que lo que ocurre es que no se ven las letras o no se ve el trazo que dibujo. Ah, qué raro, algunos sí lo veis y otros no. Bueno, como va a quedar grabado, en el caso de que no lo veáis yo lo voy explicando, lo intento decir lo mejor que pueda y luego lo que voy a explicar os lo voy a explicar. Como podéis ver en la grabación, si acaso si hay alguno que no lo veáis. Bueno, continúo aún así por la explicación, espero que lo podáis entender. Grupo A se comporta igual en las dos situaciones, el grupo C también porque reciben el mismo premio en las dos situaciones. Vamos a centrarnos en el grupo B y el grupo D. El grupo B pasa de un premio pequeño a uno grande, así que empiezan rindiendo igual, El grupo A, pero ¿qué pasa cuando en la segunda fase aumentamos el premio? Lo esperable será que se comporten como el grupo C en este caso, es decir, que pasen a ejecutar, a correr a la misma velocidad que el grupo C porque van a recibir el mismo premio, el premio grande. Pero esto no ocurre. Ejecutan por encima del nivel del grupo C. Corren más rápido que el grupo C aunque tengan la misma recompensa. Y vamos ahora al caso contrario. El grupo T y el grupo D empiezan con 22 bolitas. Empiezan con una ejecución alta. Pero ¿qué ocurre en la segunda fase? Les bajamos el premio a dos bolitas. Así que van a disminuir su velocidad de ejecución. Lo intuitivo sería pensar que bajarán su velocidad de ejecución hasta la misma que tiene el grupo que recibe dos bolitas siempre. El grupo A que siempre ha recibido dos bolitas. Pero esto no es lo que ocurre. Lo que ocurre es que su ejecución baja por debajo de la ejecución propia del grupo A. Del grupo que siempre ha recibido dos bolitas. ¿Qué quiere decir esto? Pues que el efecto del reforzador depende de lo que uno ha recibido antes. Cuando uno ha recibido siempre dos bolitas, bueno, pues corre una velocidad. Pero si uno está acostumbrado a recibir 22 bolitas y le bajan a dos, no va a rendir como el que siempre ha recibido dos, sino que va a rendir por debajo del que ha recibido dos. Y lo mismo cuando hablamos de un contraste conductual positivo. Es decir, cuando pasamos de un reforzador pequeño a un reforzador. Una cosa muy importante de este fenómeno es que es temporal. Cuando pasa un tiempo, ese fenómeno de contraste, es decir, de ejecución por encima o por debajo de lo esperado, baja y se adecua. Al rendimiento del grupo que tenía o que tiene el mismo reforzador que el grupo que ha tenido contraste. Es decir, vuelve a los niveles del grupo que desde el principio tuvo ese nivel de reforzador. Se vuelve al estado de normalidad. ¿Qué quiere decir esto? Bueno, pues que las personas que uno cobraba 1.800 y otro 1.200, cuando pasen a cobrar los 2.500, uno rendirá más de lo esperado y otro rendirá menos de lo esperado. Pero con el tiempo los dos volverán a igualarse y rendirán los dos lo mismo. Al nivel del reforzador de 1.500 euros. Así que es un efecto pasajero, es un efecto temporal que depende mucho además del estado afectivo y emocional del sujeto. De cómo le afectan esos reforzadores, de lo importantes que son, de la situación en la que está, de otras variables relacionadas. Por eso es un fenómeno muy estudiado en psicología, sobre todo en psicología motivacional. Cómo afectan los cambios y cómo afecta la historia de reforzadores y los cambios en los reforzadores a la ejecución, al nivel de ejecución. A la ejecución conductual de los sujetos. Bueno, esto en cuanto al contraste conductual. Vamos con otro fenómeno. Nos quedan creo que tres fenómenos. El otro muy importante y uno además bastante interesante por las implicaciones que tiene en humanos. Por las implicaciones que tiene además en un trastorno específico humano que es la depresión. Sirve como modelo o ha servido como modelo de depresión o como hipótesis sobre algunas de las causas o esos orígenes de la depresión. Tener en cuenta que la depresión es un trastorno multicausado. Tiene un montón, no solo de síntomas, sino de consecuencias sobre la conducta y también sobre otras situaciones. No es una cuestión de que la indefensión aprendida sea un modelo de todo lo que ocurre en la depresión, pero sí puede explicar ciertas cosas o ciertas observaciones que también se dan en personas con depresión, en personas que tienen un trastorno depresivo. Bueno, vamos a explicar qué es esto. ¿Qué es la indefensión aprendida? El efecto que descubrió Seligman, uno de los efectos más famosos en el aprendizaje. Bueno, pues es el efecto que ocurre cuando no tenemos control sobre las circunstancias o sobre las consecuencias adhesivas. Por ejemplo, si yo estoy en una caja de Skinner, imaginaos que tengo una ratilla en la caja de Skinner, y le empiezo a dar, tenemos un suelo electrificado, y le empiezo a dar descargas. Pero le doy descargas sin que ella pueda hacer nada para evitarlas. Simplemente le doy descargas y descargas y no puede ni escapar. Ni puede evitarlas de ninguna manera. Haga lo que haga, sigue recibiendo descargas. Incluso cuando salta, recibe descargas porque le ha enganchado la pata a otro electrodo. Es decir, no puede hacer nada. Haga lo que haga, siempre recibe descargas. Esto es una situación de falta de control. No hay ningún control sobre la situación. Y esto produce, como ya vimos en las consecuencias de los procedimientos con estímulos aversivos, conduce a ciertas... o produce ciertas respuestas emocionales. En este caso lo que produce es una respuesta emocional de pasividad. El animal deja de realizar cualquier conducta. Se para, frena, no hace nada, no tiene control sobre lo que ocurre, así que deja decidir, o decide, perdón, dejar de actuar. Eso es lo que se denomina... independencia aprendida. Y además este fenómeno se generaliza a situaciones que perciban como similares. Fijaros la similaridad que hay con el fenómeno de la depresión humana o con los síntomas de la depresión humana. En los trastornos depresivos las personas suelen dejar de realizar conductas, su nivel conductual desciende mucho y eso hace que también dejen de recibir reforzadores. Cuando estudiamos esto o cuando pensamos en depresión humana podemos pensar en situaciones en las que la persona ha perdido el control o siente que ha perdido el control sobre lo que ocurre y que empiezan a ocurrir cosas negativas, empieza a perder reforzadores, empieza a perder situaciones las que antes se sentía reforzado y que eran agradables, empieza a perderlas y no tiene control sobre ellas. Por eso habréis visto que muchas veces las depresiones van asociadas a ciertos eventos, ciertos eventos o a una conjunción de eventos. Pérdida de una pareja, muerte de un familiar, etcétera, etcétera. Situaciones en las que yo no puedo hacer nada, que no puedo controlar nada, estoy perdiendo reforzadores. O estoy recibiendo una estimulación muy aversiva y no puedo hacer nada para evitarlo. Esa situación puede provocar que yo deje de realizar conductas, que me vuelva pasivo ante todo el resto de situaciones. ¿Y qué ocurre si yo dejo de realizar conductas? Que pierdo todo el resto de reforzadores. Así que ¿qué es en lo que caigo? En una depresión he perdido todos los reforzadores, dejo de realizar conductas y entro en un círculo vicioso en el que cada vez recibo menos reforzadores y cada vez actúo menos. Por eso, En las terapias o en la forma de tratar la depresión, más allá de los medicamentos que sirven para situaciones puntuales y que tendrían un efecto distinto, más de elevar artificialmente o a través del principio activo, elevar el estado de ánimo para permitir volver a iniciar la rueda de la conducta. Pero las terapias psicológicas, por lo menos, y cognitivo-conductuales de la depresión se basan sobre todo en hacer cosas, en volver a la rueda de la conducta. Porque solo si actuamos obtenemos reforzadores. Y una de las cosas principales es volver a actuar para volver a obtener reforzamiento por la conducta. Y también para volver a obtener control sobre los reforzadores. Ver que nuestra conducta tiene un efecto, tiene consecuencias sobre lo que hay. Eliminar ese círculo vicioso y volver a actuar, volver a... A generar nuevas conductas y obtener nuevos reforzadores y reemplazarlos que ya no están por unos nuevos, sería una de las grandes bases de la terapia y del tratamiento de la depresión en este caso. Vamos a explicar un poco el experimento, cómo ocurre en animales, para que veáis la similaridad con este fenómeno. Imaginaros, tenemos en este caso tres grupos distintos. El grupo de escape, el grupo acoplado y el grupo control confirmado. Agárrate, es control confirmado. Finado, ¿vale? Es otra errata. Estoy descubriendo muchas erratas en los... Confinado, no confirmado. Nada de control confirmado. Bueno, os voy explicando uno por uno. Bueno, tenemos varias fases. Tenemos una fase de preexposición y una fase de aprendizaje del escape-evitación. Es decir, aquí lo que tenemos que aprender es a escapar de una situación a ver si... Pero antes del escape o de la evitación de esa situación aversiva voy a poner al sujeto en una serie de condiciones. En el grupo de escape lo que hago es someter al sujeto a una serie de descargas pero que puede controlar, es decir, puede escapar de ellas. Como si fuese un escape a evitación, por eso se llama grupo escape. El animal, la persona, lo que sea puede escapar de la situación aversiva. Su conducta tiene consecuencias sobre el entorno, puede controlar lo que ocurre. Así que se le somete a ese tipo de descargas pero de manera escapable. En el grupo acoplado, que es el grupo específicamente de indefensión aprendida, lo sometemos a descargas incontrolables. Lo que hemos hablado antes, se somete un animal a una serie de descargas de las que no puede escapar. De ninguna manera. Simplemente la recibirá una y otra y otra y otra vez. Y el grupo de control confinado simplemente se le mete o simplemente se le mete en la misma situación sin recibir ningún tipo de descarga ni hacer absolutamente nada. Simplemente está en la misma caja de esquina recibiendo los mismos estímulos excepto la descarga. Bueno, ¿qué hacemos después? Pues después sometemos a los tres grupos a la misma situación de aprendizaje. La presencia de una señal. En este caso, por ejemplo, podría ser una luz. Anticipa la aparición de una descarga y pongamos que en esta situación los sujetos pueden escapar de la descarga o pueden evitar la descarga si saltan de una zona de la jaula a otra, que es una zona segura. Así que siempre que aparezca la señal será. Siempre que aparezca la luz será una señal para saltar al otro lado de la caja y evitar la descarga. Bueno, pues en los grupos de escape el aprendizaje es normal, rápido. En el grupo confinado también, el que no ha sido sometido a ningún tipo de descarga. Además estos dos aprenden igual, aprenden de la misma manera, no hay diferencias entre ellos. Sin embargo, el grupo acoplado, el grupo que recibió previamente descargas que no eran controlables, tuvo un aprendizaje muchísimo más lento. No eran capaces de aprender esa asociación, tardaban muchísimos ensayos en aprender esa misma asociación, les costaba muchísimo más. El hecho de recibir esas descargas inescapables generaba una expectativa. La expectativa de que su conducta en otras situaciones similares no va a tener ningún efecto. Así que como les ocurría esto, generalizaban esa falta de control a las situaciones de aprendizaje y dejaban de actuar. ¿Veis la similaridad con las situaciones de depresión humana en la que generalizas esa falta de control, esa inescapabilidad de las situaciones aversivas a otras situaciones? Entonces dejas de actuar y dejas de obtener reforzadores, con lo que se agudiza todavía esa sensación de falta de control. No quiere decir que no pueda ocurrir el aprendizaje, de hecho ocurre, aunque tarde muchísimo. Y de hecho de la depresión se sale, aunque se tarde mucho y aunque cueste mucho, pero se puede salir de esos trastornos porque esto no es irreversible. Además hay situaciones que ayudan a eliminar esta sensación o a eliminar este efecto de indecencia de la aprendizaje. La más fácil, poner al sujeto en una situación en la que no puede fallar, situaciones de aprendizaje tan sencillas que no pueden fallarse. Por ejemplo, en los experimentos lo que se hacía en estas situaciones es, imaginaros que una rata, un perro, exactamente igual. En las situaciones en las que vi una descarga y el sujeto podía escapar pero no aprendía, lo que hacía el experimentador era coger al animal y ponerlo en la zona segura. Una situación en la que siempre evitaba la descarga o escapaba de la descarga, siempre, con independencia de su conducta. Esto ayuda a recuperar el control. Una de las claves es poner al organismo, al sujeto, al participante o al humano, lo que queráis, en una situación en la que siempre va a acertar, en la que siempre va a obtener. Eso ayuda a recuperar el control. Y también puede prevenirse, y esto es un tratamiento preventivo para situaciones futuras, exponiendo a la persona o al animal a situaciones en las que puede controlar más cosas. Con historia de control. Si la historia de falta de control provoca indefensión aprendida, la historia de control, la historia de que yo puedo controlar lo que me ocurre, que yo tengo la capacidad de control sobre lo que me ocurre, vacuna, palabra muy de moda ahora, por cierto, perdón para el chiste, pero palabra muy de moda, por desgracia, por cierto, vacuna contra la indefensión aprendida, contra la falta de control. Así que poner a las personas en situaciones de control... va a hacerlas mucho más resistentes a esa sensación de indefensión. Son dos procedimientos muy útiles tanto para recuperar como para evitar lo que pueda ocurrir en un futuro. Vamos con el siguiente, nos quedan dos fenómenos diferentes. El procedimiento de marcado, fijaros, este es un procedimiento interesante, está un poco más alejado de lo que solemos ver habitualmente, pero también es un fenómeno que nos ocurre usualmente aunque no nos demos cuenta de ello. ¿Qué ocurre con esto? Esto está muy relacionado con el fenómeno de demora del reforzador. Ya hemos visto tanto en el condicionamiento clásico como en el condicionamiento operante o instrumental que el momento en el que aparece el reforzador influye mucho en el grado de asociación que se establece entre la respuesta y la consecuencia, en este caso, en el caso del condicionamiento operante. Bueno, como regla general es mucho más difícil que algo quede reforzado, que una conducta quede reforzada, que se haga más probable en el futuro, ¿cuánto mayor sea el espacio de tiempo que pasa entre que yo hago la conducta o que yo realizo la conducta y ocurre el reforzador? Si queremos reforzar algo, lo mejor es hacerlo de manera inmediata. Es verdad que hay fenómenos en los que habría que ponerle peros a todo esto y que la situación es compleja, hay situaciones en las que no ocurre, recordad el caso del condicionamiento de la versión al sabor, que se saltaban todas estas reglas, pero en general suele ocurrir esto. Bueno, la cuestión es, la mayoría de los humanos... los humanos y los animales no obtenemos siempre los reforzadores en el mismo momento en el que realizamos las conductas, a veces hay demoras muy grandes. Tiene que ver con muchos fenómenos, incluso con reforzadores secundarios o con una cierta cadena de respuestas que se van reforzando secundariamente. Pero también hay un fenómeno muy curioso, que es el fenómeno de marcado. Un procedimiento que nos permite, o uno de los procedimientos que nos permite evitar el efecto de la demora. ¿Cómo podemos lograr que un reforzador sea efectivo a pesar de la demora que hay entre uno y otro? Fijaros, voy a explicaros el experimento para que veáis cómo es. El experimento es bastante sencillo. Tenemos dos grupos de ratas, el grupo de ratas A y el grupo de ratas B. Al grupo de ratas A le vamos a denominar al grupo de marcado y al grupo de ratas B es un grupo de control normal. Bueno, cogemos al grupo de ratas A. El experimento es súper sencillo. ¿Veis esta caja que hay aquí? O esta situación experimental, una especie de corredor recto pero con dos brazos. Bueno, las ratas salen de la caja de salida y llegan a lo que se denomina, la caja de elección. En la caja de elección ven dos brazos. Tienen una elección que realizar. Tienen un brazo negro y otro brazo blanco. Lo único que se diferencia es el color. La situación experimental es muy sencilla. Si pasan por el brazo negro, después al llegar a la meta tendrán comida. Si pasan por el brazo blanco, cuando lleguen a la meta no tendrán comida. Pero una vez que pasan por alguno de los brazos entran en una caja de demora, donde están un tiempo hasta que reciben la comida. Bueno, cuando se realiza este procedimiento, el típico del grupo de control, en el que no se hace nada más que esto. Las ratas pasan por aquí, están un tiempo en la caja de demora y después de un tiempo reciben el reforzador. cuando pasan por el brazo negro, recordad, solo cuando pasan por el brazo negro. Cuando pasan por el brazo blanco, nada. ¿Qué ocurre con este grupo? Bueno, pues que tras muchos ensayos su ejecución se mantiene en niveles de azar. Es decir, siguen pasando un 50% de veces por un brazo y otro 50% de veces por otro. No tienen muy claro por dónde pasar. Vale, ¿qué ocurre con las ratas del grupo marcado? Bueno, pues aquí es importante lo que se hace. En este caso, la única diferencia con el otro grupo es qué ocurre después de la elección. En el primer grupo, después de la elección, lo único que ocurría es que las ratas pasaban por el corredor y esperaban aquí. En el caso del grupo de marcado, una vez que toman su decisión y pasan a este brazo o a este brazo, el experimentador las coge y las pone en la caja de demora. Lo hacen todo igual. Tienen que esperar el mismo tiempo, tienen que tomar la misma decisión. La única diferencia es que el experimentador... El experimentador las manipula y las pone en la caja de demora. Tanto cuando pasan por el corredor negro como cuando pasan por el corredor blanco. Es decir, según entran aquí o aquí, se las coge y se las pone en la caja de demora. Bueno, pues ese grupo aumentó su nivel de ejecución hasta que al final pasaban más del 90% de las veces por el corredor correcto. Es decir, aprendieron que pasando por aquí se obtenía el refuerzo. ¿Qué es lo que ocurría en este caso? Bueno, pues la hipótesis es que... En este caso, el marcado, es decir, la manipulación, marcaba la respuesta. La respuesta es ir a un lado o a otro. Así que el hecho de coger a la rata, de manipularla, servía como marcado de la respuesta. La diferenciaba de otros eventos que podían ocurrir mientras esperaba. Todas las ratas hacían lo mismo. La única diferencia es que al grupo A se las manipulaba. Justo cuando revisaban la conducta recibían otra conducta o otro un estímulo de marcado. Es decir, marcaba esa conducta. Era mucho más fácil que quedase guardado de memoria asociado a esa elección y eso hacía que tuviese una mayor posibilidad de recuperarse durante la demora. Es decir, de asociar lo que aparecía aquí a la elección, a la conducta que se había realizado aquí. Por eso es un procedimiento de marcado. Un procedimiento en el que una conducta se marca, se pone una marca para luego recuperarla cuando aparece la consecuencia. Las diferencias de otras conductas o de otras cosas que puedan suceder en el espacio que hay entre que revisas la conducta y el reforzador. ¿Qué posible explicación alternativa hay aquí? Pues uno podría pensar, bueno, a lo mejor es que el marcado, el hecho de cogerla, funciona como un reforzador. A la rata le gusta que la cojas y eso es un reforzador secundario. Sin embargo, esto no es muy probable porque se puede descartar por el hecho de que las ratas se cogían, se manipulaban tanto cuando realizaban la elección correcta como cuando no. Así que... Si esto fuese así, asociarían como reforzador secundario de la manipulación tanto con las elecciones correctas como las que no. Así que les daría igual pasar por uno que por otro. Sin embargo, aprendieron a pasar solo por aquí aunque se las manipulaba Cuando realizaban las dos decisiones. ¿Veis? Marcar una respuesta, cualquier evento que marque una respuesta y que haga su disponibilidad mayor a la hora de recibir el reforzador cuando el reforzador es demorado. Bueno, y vamos con el último de los fenómenos, con el fenómeno de devaluación del reforzador. En este caso, esto consiste en asociar un reforzador específico a un estímulo o a una situación de naturaleza contraria. Imaginaros, esto sería un condicionamiento clásico, claro, esto sería, o la asociación sería un condicionamiento clásico. Imaginaros que asociamos la comida a un malestar, el cloruro de litio, recordad. ¿Qué producía malestar? Si os acordáis del condicionamiento de aversión a las aves. Si asociamos la comida al malestar, seguramente la comida se ve afectada con su valor como reforzador, ¿no? Bueno, pues esto es exactamente lo que ocurre. Vamos a ver qué ocurre aquí. Tenemos dos grupos. El grupo que se llama malestar y el grupo control. En el libro tenéis varios ejemplos. Yo he cogido uno en el que hay dos mecanismos, dos mecanismos diferentes que llevan a dos premios diferentes y cada uno se asocia a una situación diferente. Vamos a explicarlo un poquito. Bueno, tenemos una primera. Tienen dos mecanismos. De hecho, los mecanismos creo que en el libro queda explicado así. Tienen una cadena y una palanca. Si tiran de la cadena, obtienen agua con azúcar. Si tiran de la palanca, obtienen una bolita de comida. La situación es tal que se propone de tal manera que la rata no tiene preferencias por cada uno de ellos. Así que cuando le metes en esto, dice, uy, qué bien, tengo agua, tengo comida, puedo obtenerla libremente. Así que tira tantas veces de la cadena como pulsaciones de la palancada. No tiene ninguna preferencia por ninguna. Se reparte su conducta al 50%. Bien, ya tenemos esto. ¿Qué hacemos en una segunda fase? Pues en una segunda fase, imaginaros que asociamos, por otra parte, sin que tenga que realizar ninguna respuesta. Por eso pone aquí no contingente. En esta segunda fase, cogemos en el grupo de malestar, en el primero de los grupos, y asociamos el agua, es decir, les damos agua azucarada, que les encanta, sin que tengan que realizar ninguna respuesta. Esto es importante. No tienen que tirar de la palanca. Simplemente se les da agua. Se les inyecta cloruro de litio y, por tanto, después, malestar. El agua se ha asociado. Por condicionamiento clásico, al malestar. Sin embargo, la comida no. En el otro grupo, simplemente se les presenta agua y comida. Por cierto, en el primer grupo, en el grupo de malestar, se les presenta agua y también comida, pero solo el agua se asocia con el malestar. Es decir, cuando beben agua, después se les inyecta cloruro de litio para que se encuentren mal, pero cuando toman comida, no. Y no tienen que dar ninguna respuesta. En el otro grupo, simplemente tienen agua y comida, el platito y el comedero, pero no se asocia a ningún malestar. ¿Qué ocurre cuando vuelven a la caja de Skinner? Bueno, pues el grupo de control sigue con su conducta normal. Mitad de veces al agua, mitad de veces a la comida. Sin embargo, el grupo de malestar obtiene o da como resultado lo que se denomina devaluación del reforzador. El agua, por su asociación con un estímulo de naturaleza contraria, con el malestar, deja de tener valor como reforzador. Así que ahora, cuando le volvemos a meter en una situación de reforzamiento en el que tiene que realizar una conducta Para obtener una consecuencia, este reforzador ya no tiene el mismo valor que antes, así que la mayoría de las conductas van a la comida, a la palanca. Deja de realizar esta conducta porque el reforzador ha perdido su valor. Ves que los reforzadores no son absolutos sino que dependen de la historia con los mismos, depende del sujeto, depende del estado del sujeto y de las asociaciones previas y de la historia de reforzamiento el que el reforzador tenga un valor como tal o no lo tenga. En este caso tendríamos también dos situaciones porque este fenómeno puede revertirse a través de la práctica masiva, es decir, cuando uno practica de manera masiva una respuesta puede que aunque el reforzador se asocie con algo de signo contrario o con algo desagradable no se devalúe su valor. Fijaros, tendríamos dos tipos de situaciones, lo que se denominan acciones instrumentales Que son respuestas o acciones que varían en función de las consecuencias. Si la consecuencia es peor, dejo de hacer eso. Si yo he asociado ese reforzador con algo malo, dejo de hacer eso. Imaginaos que yo asocio el hecho de ganar mucho dinero en el trabajo aunque luego voy a tener que pagar muchos impuestos. Pues a lo mejor el ganar más dinero deja de ser un reforzador tan valioso para mí porque no quiero pagar más impuestos o porque lo veo de esa manera. Ves que depende de la historia del reforzador. Eso sería una acción instrumental. Mis acciones o la preponderancia... ...predisposición que yo tengo, el valor que tiene el reforzador para reforzar ciertas conductas depende de las consecuencias, depende del valor del propio reforzador. Así que las conductas se modifican por el valor del reforzador. Esto es la situación usual. Pero también hay otras conductas que se denominan hábitos. Todos sabéis lo que es un hábito. Son conductas que no dependen del valor del reforzador. Cuando una conducta se da durante mucho tiempo y de una manera usual, deja de ser dependiente del valor del reforzamiento. Pasa a ser mucho más rígida. Ya no depende de las consecuencias y empieza a depender simplemente del propio hábito de realizarla. Se sigue realizando aunque no se obtengan consecuencias claras de ella. Un ejemplo muy extremo es el consumo de drogas. Cuando al principio las drogas provocan placer, tiene sentido seguir realizando esa conducta. Sin embargo, cuando pasa mucho tiempo y las drogas solo provocan displacer, solo provocan malas consecuencias, uno se puede preguntar ¿por qué siguen consumiendo droga? Uno podría decir, bueno, por la adicción. Bueno, es una de las cosas, una de las variables que afectan la adicción. Aunque la adicción física no sería la más importante, había otras situaciones. Pero otra de las cuestiones que hay es que es un hábito, como el hábito de fumar. Todos habéis hablado de lo del hábito de fumar. No, sino fumo porque, simplemente fumo por el hábito, porque estoy acostumbrado. Otra situación sería, es una situación que había pasado varias veces, habrá pasado también. Cuando en algunas situaciones tenemos que ir a un sitio muchas veces, por ejemplo, en coche a nuestro trabajo, y vamos siempre por el mismo sitio. Y alguien nos dice, oye, sabes que si vas por este sitio vas a tardar mucho menos. Seguramente os hayáis sorprendido vosotros mismos diciendo, no, no, pero yo por aquí voy bien. Yo prefiero ir por aquí que en mi sitio, aunque claramente es peor, se tarda más y la otra opción es mejor y va a dar lugar a una mejor consecuencia, no resistimos hacerlo. Tenemos un hábito adquirido. peores todavía cuando vamos por un sitio cuando vamos a un lado y vamos de ida por un sitio y volvemos por el otro, se supone que si el camino de ida es el más corto será también más corto para la vuelta pero seguimos persistiendo entonces serían ejemplos de hábitos en este caso, bueno pues hasta aquí terminamos el tema 4 voy a daros un pequeño apunte sobre lo que vamos a ver en el tema 5 y terminamos y empezamos con este tema ya la semana que viene en este caso, ¿qué vamos a ver? bueno, pues vamos a ver o vamos a diferenciar el tema en dos partes por un lado, programas de reforzamiento y aquí vamos a ver los diferentes programas de reforzamiento parcial, también vamos a ver programas concurrentes programas secuenciales, es decir, programas de reforzamiento que ocurren uno detrás de otro o en secuencia o que solo ocurren una vez que se ha cumplido otro programa o programas alternantes que van alternando entre uno y otro o simultáneos en los que hay dos posibilidades de actuación vamos a ver también cómo funciona la conducta de elección en la segunda parte del programa es decir, cuando yo tengo dos opciones o varias opciones de reforzamiento posibles ¿cómo se distribuirá mi conducta? en función de las consecuencias y de los programas de reforzamiento asociados a cada uno de los reforzadores de qué tengo que hacer para obtener cada uno de los reforzadores y del valor del propio reforzador vamos a ver esas dos cosas en particular al principio de la semana que viene nos centraremos sobre todo en los programas de reforzamiento reforzamiento de razón fija y de razón variable también intervalo fijo y variable veremos que hay cuatro tipos de programas dos programas de intervalo Y dos programas de razón. Programas que, como hemos dicho antes, son programas de reforzamiento intermitente o de reforzamiento parcial. Estos son los más usuales. Programas en los que no siempre se refuerzan las respuestas. Os dejo como parte final un ejemplo de esto. Ya seguramente los conoceréis todos. Un claro ejemplo de reforzamiento parcial, uno de los más potentes y de los que llevan a las conductas más perseverativas y a mayor cantidad de conductas es, por ejemplo, jugar a las tragaperras. Es un programa de refuerzo variable. Se refuerza una respuesta de entre un número de respuestas determinado, pero no siempre el mismo, sino que varía entre un rango de respuestas. Ya veréis que este tipo de programas son los que dan lugar a una tasa de respuesta más elevada y también, recordad, a los niveles de resistencia a la extinción más elevados. Así que lo vamos a dejar aquí para empezar con los programas la semana que viene desde cero. Os recomiendo, si podéis, ya que vamos a tener que dar atentos. Hay una tutoría también online y, por lo menos hasta el 11 de abril, ya sabéis, hasta después de Semana Santa como poco. Os recomiendo que, ya que tenéis los documentos, que veáis al menos los vídeos de los programas de reforzamiento, de los cuatro programas principales de reforzamiento. Así, por lo menos, bueno, ya cuando lo explique ya lo tenéis visto. Son bastante interesantes. Ya veréis como hay situaciones bastante curiosas. Algunas son de la vida real, personas administrando a sus perros y otras son de laboratorio. Así que nada, lo dejamos aquí. La semana que viene continuamos. Desde este punto espero terminar en dos tutorías el tema 5 y, de momento, no vamos mal en cuanto a la cantidad de Mario. Y a ver si nos sobra también alguna tutoría y esperemos que pueda ser presencial para dar las partes prácticas antes de... Si hay exámenes, exámenes o de lo que ocurra, ya veremos lo que va ocurriendo. Os iré informando de todas maneras. Así que nada chicos, muchísimas gracias y nos vemos la semana que viene.