Pues ya está. Yo creo que esto está grabando ya y si no lo estará en breve. Estupendo, así que buenas tardes nuevamente y bueno pues aquí estamos para seguir un poquito más avanzando en nuestro recorrido por los principios del aprendizaje y del condicionamiento. Y bueno, como ya os comenté voy a intentar ir un poco más rápido en este tema para dedicarle pues las clases que nos quedan, al menos tres o cuatro, bueno que son las que nos quedan, al tema cinco que es bastante más complejo y también una clase a las actividades formativas complementarias, las que son obligatorias. Porque por lo que vimos, pues las complementarias no van a ser evaluadas puesto que no reduce el tiempo del examen. ¿Si no ha habido cambios? ¿No ha habido cambios? No, creo que no. Muy bien, pues nada, no sé si tenéis en primer lugar alguna duda, alguna cuestión de lo que hemos visto hasta ahora. Algo que queráis quizás aclarar y si no pues podemos seguir un poquito avanzando. ¿Cómo lo veis? Sí, es claro, son clases, claro, dicen que por ahí que sería, que es diferente. Efectivamente no, es otra parte de los principios del aprendizaje y del condicionamiento en la que importan muchas cosas. Son las consecuencias y las conductas que emite el organismo para alcanzar o repeler esas consecuencias. En ese sentido, claro, que es diferente del condicionamiento a clase. Bueno, pues estupendo. En realidad es que este tema tampoco es tan complicado. Bueno, estábamos viendo esto. Esta tabla de aquí, como os decía en la clase anterior, es súper importante. La van a preguntar seguro, seguro, seguro, seguro. Así que tenéis que tenerla. Muy, muy clarita, ¿de acuerdo? Hago un pequeño resumen rápido para luego ya seguir avanzando. Mirad, esta tabla lo que hace es resumir los procedimientos para generar un aumento o una disminución en la conducta a través de procesos de aprendizaje. Y esos dos procesos de aprendizaje se resumen en los dos conceptos que tenéis aquí. El refuerzo por un lado y el castigo por el otro. El refuerzo es aquel procedimiento que tiene como consecuencia un aumento en la probabilidad futura de la conducta. Mientras que el castigo es todo lo contrario. Es aquel procedimiento o proceso de aprendizaje que tiene como resultado un descenso en la probabilidad futura de la conducta. ¿Vale? Eso es lo primero que tenéis que tener en cuenta. Que los procedimientos de conocimiento operantes se definen por las consecuencias. Las consecuencias que tienen sobre la conducta. Será reforzamiento o refuerzo si la consecuencia es un aumento en la probabilidad de la conducta y será castigo si la consecuencia es un descenso en la probabilidad futura de la conducta. Eso es lo primero. El segundo elemento que tenéis que tener en cuenta para entender bien esta tabla es la contingencia que existe entre la conducta y la consecuencia. Si la contingencia es positiva, es decir, si hay una contingencia, una relación positiva entre la conducta y la consecuencia, es decir, siempre que se dé la conducta va a ocurrir la consecuencia y nunca que se dé la conducta va a ocurrir la consecuencia, pues estaremos hablando de procedimientos positivos porque la contingencia es positiva. Mientras que si la contingencia es negativa, esto querrá decir que cuando ocurra la conducta no ocurrirá. No ocurrirá la consecuencia y cuando no ocurra la conducta ocurrirá la consecuencia. ¿De acuerdo? Entonces, teniendo en cuenta estos dos elementos de si es un refuerzo o es un castigo, es decir, si el procedimiento aumenta la probabilidad futura de la conducta o si lo disminuye y si la contingencia es positiva o negativa, podemos entonces entender esta matriz de doble entrada, esta tabla de doble entrada por la que se definen los diferentes procedimientos del condicionamiento operante, condicionamiento instrumental. Entonces, si tenemos un procedimiento en el que yo aumento o busco aumentar la probabilidad futura de la conducta con una contingencia positiva, estamos ante un refuerzo positivo. ¿Esto qué quiere decir? Si, no sé, si mi hijito se lava las manos antes de comer, le doy un premio. Pues, no sé, le dejo que repita el postre, imaginaos. Eso es una contingencia positiva. ¿Ocurre la conducta? Es una consecuencia y a la vez tiene el efecto de aumentar la probabilidad en el futuro. Si lo que hago es que, no sé, a una rata cada vez que presiona la palanca le doy una descarga eléctrica, pues lo que pasa es que disminuye la conducta porque hay una contingencia positiva. La presión de palanca es la consecuencia negativa, ¿no? O sea, la consecuencia aversiva mejor. Dicho para no liarnos. Hay una contingencia positiva entre un evento y la consecuencia, pero lo que hacemos es reducir la probabilidad de conducta, por lo tanto estamos ante un castigo positivo. El refuerzo negativo es cuando buscamos aumentar la probabilidad de la conducta en el futuro, pero con una contingencia negativa. En este caso, por ejemplo, creo que os comentaba el caso de los adictos, las personas que tienen alguna adicción, que en fases avanzadas de su trastorno, buscan, consumen la sustancia para que no ocurra el síndrome de abstinencia. Hay una contingencia negativa entre la conducta, inyección de la droga, y la consecuencia, síndrome de abstinencia. Y esto hace que un poco se perpetúe la tendencia a repetir la conducta en el futuro, ¿vale? Por otro lado tenemos el castigo negativo, un procedimiento que busca o que contiene por consecuencia, reducir la conducta en el futuro, pero quitando algo. Pues por ejemplo, imaginaros yo cuando tengo miedo a hablar en público, ¿qué hago? Lo evito, ¿vale? Entonces mi conducta es, por ejemplo, de huida. Yo estoy, imaginaros, o de evitación, ¿no? Me invitan a dar una charla, pero yo tengo miedo a hablar en público. Entonces rechazo la invitación, evito la situación, me siento seguro y seguramente vuelva a rechazar las invitaciones. ¿Vale? ¿Qué pasa? Esa conducta de evitación se refuerza negativamente porque ha evitado una consecuencia negativa. Ah, bueno, perdón, y está el castigo negativo, que me he saltado, perdón. El castigo negativo es cuando... Cada vez que... Es cuando elimina algo positivo. Por ejemplo, si mi hijo o mi hija suspende el examen, le quito la consola. ¿Vale? Hay una contingencia negativa entre suspender y tener disponible la consola. Entonces yo estoy quitando algo. Estoy entrenando, estoy, pues eso, eliminando algo que es positivo, ¿no? O, por ejemplo, cada vez que los niños... Esto se utiliza también quizás en análisis de conducta aplicado en niños y niñas que tienen algún trastorno del espectro autista. A lo mejor si se hacen autolesiones, pues cada vez que esa conducta no ocurre, doy un premio, ¿de acuerdo? Intento evitar algún entrenamiento, como tenéis ahí, en omisión, en que se omita esa conducta que es problemática. Así las cosas. Tenemos esta... Esta tabla que describe los procedimientos del condicionamiento operante. Y tenéis que tenerla muy, muy clarita, ¿de acuerdo? Estos son aquí estos procedimientos y un poco la tabla de doble entrada o un poco la matriz de probabilidad de conducta y de contingencia que los genera, ¿de acuerdo? Así que esto, clarísimo. Por favor. Estos son los dos elementos que tenéis que tener claro. Muy bien. Bueno, pues entonces... Habiendo visto esto, tenemos que dentro del condicionamiento operante también hay extinción. Es cuando ocurre la respuesta, pero deja de haber consecuencia. Entonces, bueno, pues aquí tenemos una línea de base. Bueno, imaginaros, pues eso, un niño que cada vez que va a la esquina después de salir del colegio siempre está el camión de los helados y normalmente pues consigue un helado porque se lo compra su mamá. Y cada vez más. Y lo que pasa es que de repente un día van a donde está el camión de los helados y deja de estar. Y entonces, ¿qué ocurre? ¿Qué ocurre? Es muy probable que... Dice mamá, mamá, pero vamos a volver. Dentro de cinco minutos ha venido. Vamos a ver dentro de cinco minutos a ver si ha venido el camión. Hay un incremento momentáneo de la conducta que corresponde a esta parte que es el estallido de la extinción, que aumenta mucho más. Pero luego ya, pues cuando ya se dan cuenta de que cada vez no viene, pues la conducta tiende a desaparecer. Es verdad que... Y esto es cada vez que se emite la conducta. Si se pasa un tiempo sin emitir la conducta, un tiempo largo, de repente puede haber una recuperación. Una recuperación espontánea, ¿vale? Puede que se olvide el entrenamiento en extinción, como está aquí puesto, ¿de acuerdo? Si a lo mejor están las vacaciones de verano y el niño o la niña no puede ir al sitio donde está el camión de helados y darse cuenta que no está porque a lo mejor ha cambiado el recorrido, ya no va a esa zona. Y de repente pasan tres meses, el niño está en vacaciones y no va. Y luego a la vuelta al cole es muy probable que digan, vamos a volver, vamos a ver si está, ¿de acuerdo? ¿De acuerdo? Que haya una especie de surgimiento, una recuperación espontánea. Bueno, pues eso es un poco lo que tenéis, que la extinción en el condicionamiento clásico es fácil y de nuevo, perdón, en el condicionamiento operante, es insistir sobre el hecho de que no quiere decir que se olvide la asociación previa, sino que se superpone un aprendizaje encima del anterior normalmente compitiendo con la respuesta y viviendo la respuesta adquirida previamente. Bueno, ¿hay alguna pregunta? ¿Hay algunos factores que están relacionados? No todos los individuos se extinguen igual, ni todos los programas de reforzamiento con los que ya veremos en el tema que viene, están asociados al mismo patrón de respuestas ni tampoco a la misma extinción. Depende de cómo se haya entrenado la conducta, costará más o menos extinguirla. Esto tiene mucho sentido. Si a ti de vez en cuando te da un caramelo, bueno, pues ya está, menos que si te da un caramelo todos los días. Vas al principio, vas a extinguir más lento, lo que pasa es que luego veremos que se extingue más rápido, ¿no? Y esto es un poco la diferencia entre la extinción en función de si hemos adquirido la conducta mediante un reforzamiento continuo o mediante un reforzamiento intermitente. Fijaros, si se ha adquirido la conducta mediante un reforzamiento intermitente, costará más extinguirla, más, no menos, más. ¿Por qué? Porque fijaros. Si te tiene la costumbre. Si te ha dado a que de vez en cuando vas al camino de los helados y unas veces sí está y otras no, bueno, pues cuando deja de estar al principio puedes pensar, ah, pues es que es de estas veces que no está. Y así varias veces hasta que te das cuenta de que ya no va a venir, ¿de acuerdo? A mí me acuerdo, recuerdo cuando al principio de los canales de televisión, que ya no era ni la una ni la dos, pues de vez en cuando era una locura con las series de dibujos animados y ponían, no había ninguna regularidad. Entonces, pues yo iba los lunes a ver mi serie de dibujos animados que me gustaba, no sé si a los caballos del zodiaco. Oye, pues a veces no estaba porque habían puesto, pues yo qué sé, la corrida de toros o el partido de fútbol, pero no es que lo hubieran quitado. Entonces, yo estaba ahí, había unos lunes que sí y otras veces que no. ¿Y qué pasa? Claro, hasta... Y un día dejaron de emitir la serie que me hicieron la puñeta. Pues, ¿qué pasa? Estuve yo todos los lunes viendo a ver por qué, por qué, y creo que habían puesto más un recuerdo automático, un programa de tertulias. Imaginaros, un chaval de diez años. Le quitan su serie de televisión por un programa de tertulias. ¿Pero qué pasa? Que como al principio no había ocurrido siempre, era un poco aleatorio, pues yo estuve muchísimo tiempo tragándome las tertulias hasta que me di cuenta de que aquello no iba a volver. ¿De acuerdo? Entonces, claro, tiene más sentido que un programa de reforzamiento intermitente genere más resistencia a la extinción. Bueno, pues, no sé si hay alguna cosa más que se me olvida aquí, pero bueno, eso es un poco quizás lo que más tenéis. ¿Qué ver? Existen, como también tenéis ahí puesta la diapositiva, dos teorías diferentes que han intentado explicar por qué los programas de reforzamiento intermitente generan más resistencia a la extinción, tal y como tenéis un poco en este diagrama de aquí. Fijaros que va desde el reforzamiento continuo hasta el reforzamiento intermitente y del continuo al intermitente, pues cada vez hay más resistencia. A la extinción, ¿no? Y, como os digo, estas son las dos teorías, la discriminación entre fases de refuerzo y extinción y el contacto con las contingencias. El caso es que en la discriminación entre fases de refuerzo y extinción es un poco lo que os decía. En las primeras fases de extinción el organismo, entre comillas, lo estamos un poco antepormorfizando, pero puede pensar que está en esas fases de refuerzo intermitente en las que no hay reforzador y todavía no sabe que está. O no se ha dado cuenta, ¿no? Que está en una fase de extinción en la que nunca más va a haber reforzador. Esa es una teoría y el contacto con las contingencias en la que, bueno, pues que en la... Claro, en el reforzamiento intermitente hay menos contacto con la contingencia que con el reforzamiento continuo, ¿no? Y entonces eso hace que durante la extinción también haya esa diferencia en el contacto con las contingencias, ¿no? Hasta que... La contingencia conducta ausencia de reforzador ocurre cada muchos más ensayos en los programas de reforzamiento intermitente que los programas de reforzamiento continuo en los que cada vez que se presiona una palanca y no viene el reforzador, se asocia a esa ausencia de reforzador porque antes, cada vez que había una presión de palanca, sí había reforzador, ¿de acuerdo? Entonces... Cada contingencia negativa durante la extinción tiene un correspondiente en la adquisición y se computa mejor la extinción, ¿de acuerdo? Bueno, pues eso es un poquito así, lo podéis ver. Este tema también del reforzamiento intermitente es muy curioso porque se aplica perfectamente a las conductas supersticiosas y a esas conductas supersticiosas que tenéis ahí en el experimento clásico de Skinner del condicionamiento. Es un experimento occidental o adventicio, ¿vale? Es un experimento interesante. Yo creo que podéis leerlo y os lo pueden preguntar, ¿eh? No quiere decir que no sea importante, pero bueno, yo creo que es fácil. Sencillamente que cuando hay un reforzamiento que es un reforzador que cae continuamente cada X tiempo, en este caso los sujetos eran palomas, pues justo lo que la paloma por azar estuviera haciendo cuando cayó el reforzador va a reforzarse accidentalmente, adventicialmente. Y esto hace que en cada paloma, en cada una de las tres palomas que tenía Skinner, pues hubiera patrones de conducta muy diferentes, ¿no? Porque cada una, las primeras veces que caía el reforzador, les pillaba haciendo algo distinto. Y bueno, esto también además llama la atención a la diferencia entre lo que son las conductas terminales y las conductas de ínterima. Las conductas terminales son aquellas que como tenéis aquí en azul, en el gráfico que tenéis aquí debajo que ha puesto Marco. Son las que van a ocurrir cerquita de la aparición del reforzador. Mientras que las de ínterima son las que también se llaman de espera y son las que ocurren después del reforzador hasta que se va acercando la caída del siguiente reforzador. De tal manera que justo cuando ha caído el reforzador, lo que hay más probabilidad es que haya conductas de ínterima, de espera, porque ya se sabe que ha caído el reforzador. Pero cuando está inminente su llegada, lo que hay son muy... Muchas más conductas terminales, ¿de acuerdo? Y estos son dos patrones de conducta distintos que pueden ser modificados muy diferentemente por ejemplo el condicionamiento intermitente, los experimentos del condicionamiento ambiental. Pero tened muy clara esa diferenciación entre conductas de ínterima y conductas terminales y cuáles son cuáles. Las terminales son las que ocurren próximas a la aparición del reforzador y las de ínterima son las que ocurren en medio, entre un reforzador y otro y sobre todo cuando aparecen el reforzador, pasado ya uno hasta que viene el siguiente, ¿vale? Bueno, lo que ya aquí se cuenta en el tema son más fenómenos importantes para conocer en el tema del condicionamiento operante y uno de ellos es la deriva instintiva. La deriva instintiva es un poco... A veces es difícil luchar contra los instintos de la naturaleza, ¿no? Es un poco el resumen. Y es que hay tener... Tenéis este matrimonio que intentaba enseñar de manera muy sistemática y mediante procedimientos del condicionamiento operante diferentes conductas a diferentes especies de animales. ¿Y qué pasa? Que al final es verdad que hay un cierto éxito en conseguir entrenar estas conductas. Por ejemplo, aquí a este cerdito echar una moneda en una hucha. ¿De acuerdo? Pero al final la deriva instintiva lo que dice es que el instinto de esa especie animal se superpone al aprendizaje y al final esas conductas se pierden y se sustituyen por otras que son típicas de la especie. En el caso de los cerdos, pues no sé qué, imaginaros enterrar la moneda o mortisquearla o lo que sea, ¿vale? Eso es el fenómeno de respuesta, de deriva instintiva. Hay, como lo tenéis definido, que aparecen de repente respuestas innatas, típicas de la especie que tienen cierta relación con el reforzador, por ejemplo, este objeto brillante, ¿no? Pues enterrarlo o, bueno, lo que sea. Y que compiten con esas que nos ha costado tiempo instaurar en el organismo mediante los procedimientos del condicionamiento instrumental, ¿de acuerdo? Esa es la deriva instintiva, vamos, que al final los cerdos son cerdos en el sentido de que tienden a hacer lo que su instinto... Porcino, pues les dicta, ¿no? Y lo mismo, pues, con los mapaches, ¿no? Ese fenómeno de deriva instintiva que es interesante y que hay que tenerlo en cuenta sobre todo cuando se trabaja con especies con poca domesticación, ¿no? Otro fenómeno muy, muy, muy interesante, muy interesante y os recomiendo que lo estudiéis porque lo están estudiando ahora bastante en el laboratorio de conducta animal. Entonces, pues a lo mejor os lo preguntan por eso. ¿No? Pues porque están investigando mucho sobre ello ahora y, bueno, pues entonces lo van a tener en la cabeza. Es esto del contraste conductual. Y, básicamente, el resumen, lo que quiere decir el contraste conductual es que el valor de un determinado reforzador no depende intrínsecamente de su valor absoluto, por ejemplo, de que tengamos 500 euros. El valor de un reforzador también depende de nuestra historia previa, de reforzamiento, en el sentido de que, imaginaros, yo paso de tener 1000 euros a tener 500 o si paso de tener 20 euros a tener 500 y luego con esos 500 me intentan reforzar una conducta. Oye, pues si yo he pasado de 1000 a 500 o de 20 a 500, esos 500 euros con los que me van a reforzar la conducta no van a tener la misma eficiencia. Van a ser peores reforzadores. Van a ser peores reforzadores en los sujetos que han pasado de 1000 a 500 y mucho mejores en los que han pasado de 20 a 500. Y los que tenían 500 y se quedan con 500 pues van a tener la intensidad de referencia estándar, ¿no? Eso es lo que se llama el contraste conductual sucesivo que puede ser negativo si vamos de más a menos o positivo si vamos de menos a más. O de... sí, de menos a más. Aquí tenéis, por ejemplo, cómo esto se puede... Esto yo digo que es un contraste conductual. Digo, este tipo de experimentos se han estudiado muchísimo porque es un modelo de frustración también. Esa pérdida de lo que nos gustaba ese... Pues al final sí, nos deja con algo que no es que esté mal pero claro, no es lo mismo. Y eso se supone que elicitan los animales cuando lo inducimos a un estado de frustración bueno, pues que lo están estudiando bastante parece ser que se reduce con fármacos ansiolíticos como las benzodiazepinas que tiene efectos reforzadores sobre la conducta. Aprendizaje, perdiferenciales... En fin, se está caracterizando bastante y ya os digo, el profesor Ricardo Pellón en colaboración con un grupo de Jaendra el profesor Carmen Torres y también con un profesor de la universidad de una universidad en Texas Mauricio Papini bueno, pues lo están caracterizando bastante. Aquí tenéis un experimento en el que bueno, tenemos un grupo que tiene un reforzador pequeño y se queda... queda en el reforzador pequeño tenemos un grupo que tiene un reforzador pequeño y pasa a un reforzador grande otro que tiene uno grande y se queda en grande y otro que tiene uno grande y se queda en pequeño es decir, aquí no hay cambio no cambio, NC aquí tampoco hay cambio, NC y aquí hay un contraste conductual sucesivo que este es positivo vamos de pequeño a grande y este es negativo vamos de grande a pequeño ¿vale? Pasamos, en este caso de dos bolitas a dos bolitas en este caso de dos bolitas de comida a veintidós bolitas aquí nos quedamos con las veintidós bolitas en los dos casos y aquí pasamos de veintidós a dos y fijaros que tenemos dos condiciones en las que miramos la conducta con dos bolitas y otras dos condiciones con veintidós pero dentro de cada una de ellas en una no hay cambio y en otras bueno, pues aquí tenemos un cambio tenemos un contraste positivo y uno negativo y fijaros, aquí lo que se hacía era reforzar la carrera o sea, en un no me sale, en un pasillo sí, en un laberinto pero que es de un laberinto recto en un corredor al final había, pues se ponía este reforzador habiéndoles pasado por estas condiciones de contraste y claro, fijaros voy a borrar para que lo veáis mejor aquí tenemos en ambos casos dos bolitas de comida y dos bolitas de comida pero curiosamente en los que no hay cambio es decir, se quedan pequeños hay la misma velocidad en todas las carreras mientras que aquí que pasamos de grande a pequeño hay una disminución ¿vale? y aquí que tenemos veintidós bolitas de comida pero que ya las teníamos previamente no hay cambios en la velocidad de la carrera y aquí fijaros que pasamos de dos a veintidós claro que hay un aumento con el cambio del reforzador ¿de acuerdo? o sea que no es tanto que tengamos dos bolitas de comida o veintidós sino que hayamos pasado de mucho a poco o de poco a mucho eso es el contraste conductual y como os digo es un fenómeno muy interesante se está estudiando mucho a nivel psicobiológico ya os digo esta colaboración que tiene el profesor Ricardo Pellón con la profesora Carmen Torres y el profesor Mauricio Gaviria ¿vale? y yo os animo a que lo yo cuando esto lo estudié en su momento hace ya tantos años en la carrera me pareció un fenómeno súper interesante bueno otro fenómeno súper interesante de el condicionamiento operante y que tiene una grandísima aplicabilidad a la psicopatología sobre todo a los trastornos depresivos es la indefensión aprendida y de una manera más general el control que nosotros percibimos que tenemos sobre nuestra conducta ¿de acuerdo? eh primero os cuento una especie de aplicación real y luego los experimentos en los que se se fundaron ¿no? en perritos bueno pues fijaros en general y esto fue Martin Seligman eh que fue que ahora es un poco el fundador de todo movimiento que se llama de psicología positiva muy interesante eh que dice este movimiento de psicología positiva que en realidad la psicología no debería descentralizarse ni conectarse única y exclusivamente en remediar las alteraciones psicológicas sino más bien de manera primera y quizás principal de potenciar los aspectos positivos y las fortalezas psicológicas de las personas obviamente también tratar aquellas personas que tienen están pasando por malas rachas que tienen algún trastorno eh de naturaleza psicológica pero que la psicología debería potenciar sobre todo las fortalezas humanas ¿no? esa es la psicología positiva bueno mucho más complejo obviamente os recomiendo que si os interesa pues también leáis los últimos libros de Martin Seligman pero hace ya muchos años Martin Seligman en realidad se le conoció porque fue el que un poco descubrió este fenómeno de indefensión aprendida que os voy a contar y básicamente consiste en que si yo tengo la percepción de que no tiene ningún sentido lo que haga que las consecuencias van a ser las mismas es decir que yo no tengo control sobre las consecuencias de mis acciones entonces genero ese estado de indefensión de que no me de helplessness es en inglés ¿no? como bueno pues desesperanza ¿no? y entonces dejo de actuar pierdo la la esperanza dejo de actuar y en y bueno pues eso parece que lleva a la depresión si haga lo que haga eso pasa un poco con con los males del mundo ¿no? la gente piensa que haga lo que haga en el devenir de los acontecimientos y eso genera ese estado de desesperanza aprendida en el que que deriva en depresión pero fijaros toda esa teoría que es un poco más compleja en seres humanos deriva de estos experimentos en perritos yo creo que estos son son millions o son teclas el caso es que fijaros había tres grupos en este experimento había un grupo de de perritos en los que pues se les tenía sujetos pero podían evitar una descarga eléctrica pues saltando cuando se les iba a encender una luz que les avisa dice ojo cuidado que entre tres segundos si no saltas pues te llevas una descarga así que perrete y salta y saltaba al otro lado ¿no? ese es el grupo que se llama grupo de escape que puede prevenir o parar la descarga puede prevenirla saltando a otro lado escapándola o una vez que ha ocurrido si salta pues también paraba la descarga ¿no? luego había otro grupo y este es el interesante que no podía hacer nada su conducta no servía para evitar las descargas eléctricas tenían descargas que estaban acopladas a los del grupo de escape de tal manera que si los en otras cajas en otras habitaciones los perros del grupo de escape por lo que sea no escapaban la descarga a estos pobres perros que se llamaban acoplados les iban a dar una descarga eléctrica y luego tenían un control un grupo de control que estaban igual sujetos o sea podían saltar y hacer lo que sea y nunca recibían descargas eléctricas estos son los tres grupos bueno pues el grupo acoplado es decir el grupo que no tenía niña control sobre su conducta desarrolló todo un síntome es decir un conjunto de síntomas de conductual de apatía de pérdida de peso alteraciones inmunes etcétera que luego se vio que era muy compatible con lo que pasaba en los seres humanos que tenían depresión ya no querían andar no querían habían perdido la esperanza ahora estoy a decirlo un poco llevando este concepto quizás humano entonces fijaros luego ya cuando aquí estos son los resultados del experimento el caso es que el grupo acoplado tenía un aprendizaje muy lento es decir no pensaban entre comillas los perros si es que podemos antropomorfizarlos de esa manera que pudieran escapar después en una fase en la que a todos los grupos ya sí se les permitía escapar las descargas era un aprendizaje muy lento de acuerdo fijaros aquí cómo el grupo acoplado tenían muchos más veces que no consiguían escapar es decir ensayos fallidos que obviamente el grupo que ya había aprendido que sí que podía escapar y que el grupo que había estado ahí sin nunca tener posibilidad de descargas pero rápidamente cuando le dieron las descargas pues dijo ostras esto yo me salto aquí para no pero fijaros la poderosa diferencia entre estos dos vale el grupo acoplado había perdido la esperanza de que su conducta pudiera evitar las consecuencias negativas y como os digo como os digo este experimento sirvió un poco para estudiar las bases del aprendizaje que podían sustentar los trastornos depresivos y fue muy interesante porque permitió además diseñar estrategias conductuales para proteger a los individuos de esta desesperanza aprendida de esta indefensión aprendida de manera que bueno pues hay muchísimos y en esto se basa toda la gran parte del abordaje conductual contra la depresión por lo menos en esa época clásica ahora hay alternativas un poco diferentes que parece que quizás funcionan mejor pero bueno pues un poco enseñando que siempre hay estrategias de control de retomar el control sobre la conducta incluso cuando la percepción es que no se tiene control sobre la misma etcétera ya os digo que fueron unos experimentos muy importantes contribuyó muchísimo además a generar esta especie de modelo animal de trastorno depresivo que luego pues sirvió para estudiar las diferentes alteraciones tanto conductuales como biológicas que se daban y también para explorar nuevos fármacos o sea que este experimento de la indefensión aprendida como os digo pues tiene pobrecito este perro qué pena que da tiene muchas aplicaciones no sólo en el campo de la conducta animal sino pues en el caso de los seres humanos también y este tema ya acaba explicando un poco otro otro fenómeno interesante del condicionamiento clásico perdón el condicionamiento operante el condicionamiento instrumental que es el procedimiento demarcado el procedimiento automarcado es un procedimiento que se da en los cuando estamos generando estamos intentando implementar un procedimiento de condicionamiento operante pero que hay una gran demora entre la conducta y la consecuencia de acuerdo es decir se da la presión de palanca pero tardan 5 minutos en caer la bolita de comida entonces claro ahí el establecimiento de las contingencias se dificulta muchísimo hay mucha demora entre la conducta y la consecuencia evitando el establecimiento de la contingencia bueno pues este procedimiento demarcado es un procedimiento que se puede implementar para un poco hacer de puente durante la demora entre la conducta y la consecuencia y que luego se restablezcan esos lazos de contingencia el procedimiento demarcado en algunos casos es tan sencillo como llamar la atención del sujeto sobre lo que acaba de hacer o en general incrementar su estado de activación fijaros este experimento tan sencillo pues nada con ratitas tenemos aquí un laberinto en la que hay una caja de salida aquí está la ratita y tiene una puerta tipo guillotina que si abre y se cierra pues le abrimos sale la ratita aquí y tiene que elegir tiene un brazo negro o un brazo blanco y entonces va por aquí en función del que elija pasa una cosa u otra y bueno pues llega al siguiente compartimento que se les deja pues una demora imaginaros cinco minutos diez minutos entran en la caja de meta donde está la recompensa pero claro fijaros todo el tiempo que pasa entre que hacen la elección hasta que reciben la consecuencia hay una gran demora bueno pues lo que se hizo aquí para ver el procedimiento de marcado fue que en un grupo me parece que eran los que elegían el brazo negro se les cogía del cuerpo a la ratita y se le transportaba hasta la caja de demora me parece que era así mientras que los del brazo blanco pues no estaban ahí y llegaban o era de la caja de demora a la meta cosa es que el procedimiento de marcado consistía en coger al animal el cuerpo y ese estado de activación que bueno les da un pequeño susto imaginaos una mano gigante que te coge y te lleva a otro sitio pues hombre es raro como cuanto menos bueno pues ese procedimiento de marcado hacía que fijaros en los animales estos pues había más porcentaje de respuestas correctas es decir escogían más el brazo que les llevaba a la presencia del reforzador frente a los que llevaba a que no hubiera reforzado eso es el procedimiento de marcado vale y un poco se resume lo que tenéis aquí que el marcaje de la respuesta se hace de tal manera que esto hace que haya un estímulo contingente a la misma en este caso cogerle con el brazo y eso reduce el efecto de la demora bueno pues eso es el procedimiento de marcado es bastante sencillo pero bueno es un procedimiento que también merece la pena que conozcáis dentro del condicionamiento instrumental como lo veis tenéis alguna duda hasta ahora estáis muy callados bien sí verdaderamente este tema pues es es sencillito hay yo pensaba que con esto acababa el tema me parece que esto no ha puesto marcos bueno el el procedimiento de devaluación yo creo que no sé si está antes porque yo juraría que con el procedimiento de marcado acababa el tema ah vale pues es que pensaba que era lo último lo del marcado bueno pues devaluación del reforzador es otra cosa que esto también es súper importante súper importante porque se está investigando mucho con esto de la devaluación y y ahora os voy a explicar varias cosas que yo creo que os puede interesar vamos a ver la devaluación del reforzador es cuando intentamos devaluar la consecuencia que tiene vale y por qué es importante esto pues mira tradicionalmente se asume que hay como dentro de los sistemas de respuesta hay de los sistemas de conducta que todo esto que estamos explicando ahora mismo del condicionamiento instrumental es dentro de lo que se llama un sistema voy a borrar esto de respuesta consecuencia oro lo de lo es porque es en inglés que es outcome vale espera que voy a ponerlo dentro de así bueno más o menos como lo puedo escribir con el ratón y entonces se supone que este sistema en el condicionamiento instrumental la respuesta va a estar guiada por la consecuencia por el outcome por la meta vale de tal manera que si estamos dentro de este sistema de respuesta que es el que se supone que tradicionalmente es el que guía todo el condicionamiento instrumental que hemos visto hasta ahora pues si esta si este outcome si esta meta pierde su valor pues entonces habrá menos respuestas para conseguirlo de acuerdo y este tipo de experimentos son los que se hacen con lo de la devaluación del reforzador manipulando el valor del reforzador para ver su consecuencia sobre la conducta instrumental que se supone que le tiene que conseguir y como os decía esto es importante porque hay dos sistemas de respuesta este que hemos visto pero luego hay otro que es el que supuestamente es el que guía el condicionamiento clásico de estímulo respuesta es un condicionamiento respondiente y cuando estamos en este sistema de estímulo respuesta fijaros que aquí no está el outcome la conducta es automática o se supone que es mínimamente automática y está desencadenada por los estímulos pero el outcome la respuesta no la modifica por lo tanto si por lo que sea un animal estuviera comportándose siguiendo este sistema de conducta por mucho que nosotros devaluáramos el reforzador no habría cambios en la respuesta porque la respuesta ya está en un sistema automático ilicitada por los estímulos y esto parece ser que es lo que ocurre en los hábitos de conducta hábitos que no deben de ser confundidos con habilidades no es lo mismo la habilidad de tocar un piano que corresponde a una serie de actos motores que sí que son automáticos y que los hacemos sin pensar y que además son muy resistentes al olvido porque son sistemas de conducta almacenados en la memoria procedimentales los sistemas procedimentales pero esto no quiere decir que una habilidad no puede hacerse por hábito que yo imaginaros me pongo a tocar el piano casi sin darme cuenta cuando veo la foto de mi madre que era la que me enseñó a tocar el piano tocar el piano en sí es la habilidad pero empezar a tocar el piano automáticamente y sin darme cuenta iniciar ese conjunto de sub habilidades que corresponde en tocar el piano ese es el hábito ¿vale? y como os digo es una conducta que es automática y es ilicitada es respondiente a los estímulos bueno entonces ¿cómo podemos hacer experimentos de evaluación del reforzador para ver si estamos en un sistema RO o en un sistema SR? bueno pues aquí tenemos algún caso fijaros aquí en este experimento teníamos a la ratita que puede estar presionando una palanca para conseguir un sabor de naranja o un sabor de fresa y luego a uno de los sabores es decir se ha estado tomando el sabor de naranja pues se le deja que tome el sabor de naranja y se le da una inyección de cloruro de litio ¿vale? y luego se le da a elegir es decir la rata ha tenido la elección sabe que una palanquita da zumo de fresa imaginaros y otro da zumo de naranja pero luego se le deja imaginaros que tome solo uno y se le da cloruro de litio y luego se le da a elegir pues normalmente la rata el cloruro de litio cuando se inyecta a los animales produce malestar gástrico por procedimientos de condicionamiento versus gustativo que vosotros conocéis de sobra pues si hemos asociado el cloruro de litio a la naranja obviamente la rata se va a ir a la fresa eso está clarísimo ¿no? entonces fijaros aquí tenéis este experimento una palanca da comida de sabor naranja otra da comida de sabor fresa este es el grupo experimental en el grupo de control exactamente lo mismo pero en la segunda fase en el grupo experimental damos una inyección de cloruro de litio asociado a uno de los dos sabores en este caso la fresa en este caso y luego en la tercera fase pues se les ponen las dos palancas una da un sabor y otra de otro ¿no? pues obviamente va a haber más tasa de respuesta en el sabor que no hemos condicionado aversivamente y aquí en el grupo de control vemos que en los dos en los que no ha habido litio no ha habido devaluación es decir en este caso pues claramente hay una devaluación por lo tanto estamos en un sistema de respuesta a consecuencia las conductas están guiadas por sus consecuencias ya os digo si seguramente si hubiéramos entrenado muchísimo la presión de palanca ya sería insensible a la devaluación del reforzador ¿qué es lo que qué es lo que hace de qué depende de que estemos en un sistema SR o RO pues hay varios factores los hábitos en teoría al no estar guiados por la consecuencia sino que estar activados automáticamente por los estímulos da igual que devalúes la consecuencia porque no tienen ya influencia sobre la conducta ¿vale? no hace falta tener una representación mental del valor de la meta sino que es un acto conductual automático elicitado por el estímulo por eso no es que no se puedan devaluar es que tú puedes devaluar la meta pero es que la meta no es relevante aquí bien pues esto es muy importante y de hecho hay toda una teoría muy en boga actualmente y es que las adicciones por ejemplo suponen se da una adicción cuando hemos pasado de un consumo controlado un consumo instrumental guiado por las consecuencias oye pues yo consumo al principio la cocaína por ejemplo pues porque por el subión que me da por la sensación de euforia esa sensación de poder que yo tengo pero cuando yo consumo muchas veces ya y estoy varios años consumiendo ya no consumo por esa sensación supuestamente sino que es una cosa es un evento automático es un hábito ya y no lo hago por las consecuencias no lo hago porque me guste sino que lo hago un poco por pues por lo que se llama una sensibilización del incentivo es decir la tendencia compulsiva al realizar la conducta pero no ya porque me guste o no me guste de hecho muchos cuando tú preguntas a gente que tiene problemas con adicciones con heroína con alcohol etcétera cuando ya tiene muchos años con su problema te dicen no yo ya no lo hago porque me guste es otra cosa es que lo necesito es que yo no puedo pensar en irme de fiesta con mis amigos sino meterme unas rayas de cocaína es algo que es automático es que además aunque no quieras si se da las circunstancias adecuadas si estás en una fiesta con la típica mesa tal no sé qué y tienes te ofrecen la droga es que lo vas a hacer ¿vale? está automático dice seguiría tomando el zumo que le ha creado malestar en el caso de efectivamente que ya hubiera un hábito conductual sí porque es una una conducta que es automática y que no depende de las consecuencias entonces lo que os pone aquí si se refuerza mucho una respuesta instrumental puede automatizarse pero además también no es solo si se refuerza mucho sino es por ejemplo en los programas de respuesta que son intermitentes en los que son por ejemplo los veremos en el tema siguiente los de los de reforzamiento variable los de intervalo razón variable o sobre todo intervalo variable que luego veremos cómo son entonces ya os digo las respuestas instrumentales son sensibles a la devaluación ¿de acuerdo? y cuando ya hemos generado un hábito conductual podemos intentar castigar lo que es la conducta y si es un hábito quizás lo devaluaremos o sea no es que lo devaluaremos sino que castigaremos la conducta en sí sin modificar el valor de la meta pero lo que es la conducta en sí la podemos castigar y ya si es una compulsión se ha pasado al nivel de compulsión por mucho que castiguemos la conducta incluso dando descargas eléctricas cada vez que presionen la palanca por conseguir en el caso de los experimentos con drogas imaginaros una inyección de cocaína seguirá haciendo emitiendo la respuesta esto último creo que no viene en el libro solo para que veáis un poco la aplicación práctica de estos temas bueno y con eso acabaría el tema que tenéis un pequeño resumen de todos los conceptos que se han ido viendo y que os tienen que sonar eh que hemos ido viendo durante el tema vale pues un poco las diferencias entre la ley del del efecto y la ley del refuerzo y los elementos entre zonda y skinner la contingencia de tres términos con el papel de los estímulos que hacen de discriminativos las respuestas y los reforzadores o los entre comillas castigadores que no hay un término en castellano pero bueno el que supone que aumenta o disminuye la probabilidad de conducta los cuatro tipos de procesos de reforzamiento o de castigo de procedimientos de condicionamiento operante que hemos visto vale y que esto es súper importante y los diferentes fenómenos que también hemos ido viendo a lo largo del tema las condiciones supersticiosas y que todo lo de las de íntegrin y terminales la instintiva el contraste contextual la ingresión aprendida la demora y la devaluación y todo lo relacionado con la extinción ¿de acuerdo? para que son más grandes conceptos que os tienen que quedar muy claritos después de haber estudiado este tema muy bien bueno pues después de esto tenéis alguna pregunta sobre el tema 4 alguna cuestión que queráis ver a ver es un tema que en realidad no es tan complicado sobre todo bueno que tiene muchos conceptos pero no no es difícil ¿alguna cuestión que nos haya quedado clara? bueno pues entonces sin más dilación pasaríamos genial pues pasaríamos al tema 5 bueno pues como siempre debemos estas estupendas diapositivas a Marcos Sucha que ya sabéis que es tutor del centro de Jacinto Merlager y que es generoso para pasárnoslas es que se le da muy bien hacer diapositivas así que usamos las suyas que seguro que están mucho mejor de las que yo podría hacer bueno en este tema vamos a es un tema denso ojo es un tema no os asustéis pero es bastante denso bastante complejo y yo creo que le vamos a dedicar ya el resto del curso ¿vale? también es que está complejo explicado aquí yo os recomiendo de una manera muy ferviente si me lo permitís que uséis también de manera complementaria el libro de Michael Dunjan de principios de aprendizaje y conducta ¿de acuerdo? porque os va a ayudar a comprender bastantes de las cosas que quizás no quedan tan claras en el libro de texto aparte de lo que nosotros podamos ver aquí en clase en la tutoría y por supuesto lo que vosotros pues vayáis preguntando en los foros temáticos de ALF ¿no? entonces bueno entre eso y tal bueno yo creo que quizás tenéis herramientas suficientes para salir más o menos adelante bueno programas y teorías de reforzamiento este tema pues el propio nombre lo indica está dividido en dos la primera parte es bastante más corta y es donde vamos a ver los diferentes programas de reforzamiento dentro del condicionamiento operativo del condicionamiento instrumental es decir las reglas que dicen que establecen la relación entre la conducta y los reforzadores ¿cuánta conducta tiene que ocurrir y cada cuánto tiempo para que ocurra uno o más reforzadores? eso es un programa de reforzamiento el más sencillo pues puede ser un programa de reforzamiento continuo en el que cada vez que se presiona la palanca en caso de una caja de Skinner pues caiga una bolita de comida esa es la regla más básica pero hay otras reglas hay otros programas de reforzamiento pues por ejemplo cada vez que se presiona una vez la palanca pero cada 15 minutos o cada media 15 minutos siendo algunos ensayos dos minutos y en otros 30 ¿vale? en fin hay diferentes reglas que establecen esa correspondencia entre la conducta y las consecuencias ¿de acuerdo? esos son los programas de reforzamiento y veremos veremos que cada uno de esos programas de reforzamiento genera patrones de conducta diferenciales con morfologías topografías distintas y muy y ya veréis que es muy interesante ver como unas pues hacen una escalera así con lo que se llama una carrera de la razón y luego una pausa otros si no hacen como si fuera el festón de una cortina el intervalo fijo bueno generan yo os digo patrones conductuales diferentes ¿vale? y en la vida real en algunos casos veremos que la conducta de los individuos pues está bajo siempre todo más mezclado la vida real no se puede separar tanto como en un laboratorio pero veremos que la conducta de los individuos está marcada quizás más por un programa de reforzamiento continuo o uno de reforzamiento variable el caso de las por ejemplo de las máquinas tragaperras en los en los salones de juego ahí lo que se está en marcha son programas de reforzamiento eh intermitente normalmente de intervalo variable que generan una gran adherencia conductual muchísima conducta que es lo que interesa es decir muchas moneditas que se meten por la ranurita ¿vale? entonces ya os digo que en la vida real también están operando estas reglas que veremos pero normalmente de una manera no tan clara más difusa más mezclada y normalmente además de manera compuesta varios programas de reforzamiento unidos y actuando a la vez y luego vamos a ver todas las teorías bueno y no todas unas pocas que hay para explicar el reforzamiento tened en cuenta que este tema es como el el buque insignia de toda la disciplina y toda la asignatura ¿vale? por eso es tan largo y es tan complejo muy bien eh ya os digo hay varios programas de reforzamiento de la vida real aquí tenemos un facóquero esto es un facóquero que es Pumba ¿no? de, del rey león y, y bueno pues está huyendo de un supongo que esto es un león hembra si, si no soy demasiado inculto en la zoología eh y bueno pues esto es un programa de escape seguramente eh que además es continuo cada vez que el facóquero ve al león siempre va a emitir la conducta de escape ¿no? por ejemplo y esto es un para maximizar la supervivencia aquí tenemos otro caso en los que como os decía este es el ejemplo que ponemos todos los profesores de psicología del aprendizaje eh las máquinas tagaperras en las que normalmente están operando para más de eh intervalo variable es decir tú le echas la monedita le das a los botones y vas a tener jackpot vas a tener premio pues cada X tiempo y además de una manera muy variable y el premio además va a ser muy variable y esa combinación esa gran variabilidad esa incertidumbre va a hacer que tengas una gran adherencia conductual aquí los que diseñan las tagaperras no son tuctos seguramente hayan contratado a psicólogos ¿vale? eh para diseñar el programa de reforzamiento que más adherencia conductual genera además a expensas del menor coste en reforzadores claro tú lo que quieres es que haya mucha conducta muchas moneditas pero tú dar poco dinero ¿vale? entonces ¿cuál es el programa de reforzamiento que genera ese patrón? y ahí tienes a los psicólogos eh diseñándolo para, eh hacerte muy rico igual tenéis aquí a Yuki porque Yuki no puede faltar yendo a su comedero pues eh supongo que aquí también será el el cada vez que va al comedero pues cae un poco de comida si es que no hay ¿no? también sería un programa de razón fija aún es decir de reforzamiento continuo cada vez que se emite la conducta ocurre la consecuencia bueno todo esto que hemos ido introduciendo vamos a intentar sistematizarlo un poquito más eh fijaros hay de nuevo dos gran una tabla de doble entrada dos tipos eh de variables que configuran los cuatro tipos de programas de reforzamiento más sencillos que hay los básicos que tenéis aquí porque luego veremos que hay compuestos ¿vale? pero los programas de reforzamiento que insisto son esa regla que establece la relación entre la conducta y las consecuencias ¿vale? cada cuantas conductas y cada cuando van a ocurrir las consecuencias pues ya os digo en primer lugar pueden ser programas de razón o programas de intervalo es decir que lo importante sea cuanta conducta haya en los de razón o que lo importante sea cada cuando se emite la conducta en los intervalos y luego pueden ser fijos o variables que lo que se manipule sea una cantidad fija imaginaros programa de razón fija cinco quiere decir que cada cinco presiones de palanca recibe una horita de comida o pueden ser variables en las que la cifra habla de una media una imagina razón variable cinco a veces el requerimiento serán dos presiones de palanca pero otras veces serán diez imaginaros y el el cómputo global la media aritmética global pues me sale cinco entonces los programas pueden eso ser fijos o variables y de razón o de intervalo combinando ambas variables tenemos programas de razón fija de razón variable de intervalo fijo y de intervalo variable en los intervalos fijo es que se refuerza la primera conducta la primera respuesta que ocurre tras un periodo de tiempo imaginaros la presión de palanca la primera presión de palanca que ocurra cada cinco minutos o sea le doy una vez a la palanca me cae la bolita de comida y yo le puedo dar millones de veces a la palanca que hasta que no pasen cinco minutos y yo le doy una vez a la palanca no me cae la bolita de comida le puedo haber dado doscientos millones de veces hasta el minuto cuatro cincuenta y nueve que si no le vuelvo a dar una vez cuando ya ha llegado al minuto cinco no me cae la bolita de comida es el intervalo fijo y el intervalo variable es lo mismo solo que en veinte cinco minutos siempre pues es una media de tiempos en los diferentes ensayos y que al final pues salen cinco ¿vale? ¿lo entendéis esto? los cuatro grandes tipos de programas de reforzamiento básicos que hay vale entonces también esto es muy importante os lo van a preguntar seguro entonces aquí tenéis por un lado el reforzamiento continuo que se le llama razón fija uno es decir una una respuesta un reforzador y cuando ya no es continuo pues es parcial no siempre ocurre la conducta ocurre la consecuencia pues tenemos estos de razón que lo que se manipula es el requisito es el número de respuestas eso es lo que va cambiando puede ser fija o variable o los programas de intervalo que lo que se requiere es que al menos hay una conducta pero pasado un intervalo de tiempo que puede ser fijo o que puede ser variable ¿vale? pues eso bueno como estudiamos o como se estudiaba hace muchísimos años porque esto ahora ya obviamente esta maquinita no existe se utilizan ordenadores pero bueno está bien que es verdad que los ordenadores producen una gráfica que es igual a la que tenéis ahí entonces tenéis que entender por qué tiene esa forma la gráfica es lo que se llama el registro acumulativo mirad en las antiquísimas cajas de Skinner de antes yo estas nunca las he llegado a conocer yo solo he utilizado cajas de Skinner ya con ordenadores tampoco soy tan mayor además y que el registro pues te lo daban en la pantalla bueno pues ya os digo en las cajas que usaba Skinner que de hecho el registro acumulativo lo inventó Skinner había un rollo de papel que iba a estar en un rodillo y el rodillo iba girando como tenéis aquí según esta esta esta dirección y podíamos un poco poner que girara más rápido más despacio pues para hacer tiempos más cortos o tiempos más largos si yo tengo una porque I una sesión que dura muy poco durante cinco minutos pues voy a poner que vaya un poco más rápido pero si yo tengo sesiones que duran dos horas pues voy a ir más voy a poner más lento el rodillo para que no gaste tanto el papel y además la resolución de del dibujo pues sea más acorde con lo que dura el tiempo y luego tenemos diferentes plumillas que generaban un marcado hacían como las del polígrafo pues parecido había una que marcaba las respuestas y otra que marcaba los estímulos discriminativos cada vez que ocurría un estímulo por ejemplo una luz que le decía al animal que si pues eso que era que aparte cuando estuviera presente la luz pues podía haber conducta que iba a tener consecuencias y a veces también había una tercera plumilla para marcar cuando caían los reforzadores que obviamente los problemas de reforzamiento continuo los reforzadores iba a haber cada vez que hubiera una conducta pero los otros tipos de problemas de reforzamiento y el caso es que fijaros tenemos si giráis un poco la cabeza así podéis ver este registro en el que en esta dirección es avanza el tiempo y aquí tenéis en este eje las respuestas y aparte es acumulativo es decir que va subiendo y va subiendo o sea no marca una rayita en horizontal sino que cada vez que sube o sea cada vez que da una respuesta del animal sube un poquito la plumilla de tal manera que al final si tú tienes mides el área bajo la curva tienes una idea de las respuestas totales ¿no? que has tenido bueno pues este es el registro acumulativo es importante que entendáis un poco que estas formas de conducta ¿vale? aquí nos permite también ver por ejemplo este tiempo en el que está plano pues es tiempo que hay entre respuestas en las que no se han dado respuestas ¿vale? fijaros aquí esta es la plumilla del reforzador que os decía ¿vale? cada vez que hay ese trazo en oblicuo es un reforzador que cae y aquí es lo que tenemos lo que os decía los diferentes patrones de respuesta que podemos ver con los diferentes programas de reforzamiento y cada uno de ellos hay una serie de parámetros que tenemos que ver ¿no? por ejemplo en los programas de razón fija que puede ser razón fija 1 razón fija 5 razón fija 50 aquí es un programa de razón fija 50 en el que ojo que en el libro hay una rata aquí Marcos lo ha corregido ¿vale? con los eh las etiquetitas de los programas de reforzamiento pues eso esto es un razón fija 50 hasta que no se producen 50 respuestas no ocurre el reforzador pero es siempre el mismo requerimiento 50 ¿vale? cada 50 respuestas un reforzador y aquí hay no las veis porque están muy juntitas pero las diferentes respuestas acumulándose bueno pues en los programas de razón fija vemos algunas cosas interesantes por ejemplo los fenómenos de aquí nos abro de la pausa pos reforzamiento ¿no? como tenéis aquí pues la pausa pos reforzamiento la veis aquí son estas paradas en la respuesta ahí se deja de responder en en los diferentes tiempos luego también tenéis la carrera de la razón una vez que como que han cogido fuerza fijaros ahí como no es progresivo sino que es bastante inclinada la pendiente de la línea de respuesta y luego también tenéis otro fenómeno que os tiene que sonar que es la tensión de la razón y es que con las razones muy altas imagina la razón fija 500 el sujeto ya deja de responder no me compensa porque además hay muchas contingencias negativas en las que se dan muchos palancazos pero no hay reforzador ¿vale? entonces hay un umbral en el que se da lo que se llama la tensión de la razón en el que ya si te pasas ya dejas de responder quizás muchas veces no sea por cansancio físico sino porque hay muchos ensayos no reforzados entonces la contingencia es es más negativa que positiva ¿no? si me lo permiten bueno pues esa es la razón fija en cuanto a la razón variable pues lo que no se da son las pausas por reforzamientos sino que es como bastante más eh bastante mayor tasa de respuestas una respuesta más constante ¿no? veis así aquí que no hay esas pausas sino que es todo mucho más constante bien y luego ahora ya nos vamos a los programas de intervalo recordad que estos son los que eh se refuerza la primera respuesta que ocurre tras un periodo de tiempo y todas las respuestas que des antes de todo ese tiempo no sirven para nada ¿vale? y aquí tenemos por ejemplo un programa de intervalo fijo 60 es decir que se refuerza 60 segundos la primera respuesta que se da a los 60 segundos tú has podido dar 5.000 millones de respuestas hasta los 59 segundos como no des una más pasado los 60 segundos te queda sin bolita de comida ¿vale? y fijaros aquí se da este patrón muy interesante esperad voy a ponerlo en otro color para que lo veáis mejor veis esta especie de curvatura como el festón de una cortina eso es lo que se llama el festón del intervalo fijo ¿vale? ¿de acuerdo? el festoneado y es un patrón festoneado así es como se llama y bueno básicamente es característico del intervalo fijo y lo que pasa es que no es o sea es una pausa por reforzamiento pero que no es continua sino que es que se desacelera siempre hay versión de palanca pero se desacelera un poquito se desacelera bastante o sea justo después del reforzador pero luego se acelera cuando se acerca el momento de que se pasa el requerimiento temporal del intervalo ¿vale? eso es lo que genera este patrón de festoneado esa desaceleración inicial tras el el reforzador pero luego esa aceleración rápida cuando se va acercando al reforzador y cada vez más rápido cuando se acerca el momento pues eso es como os digo típico de los programas de intervalo fijo y luego ya por último tenemos los programas de intervalo variable que de nuevo pues generan muchísimas respuestas aunque no haya tantos reforzadores es decir mucha adherencia conductual fijaros aquí hay muy poquitos y todo lo que ocupa entre este y este todo esto es conducta todo lo que tenéis aquí fijaros todo esto para conseguir este reforzador y con haber esperado no haber hecho nada y haber dado uno justo en este momento hubiera sido lo mismo en razón e intervalo variables no hay pausa por reforzamiento no hay una pausa tan llamativa no siempre o sea una pausa siempre estás un tiempo sin responder es decir a lo mejor responde cinco veces para un segundito luego sigue respondiendo pero no es tan característico como en los programas de razón fija el programa en los que hay esa asociación temporal dejas de responder estás ahí disfrutando del reforzador pero porque sabes en los programas de razón fija por ejemplo tienes muy clara cuáles son los requisitos de conducta para conseguir el reforzador y tú distribuyes los esfuerzos en los otros no en los otros depende de tu estimación temporal vale bueno ahora en esta parte del tema lo que se trata un poco es de comparar los programas dentro de los programas variables las diferencias que generan los de intervalo y los de razón fijaros que los de razón variable bueno pues por lo que veis aquí bueno pues tiene más adherencia conductual hay más conducta hay más masa conductual ¿no? que los de intervalo variable los de intervalo variable bueno pues no hay esa aceleración de la conducta ¿de acuerdo? entonces en general como os pone aquí hay más tasa de respuesta tasa de respuesta es decir respuestas por unidad de tiempo eso es lo que quiere decir tasa de respuesta en los programas de razón que en los de intervalo ¿vale? ¿por qué? bueno pues se han venido a dar dos tipos de explicaciones diferentes una más entre comillas local y otra más global ¿vale? una que se se centra en las tasas de reforzamiento que hay en un momento muy concreto y otras en las tasas de reforzamiento de todas las sesiones entonces es lo que tenéis aquí la explicación que se ha venido a llamar molecular que es como la más concreta la más acotada en el tiempo se centra en los programas o bueno dice que estos programas de de razón de intervalo perdón variable lo que refuerzan diferencialmente son los tiempos de interrespuesta largos ¿vale? y claro esto es así efectivamente un programa de de intervalo fijaros no tiene sentido que respondamos muchísimo porque solo me van a responder solo me van a premiar por aquella respuesta por una que ocurra justo después de que ha pasado el intervalo de tiempo necesario entonces al final esos programas lo que lo que van claro reforzando porque siempre se hace una todos los organismos lo hacemos un análisis de coste-beneficios pues son que yo responda cada bastante porque además así primero invierto poco esfuerzo conductual y voy probando el programa voy afinando mi respuesta para que caiga en el intervalo al principio esto no es así en las primeras sesiones esto es algo que se adquiere con el programa de reforzamiento ¿vale? pero es que los de intervalo al final acaban reforzando tiempos de respuesta largos y eso quiere decir que hay menos conducta ¿vale? por eso los programas de intervalo según esta explicación molecular generan menos conducta que los de razón dentro de los variables siempre vale entonces una explicación de que los programas de intervalo tengan menos tasa de respuesta es que estos programas están reforzando al final tiempos entre respuesta largos ¿vale? porque los tiempos entre respuesta cortos no llevan a reforzadores ¿vale? si yo di muchos palancazos cada poco tiempo hay muchos palancazos que no van a estar reforzados pero luego está la explicación molar que lo que habla no es ya que se estén reforzando tiempos entre respuesta sino lo que habla es de la tasa de reforzamiento ¿vale? la tasa siempre es el número de reforzadores por unidad de tiempo y lo que dice es que esta tasa de reforzamiento aumenta con la tasa de respuesta esto es lo que hace la explicación molar que es como os digo una explicación como basada en ventanas temporales más largas que los tiempos entre respuesta que siempre es pues más local ¿no? si ya he dado una respuesta ya sé que ese programa de reforzamiento no me va a reforzar las respuestas que de inmediatamente después pero fijaros es más circunscrito a una vez que da la respuesta y los tiempos que ocurren cerquita de esa respuesta ¿vale? mientras que la tasa de reforzamiento es una tasa que se construye en el global de la sesión ¿vale? al fin y al cabo los programas de reforzamiento requieren de varias sesiones para ser efectivos entonces al final bueno los programas de razón variable que generan más respuesta pues también en estos programas hay más tasa de reforzamiento al fin y al cabo si si doy más tasa de respuesta ¿no? porque el tiempo el tiempo en estos programas de razón no es importante sino lo que es es la cantidad de respuestas que se dé por lo tanto sí que aquí en los programas de razón aunque sean variables sí que hay una relación de paralelismo entre cuántas conductas de y cuántos reforzadores voy a recibir por lo tanto los programas de razón variable están actuando sobre la tasa de reforzamiento a mayor tasa de reforza voy a aumentar mi tasa de reforzamiento reforzadores por medida de tiempo mientras que los programas de intervalo es todo lo contrario bueno no es que sea todo lo contrario es que los programas de intervalo no modifican la tasa de reforzamiento en un programa de intervalo variable 10 tú vas a tener tus 6-7 reforzadores en función de los tiempos establecidos por el programa independientemente que des 500 respuestas o que des 5 ¿vale? entonces ya os digo la aproximación molecular explica que haya menos tasas en respuestas en los programas de intervalo porque dice que estos programas de intervalo variable están premiando los tiempos entre respuesta largos y esto es una computación que se hace a nivel local es decir he dado mi respuesta y ya voy a esperar va a haber un tiempo de respuesta más largo hasta la siguiente y ese tipo de patrón es el que refuerza en este tipo de programas de reforzamiento de intervalo variable sin embargo los programas de razón lo que se está reforzando es la tasa de reforzamiento alta que yo consigo con una tasa de respuesta alta aunque sea variable los programas de reforzamiento si a mí me premian cada media de 8 palancazos pues voy a me va a rentar entre comillas tener una alta tasa de respuesta porque eso me va a llevar quizás no de manera tan directa como los de intervalo fijo pero sí a una mayor tasa de reforzamiento que son el número de reforzado por unidad de tiempo ¿esto se entiende? vale más o menos bueno luego lo leéis y lo veis otra vez pero yo creo que es eso relacionar cuántos reforzadores voy a tener por unidad de tiempo con la conducta que yo el número de respuestas que yo haga por unidad de tiempo esa es la explicación molar mientras que la explicación molecular lo que dice es que los programas de intervalo me van a premiar si yo espacio mis respuestas porque solo va a estar reforzada la que ocurra cada cinco minutos de media entonces no tiene sentido que me responda en medio entonces se refuerza diferencialmente los tiempos entre respuestas más largos muy bien bueno esta relación que existe entre la tasa de respuesta dictaminada por un programa de reforzamiento y la tasa de reforzadores que ese programa de reforzamiento me va a permitir en función de las respuestas es lo que queda es una relación que queda un poco determinada o que queda recogida en las que se llaman las funciones de retroalimentación bueno una función y en matemáticas es así es una relación una relación entre dos variables imaginaros una función por ejemplo muy básica que dice que la tasa y es igual a 2x lo único que me está diciendo es que esta variable va a ser siempre el doble de esta es una relación entre dos cosas ¿no? bien pues es lo mismo en las funciones de retroalimentación son funciones que me están explicando me están describiendo la relación que existe entre por un lado la tasa de respuestas respuestas por minuto en un determinado programa de reforzamiento y la tasa de reforzamiento es decir reforzadores por minuto fijaros que estamos hablando siempre en tasa en términos de tasa y por eso siempre es por minuto por segundo por hora ¿no? pero por medida de tiempo eso además me permite a mí llevarlo a una métrica común las dos variables los reforzadores y las respuestas en términos de tasa muy bien bueno lo voy a decir un poco rápido y con esto lo dejamos pero tenemos que hay funciones de retroalimentación que son lineales y otras que no lo son que son por ejemplo hiperbólicas ¿vale? fijaros aquí en los poemas de razón las relaciones son siempre lineales con más o menos pendiente eso sí en función de la razón razones más altas y pendientes más bajas es decir hay menos tasa de reforzado de reforzamiento en función de la tasa de respuesta mientras que los programas de intervalos son relaciones hiperbólicas están negativamente aceleradas llega un momento al principio con tasas de respuestas bajas se aumenta mucho la tasa de reforzamiento pero luego llega un momento en que tasas de respuestas más altas no tienen cambios tan notables en la tasa de reforzamiento es decir en los reforzadores que yo voy a conseguir por unidad de tiempo bueno lo vamos a dejar ahí mirad bien esto un poco avanzad bastante todo lo que podáis en el tema y id apuntando dudas y cosas para un poco dinamizar más la clase ¿de acuerdo? porque tenemos que avanzar esto es un tema muy denso pero bueno hemos cogido algo de carrerilla así que por mi parte ya está os deseo muy buenas semanas y que estéis muy bien y nos vemos pues en la clase del lunes 26 y bueno lo digo leed por favor todo lo que avanzad todo lo que podáis en el tema para que podáis preguntarme todas las dudas que tenéis ¿de acuerdo? muy bien pues nada buena semana y hasta luego adiós