Vamos a grabar. Hoy, yo os dije que a partir de este capítulo y de estas condicionamiento operante ya tenemos el lenguaje, va a ir un poco más reprisado, básico algunos resultados y nos iremos a las prácticas. Luego, como habréis mirado muchas cosas no os preguntaréis dudas. Condicionamiento operante. Vamos a recordar cuatro cosas del primer capítulo que dijimos. ¿Cómo aprendemos? En el primer capítulo. Una de las formas son respuestas automáticas como la del condicionamiento clásico. Pero ¿cómo aprendemos a conducir? ¿Cómo aprendemos a abrir una puerta? Lo que ocurre es que hacemos muchas cosas en el medio. Probamos cosas. Y las cosas que funcionan o que nos traen consecuencias positivas se van aplazando poco a poco. Y llamamos operante a cualquier movimiento de respuesta abierta, completa, que no es un movimiento reflejo, sino una. Por ejemplo, coger el bolígrafo este. Es una operación compleja que conlleva buscarlo, agarrar la mano, hacer la pinza, agarrarlo, subir. Bueno, la operación completa es una buena. Nosotros estamos continuamente operando. Todo aquello nos va bien, las consecuencias que nos interesan se van afianzando. Ahora veremos las teorías de cómo lo hacen. También le llamamos instrumental, porque normalmente son para conseguir algo como instrumento o como medio. Bien. Esta nueva forma de aprendizaje es la segunda forma básica que vamos a estudiar. Una es el aprendizaje, digamos, de seguro reflejo, de cosas que se asocian con algo que vamos a aprender. Y la otra es la forma básica de aprendizaje. Es decir, una forma básica de aprendizaje en el sentido que puede ser conductas o el comportamiento clásico. Puede ser arribar como puede ser levantar la mano. Estas conductas son complejas, pues son las bases de todo tipo de aprendizajes que debemos hacer después o que acabamos de hacer. Las teorías que vimos ya en el primer capítulo. Y ahora les voy a dar un poco más. Por eso os dije en el primer capítulo que esto lo íbamos a volver a ver que no tiene falta, que da sentido. Y luego, señor Zorn, el de los gatos. ¿Habéis visto el vídeo? Este es el de los gatos. un gato en una jaula y esperaban que saliera. Esto tenía que aprender un mecanismo más o menos complejo, ya dijimos que los animales tienen capacidades igual que nosotros, esas capacidades hay una continuidad biológica y que podemos experimentar con ellos. Thorndike vio que la exploración al azar, las operaciones en la caja iban llevándole a diversos efectos hasta que se abrió la puerta. Cuando se abrió la puerta solía haber una comida o algo fuera por el mero hecho de salir y el gato la segunda vez daba con la tecla mucho más rápido, la tercera más rápida y la cuarta más rápida. Bueno, esto, pues la ley del efecto, quiere decir que para Thorndike el hecho de conseguir salir de la caja, de la caja de la caja, de salir y conseguir la comida iba fortaleciendo la imagen de la caja en la mente del gato con lo que tenía que hacer para salir de esa caja. Y eso quedaba asociado, pegado gracias a la comida. Eso se llama ley del efecto, que es una ley de perogullos y la miramos de otra manera pero que es una comprobación científica. Las acciones que tienen consecuencias positivas tienden a repetirse. Bien, Skinner. Skinner en vez de decir que cada estímulo se asociaba con una respuesta lo hace todo mucho más global. Dice nosotros operamos en el ambiente todo el tiempo estamos haciendo algo y todo el tiempo estamos recibiendo consecuencias y somos libres. Entonces para él no es lo importante qué estímulo me está provocando, qué respuesta puntual. Sino la conducta a lo largo del tiempo y a lo largo de muchos estímulos cómo vamos modelándonos, vamos haciendo unas cosas y no otras con más probabilidad. Con Skinner todo es un análisis a lo largo del tiempo y a lo largo de muchos estímulos. Para eso construye, se llama operante libre, puede hacer lo que quiera en el mundo, construye una caja que en vez de tener un mecanismo de salida tiene un mecanismo de salida que se puede activar, que se puede hacer algo con él. Normalmente solo hay uno para no complicarnos la vida, el ambiente real y muchas cosas. Ve por una palanca, una palanca se le puede dar una vez, dos, tres o pone una palanca y un botón, lo que sea. Bueno, la palanca se puede apretar muchas veces o pocas dependiendo de las consecuencias. Y esto es lo que estudia él a largo plazo. Las respuestas en principio son más naturales, por supuesto, se parece mucho más que la... ¿no? Es una caja, cerradas. Y sí que es verdad que podemos hacer cosas. Pero, claro, para poderlas estudiar tenemos que poderlas contar. Después en una palanca tenemos un contador de las veces que da la palanca, de las veces que consigue algo de la palanca, en fin, las cajas de Skinner. O sea que para el trópico es más concreto, más concreto. Puntual. Cada aprendizaje es puntual. Y para Skinner es más a largo plazo, no son respuestas, son naturales. Hacemos lo que sea y lo que aprendemos es que la probabilidad de que pase algo bueno haciendo esto, es mayor que haciendo esto u otro. Por lo tanto, o sea, es todo más probabilístico a largo plazo. Eso es el... Bueno, y Skinner tampoco aludía a la asociación en la mente de estímulo y respuesta. Es decir, para él, para Zombre, la respuesta, o sea, la comida, se llama una asociación. Skinner decía que eso no era un trópico. No le importaba. Que simplemente quería ver en qué condiciones se hacían qué respuestas. No le importaba la asociación mental, sino ver unas leyes que describían la conducta en función de los estímulos y las consecuencias. Y hacía una descripción funcional, que le llamamos, sin aludir a asociaciones puntuales de estímulos. Eso es conductista. Bien, en este tipo de condicionamiento de aprendizaje, lo que antes íbamos a hablar de una serie de... De conceptos... Yo voy, ya os digo que voy un poco... El esquema se corresponde con el libro, pero no lo sigo, si tenéis algún problema decídmelo con él. Lo sigo más o menos, pero no lo digo yo. Primero, ¿qué es una respuesta operante? Cualquier respuesta que produzca algo en el medio, una unidad de acción. Sentarme en una silla, agarrar algo, abrir la puerta, recorrer un pasillo, encender un ordenador. Cualquier cosa es una respuesta operante. Como conjunto. No cada uno de los movimientos es una respuesta, sino una respuesta funcional. Eso lo estamos haciendo todo el tiempo. Y lo que cambia a medida que aprendemos es que unas respuestas se hacen más probables que otras. ¿No? A medida que aprendo entiendo hacer unas cosas más que otras. Eso es lo que cambia en el mundo del movimiento. Y estamos preparados para aprender. ¿Por qué? Porque tendemos a ser curiosos y hacer cosas. Y a probar cosas. Y esa variabilidad nos permite aprender. Vamos observando el principio, ¿no? ¿Qué tenemos que ver con esto? Cuántas respuestas se dan por unidad de tiempo, por ejemplo. Pero se podría medir cualquier otra medida, ¿eh? La latencia, es decir, lo rápido que respondo, que es un indicador de lo rápido que ha aprendido. El tiempo de acción. El número de respuestas por minuto, por segundo. La fuerza o la magnitud. Cualquier cosa. Lo que se suele medir es el número de respuestas y la tasa de respuestas. Una vez que una respuesta aprendida, por ejemplo, dar una palanca, aparece en medio de una palanca, digamos, un botón o una cuerda, el mero hecho de dar la palanca se puede transformar en tirar una cuerda. Es decir. La respuesta se construye una sobre otras, pero al final son enteramente nuevas. Tú todo lo que has aprendido son movimientos en base a los primeros reflejos. Bueno, pues la variabilidad. Vas combinando movimientos y vas aprendiendo cada respuesta más complejas que quedan en tu cerebro asociadas con un operante. Tú cuando abres una puerta no piensas en cada paso. Ya lo tienes en el cerebro como una unidad. ¿De acuerdo? Eso le llamamos operante. ¿De acuerdo? Eso le llamamos aprender. Generar nuevas respuestas en situaciones en las que la respuesta es efectiva. ¿Cómo sé yo cuando una situación en la que la respuesta es efectiva una y no otra? Por ejemplo, cuando sé que tengo que abrir una puerta. Pues cuando veo una puerta. Yo no trato de pasar por la pared y veo una puerta y la reconozco. Trato de abrirla. Bueno. El estímulo es esa señal que me dice dónde estoy y qué puedo hacer. Una puerta o el que aporte el actor. Yo creo que no. La manecilla. Podría ser el estímulo discriminativo que me dice por ahí se sale. ¿No? O sea, un estímulo discriminativo es una señal o cualquier cosa en el contexto que me indica que una respuesta es operativa en ese lugar. Aprendida obviamente. Le llamamos estímulo discriminativo fijaos a lo que antes le llamábamos a veces algo parecido. El estímulo condicional. ¿Os dais cuenta? Una especie de señal. Pero en este caso no se condice. Sólo señaliza. El estímulo discriminativo por sí mismo no genera ninguna respuesta. Bueno, sí que genera una respuesta automática. Eso es paralelo. La que nosotros sientes al operante por sí misma no. Sino que te da la... Una señal. Una señal de que... ¿Cómo se dice? Once... Bueno, el que predispone la ocasión de responder. Nada más. O sea, no es... Es parecido pero no es lo mismo el estímulo condicional. El señal se va a poner verde y el rojo. Se va a poner en el indicativo positivo. Ya puedes pasar. Fijaos. Lo que tenemos en este tipo de argumentación es el estímulo previo que dice ahora puedo. Segundo. La respuesta. Tercero. Las consecuencias. Esos son los tres elementos que nos quedamos a jugar. El estímulo puede ser cualquier señal o un contexto que indique que hemos asociado con la respuesta. Ya veremos luego que también produce reacciones de condicionamiento clásico. Si una señal sirve para que haga algo en vez de comer, ese estímulo probablemente generará también la anticipación de la comida. Pero es una mezcla con el otro. En este caso es diferente. Obviando eso. Respuesta funcional. Le llamamos respuesta funcional aquella que tiene como objetivo conseguir algo. Un operante que es un instrumento para conseguir algo. Y como una totalidad, la respuesta, no como partes separadas, se convierte en una unidad funcional. Abrir la puerta es una unidad funcional. Arrancar el coche y conducir también. Lo haces casi automáticamente. Se define por su función. A ver, entre la respuesta podemos distinguir la forma y la descripción formal de la respuesta. Pues levanto la mano, agarro la manecilla, la tiro para abajo y empujo. Eso es describirla por la forma. Pero nosotros la vamos a describir por la función. Y llamamos abrir la puerta. Es un conjunto de movimientos que tienen una función. Por eso le llamamos función. Y no nos paramos a analizar la forma. Aunque a veces también nos interesará saber la forma. A veces abrir la puerta la puede abrir con la mano, con el pie. Con la boca. O pidiéndote que la abras, ¿no? Muchas maneras de abrir la puerta. Funcionalmente son equivalentes todas las formas. Porque consigo abrir la puerta. Pero formalmente son diferentes. Nos va a interesar normalmente la funcional. Normalmente. Y funcionar es porque consigue algo. Abrir la puerta a lo mejor en sí mismo no es reforzante porque lo que hay afuera no me gusta. O al revés, sí que es reforzante en el sentido negativo. Pero lo que importa es después de la respuesta las consecuencias, que son las que harán que esa respuesta sea más o menos probable. Si la respuesta, después de hacerla, las consecuencias que vienen hacen que respondamos más veces, le llamaremos bien un reforzamiento positivo. Y si es menos veces, negativo. Y si no ocurre nada, no hay refuerzo, no hay aprendizaje. Todo se define de forma funcional. Por ejemplo, que es un refuerzo positivo. Yo os he hablado mucho de la comida. Bueno, sí. Pero puede ser cualquier cosa que consiga que hagas más mal. Una medula, por ejemplo, es eso que pone ahí ese 50%. Yo creo que es que eso ha guiado del reforzador. El 50% que no va muy bien. Eso es medula. Sí. Mira, quiero decirte la probabilidad de que hagas lo... No. No es cierto. Mira. Yo hago así. Sí. Consecuencia. Ahora sí. Consecuencia. Y ahora sí. Ahora sí. Consecuencia. Ahora sí. Consecuencia. Ahora sí. Aquí hay una asociación que si tú sacas una cuenta se llama correlación. Sí. Es perfecta. Sí. Están asociadas. Aquí sacas una cuenta. Sí. Y es cero. Es decir, es al azar. Entonces la medida de eso es al azar. ¿En qué medida? Es al azar o está asociada. Y normalmente eso se mide de cero a uno. Sí. Pero en consecuencia es nula. Es nula. No. En consecuencia es nula. Es cero. Porque la negativa sigue siendo una contingencia informativa. Si tú sabes que al tocar un botón no va a ocurrir algo, es tan informativo como que... O sea, el cero es que están asociados al azar. La probabilidad de que salgas uno después del otro es artístico. Sí o no, es mitad-mitad. Vale, vale. Y luego el último concepto básico... Bueno, perdón. Antes de saltar... Los responsables primarios y secundarios. Igual que hablábamos en el clásico. ¿Cuál es primario? Aquel de que por sí mismo logra incrementar o disminuir las respuestas. Por ejemplo, si tú sabes que al tocar un botón no va a ocurrir algo, es cero. Entonces, ¿cuál es el primario? ¿Qué es el primer momento en el cual se hace una carga eléctrica a la manera? El secundario es aquel que, por aprendizaje, ha adquirido o lo ha reforzado. Por ejemplo, el dinero, por ejemplo, yo qué sé, una felicitación, un recuerdo social, ¿no? Ya está. Eso es sencillo, ¿no? Bien. Distinguir el reportamiento, que le llamaríamos al proceso, a todo junto, estímulo discriminativo, respuesta-refuerzo ese es un proceso y reforzado es la consecuencia es una restricción la consecuencia no tiene por qué ser positiva ahora la hablamos también bien esto yo lo veo es un proceso si esto te lo puedes bajar tú el no, es lo que ocurre después de la convocatoria las consecuencias o sea, perdón el proceso, ¿te refieres? no, o sea el reforzador o el proceso de reforzamiento es que me ha ido que en el cine lo cual era estímulo respuesta y conducta sí no, pero él se refiere a que no tenemos que analizar cada cosa que haces y que ocurre a continuación sino que tienes que analizar en global pero el reforzamiento como proceso es todo le llamamos reforzamiento a toda la secuencia de lo que yo veo lo que hago y las consecuencias y le llamamos refuerzo a las consecuencias no te compliques más reforzamiento es todo el proceso para nosotros de una forma estudiada lo llamamos proceso de reforzamiento discriminación y olvídate o sea, las respuestas en este caso vamos a medir normalmente que probablemente hay de respuesta y son totales millones de veces más o menos nada más o sea, como cierto resumen de la parte teórica los tipos de respuestas que podemos medir Fallback medía una respuesta los laberintos que veréis en el vídeo también una sola, salir de la jaula o irse un laberinto de un lado hacia otro o encontrar la salida como solo hay una respuesta tenemos que medir la fuerza de respuesta la rapidez que se prefiere A o B el tipo de medida que haremos cuando el ensayo sea de una sola respuesta la latencia que es cuanto tiempo tarda en empezar después de una señal la velocidad si es un laberinto de velocidad acaba de encontrarla o delante de la corredora la elección, como prefiere las... de Skinner, las que mediremos son números de respuestas, son tasas normalmente cuando son muchas respuestas frecuencias distribuir topografía en función de su expresión forma y finalidad la misma cosa se puede hacer de varias formas diferentes topografía sería describir la respuesta en sus movimientos detallados y función la finalidad eso es muy parecido a instancia y clase de respuesta instancia movimiento de la mano hacia arriba hacia abajo instancia clase sería una instancia, sería una análisis puntual de los movimientos micros le llamamos instancia de respuesta a cada uno de los movimientos que viene y clase a una agrupación de movimientos que son ir juntos por ejemplo para para agarrar algo agarrar la mano juntar los dedos bueno son tres formas de decirlo bueno algo parecido no es exactamente lo mismo pero lo podéis leer y veréis que no tiene nada que ver las relaciones entre este condicionamiento que estamos viendo y el clásico uno de los fenómenos que vimos en el clásico era el seguimiento del símbolo cuando en un trabajo de condicionamiento clásico una señal que indica que va a haber comida SLC ¿os acordáis? muchas veces las palomas se ponen a picotear esa señal eso le llamábamos seguimiento del símbolo ese picoteo de la señal no deja de ser una respuesta elicitada por la señal y porque aparece una comida después se está dando un condicionamiento clásico porque esa luz me prepara para comer y me da y un condicionamiento operante porque estoy respondiendo con una conducta ahí vemos que la conexión interior de su aprendizaje ocurre todo el tiempo fijaos un ejemplo el ejemplo tonto que se me ha ocurrido abro la puerta y me encuentro al otro lado la comida o lo que sea, algo bueno obviamente hay un condicionamiento operante tenderé a buscar detrás de esa puerta o aprenderé a abrirla con más facilidad pero a la vez se está produciendo el aprendizaje en el condicionamiento clásico apetitivo salivaré o sea, en la naturaleza o incluso en los laboratorios los dos aprendizajes comparten muchos conceptos entonces simplemente lo separamos muchas veces por lo que estamos analizando y nos interesa y también porque se ha demostrado que quizás un tipo de aprendizaje del otro tiene un sustrato neurológico diferente puede ser que sean diferentes fijaos no es automático casi el otro es de emisión de respuestas y como eso de aprender pues el condicionamiento operante ¿para qué sirve esto? ¿cómo enseñan a los elefantes en el circo a pasar por un cable? modelamiento progresivo las técnicas son todas las que veremos aquí sólo que tenemos que lograr que la respuesta que hasta ahora no existe en respecto al animal se incorpore ¿cómo? le vamos dando refuerzos clásicos a medida que se acerca, por ejemplo a medida que yo me acerco a la puerta si yo quiero que un animal abra la puerta si se acerca hasta ahí le doy un premio cuando ya logro que se acerca hasta ahí con cierta frecuencia le quito el premio de ahí y se lo doy solo si va hasta allá luego si toca la manecilla y esto claro es una combinación, el premio a consecuencia de condicionamiento del uno y del otro y al final lograré que abre la puerta ¿de acuerdo? ¿moldamiento es unito o no condicionamiento? Usar normalmente los dos pero normalmente usan los dos lo que se hace en condicionamiento operante se llama moldamiento porque la respuesta hay que modelarla de alguna forma hay que moldearla, es nueva a partir de lo que ya hace diciéndole en qué dirección debe ir y esa dirección se puede hacer directamente con refuerzos o con estímulos de condicionamiento clásicos, señales que asocien a cierta consecuencia y a la cierta el refuerzo pues es de muchos tipos pero que lo veáis en conjunto aunque lo analicemos por separado todo se puede ver en conjunto de hecho hay unas teorías que si los tenéis en cuenta visto esto que es la introducción vamos a ver los programas que se pueden dar en un reforzamiento esta parte es la base con la que todo lo demás tiene sentido por lo tanto es como cuando hablamos del primer esquema de condicionamiento clásico sobre el que todo lo demás se divide esto es lo mismo, no importa y que aquí pone automoldamiento no, el automoldamiento es cuando lo haces tú solo no es que alguien te enseñe a abrir la puerta sino que lo haces tú solo y vas viendo que cada día que haces algo, te sale algo bien y lo has ido haciendo cada uno aprende no solo es más automoldamiento la mayoría de la aprendizaje es automoldamiento bien vamos a ver situación normal yo hago algo y hay una consecuencia si la consecuencia es buena la probabilidad de que repitase algo es alta eso es lo que llamamos un refuerzo positivo porque la consecuencia, el refuerzo aumenta la probabilidad de una comida la consecuencia de un refuerzamiento positivo es algo apetitivo comida y el efecto es que aumenta la conducta bien vamos a hacer lo contrario vamos a tratar de que alguien deje de hacer algo ¿cómo? castigándolo ¿qué es un castigo? cualquier consecuencia que disminuya la probabilidad de una conducta no os compliqueis en qué saber si va o deja de ser se define por su esencial un castigo es todo aquello obviamente el castigo será poco agradable para quien lo recibe por lo tanto será una consecuencia negativa para el que la recibe poco deseada que no lo quiero olvidar que quiero hacerlo poco a poco esas son las dos primeras cosillas te doy un palo o te doy una zanahoria las otras dos son ¿qué ocurre cuando quiero que en el reforzamiento negativo quiero que alguien haga algo mediante un castigo ¿qué tengo que hacer para que alguien haga algo o vas o te pincho o vas o te golpeo esto se llama escape de limitación escape del castigo si lo estás recibiendo y evitación si logras prevenirlos antes de que ocurra normalmente vamos a aprender primero el escape y luego aprendemos a evitarlo porque la señal nos dirá si hay señales pasaremos de escape a evitación normalmente entonces son equivalentes aunque son diferentes al final no lo recibo en la evitación directamente no imagínate se enciende una luz y después de la luz hay una descarga a no ser que me aparte ahora las primeras veces me apartaré al principio no te has escapado tan fácil al recibir la descarga luego me voy si te vas mientras se produce lo estás dando ganando ya quitas o ya no confundís porque con el reforzamiento negativo lo que logramos es un aumento el castigo es para que te estés quieto para que no hagas algo y el escape es para que lo hagas no son sólo cuatro la última es ¿cómo? con una consecuencia positiva trabajando en una consecuencia positiva puedo lograr que alguien deje de hacer algo premiando cada vez que no hace algo no, premiando cuando hace lo otro premiando cuando hace lo otro por ejemplo yo como los ministerios tengo misión que no lo hagan en casa bueno, podría ser lo siento pero lo que estás haciendo en el reforzamiento positivo es la calle ¿de acuerdo? ¿cómo es la misión? ¿tú qué has dicho? es mantener un premio que ya tenía si deja de hacer algo quitárselo si no deja de hacerlo a ver, pensadlo de esta forma ¿cómo lo ha pensado el rey? como los ministerios que deje de hacer algo ese algo que está haciendo debe ser malo para mí ¿cómo hago que una persona que está haciendo algo malo me está molestando, me está incordiando está haciendo lo que no debe en casa le quito la comida si vuelve a hacer eso o te quito el juguete a un niño si sigues haciendo tonto o haciendo ruido y tú me dejas trabajar eso es omisión te quito el refuerzo que ya tienes para que dejes de hacer algo malo o sea, en estos lugares de trabajo normalmente lo que está haciendo es algo malo que queremos que deje de hacer o lo castigamos porque no lo deje de hacer o le quitamos un premio y esto desde arriba si estamos pidiendo que haga algo, dándole un premio o amenazándome con un castigo si no lo hace y el nombre es el segundo refuerzo negativo tenemos que evitarlo mejor escape de evitación castigo mejor que refuerzo negativo consecuencia del éxito y entrenamiento de omisión quitar un premio es la omisión y dejar de hacer una conducta y ahora me falta el último detalle que es la contingencia es simplemente una correlación la correlación entre hacer cosas y las consecuencias simplemente es a más respuesta más consecuencias contingencia positiva a más a menos respuesta también es positiva si a menos respuesta menos consecuencia ahora, si es al revés a más respuesta menos consecuencias la contingencia es negativa la correlación es negativa y tenemos que verlo en este caso ¿no? a más respuesta más premio y en el castigo ¿qué pasa? menos menos a más respuesta ¿qué hay? más consecuencias positiva ¿entendéis ahora? es positivo porque piénsalo así las otras no son negativas ¿quieres que te explique las otras por qué son negativas? el escape el escape a más veces salte menos descargas negativa, a más veces menos negativa porque el sujeto no lo hará si lo hará, en el escape saltará la respuesta que le estoy pidiendo es que se escape a más veces se escape menos descargas ¿si o no? la conducta deseada es el escapar por ejemplo, si estoy en esta banda se me va a descargar habrá más respuesta pero recibiré menos descargas por lo tanto la relación entre consecuencias y respuestas negativa a más respuesta menos descarga lo único que tienes que valorar es la relación entre el número de respuestas y el número de consecuencias si los dos aumentan o disminuyen a la vez correlación positiva si uno aumenta y el otro baja negativa y número de consecuencias da igual que sea positiva es una correlación, no tiene mayor importancia mira a más veces me escapo menos castigos me llevo negativo más menos ¿y en este qué ocurre? en la omisión ¿qué ocurre en este? que pare de hacer algo y si para, ¿qué tiene? más premio a menos respuestas más premio la respuesta objetiva el primero es positivo ¿por qué? a más veces lo hagas más consecuencias recibes a más respuestas más premios el segundo es negativo porque a más veces te escapes menos descarga recibirás a más respuestas menos el tercero es positivo positivo, porque a más veces lo hagas más te castigas más descargas solo tienes que ver el número de respuestas y el número de descargas en el castigo a más veces lo hagas más veces te castigas más consecuencias recibirás y el último es omisión a menos veces hagas lo malo que estás haciendo más premio tendrás y viceversa a más veces hagas lo malo menos premio tendrás la relación es negativa ¿sí? las positivas ellas entienden ¿no? el castigo también la consecuencia del castigo es una descarga cada vez que toques eso te doy más descarga a más veces los toques más descargas eso es lo único que me cuenta ¿es positivo porque hay más conducta? claro, más conducta más consecuencia el más más es positivo solo es la relación entre número de respuestas y número de consecuencias además en el cuadro es muy fácil pensar si no has acordado eso se lo diré un poco a más respuestas pero yo veía al signo y me había mojado por eso yo los signos más o menos de alguna manera están debidos ¿eh? tú piensas en una relación ah, eso es como la relación la relación es una multiplicación más menos y menos y ya está y todo lo demás claro el cuadro básico está ahí ya no le falta más lo único algunas pequeñas matizaciones por ejemplo ¿por qué un reforzador positivo lo es? porque o bien cubre una necesidad básica o bien está asociado con aprendizaje a esa necesidad básica por lo tanto la comida es un reforzador porque sirve para la supervivencia el cuerpo está preparado para existir ¿cómo sabemos si un alimento es más o menos reforzador? en general no es lo mismo tener mucha hambre que poca, según qué animal come qué cosas pues para igualar para igualar lo que hacemos es tomar alguna tasa de la necesidad que sea más o menos objetiva por ejemplo el peso que tiene un animal comparado con el peso que suele tener para igualar todos en la misma necesidad y que la condición de partida sea la misma pero que sepáis que un reforzador es muy variable en las situaciones en las personas y en los animales por supuesto eso es bastante lógico entonces lo que se hace es dejar al animal al 75% el peso que tendría si pasa la hambre sí, pero dice que en realidad no pasa la hambre porque si estuviera libre pesaría menos si le gastaba mucho pues no pasaba nada bueno qué más las aproximaciones sucesivas que hemos nombrado antes el entrenamiento complejo se hace haciendo movimientos de aproximación y luego los vas quitando los refuerzos bien el escape y la dictación ya lo hemos dicho el primer castigo el castigo tiene un efecto añadido no deseable, que es que genera una frustración un dolor que se asocia con la situación de aprendizaje con los estímulos discriminativos y que muchas veces no conviene por eso porque el reforzo positivo sería fácilmente atendemos fácilmente a las contingencias del ambiente mientras que en el castigo hay algo que distorsiona una interferencia, el dolor o la frustración que puede generar consecuencias al revés, puede generar que el castigo se asocia a la persona y no a la conducta entonces el castigo se usa menos o al menos con poca intensidad, con mucho cuidado y nada más la la omisión es simplemente buscar algo que le guste y quitárselo para que deje de hacerlo lo malo nada más la extinción en la extinción vimos también un condicionamiento clásico que cuando yo aprendo algo y luego empieza a ocurrir sin consecuencias poco a poco ese estímulo discriminativo yo dejo de emitir la respuesta dejo de darle a la palanca ahora bien hay un par de fenómenos que responden a la lógica perfectamente ¿qué os ha pasado cuando habéis aprendido por fin a usar el no sé qué el whatsapp que no sabíais? pues le das a los tres botes mira ahora funciona, mira ahora funciona te cambian el código y no funciona nada lo primero que haces ¿qué es? probar al revés eso es lo que ocurre cuando hacemos extinción hay un momento que se llama estallido de extinción en el que la respuesta es más intensa incluso hay una variabilidad de respuestas de probar otras a ver por dónde va y cuando ya ves que no hay manera va bajando esto se llama estallido de extinción ese pequeño periodo en el que intentamos volver a lo que teníamos y luego también ocurre como en el condicionamiento clásico que no hay una desaparición del aprendizaje sino que luego por el paso del tiempo por ejemplo si lo ponemos en una situación parecida a la que había pues todo un tiempo sin refuerzo sin nada, vuelves a la habitación vuelves a tocar un programa y pruebas lo mismo que la otra vez o sea, no te olvidas del aprendizaje recuperación espontánea o sea, si he aprendido en una caja y la vengo de esa caja a la rata vuelvo a hacer lo que hacía aunque en su momento lo hubiera detenido ¿durante cuánto tiempo? depende del momento del animal ¿por cuánto tiempo dices que hay que dejarlo? si por ejemplo aprendes una cosa si una cosa la haces diariamente pues a lo mejor el tiempo que hay de pagar es otro menos a veces bastan dos días depende de la conducta del animal ¿qué más? que por ejemplo durante la extinción hay que hermoso sin querer un condicionamiento clásico asociado que es la frustración no ocurre lo que debía ocurrir eso lo llamamos frustración y la frustración de por sí genera una serie de conductas que tratan de disminuirla por ejemplo la agresividad otra cosa importante la resistencia a la extinción ¿qué es esto? lo que hemos aprendido se puede medir o sea cuánto ha aprendido una persona en una situación de reforzamiento se puede medir viendo cuánto tarda en extinguirse si la asociación es muy débil el aprendizaje es muy débil en poco tiempo dejaremos de hacerlo se extinguirá rápidamente pues eso es la medida del aprendizaje la resistencia a la extinción y curiosamente cuando una cosa se ha aprendido con reforzamiento continuo es decir siempre que lo has hecho te ha salido bien es más fácil que se extinga más rápido a las pocas veces que te salga mal lo dejas de hacer también es lógico si lo piensas ahora una cosa que se ha reforzado parcialmente 5 o 6 veces tardas más en extinguirlo en darte cuenta que falla y que no funciona ¿por qué? pues por muchas razones una de ellas es esa que no sabes distinguir bien si no funciona porque lo haces mal o porque había muchas veces que no funcionaba sin embargo cuando siempre te sale bien ya debes analizar bueno eso se llama efecto de reforzamiento parcial de alguna manera el reforzamiento continuo dar siempre la consecuencia hace que la extinción sea más fácil se llama sobreentrenamiento en la extinción bueno esto lo veremos también más en detalle el efecto de reforzamiento parcial y también veremos algunas teorías claro una persona hay varias explicaciones les doy un poco por encima pero son lógicas también las veces que has estado y te han salido bien las cosas en el condicionamiento continuo y en el otro estás acostumbrado a que te salgan mal de alguna forma es lo normal la extinción es más difícil de distinguir y los efectos que vimos bueno hay un par de cosas también que son también a mayor reforzado y a más inmediato sea en general mejor aprendizaje si el reforzamiento es parcial también eso es mejor eso es continuo por lo que hemos dicho porque te obliga a responder más veces y estás acostumbrado a responder mejor dar un premio de cuando en cuando ahora si vas a tardar mucho en dar un premio conviene dar señales o recordatorios intermedios lo que se llama a veces el premio electrónico cuando tengas tres vales así mantenerla si te pasas de tiempo a lo mejor consigues la extinción los mismos fenómenos que veríamos en condicionamiento clásico y con el mismo nombre y así los entenderemos puede haber olvido pero la extinción no es olvido sino que nos olvidamos de algo quiere decir que ha pasado el tiempo no ha habido experiencias y es diferente la extinción la extinción que dijimos en condicionamiento clásico desapareció otra cosa no sé que desaparecía la huella de memoria por ejemplo aquello de renovación restauración del establecimiento que es lo mismo que en el condicionamiento clásico renovación si cambio de contexto si yo hago la extinción de un contexto y cambio a otro la restauración cuando y la restauración cuando cambio de contexto perdón restauración es también cuando cambia de contexto no, cuando vuelve al contexto original ah renovación cuando cambia de contexto restauración restauración de la extinción si tu a un animal aprende en A, olvida en otro contexto B al volver a A y da renovación pero si vuelve al B restauración de la extinción eso lo llamamos restauración o sea, vuelve a la extinción restauración es la extinción pero ese es el contexto no es más complicado que eso restablece va donde se ha extinguido y luego el restablecimiento aparece el reforzador aunque esta vez no asociado a la conducta que hacemos sin embargo aparece también la conducta o sea en el condicionamiento clásico el restablecimiento aparecía el EI por ahí de alguna manera se restableció la respuesta aquí aparece el reforzador aunque esta vez ya no es consecuencia de lo que yo hago sino que aparece ese premio que me daban y vuelvo a la conducta anterior o sea, que no se olvida simplemente recordaos que la extinción no es olvido hay cuatro cosas si aparece el reforzador sin asociarse a ninguna cosa luego hay cuatro fenómenos que tienen que ver con la con las capacidades del animal es decir hay ciertas conductas que son más favorables que otras para aprender porque son naturales otras que son casi imposibles de aprender porque no están en el repertorio luego tenemos también los efectos del refuerzo, del cambio de refuerzo si se duelen el premio o bajan el premio que ocurre también es bastante lógico y que ocurre cuando en el aprendizaje no permitimos que se cuestionen asociaciones que siempre hay una consecuencia quieras o no si esta consecuencia es negativa se produce lo que se llama indefensión aprendida hagas lo que hagas te pasa algo malo y se asocia mucho con la depresión un mecanismo de depresión son cuatro cosas que son sencillas por eso yo en cierto modo las voy a a dejar para que las miréis por ejemplo la devaluación del reforzador esto lo vimos en un cierto momento con el condicionamiento clásico qué ocurre si el reforzador que estoy utilizando lo condiciono a algo malo lo asocio a algo malo por ejemplo esa comida o algo que te siente mal también bajará lo miráis lo que pasa es que aquí no hablamos del condicionamiento clásico hablamos de la respuesta en el clásico sí pero aquí hablamos de la respuesta al asociar el reforzador con algo malo la respuesta que se ha condicionado al reforzador baja os quiero presentar de entrada el experimento en inglés en castellano está muy fácil vais a tener esto el artículo lo tenéis en la página no me acuerdo dónde está aquí está página 188 arriba pone la renovación del condicionamiento operante consiste en la recuperación de la respuesta extendida ¿me seguís dónde estoy? en la página 188 arriba la renovación en un contexto diferente porque se ve con el producto de extinción este es el que estoy leyendo está aquí nombrado ¿qué vais a ver en este artículo? vamos a ver la renovación en el condicionamiento operante es decir, cómo se ha aprendido una conducta hablamos de conductas ahora a través de un refuerzo luego se ha extinguido es decir, esa conducta se ha dado muchas veces sin refuerzo ha dejado de hacerse esa conducta ¿cómo se renueva al cambiar el condicionamiento? entonces tenemos renovación ya nos situamos ahí ya vimos que también le llamamos renovación en inglés o como sea al mismo efecto en condicionamiento clásico y estos autores también fueron los que trabajaron en condicionamiento clásico entonces lo que hacen en este experimento es aplicar lo mismo al condicionamiento operante ya la introducción nos dice en este trabajo vamos a ver a comprobar el efecto de renovación en el condicionamiento operante básicamente el experimento tiene los siguientes elementos tienen jaula aquí he puesto una palanca de un poco de comida para que hagáis una idea que los elementos más importantes de esas jaulas son una palanca y un dispensador de comida tienen tres fases más la última fase que le doy partes la primera fase es el aprendizaje propiamente dicho cada X veces que le deis a la palanca de comida en este caso es apetitivo es refuerzo positivo porque se está usando antes veréis que pone en inglés como era el entrenamiento al comedero que se llama en castellano simplemente acostumbrar al animal a saber que ahí va a haber comida y que se acostumbre al entorno y al comedero o sea es una serie de ensayos que le pone al animal en la jaula ah magazine train magazine train entrenamiento al comedero si pero en este caso se refiere al dispensador de comida a donde se muestra la comida bueno pues en este caso lo primero que se hace es acostumbrar es que quiero que veáis también en el experimento un poco del procedimiento científico de la exactitud con la que describe la jaula de las dimensiones los colores la intensidad del agujero la intensidad del sonido para que veáis por qué se hace esto porque nos gusta ser específicos no, para que tú puedas reproducir el experimento con las mismas medidas y ver si se produce lo mismo o bien cambiar algunos de esos datos a ver si dependía de esos datos es más que nada para controlar las variables que extrañan y precisan esta precisión tenemos una fase después de determinar un parco de dedos acostumbrarse al animal que hay ahí y ver cómo funciona la primera fase es una cronología cada X veces que le pones la palanca te pone una cronología te describe pues qué se hace durante 4 o 5 días durante media hora cada eso es lo que vemos luego 30 segundos de cada 30 segundos por término medio se puede producir una respuesta está disponible la cronología si tú le das a la palanca aparece la cronología por término medio no cada 30 segundos a veces cada 2 intervalo largo la segunda fase en las mismas jaulas o a ver en diferentes jaulas en este caso es base 100 se hace la extinción es decir le dejamos al animal que haga la respuesta que ha pedido pero esta vez no hay comida durante 3 o 4 sesiones la describen perfectamente eso podría caber en la pregunta de examen si tú lo has leído vas a memorizar si tú te lo has leído no es tan complicado te dirá cuántos experimentos llevo a cabo pues eso la última fase está así en un contexto que va a ser diferente del anterior luego también se hace una prueba pero lo que nos interesa es en un contexto diferente de una extinción para ver si hay renovación o no todos los procedimientos posibles que caben con este planteamiento y con esto lo dejamos de aquí los procedimientos que caben contexto A en otro diferente se extiende y volvemos al A A B y uno en tercero es diferente a ver lo que ve habrá renovación o no muy bien empezamos con la extinción en A y luego vamos a ver los procedimientos en la fase de extinción ¿de acuerdo? el último día veremos los 4 experimentos en detalle las hipótesis y todo bueno leemos un castellano lo queráis