El capítulo séptimo relaciona la motivación con el aprendizaje. Ya vimos en el 6, el 7 y el 8 y empezamos a ver algo de esto. En el 6 hablábamos de los procesos etológicos, los más sencillos. En el 7 veremos las teorías de aprendizaje con toda su complejidad para ver qué factores aumentan, o sea, qué factores motivacionales y qué factores de conocimiento influyen. Volveremos a ver muchos conceptos que hemos visto como el efecto de contraste, que hemos visto en la PEC y todo eso, algunas de las cosas que hemos visto en la PEC. En el capítulo 8 veremos la parte cognitiva, o sea, el aprendizaje digamos que podría ser un efecto de la experiencia, asociativo, más sencillo y la motivación que eso genera. Y en el 8 veremos la motivación que genera mi interpretación de las situaciones, las teorías que trabajan en eso. Como vimos en la práctica, lo que me motiva en las situaciones de aprendizaje en las que aprendo relaciones nuevas es el valor de incentivo. Hablaremos de cómo se, bueno, como vimos en la práctica, que no son las consecuencias de lo que hago, lo que me lleva a aprender, sino la valoración que yo le doy a través de mi historia, mi aprendizaje anterior y mis necesidades actuales. Es decir, la componente motivacional del aprendizaje es el valor de incentivo, mientras que el refuerzo y las consecuencias serían la componente que ayuda a, a ver si la conducta se va a repetir o no. Ese es el valor de incentivo, es pertenecer al sujeto. Vimos que se genera por un estímulo externo, por sus propiedades sensoriales, las hedónicas, adquiriéndolo y lo que tengo en mi interior respecto a cada situación son una serie de expectativas de qué va a ocurrir. Formada a lo largo de mi historia. También veremos que hay otras formas más complejas de aprender, por ejemplo la imitación. Es Dickinson el que habla de, primero del valor de incentivo propone este concepto y los objetos externos, espera un segundo, es el que me quiere saltar cosas. Y propone que tiene un, cualquier consecuencia de nuestras acciones, tiene un componente emotivo y un componente cognitivo. El emotivo son las consecuencias automáticas, emocionales, placenteras o displacenteras, el cognitivo la interpretación que yo hago y bueno, y ahí estaría la clave de nuestros incentivos. Cuando aprendo algo, bueno esto lo vimos en la práctica, es lo que acabo de decir respecto a motivacional. Y tira porque son expectativas futuras, ahora bien, esas expectativas futuras se han creado en nuestras experiencias anteriores, en nuestros aprendizajes anteriores. Como dijimos en la TEC, el aprendizaje depende de las consecuencias, pero una vez establecido es el valor incentivo el que componente motivacional. Bien, si no habéis dado aprendizaje aún, que algunos ya lo habéis estudiado, ya vimos que el condicionamiento clásico era una asociación simple, todos estímulos, entonces, estímulos que en principio son completamente neutros, como nos hacen en la publicidad, a fuerza de asociarlos con algo placentero o displacentero adquiere propiedades hedónicas. Los niños pequeños a fuerza de, o con una sola vez que vayan al médico y les duela un poco lo que les hacen, empiezan a reaccionar de una forma agresiva o negativa con unas batas blancas o el ambiente médico, cualquier cosa. También los positivos, es decir, aquello que asociamos a una asistencia de un placentero, una buena comida, pues esto se llama que por condicionamiento clásico los estímulos externos adquieren un atractivo o un rechazo normalmente asociado a sus propiedades sensoriales, es decir, tenemos que verlo, oírlo. Y por condicionamiento clásico, los estímulos externos adquieren un atractivo o un rechazo, normalmente asociado a sus propiedades sensoriales, es decir, tenemos que verlo, oírlo. Y por condicionamiento operante, cada vez que hago algo veo las consecuencias que van ocurriendo que también tienen un valor positivo o negativo. Y esto ocurre todo el tiempo. Es decir, yo voy haciendo algo, voy teniendo respuestas, las cosas que hay a mi alrededor actúan como señales, se van condicionando según las respuestas y aprendo a anticipar lo que va a ocurrir. Esto es básicamente como aprendemos. La forma más básica de aprendizaje. ¿Eh? Bien, entonces, ya vimos en la práctica que vamos a hablar en este momento de motivación extrínseca porque va a depender normalmente de unas consecuencias externas aunque el condicionamiento clásico lo que hace es internalizar ciertas relaciones, hacer ciertos estímulos y en el operante hay una respuesta visible. En el operante una respuesta viene al refuerzo, ese refuerzo, esa consecuencia la valoro, crea más expectativas y como vimos en la práctica uno de los aspectos del estímulo que aumenta el valor incentivo que no el aprendizaje en sí era la magnitud de un estímulo positivo. Es que tiene mucho que ver, ¿no? Y insistimos en que lo que hace es incrementar la probabilidad de una conducta. No la causa, sino que hace el aprendizaje y la motivación. Hay que distinguir las consecuencias y el valor incentivo. ¿Cómo sería este ciclo de construcción del incentivo? Pues hago algo, una recompensa me castiga el entorno después y las conductas, aprendo unas buenas y otras malas, voy generando las expectativas y según mis necesidades, mis valores en cada ocasión crearé unas expectativas o crearé una combinación diferente y será mi incentivo. Será mi incentivo que es previo a cualquier conducta. Es una esperanza de lo que va a pasar. ¿Bien? Pues esto yo creo que lo tenemos bastante claro. Ahora vamos a ver los tipos de aprendizaje que hay y qué variables motivacionales se dan en cada conducta. El más sencillo es el condicionamiento clásico que este, digamos que es una forma de pintar estímulos neutros con valores hedónicos ocurre todo el tiempo pero la para el cuadro clásico es un estímulo que de por sí produce una reacción lo asociamos con otro y pasa a producir una reacción similar. Vemos muchos ejemplos y esa asociación cuando hacemos algo hablamos del condicionamiento operante. El más sencillo con el que vamos a trabajar para ver los componentes motivacionales luego veremos los demás es el reforzamiento positivo. Hago algo se produce una consecuencia positiva y a continuación lo más probable es que aumente esa acción. ¿Por qué? Porque se crea un valor incentivo, una probabilidad. Puede ser agradable o desagradable ya veremos los otros tipos de aprendizaje que hay que creo que los vimos en el tema anterior y ya hemos visto que puede ser diferente el valor de incentivo aun con la misma recompensa como vimos en la PEC. La misma cantidad de bolas de comida para un animal le generaban una conducta de cierta intensidad y el otro que venía de más o de menos le generaba una intensidad muy diferente. Tenéis el ejemplo otra vez. ¿Qué es un refuerzo positivo? Yo pongo aquí refuerzo positivo. No hay que hacer un juicio previo de qué es positivo y negativo, es tan simple como que un refuerzo es positivo se aumenta la probabilidad de una conducta. Así nos evitamos tener una definición previa, es una definición operativa. ¿Y qué es un castigo? Una consecuencia que disminuye la probabilidad de una conducta. ¿El incentivo qué es? La interpretación, la expectativa que tengo yo en una situación de lo que producirá determinada acción. Y es motivacional, no depende del aprendizaje. Bien, los premios. Cuando la situación es esta, es decir voy a obtener un refuerzo positivo la los factores que afectan serían los siguientes dependiendo de cómo planteé la situación de aprendizaje. Y la situación de aprendizaje se puede plantear de dos formas básicamente. Dependiendo de la cantidad de respuestas que yo dé, de intensidad lo que queréis decir, sería lo que se llaman programas de razón. Si yo hago una cosa X veces obtengo un refuerzo. O bien programas de tiempo en el que no depende de cuántas veces sino de hacer las cosas en un tiempo determinado. Son diferentes en el grado de efectividad que tienen, son diferentes en el valor de incentivo que generan, son diferentes la motivación que genera. El número de respuestas que yo exijo para dar un premio, bueno aquí le he puesto las respuestas en las barras por ejemplo aquí hay una razón fija de 6, cada 6 respuestas te doy un premio. Puede ser fija cada 6 respuestas te doy un premio o puede ser variable con un promedio de 6, 5 las que sean pero no sabes exactamente en qué respuesta te daré el premio. ¿Vale? Ahora veremos los tipos de consecuencias, motivaciones de esto. El intervalo el programa de aprendizaje por tiempo también se puede distinguir entre intervalo fijo si respondes una vez en 8 segundos te daré un premio o intervalo variable, si en promedio cada 5 segundos en promedio o sea cada ensayo va variando te daré un premio. Esto que parece una situación un artificio pues tenéis varios ejemplos que lo podéis entender. Programa de razón fija una máquina expendedora de algo, si echas determinadas monedas, tantas monedas te va a dar el producto, 100. Uno de razón variable una máquina de premio que no sabes cuándo pero que a más monedas eches más probabilidad de que te dé el premio. El intervalo intervalo fijo bueno pues yo qué sé participa en los Juegos de Atención, cada 4 años tengo que dar mi máximo rendimiento, intervalo fijo. Intervalo variable pues poner una caña en el agua y esperar que pique, picarán pero no sabes cuándo ¿de acuerdo? Bueno, pues lo que nos interesa es qué ocurre con esto según esto este es el tipo de respuesta que se obtiene en estos 4 programas Razón fija se produce una respuesta que aumenta rápidamente al principio, luego hay una fase de estabilización o descanso y un aumento a través de las respuestas, descanso, es decir yo sé o intuyo cada cuánto me va a venir el premio y ya establezco una estrategia en la que hay paradas. Si la razón es variable, que no sé cada cuántas respuestas van a dar el premio la actividad es mucho más constante no hay pausas por reforzamiento y hay un ritmo bastante alto de actividad En los de intervalo fijo, también se produce un parón pero mucho menos drástico que en la de razón es como que el parón depende de una especie de reloj interno que me dice si no pasa X tiempo no tengo que hacer nada y tu reloj interno te dice y vas aumentando de una forma mucho más progresiva la actividad y de intervalo variable es decir hay que esperar un tiempo para que una respuesta obtenga un refuerzo pero no sabes cuánto, también produce una actividad mucho más constante pero esta es más elevada que esta es más intensa la actividad que esta en general los programas variables producen una actividad más sostenida, más intensa y los programas de razón variable la que más, esa sería la parte motivacional la que nos interesa en los programas de razón hay más respuestas y en los de razón fija hay pausas, así pues dependiendo del programa tenemos un resultado diferente bien la cantidad de premio este lo hemos visto también en la PEC ya veis que la PEC nos es bastante útil en principio si el refuerzo es positivo la magnitud o cantidad ya vimos que va a aumentar bueno, aquí hay un resumen de lo de la eficacia, razón variable el valor variable mucho más eficaz la razón espera, antes de llegar aquí, la cantidad de premio ya lo hemos visto, el efecto contraste que vimos y lo tengo pintado un poco después en principio cuando el reforzamiento es positivo a mayor cantidad mejor, hay una cantidad óptima por supuesto no todo es el máximo pero esa cantidad óptima depende de cada individuo, de su historia previa es decir, un factor motivacional como vimos con el efecto contraste de Crespi que creo que lo he puesto aquí también al final antes de explicar los tipos aquí, pero antes de llegar ahí yo cambio el orden un poco y os explico los otros tipos de aprendizaje que vamos a ver que vamos a ver luego el programa de castigo el programa castigo como en el lenguaje cotidiano busca que disminuyas una conducta que yo no quiero que hagas por lo tanto cada vez que la haces te proporciona una consecuencia negativa, el cuadro o el esquema sería entonces hago la consecuencia negativa y espero que disminuya la conducta justo consecuencia, respuesta respuesta, consecuencia disminuir la respuesta disminuir la consecuencia negativa bien estos dos por analogía con la vida son muy sencillos luego tenemos otros dos programas que son el escape o evitación que es una forma de obligarte a hacer algo y en vez de darte un premio lo que hago es que si lo haces evitas o te quitas una consecuencia negativa el experimento habitual es poner un animal en una caja, una jaula y que haya dos compartimentos si no cambia de un compartimento a otro recibe por ejemplo una descarga, una pequeña descarga algo desagradable si recibe la descarga y salta al otro lado la evita o huye de ella la diferencia entre evitarla y escapar es que haya tenido experiencia con la descarga o no, si sabe que va a venir si hay alguna señal la evitará si no hay ninguna señal o le pilla por sorpresa se escapará, ese es el tipo de aprendizaje es una forma de obligarle a hacer algo cambiar de un sujeto a otro y en vez de utilizar un estímulo positivo utilizamos un estímulo negativo del que la persona el animal, el sujeto escapa ese procedimiento se llama refuerzo negativo que es un nombre un poco confuso porque lo de refuerzo no se refiere a consecuencia sino a que la contingencia baja aumenta respecto a algo negativo sino el nombre más claro es escape o evitación evitación si conoce o tiene una señal clara escape si no y el otro que nos queda es otra forma de disminuir una conducta que no quiero que hagas y en este caso con una consecuencia positiva en este caso te quitaré algo positivo que ya tienes para obligarte a dejar de hacer algo que no quiero que hagas en vez de castigarte con algo malo te quito algo bueno que ya tienes si no, deja de hacer lo que yo te diga el ejemplo más clásico es niño no haga ruido o apago la tele o te vas a la cama o sea, deja de hacer algo o te quita algo mmm el escape veis que es al revés intento que hagas algo a través de quitarte algo negativo intento que hagas algo a través de quitarte algo positivo bueno, se llama de omisión porque lo que quiero es que omites una conducta bueno, con este cuadro vamos a ver ahora todas esas variables que decimos de la motivación en general la mayoría de las consecuencias y de las las consecuencias o sea, perdón lo que ocurre en las diferentes modalidades de aprendizaje respecto a la motivación es bastante intuitivo por ejemplo la demora en darte el premio si yo tardo más tiempo en darte el premio la consecuencia que sea la eficacia del aprendizaje será menor la detección de que esto sigue a esto será más difícil más difícil aprender y más difícil mantener el valor, la expectativa en marcha en general a mayor tiempo menor eficacia del aprendizaje mmm puede ocurrir o hay un procedimiento en el que bueno la demora es porque en principio durante ese periodo pierdo conciencia de la asociación o estoy haciendo otras cosas que me impiden ver claramente cuál es la consecuencia porque la consecuencia está conectada con lo que yo he hecho si en medio he hecho más cosas es más difícil conectarlo pues bueno, hay alguna forma de contrarrestar el efecto de demora que es por ejemplo la técnica de marcado la técnica de marcado es hacer algo durante el tiempo de demora característico como una especie de señal que no está relacionada con lo que va a ocurrir pero algo extraño por ejemplo con los animales el procedimiento de marcado es cambiarlos de sitio o manipularlos en un momento dado y eso hace como una especie de mojón una señal intermedia para aumentar los tiempos de demora para la eficacia del aprendizaje la demora parece que reduce el valor de incentivo porque con una con un procedimiento de marcado o sea, con una señal intermedia logramos que ese perjuicio que genera la demora se compense bastante o sea el aprendizaje se da pero no hay una conciencia de su bueno no hay una motivación suficiente un valor incentivo bajo y con la demora luego hay que tener claro o ver claramente que ese descuento de la demora si lo combinamos con la magnitud con el que hemos dicho antes a mayor premio más motivación a mayor demora, menor valor incentivo como lo combinamos pues bueno, que preferís un premio muy grande más alejado en el tiempo o uno más pequeño más inmediato ese es el tipo de experimento el tipo de decisión que involucra puede haber otras variables la magnitud y la demora y algunas otras por ejemplo el atractivo que tiene para mi el premio una serie de variables que cambian el valor del incentivo pero los principales o los más generalizables o los más fáciles de estudiar la demora y la cantidad por supuesto esta ecuación o algo parecido, no hace falta que veáis la ecuación pero sí, a mayor magnitud mayor valor incentivo a mayor demora menor valor incentivo la demora divide y la magnitud multiplica bueno, pues la teoría Mazur dice eso que hay una hay una ecuación explica un poco la actuación de cada persona y hay personas que tienden a preferir un premio mayor más tarde se llamaría personas con alto autocontrol que pueden decidir contenerse y lo contrario el que prefiere un premio pequeño e inmediato es una persona de tipo impulsivo ¿eh? bueno el ejemplo que pone es bastante popular intentar adelgazar y bueno hay muchos otros, ¿no? pues por ejemplo, ¿qué prefieres? invertir en estudiar una carrera cinco años para tener un sueldo más decente o dedicarte a trabajar con un sueldo menos decente pero desde ya muchas, muchas situaciones bien, pues el valor de alternativa o sea, en este caso le llama alternativa porque va poniendo la que cree que son las variables que configuran el valor pero ya veis que esto depende también de la de la persona y de su historial una persona es más autocontrolada o más impulsiva depende del valor bien la ejecución y la motivación depende también del dominio de la tarea una persona que tiene más experiencia tiene una motivación diferente que el que no el que no cree que no va a tener éxito no la va a intentar y como bien digo cree que va a tener éxito no se trata de una de un nivel de dominio objetivo sino subjetivo la percepción que tengo yo del dominio que tengo en en el caso bueno esto hemos visto los efectos quizás bueno la detección de causalidad vale aunque no siga el esquema voy a nombrarlo aquí en el libro la detección de causalidad y vuelvo un poco atrás es darme cuenta de veis que con la demora decíamos que yo no conecto mi conducta con las consecuencias más difícil aprender o el valor incentivo va disminuyendo también hay otras cosas que a veces ocurre lo contrario que yo conecto una acción mía con una consecuencia y en realidad no tiene nada que ver es un error de concepto esto es la conducta supersticiosa si yo llevo el bolígrafo en color negro en examen y tengo buena nota siempre hay un bolígrafo negro bueno pues ese tipo de tendencia a detectar que dos acontecimientos iban próximos tienen uno que ver con otro son emparejamientos que pueden ser erróneos y supersticiosos bueno pues eso por supuesto influye y como mis expectativas generan o sea si mi boli negro me da confianza igual son los exámenes con mucha más confianza es más probable que saque buenas notas y no tiene nada que ver con el bolígrafo sino con mi confianza o sea con el valor de incentivo que yo he puesto ahí es que el bolígrafo no tiene nada que ver con la confianza si no que el bolígrafo es un valor que tiene el bolígrafo es una se ha construido a lo largo de tu historia y partes de unos impulsos de unas necesidades vitales fíjate que la mayoría llegamos a a un consenso de lo que nos importa por ejemplo un reforzador secundario el dinero mira a ver a quien no le interesa el dinero ni se come ni se bebe es subjetivo porque depende de tu historia pero tenemos necesidades de partida similares e historias bastante similares, somos seres sociales la devaluación del reforzador es que si un estímulo positivo por ejemplo una comida por lo que sea pierde valor hedónico porque me sienta mal o porque está mala si el valor hedónico de la comida lo pierdo, la conducta también disminuirá yo sé que esa comida me alimentará y tal, pero ya no me gusta tanto, es decir, ¿qué ha disminuido ahí? el valor de incentivo, la devaluación del reforzador es una técnica que se utiliza a menudo, bueno se utilizaba para discutir teóricamente si yo tengo una representación de lo que va a ocurrir o no imaginaos que eso que me ha sentado mal una comida o no me gusta tanto porque un día estaba medio mala y claro, yo dejo disminuyó la conducta mis expectativas son lo que generan la conducta yo sé las consecuencias no cambia el aprendizaje, cambian las expectativas bien, el efecto Crespi que sale aquí un poco antes ya lo he puesto ahí recordáis que si visteis o habéis hecho la pepe, es muy sencillo el contraste positivo es un nivel de ejecución aumenta exageradamente cuando hay un aumento de alguna propiedad del refuerzo de la magnitud una propiedad positiva del refuerzo positivo y hay una disminución cuando disminuye la propiedad dijimos que hay un estado afectivo intermedio la alegría y la frustración bueno, el cuadro que le he puesto aquí es el mismo que teníamos en el efecto de contraste si paso de un premio alto a uno bajo si paso de uno bajo a uno alto hay un periodo en el que incluso es mayor que si hubiera tenido ese premio ¿os acordáis? bien, ahora vamos a ver los otros los otros programas, los que antes os he puesto en esquema no solo con una consecuencia positiva sino cuando las consecuencias son negativas ¿cómo debe ser un castigo? ¿qué variables del escape y la evitación son importantes? el escape y la evitación con la definición nos queda bastante claro si yo tengo una señal de que va a ocurrir algo malo y que tengo que hacer algo para evitarlo es una situación de evitación porque no llego a enfrentarme con la consecuencia negativa eso para las teorías de aprendizaje son difíciles de explicar porque a ver, voy a poner un ejemplo aunque sea de conducta supersticiosa si yo no paso por debajo de las escaleras porque creo que trema la suerte siempre pasar por debajo de las escaleras más o menos no me ha pasado nada malo porque no suele pasarte nada malo es una conducta de evitación ¿cómo puedo mantener esa conducta si no hay consecuencias? las teorías de aprendizaje dicen que tú aprendes en función de las consecuencias pues en la situación de evitación no llega a producirse ninguna consecuencia tú haces lo correcto y la consecuencia negativa no se produce la de escape es fácil de explicar se produce algo malo, hago algo y deja de producirse, ahí se produce la consecuencia hay un aprendizaje bueno, la única forma de explicar la evitación es meter algún otro factor, por ejemplo un factor emotivo que la señal que me permite saber que va a ocurrirme algo malo adquiere un valor negativo por condicionamiento clásico, es decir, si hay una luz que dice que luego te va a dar una descarga esa luz poco a poco te genera una emoción negativa un rechazo, por condicionamiento clásico, por la asociación con la descarga y esa luz es lo que evito es decir, hago algo para evitar ya esa luz que de por sí aunque no reciba la descarga, estoy evitando algo negativo que es la luz, que ya me produce ya un una especie de dolor bueno la, esa explicación no, el evitarte pasar por una escalera es dar un rodeo cuando pasar, o sea, no es no es no es una respuesta negativa una respuesta positiva, hago algo ¿vale? no, por cierta experiencia no yo digo que una evitación vamos a poner un ejemplo que no sea supersticioso si yo una vez yo que sé he pasado la velocidad al límite en la ciudad y me han puesto una multa de 50 euros procuraré no volver a pasar estoy evitando ese castigo mantener esa actitud es porque preveo que si paso me van a castigar pero no me castigan casi nunca por lo tanto ese aprendizaje en teoría las teorías del aprendizaje ese aprendizaje se debería ir extinguiendo llegaría un momento que volvería a ir a más velocidad bueno pues lo que lo que dicen las teorías que a lo mejor simplemente los señales de no pase de 50 hacen el mismo efecto que la multa en su momento porque las asocio con ellas bueno pues las teorías de de motivacionales tienen una explicación mejor la teoría de la expectativa teoría cognitiva yo anticipo las consecuencias y es un factor cognitivo no es una asociación veis que el aprendizaje busca asociaciones simples bueno la teoría cognitiva es que yo anticipo las consecuencias por lo que las he vivido antes entonces puedo explicar la evitación nuestra teoría de expectativa valor de incentivo lo explica de una forma mucho más cognitiva bueno como hago y también explica las supersticiones en el caso del castigo cuando yo hago algo y recibo una consecuencia desagradable creo expectativas del incentivo desagradable disminuyo el número de respuestas variables que influyen en el castigo a más intensidad o sea el castigo a más desagradable más efectivo bien ¿no? está dentro de la lógica el valor de incentivo disminuye mucho más rápidamente ahora bien si la intensidad del castigo va aumentando poco a poco es no tan potente como que te vas acostumbrando a recibir ciertas consecuencias y lo vas soportando mejor ¿de acuerdo? también yo creo que es bastante lógico ¿no? la duración a más duro el castigo más efecto más eficacia al disminuir mi conducta también es lógico la contingencia es decir la asociación de las actividades que son efectivas y efectivas en el caso del castigo sistemática entre la conducta y el castigo igual que en el premio veremos ahora que el refuerzo variable o ya hemos visto que los programas de razón variable son mucho más eficaces que los de razón fija el castigo es al revés si alguna vez no castigas la conducta el efecto del castigo disminuye bastante es decir el refuerzo positivo si no castigas la conducta si alguna vez no premias la conducta el efecto de incremento de la conducta aumenta porque hay una especie de expectativa de que algunas veces no me van a dar premio pero hay que hacer unas cuantas y el castigo es al revés si algunas veces no eres consistente con el castigo disminuye el efecto bueno esto en la práctica tiene muchas aplicaciones una vez que te saltes una consecuencia negativa pierdes mucho tiempo el efecto demora es idéntico a más tarde se produzca el castigo después de la conducta peor porque es más difícil mejor que sea inmediato y por último que haya respuestas alternativas si el castigo solo consiste en que dejes de hacer algo y no hay ninguna otra posibilidad agradable cerca tiene mucha menos eficacia que si te doy una alternativa positiva que a ti te convenga ¿de acuerdo? por ejemplo el castigo que sería yo que sé, por romper algo y repararlo por ensuciar o limpiarlo o algo así y el castigo tiene una serie de variables propias por esto de los incentivos desagradables que no ocurre con los premios y es que genera estados emocionales negativos que pueden perjudicar bastante el aprendizaje si el castigo es desproporcionado inconsistente con malas demoras cualquier variable que no la usemos bien va a tener que ser va a perder la eficacia y no va a tener las consecuencias que esperamos porque las consecuencias emocionales desagradables nos pueden llevar a conductas propias por ejemplo un dolor físico me puede llevar a la parálisis, al aislamiento un dolor social al aislamiento a vergüenza hay muchos efectos secundarios la respuesta emocional el escape y la huida que ya hemos visto que puede ocurrir es decir pasar de la persona que te castiga al otro lado vale no hago lo que tú me prohíbes pero hago otra cosa que me lleva al mismo lugar a veces hay una reacción al castigo que es lo contrario en vez de disminuir la respuesta la aumento como una forma de protesta o de fastidiar o de reacción emotiva también a veces hay el castigo secundario que se extiende a otras conductas y se suprimen algunas más es decir castigas más de lo que debes y por último y lo vamos a ver también el papel del ejemplo si alguien castiga yo entiendo que eso es normal y eficaz y es más probable que ocurra el modelamiento negativo bueno todo eso yo creo que también es bastante lógico que veis que no es el premio y el castigo no son caras contrarias sino que tienen es más complejo el castigo siempre ha sido más difícil y hay un fenómeno muy extendido hay que entenderlo no hay defensión aprendida sería un equivalente o funcional a lo que creemos que ocurre en la depresión cuando todas tus acciones tienen consecuencias negativas o hagas lo que hagas no puedes evitar ciertas consecuencias negativas llega un momento en que dejas de hacer como si estuvieras deprimido en los animales ocurre que cuando tú les das una pequeño castigo hagan lo que hagan llega un momento en que se paralizan se aislan y les impide aprender o ver lo lo que ocurre en el ambiente impide aprendizajes posteriores porque deja de atender al entorno de una forma eficaz es decir estamos creando una expectativa de falta de control es una variable claramente cognitiva bien pues es importante en la infección aprender y que ocurre hemos visto escapabilitación castigo es también muy parecido cuando usamos incentivos desagradables que ocurre cuando dejamos de reforzar algo como vimos en la PEC que ocurre cuando dejo de darte bolizas de comida cuando llegas al al final del corredor o que ocurre cuando dejo de pagarte el sueldo pues que poco a poco dejo de hacer la actividad que yo hacía aquí estamos hablando vamos a hablar de la extinción en el caso de refuerzo positivo lo que es más sencillo bueno ya sabemos que la extinción consiste en que dejo de reforzar y poco a poco disminuir la conducta ahora bien cómo disminuye esa conducta primero si la consecuencia era positiva hay un sentimiento de frustración que suele llevar a respuestas emocionales y una de ellas es el que se llama estallido de la extinción si yo dejo de hacer algo produce cierta agresividad la respuesta que yo pretendo extinguir porque dejo reforzarte la haré con más intensidad bueno yo pongo siempre un mismo ejemplo que es un botón y te imaginas que le das a un botón o un aparato un teléfono mismo le das a un botón y no funciona lo que ha funcionado siempre ya sigues dando y no funciona y le das con mucha intensidad en un momento el estallido la extinción te das cuenta que no va a funcionar entonces empieza a bajar la respuesta vas probando cuando y dejas de probar ¿no? también se produce variabilidad de respuestas en vez de darle al botón le das a otro lado otro arriba le das un golpe esos dos fenómenos ¿no? lógicos cuando deja de producirse la consecuencia deseada frustración estallido la extinción que es aumentar la respuesta y variabilidad pues resulta que si antes de la extinción el reforzamiento era parcial es decir recibía el premio de cuando en cuando tarda mucho más en desaparecer la conducta que si el reforzamiento era continuo que desaparece mucho más rápido ¿os acordáis en la P que decíamos que los que más recompensa recibido más pronto dejaban de correr mientras que los que han recibido menos tardaban más bueno pues el reforzamiento parcial y la magnitud también la demora el reforzo también tiene un efecto es como que en el reforzamiento parcial hay muchos ensayos o muchas ocasiones en que a pesar de hacer lo que debes no recibes premio y estás acostumbrado a que haya acciones sin consecuencia y te cuesta más distinguir que ahora ya no va a haber nunca consecuencias tardas más en dejar de hacer las acciones es un cambio de expectativa veamos programa refuerzo continuo se extingue antes que los variables ¿vale? esa es una segunda si yo he aprendido algo en diferentes lugares el ambiente y el contexto es más difícil que se extinga la expectativa se asocia también con el contexto entonces si sólo se ha aprendido en uno es al cambiar a otro se extingue más rápidamente la respuesta pero si se aprendió en varios está como más generalizada y es más tarde si sólo se aprendió en uno se extingue más rápido la magnitud lo que hemos dicho aquí si la recompensa era grande y la cantidad de veces es grande la forma o sea si he hecho muchas veces la conducta para que me dé una recompensa grande hay mayor resistencia a la extinción si el entrenamiento es breve menor resistencia a la extinción o sea en corto plazo y luego la demora si es variable más resistente lo mismo que antes es decir intervalo de tiempo variable también no sabes cuando te cae el refuerzo pues es más difícil extinguirlo después vale son como veis datos que yo creo que responden a la lógica vamos con la conducta la actividad motivadora de la conducta este punto dice que a veces no aprendemos porque nos tenemos una consecuencia sino por hacer lo que hacemos yo muchas veces haces algo que te lleva a tener ocasión de hacer otra cosa y esto es lo que necesitamos somos seres activos necesitamos ciertas acciones entonces para poder pasear por el bosque tengo que llegar al lugar donde para poder pasear por el bosque tengo que llegar al bosque bien el camino de aquí al bosque para mí es algo que tengo que pagar para poder pasar en el bosque que es lo que me gusta no o para poder ir en bici tengo que ahorrar y comprarme bueno esta forma de ver el aprendizaje es diferente a las consecuencias sino que lo que hago es una actividad reforzante y lo que no me gusta hacer es lo que pago para la actividad reforzante según premac si yo te dejo hacer lo que quieras y haces dos cosas diferentes pero una la haces el 80% del tiempo y otra un 20% del tiempo yo puedo obligarte a hacer algo desagradable impidiéndote hacer lo que más te gusta si tú estás todo el tiempo tumbado al sol impido estar tumbado al sol te digo si no haces esto no te dejo ir al sol entendéis lo que uso como refuerzo es una actividad y qué actividad es reforzadora pues aquella que me gusta más aquella que hago más a menudo si las ratas pasan más tiempo corriendo que bebiendo les puedo hacer correr están jugando más tiempo que comiendo golosinas bueno pues también se puede hacer con el castigo es decir tu conducta preferida puede ser un refuerzo para hacer una que no quieres te puedo obligar a trabajar para hacer algo ¿no? esa es una y la otra un matiz a esta teoría es la de Timberlake la de Allison y Timberlake Allison y Timberlake dicen que no hace falta que sea la preferida tu actividad reforzadora que incluso utilizando la que no prefieres también puede ser un refuerzo ¿por qué? porque la que no prefieres aunque la hagas solo un 20% del tiempo ese 20% es tu necesidad si yo te impido hacer ese 20% y solo te dejo hacerlo un 5% querrás aumentar esa actividad al 20 entonces con actividades no preferidas también se puede reforzar una actividad la actividad reforzadora prima que siempre llega un momento desaparece en teoría si tu preferencia es estable te puedo reforzar siempre es decir si yo qué sé descansar es una actividad que por supuesto es de motivación permanente te va a gustar siempre pues va a funcionar siempre yo te dejaré descansar si haces lo que te pido si es una actividad temporal pues funciona claro las preferencias pueden cambiar por el tiempo pero algunas no cambian nada esa es la medida o sea para premar puedo utilizar de refuerzo una actividad que prefieres bueno esa preferencia pues es temporal o permanente y para Timberlake y Alice si con niños les cambia la preferencia pero es fácil bueno el experimento clásico es tú los miras y el 20% del tiempo vamos a poner está haciendo puzzles el 80% corriendo vale pues lo que prefieres correr entonces dices si quieres correr me tienes que hacer este puzzle ahora la actividad correr con tres años a lo mejor es muy reforzante con cinco ya no claro que va cambiando a lo mejor de un día para otro o sea tendrías que volver a evaluar y Timberlake y Alice dicen que incluso la actividad con menos frecuencia la de hacer puzzles yo le puedo utilizar como refuerzo diciéndole vale te gusta hacer puzzles una cuarta parte del tiempo pues no te voy a dejar te va a dejar hacer puzzles sólo una décima parte del tiempo con lo cual él te va a pedir hacer puzzles y después eso es lo que dice o sea mi la actividad es una fuente de motivación y manipular eso pues es una forma de a ver si nos queda bueno igual vamos a ver un poco lo que queda porque hace poco podemos acabar el tema bueno nos queda el aprendizaje observacional en principio obviamente sabemos imitar sabemos observar y hacer no sólo nosotros sino muchos animales sobre todo los más cercanos en el sistema evolutivo imitan entonces observar imitar para las teorías clásicas es muy difícil de explicar por ejemplo bueno a mayor capacidad cognitiva en la especie más y en las personas por supuesto a lo largo de la vida más capacidad para imitar modelos y por supuesto imitar o ver las consecuencias en otro nos puede restar muchos perjuicios en la vida y es muy efectivo ese tipo de aprendizaje al principio la primera explicación es o recurrían con la teología al gimnatismo tenemos una especie de sistema de copia pero claro eso la imitación humana es muy flexible no puede explicar las imitaciones complejas humanas el condicionamiento clásico decía que aprendemos por contiguidad por asociación pero claro no puede ser porque aprendemos a imitar hacer respuestas que no teníamos en nuestros repertorios por lo tanto no es simplemente una asociación de lo que le ocurre a él o lo que me ocurre a mí condicionamiento operante también daba explicaciones de refuerzo el condicionamiento decía bueno si yo veo que una persona tiene un refuerzo eso refuerza también me da cierta cierta consecuencia positiva a mi por lo tanto puedo aprender por ver el modelo feliz el modelo que yo voy a imitar igual hay una similitud una especie de refuerzo secundario pero también hay muchas situaciones de aprendizaje observacional donde no hay ningún refuerzo es decir yo imito a una persona que hace cosas y no le pasa nada agradable es más hay muchas situaciones en las que aprendes a imitar algo y no lo pones nunca en marcha sino que con el tiempo te sale es decir aprendiste pero no hay una evidencia por lo tanto no hay operación el condicionamiento no lo explica entonces Bandura propone una teoría del aprendizaje observacional que le llama social y es una teoría plenamente cognitiva yo lo que hago cuando imito es una construcción simbólica de la situación que requiere toda una serie de variables que introducimos ya en el tema siguiente en principio el aprendizaje social de Bandura tiene tiene muchos nombres vicario modelado aprendizaje sin ensayo observacional social y lo importante es esto que es cognitivo que es simbólico por lo tanto aquí hablamos plenamente de expectativas de motivación vicaria donde un estímulo externo una situación nos le prestamos atención vemos que está ocurriendo algo vemos que el modelo hace algo y recibe una recompensa codificamos esa relación la organizamos y si es el caso lo hacemos nosotros también es decir una cosa es ver lo que le ocurre al otro y otra cosa es poderlo hacer yo y veis que los bebés desde muy pequeños son capaces de imitar es decir reproducir una acción que has visto con tu propio sistema muscular tiene que ser una capacidad muy básica y si es mental una secuencia compleja mucho más difícil bueno pues este sería el esquema de cómo funciona y lo importante es lo que es necesario o los presupuestos teóricos una representación mental no hace falta que haga nada se puede aprender sin hacer creamos expectativas las expectativas cuando vemos que ocurre algo importante hace que atendamos más codifiquemos más seamos más eficaces y por supuesto estas expectativas son antecedentes de futuras conductas el reforzado no es necesario nosotros ya tenemos el cuadro construido se puede aprender sin hacer y esto es muy importante también el condicionamiento operante el aprender a hacer algo que hemos visto hasta ahora para Bandura es un caso de aprendizaje observacional de uno mismo se puede aprender viendo a otros o viendo lo que me ha ocurrido vale y los cuatro puntos que vienen aquí son los factores que son necesarios para que ocurra el aprendizaje observacional en la fase de adquisición es decir cuando aprendo del modelo y en la fase ejecución cuando llevo a cabo la conducta requiere factores atencionales y de memoria retención en la ejecución requiere capacidad de reproducir y la motivación para reproducir eso que sería en pequeño los atencionales serían los siguientes focalizar en lo que me interesa no ha de contribuir sino en la situación según el estímulo el estímulo es aquello que ocurre lo que busca la situación en sí si es discriminable intenso nuevo vivo adecuado a lo que a mí me interesa da igual que sea real o imaginaria o imaginar también lo complejo que sea son los factores que encontré el modelo alimentario si tiene yo le asigno competencia tiene prestigio si tiene ciertas características del observador pues lo que yo creo que me va a costar dependiendo de esa consecuencia o no una serie de variables segundo factor de adquisición la retención es construir una simbolización imaginación verbal la tengo ahí como guía construyo un esquema y lo construyo activamente porque lo hago mío con mis esquemas y mi historial lo repito lo repaso y lo guardo más o menos claro y la segunda fase para reproducir la conducta depende de mi repertorio por supuesto hay cosas que nunca sabré hacer capacidades y límites y algunas no hace falta que las dé sino que las supongo algunas el modelo no las puedo ver porque no sé lo que hace mentalmente y bueno no se la dan y por último los factores relacionados con la motivación en la ejecución la motivación aquí es el valor de incentivo si hago o no lo que hago depende del valor de incentivo que influye en todas las fases en las anteriores también atención que presto cuánto memorizo la eficacia de la aprendizaje entonces los incentivos sirven como informadores de lo que va a ocurrir es decir motivadores porque simbólicamente yo ya anticipo la consecuencia las consecuencias agradables o desagradables me auto incentivo y por último acrecentar ayuda a centrar a discriminar a mirar dónde quién y cuándo tengo que actuar vale todo eso una parte veis esta teoría bandura bastante completa al final del tema y nos introduce al tema siguiente que es la parte cognitiva y esto lo veremos después de las vacaciones así que vaya muy bien y nos vemos en enero hasta el próximo domingo nos quedan dos sesiones y tres temas cuatro temas o sea será un poco más rápido pero los temas que nos quedan también son siete u ocho son mucho más dime la duda la práctica si la veremos la veremos a la práctica 2 trata de un cuestionario de motivación en el ámbito deportivo es decir vamos a ver la estructura cómo está construido y a qué responde el cuestionario cómo mide la motivación era un instrumento de medición de motivación que es un cuestionario de acuerdo y la veremos después del tema 9 y yo creo que en la penúltima o la última sesión intentaré que sea en la penúltima de acuerdo hasta enero sí también habrá preguntas dirías en el examen lo que no hay