Vamos a ver el tema de... Bueno. El adhesivo. Este tema... Hola. ¿Te has llegado bien o no? No. ¿No has visto el tema 7? ¿Tampoco? Te voy a hacer una introducción más bien de fondo, de aspectos más geniales, porque si lo miraría, pues iríamos más al detalle y... El tema habla, y nos podemos hacer una idea de qué va, de eso que hablábamos al principio de que los condicionamientos aversivos, el castigo y todo eso, tienen consecuencias paralelas a las deseadas, porque generan dolor, frustración y todo eso interfiere de alguna forma. Este tema se dedica a ver exactamente eso. De qué forma interfiere, qué teorías hay, qué resultados hay. Entonces, empezamos la primera parte del tema viendo o repasando qué eran los aversivos, comparándolos con los otros, qué consecuencias tiene cada uno y luego vemos algunas teorías que dicen qué es lo que ocurre cuando castigamos. ¿Qué diferencia hay cuando castigamos a cuando creemos que algo ocurre en medio? Hay una emoción en el medio que tiene defecto. Y explicando por qué es de una forma diferente y hay una serie de experimentos que varían un poco en la forma para ver quién tiene la emoción. La veremos con eso. Luego vemos el castigo en detalle, qué factores hacen más efectivo los castigos y menos, la admisión en detalle y por último, el mismo programa que vimos de elección es una pequeña consideración de si tenemos que elegir entre dos premios, ya vimos en el capítulo A o B lo que hacíamos, la ley de igualación, y si hay dos castigos, pues yo creo que lo ves. Si hay menos o más castigos, pues son pequeños. Vamos con la primera parte. Dice Aversivo siempre es un aprendizaje que consiste en evitar algún estímulo que es malo, se refiere a aquellos métodos en los que se utiliza alguna consecuencia mala para el individuo. Por lo tanto, vamos a evitarnos. Entonces, ¿qué solemos evitar los seres vivos? Aquellos caminos. Que amenazan nuestra salud y nuestra vida. Eso le llamamos aversivos primarios. Dolor y todo ese tipo de cosas. Y llamaremos secundarios aquellos que, por asociación con los primarios, los evitamos también. Por ejemplo, si me ha morido un perro, me alejo de todos los animales que tengan pelo. Aunque sean buenos, aunque no me digan nada, ¿eh? Pero cualquier cosa. Secundarios y primarios. Ese aprendizaje de qué estímulo es aversivo sigue la lógica del condicionamiento clásico. Uno secundario se convierte en aversivo por asociación con uno primario. ¿No? Y poco a poco genera el mismo efecto. Si usted se ve mucho en positivo, pues negativo es lo mismo. Muchas veces las fobias vienen de un aprendizaje de este tipo. ¿No? Por lo tanto están sometidas a los procedimientos de extinción como una fobia se puede curar mediante la desensibilización sistemática, que no es más que un proceso de extinción. ¿Habéis oído hablar de eso? Si tú le tienes miedo, pongamos a las serpientes, la desensibilización sistemática consiste en ponerte una serpiente primero lejos, aislada con un cristal, segundo más cerca, primero con el cristal levantado un poquito, cuarto sin cristal, y así poco a poco se va extinguiendo el miedo, el miedo condicionado. ¿No? Hay otro método que es la inundación. Me sentí una sola vez en serpientes. Que también o se extingue o te muere. Bueno, eso también sería un contracondicionamiento, es presentarte una serpiente y darte un caramelo cada vez. O algo que te guste mucho y con el efecto contrario se va contra ti. ¿Qué ocurre cuando aprendemos un condicionamiento adversivo? Pues que suele haber una conducta que denominamos defensiva. La conducta que evita es defensiva. Tanto en condicionamiento clásico, cuando apartamos la pata, saltamos, nos paralizamos para recibir, como en condicionamiento operante, la huida, el ataque, la reacción... Las principales, las que hemos dado en condicionamiento operante son siempre la huida, la agresión y la inmovilización. Y dependerá el animal y dependerá de lo que haya vivido Bien. Repasamos los procedimientos de condicionamiento para ver cuáles son aversivos. Pues la clave es esta. Estímulo o consecuencia que se utiliza en cada uno de ellos. ¿Cuál es en el reforzamiento positivo? Un premio. Ponemos aquí un signo más y tiene... Lo que se utiliza aquí es agradable. En el reforzamiento negativo, escape o evitación, ¿qué se utiliza como consecuencia? Al revés. Eso es en la admisión. En el escape. ¿De qué te escapas? ¿Cuál es la consecuencia que se utiliza? Ah, perdona, has dicho no tener dolor. Bueno, dolor es la palabra. ¿Qué se utiliza? ¿La descarga o algo que produzca dolor? Por lo tanto, a ver si... ¿En el castigo? En el castigo, es obvio. Aversivo. Y en la admisión, si no te callas, te apago la tele. Positivo, porque la tele es positiva solo que la quitamos, pero es positiva. Por lo tanto, estos dos del medio son los aversivos de por sí. ¿Os acordáis que el primero incrementa la posibilidad de una conducta? ¿Qué hace el reforzamiento negativo? ¿Quién sabe bien? De huida y escape. Lo que estamos entrenando es la huida y el escape. Y nosotros dos, porque estás quieto en tu castigo, porque estás quieto en la tele, adivina. Y, por último, hacíamos las relaciones. ¿Os acordáis? De la conducta con la consecuencia. Esto es una multiplicación. Si sabéis multiplicar, ya está hecho. Más por más. Más. Relación positiva. Menos por más. Menos por menos. Más. Y, por último, más por menos. Es decir, es la interpretación. En el refuerzo positivo se aumenta la conducta, aumenta la consecuencia. En el negativo se aumenta la conducta, disminuye la consecuencia, porque a más escapo, menos descarga recibe. En el castigo, a más me porto mal, más castigo. Aumenta, aumenta. Aquí está. Este es el cuadro, otra vez. Ahora, hoy vamos a hablar de estos dos, que son aversivos, porque utilizan consecuencias aversivas. Por esta parte. Y entre ellos, y entre positivo y negativo, pues podemos hacer una serie de matices de semejanzas y diferencias. ¿Qué diferencia hay entre el castigo y el refuerzo negativo? La huida o la dictación. No son lo mismo. Obviamente, la diferencia es que en el refuerzo negativo primero aparece una consecuencia negativa. La conducta obviamente se estimula. En el castigo, sólo aparece después si hay conducta. Por lo tanto, no hay una diferencia. Es el tipo de matices que hace. Lo leéis que no tiene mayor dificultad, pero ver simplemente cuál es la diferencia. Entonces, ¿qué es lo específico de estos dos que tienen en común que producen? Bueno, pues todo condicionamiento operante con un estímulo aversivo produce además un estado emocional. Por lo tanto, fijaos lo que está ocurriendo. Como en el condicionamiento clásico estamos haciendo una descarga, está produciendo miedo. Esto en el clásico, si hubiera una señal, sería inhibitorio. ¿Lo veis? Hay señales. Sí, el ambiente. El ambiente en sí mismo, donde se lleva a cabo el experimento, puede funcionar como señal. Y también vimos que en muchos estímulos de condicionamiento operante se utiliza el estímulo discriminativo. Entonces, actuará como señal inhibitoria. ¿De acuerdo? Si en un condicionamiento operante yo utilizo una luz, diciendo, cada vez que aparezca la luz, como un salto, este va a dar una descarga. Esa luz acaba siendo una señal de la descarga en términos clásicos, del miedo. Aparece la luz y aparece el miedo. ¿Lo veis? O sea, hay un condicionamiento clásico paralelo. Y aunque no hubiera luz, aunque no hubiera estímulo discriminativo, la habitación en sí misma se asocia o cualquier cosa del contexto, que me llame la atención, se asocia con eso. Y le pide miedo. Que no te pasa alguna vez que te pasa algo malo en un lugar y luego cualquier cosa que te recuerde ese lugar te genera una sensación parecida. Pues eso sería. ¿Cuáles son los estímulos incondicionados de este condicionamiento clásico que se producen paralelo sin querer? En general, o bien son positivos o son negativos. Cuando yo recibo un premio, siento una especie de alegría, el estado emocional que se condiciona a la alegría y cuando recibo un castigo, miedo. Por lo tanto, en refuerzo positivo, en un mensaje de refuerzo positivo, las señales del ambiente o el estímulo discriminativo se condicionan. ¿Me produce alegría ya ver esa señal? ¿De acuerdo? Cuando voy a cobrar a fin de mes, el día que llegan y reparten y se ve la señal de que van a pagar, ¿me produce alegría? Bueno, pues eso. Y lo contrario, el miedo. Ese es el estímulo incondicionado. ¿Y el condicionado cuál será? Pues dependiendo. El experimento se excita a todo el mundo. Es decir, si la señal va a ser efectiva, va a haber una señal efectiva de que va a ocurrir algo, por ejemplo, en el reforzamiento positivo, una señal de que me van a pagar, todavía no produce la alegría de cobrar, pero sí la esperanza de que me van a cobrar. Y una señal de que me van a castigar, todavía no produce el dolor, pero produce la tristeza. Y un entrenamiento inhibitorio, si te dicen que este mes no vas a cobrar porque hay problemas con los fondos, no va a haber consecuencia, lo que hay es una ansiedad. Una señal de que no vas a cobrar o una señal de que no te van a castigar, alivio. Esto, hagamos lo que hagamos, ocurre en paralelo. ¿De acuerdo? Entonces, sobre todo esta parte de aquí abajo, los negativos, tienen un efecto emocional destructor o que interfiere en gran medida en la mentalidad. Entonces, el papel del estímulo discriminativo positivo y del estímulo delta a la discriminación negativa, que os acordáis que era, condicionamiento operante, alguna respuesta tiene una consecuencia. Si hubiera una señal de cuando la respuesta es coherente o es operativa, es un estímulo discriminativo. Pues ese estímulo discriminativo es el E.C. del condicionamiento clásico en paralelo de lo que está produciendo. Porque acaba produciendo alegría, miedo, esperanza. Bueno, analizando eso, lo que tenemos aquí es miedo. Miedo es lo que generan los estímulos aversivos. Por lo tanto, en este tema, estamos hablando de que en todo condicionamiento que utiliza aversivos, hay una reacción de miedo o un aprendizaje clásico que produce el miedo paralelo a lo que estemos haciendo. ¿Y el miedo cómo lo medíamos? ¿Os acordáis? ¿Cómo medía yo la reacción emocional negativa en un aprendizaje inhibitorio, por ejemplo? En el condicionamiento clásico decíamos el aprendizaje de miedo se tiene que medir con la supresión de la conducta. ¿Por qué? Porque había muchas conductas que no tenían una línea base para subir y bajar, sino que bajaban a cero. ¿Hago o no hago? ¿No hacer qué significa? ¿Que tengo miedo o que estoy cansado? No hay una explicación clara. Entonces lo que hacíamos era en todo aprendizaje inhibitorio una señal de la negativa teníamos una tasa de conducta base que la habíamos provocado. Teníamos una señal de la rata y una señal de la palanca. Y luego soltábamos el condicional que era señal de algo aversivo. En la medida en que paralizaba la actividad normal, la que había más inducido, era una medida del medio inducido. O sea, la supresión condicional de la conducta. Y la medíamos con una fracción que decía arriba lo que hace ahora dividido por lo que hacía un minuto antes y lo que hace ahora. Es decir, si no ha suprimido la conducta daba 0,5. Uno para dos. Y si la ha suprimido se iba aproximando a cero. Más abajo, más miedo. ¿De acuerdo? Bueno, pues acordado eso. Y ahora tenemos una teoría nueva que dice esto es. Nos proponen que lo que ocurre en todo condicionamiento aversivo es una respuesta emocional condicionada de miedo que suprime la conducta. ¿De acuerdo? O sea, esto estaría en las páginas 356, 357 donde explica lo que se da en paralelo cuando estamos aprendiendo algo operante. Por ejemplo, la tabla 1, 356 dice condicionamiento operante hay una señal que actúa como F. Ciertas reacciones de mi cuerpo también pueden actuar como F. Más allá de eso. En mi libro que tiene otras páginas. 356. Sí, ese es el cuadro. 366. Bueno, el otro se hizo la tía. Es que mi libro es una diciembre. Es una diciembre. No, no, sí, pero lo han revisado y este tiene más ratas que el tuyo. ¿No? No más ratas, sino más ratas. Bueno, pues la teoría de este es la teoría del final simplemente dice teoría de respuesta emocional condicionada. Es lo que hemos dicho. Toda situación de condicionamiento ha sido provocado por una reacción emocional que muchas veces provoca su presión y, por lo tanto, contamina los resultados porque hay una incompatibilidad entre la conducta que debe llevar a cabo y la que el niño le está provocando. ¿De acuerdo? Bien. Seguimos viendo en detalle ahora la evitación. Escape de evitación. Pensar que el escape es una primera fase de la evitación. Este es a veces confuso nombre reforzamiento negativo. Lo podemos llamar mejor huida de evitación o simplemente evitación. La primera fase es huida, la segunda es de evitación porque ya no ocurre más el estímulo agresivo del antecesor. ¿Cuál es la característica más llamativa de este aprendizaje? Pues que ocurre o se mantiene sin consecuencias. Una vez que se ha establecido la huida empieza la evitación y una vez que empieza la evitación ante cierta señal evito la consecuencia y como no hay consecuencia esa es la paradoja. ¿Qué podemos esperar? Que con el tiempo se extinga porque no hay consecuencia. ¿No? Pensad un momento una persona que está muy habituada a conducir se confía mucho pero ya tiene un susto porque está a punto de y vuelve a ponerse en tensión. Esa evitación que aprendió en su momento las primeras veces cuando llega muy tenso se automatiza y poco a poco algo así. Eso es la idea. Los primeros experimentos este es el aprendizaje que se produce sin consecuencia. Dentro de la evitación tenemos dos procedimientos básicos una es discriminada otra es indiscriminada. ¿Qué quiere decir discriminada? Que hay una señal que anticipa que va a ocurrir algo malo y que crece. En la norma discriminada no hay señales hay otros procedimientos que nos permiten aprender pero no es una señal explícita. Bien la señal nos lleva a las dos fases primera fase voy aprendiendo que la siguiente consecuencia escape la segunda fase aparece la señal y me voy nunca percibo la consecuencia. Normalmente hay una serie de reacciones que podemos considerar en este paradigma siempre que hay señal las reacciones de la señal con la conducta y con las consecuencias. Al principio del aprendizaje cuando está la señal suele haber consecuencias ¿verdad? Al final no cada vez que está la señal como yo hago lo que debo no hay consecuencia pero esa relación cambia. ¿Qué ocurre con la señal y mi conducta? Pues que al principio poco a poco la señal va asociada a mi conducta señal movimiento señal movimiento y con mi movimiento y las consecuencias pues que al principio tengo una relación negativa y al final tengo una relación de extinción porque cuando me muevo no hay consecuencia esos son los parámetros de esta aprendizaje Claro hay cierta interferencia hay cierta dificultad en el aprendizaje lo que he aprendido en positivo que mi huida me quita una consecuencia luego deja de tener consecuencias la descarga en cierto modo tiene una consecuencia de parálisis que impide la huida también en la fase de escape yo recibo una descarga ¿qué produce una descarga? miedo condicional ¿qué produce miedo? Parálisis ¿Qué me está impidiendo? Que salte hay interferencias en el aprendizaje o sea es un todo complejo ¿no? y al final vemos que es de los más difíciles que hay a pesar de ser discriminado el aprendizaje de evitación cuesta mucho más relativamente hablando que los otros tipos de castigo ¿eh? probablemente por estas razones que estamos escuchando entendéis por qué ¿no? bien obviamente al final el estímulo de estudio negativo positivo la señal actúa como estímulo discriminativo positivo en el de de evitación ¿por qué? poco a poco la señal va siendo una una señal de seguridad bien ¿cómo explicamos esto? hay dos teorías básicamente que habrían que distinguir o por lo menos caracterizarlas bien la primera es muy fácil se llama bifactorial se produce un miedo en los primeros ensayos de escape la descarga produce miedo y en la segunda fase me escapo de ese miedo que me produce la primera es decir pensar un momento la lógica ¿por qué se mantiene una conducta si no hay consecuencias? pues él pone primero la descarga produce miedo y luego el miedo condicionaba la señal es lo que está produciendo la huida sí que hay una consecuencia un miedo y me escapo del miedo ¿de acuerdo? la teoría dice que hay una variable intermedia que es el miedo que permite mantener la la conducta cuando pasa mucho tiempo y el miedo cada vez es más más leve yo me subo al coche cada vez voy más confiado para que tenga menos miedo se pone una extinción hasta el momento tengo otro asusto y se reactiva el miedo o sea una especie de ciclo ¿vale? eso dice la teoría intermedia la teoría alternativa dice que no hace falta un miedo condicionado clásicamente interno en medio sino que basta con que la señal asumamos que adquiere un valor reforzador de la misma manera que una cosa que tú asocias con algo malo es un valor castigo la señal discriminativa se asocia con el escape a algo positivo y por lo tanto tiene un valor reforzador la señal por sí misma tiene un valor reforzador secundario no hace falta hablar de miedo y para el something es un aprendizaje aversivo secundario y la señal de seguridad o sea el estímulo discriminativo es lo que provoca el aprendizaje es decir hay una teoría la bifactorial alude al miedo y something no hace falta ponerle miedo porque dice que es innecesario la más simple es una teoría mejor para él la señal podría ser una asociación con la posible descarga libre de esa señal porque normalmente cuando huyes a pensar en el miedo cuando empiezas a pensar o sea voy a llevar al hambre lo que hay que pensar si salgo soy bien pero no es no es reflexionado simplemente que no hace falta el miedo es la señal en sí misma igual que cuando ves una señal de algo que te gusta esa señal de por sí ya te gusta también sería algo así el reforzo de llevar la señal mismo cuando falta lo están funcionando huir de la señal o sea la señal está asociada con la descarga es que lo digo a lo mejor me explico me da la señal está asociada con la descarga huir de la señal es reforzante la señal es algo malo huir de la señal ya es reforzante vale dice no hace falta que la señal produzca miedo la señal por sí misma adquiere un aversivo secundario ¿de acuerdo? bueno los procedimientos de Sidman y los siguientes de Heister y Finnegrin son un pelín crueles en el sentido de que éstos no avisan es fácil distinguirlos del otro Sidman te pone en una caja y normalmente es de tipo variable o de tipo fijo cada diez segundos se muestra una descarga si tú haces algo pues la señal la conducta buscada de huida o evitación en vez de la descarga cada diez segundos ocurre cada treinta es decir te dan una seguridad de treinta segundos ¿de acuerdo? o sea si tú no haces nada cada diez segundos descarga ahora si haces lo que se te pide la descarga tarda treinta segundos claro si tú haces lo que se te pide cada veinte o veinticinco segundos nunca recibes descargas o sea luego es la evitación porque te da treinta segundos de margen ese es el método Sidman el método Sidman lo único que tiene que cambia de unas sesiones a otras son la cantidad de segundos de descarga y la cantidad de segundos de seguridad el de descarga le llamaría de estímulo a estímulo de descarga a descarga y el otro de respuesta a descarga cada vez que hay una respuesta ¿cuánto tiempo de seguridad? bueno pues qué pensáis ¿cuándo se aprenderá más fácil? pues cuando cuando hay muchas descargas se aprende más fácil cuando el tiempo de seguridad también es más largo se aprende más fácil y cuando la relación entre este y este este es mucho menor que este también se aprende más fácil claro en un ambiente que hay mucho peligro una conducta que te dé mucho tiempo de seguridad se aprende muy rápido ¿no? o sea es bastante lógico el procedimiento de Sidman lo importante es esto los intervalos sin respuesta cada cuánto tiempo hay descarga si no haces nada y los intervalos con respuesta cuánto tiempo de seguridad para cada y en función de esos intervalos cambia la efectividad del procedimiento datos con este condicionamiento es muy diferente perdón difícil no es diferente creo que es muy difícil se aprende muy lentamente se necesita mucho tiempo y la segunda es que dependiendo de cada animal puede haber mucha variabilidad algunos se aprenden más rápido que otros con lo cual es una pregunta que dependerá más de habilidades ontogenéticas de cada no tanto de la especie sino de la historia de cada uno de las capacidades de cada uno o sea una aprendizaje difícil ¿de acuerdo? ¿de qué depende que aprendamos esto? ¿de qué pensáis que depende? que yo anticipe que tengo que hacer algo justo 25 segundos pues de un reloj interno ¿no? lo más lógico es pensar en una especie de reloj interno que te permita estimar cuánto tiempo ha pasado aquí la variable clave es el tiempo entonces hay dos teorías una que dice lo que ocurre es que hay la proprioceptiva dice hay estímulos internos que por sí mismos mi cuerpo mide el tiempo y anticipa empieza a haber cierta inquietud a los 25 segundos y ese estímulo interno esa inquietud me hace reaccionar otra teoría dice que es un reloj biológico que tenemos dentro y que nos permite medir el tiempo ¿no? son dos teorías que dicen entonces la hay otra tercera teoría que claro lo que sea que ocurre es el estímulo interno o el reloj temporal te da una señal de seguridad de la conducta hacer la conducta con cualquier estímulo interno que indique que hay un periodo de seguridad es algo positivo que me dice la gente en un rato que no lo cree ¿no? la hipótesis de señal de seguridad es limpia dice todo lo que provoca la respuesta de huida el salto lo que te hagan hacer es una especie de señal de un periodo de tranquilidad y eso es lo que se realiza tenemos un sistema interno de estímulos internos porque efectivamente un reloj interno o un condicionamiento del movimiento de huida que genera un periodo de seguridad y por lo tanto adquiere un valor de periodo tranquilo el segundo procedimiento no es discriminado aún es más claro que el primero en el sentido de que no es que no sólo te avisen sino que las dos posibilidades son automáticas es decir haces lo que hagas en las dos posibilidades hay un castigo cada x segundos ahora bien en uno de los programas es cada 10 segundos pongamos yo necesito cada 20 segundos entonces cuando tú respondes lo que yo quiero que aprendas lo que hace es cambiar del programa duro a blando y si no respondes vuelve al blando al duro pongamos que el a es cada 10 segundos mi respuesta provoca que cambia al b que es cada 20 segundos y si no respondo vuelve al a entonces ¿qué puedo lograr yo como mucho? mantenerme en el b mantener un programa con menos descarga no evitarlas ¿de acuerdo? con el tiempo claro se produce un aprendizaje y se responde para evitar volver al a ¿qué diferencia tengo en el anterior? pues que en este caso en el anterior cada movimiento era un periodo de seguridad que podía condicionarse en este procedimiento lo que se condiciona es un cálculo global de qué me conviene cada movimiento no evita necesariamente la descarga pero sí en global me conviene responder por lo tanto es un aprendizaje tipo molar y demuestra que el estímulo el procedimiento que sea te ayuda a la evitación es molar y que hay un mecanismo de aprendizaje que es capaz de calcular pero que conviene con probabilidades a largo plazo ¿de acuerdo? ¿entendéis cómo se programa no? bien nos propone al final qué factores del condicionamiento de refuerzo de huida o evitación son los que lo hacen más efectivo o menos y habla de algunos así en reflexión más o menos abierta la intensidad claro si el castigo que se utiliza es más intenso por lógica el aprendizaje va más rápido ¿no? la consecuencia es más costosa segundo la familiaridad también dependiendo de si yo tengo mucha experiencia con el castigo ese que me ofrece pues a lo mejor no es tan efectivo ¿no? como si te ponen una multa de un euro cada vez que te pasas de velocidad y luego te ponen una de 50 bueno pues tardarás más en aprender que el que no ha pagado nunca ninguno de un euro te sorprende más algo así eso la habituación a la descarga te puede hacer tardar más en aprender y bueno también los periodos de que has estado en extinción si durante mucho tiempo no te ocurrió nada la familiaridad depende de eso y por último los intervalos que hemos hablado de ellos en función de mayor sea el intervalo de seguridad que da la respuesta más rápido se aprende en función que sea más corto el tiempo descargante estímulo más rápido aprende y todo eso vamos con el castigo el castigo también se llama a veces castigo positivo para diferenciarlo del otro procedimiento agresivo porque positivo porque si haces algo hay una consecuencia o sea castigo efectivo explícito si haces algo consecuencia entonces la teoría de un castigo se remonta históricamente a von may que lo consideraba como un aprendizaje paralelo pero opuesto en el sentido al reforzamiento positivo en vez de hacer algo sabes hacerlo pero claro si luego se veía que eso no era perfectamente simétrico y para nada porque el castigo tiene su propia implicación y ahí viene las teorías de éste que hemos visto antes la respuesta emocional no sólo se aprende a hacer algo sino que también aparece una respuesta emocional que genera unas asociaciones clásicas y que puede contaminar la respuesta habitual porque la respuesta condicional emocional paraliza la naturaleza de todo el mundo y por último hay un análisis del castigo más moderno que dice que no hay en realidad el castigo lo que hace es reforzar alternativas lo explico ahora mismo también en este caso dice no ni respuesta emocional ni paralelo tú siempre estás haciendo algo cuando haces algo es porque te conviene que alguna consecuencia positiva tiene algún refuerzo implica para ti y cuando una parte de las conductas que te hacen las castigan esto no lo toques lo que estás haciendo es encarcelo a otro es decir cambias el refuerzo que te daba esto al refuerzo de otra cosa un castigo lo que hace es reforzar la alternativa eso es lo que se aprende según bismuth en un paradigma de castigo se aprende haz la alternativa estudia y no molestes o algo así ¿de acuerdo? eso como análisis te lo ponemos rápido factores de castigo ¿os acordáis de premak en el refuerzo positivo? que era un reforzador o que podría ser un reforzador en principio sin saber nada de él porque dijimos que el reforzador es aquello que incrementa una conducta como puedes saber si una cosa incrementa la conducta o no previamente premak decía si el animal libremente hace una cosa nueve veces y otra una las que hacen nueve veces las preferidas y se puede usar como refuerzo ¿de acuerdo? dejarle hacer eso bueno por el principio de premak se aplica al castigo la cosa que no prefieres pues es un castigo si te obliga a hacer algo que tú prefieres menos pues es un castigo se puede aplicar ¿de acuerdo? y luego lo que ocurre cuando podemos hacer una siempre que hay un castigo hay que tenerlo claro también siempre que hay un castigo tiene que haber previamente una situación de premio de refuerzo positivo porque el animal está haciendo algo que vamos a castigar realmente siempre estamos en una situación que estamos cambiando lo normal que es conducta refuerzo con habitual ¿de acuerdo? siempre el castigo es en contexto de refuerzo positivo bien factores que afectan al castigo y todo esto es bastante lógico pero hay ciertos detalles ¿no? y aquí los he puesto así todos juntos la intensidad ¿qué os parece? peor descarga más funciona ¿no? el cáncer que a la gente perfecto la inmediatez ojo con la intensidad porque también decíamos que cierta intensidad puede provocar una interferencia grande Skinner decía que los castigadores deben hacer lo menos posible porque interfieren con el aprendizaje esa frustración esa emoción impide las resoluciones correctas el cálculo correcto bien segundo la inmediatez el castigo sí que a más rápido mejor si carga demora el efecto demora parecido al de detect mayor porque fijaos en el castigo si hay un tiempo largo lo que estás castigando mal que tú pienses sino lo que está haciendo en el medio ¿no? malinterpretar fácilmente tercero el cambio gradual del castigo hacia más y hacia menos va produciendo un aumento y una disminución si al principio voy acostumbrándome al castigo suave luego me cuesta más el efecto del puerto es lógico el efecto la experiencia previa si he estado mucho tiempo con refuerzo el castigo también se da menor si la conducta la tengo muy bien reforzada efectos discriminativos del efecto del condicionamiento agresivo es decir si hay un estímulo discriminativo que indica cuándo te van a castigar sólo si está el profesor y te ve si no está y no te ve no te castiga nadie el profesor va a hacer estímulo discriminativo bueno pues llamaremos estímulo discriminativo al profesor discriminativo o negativo si con el tiempo se puede lograr que la mera presencia del profesor sustituya al castigo programa de castigo según el programa que utilicemos hemos visto que son de intervalo fijo intervalo variable y todo eso tiene un efecto más o menos el castigo igual que el reforzamiento parcial es más efectivo el castigo debería ser continuo el castigo si falla una especie de inhibitorio que compite el castigo es más efectivo si es continuo programas compuestos qué ocurre si hacemos como hemos dicho que siempre desde que hay un programa de reforzamiento positivo qué pasa cuando después de un programa de reforzamiento positivo castigamos pues hay una especie de suma resta se suaviza qué pasa si hemos enseñado primero mediante evitación la conducta y luego la castigamos ese la línea base o sea la conducta que haces con la evitación lo mismo hay una especie de suma de resta va disminuyendo pero como está sumado hay un contrapesión parecido y la tercera si estamos en un periodo de extinción ya no hay premio una conducta que antes se premiaba y ya no se premia y empezamos a castigarla pues que la extinción será más rápida que uno puede pensar ¿no? salen más de extinción puede estar esos son los tres contingencias puede haber pensar que tiene algún contexto de reforzamiento positivo si es reforzamiento positivo simple a la medida del castigo hay una contradicción que igual con la evitación produce una suma y la tercera posibilidad es que esté en periodo de extinción haya habido una penitencia en extinción el castigo ahí sí que contribuye bueno último las alternativas si hay una conducta alternativa posible ya no sólo el castigo te impide hacer algo o sea el castigo es mucho más efectivo como puedes pensar ¿no? porque te doy una posibilidad alternativas positivas no y por último la motivación ¿qué ocurre? la motivación la vamos a medir de forma técnica el hambre o el miedo o lo que sea ¿qué ocurre si uno tiene mucha necesidad de comer el reforzamiento positivo es más rápido ¿qué ocurre si uno tiene poca hambre cuando le castigo positivo? obviamente el efecto es menor si hay menos motivación en un aprendizaje siempre el castigo pasa lo mismo si hay menos necesidad el castigo a menos ¿cómo sería aquí? sería si lo estudias ¿cuál es el lugar si estudias habría que tener un castigo para rellenar no pero si no estudias no puedes jugar no es un castigo eso es una omisión el castigo sería si no estudias ten con la regla en la mano y para si estudias no hay pero si estudias en vez de darte con la regla en la mano te doy un caramelo mejor que si nos das caramelo es obvio ¿no? un poco dicho así parece obvio pero es bien o sea en el caso del castigo si hay más necesidad el castigo si hay menos necesidad el castigo es más eficaz a ver si uno tiene hambre y lo castigas sin comida es más efectivo que si tiene poca no claro no me importa respetar el castigo porque no tengo el charme o sea y a terminar la eficacia relativa mirad según la teoría que asumamos depende de la atención de los que la atención del castigo lo que estamos atendiendo de los tímidos salientes dependen de la atención entonces ojo a dónde se hace el castigo pero eso ya un poco la idea lo que no mirad vamos a verlo de esta forma un niño que no come y lo castigas porque no come ¿cómo lo castiga? le grita no sé qué te enfadas con él y ahora me enfado y cómo no te está ganando periodos de atención desde su progenitor es que eso a lo mejor lo que está buscando porque no le hacen mucho caso el resto del tiempo entonces qué hará el niño el día siguiente no lo mirará y venden a darle efecto paradójico que no nos damos cuenta bueno pues eso sería por ahí la atención es un refuerzo positivo el mero hecho de que acudan al castigante es un refuerzo positivo bueno pues para mí es una cosa pero eso es un refuerzo positivo claro que no haya en ese caso lo mejor sería decir no me come que no me come al día siguiente ya no estoy usando algo así segundo bueno dice que normalmente el castigo ha habido muchos trabajos que han dudado de que sea estable en un tiempo los efectos ni siquiera que sea eficaz para decir las conductas y ahí entraba todo este juego de teorías de skinner de que interfiere todo lo que hemos hablado hasta ahora luego hay otros trabajos que sí que dicen cuidado con los parámetros adecuados teniendo en cuenta ciertas cosas si es eficaz esa discusión y por último los efectos colaterales que pueden aparecer pues bueno el condicionamiento del contexto es uno de ellos lo que hablábamos antes el contexto castigador puede ser un condicionamiento clásico que a la larga no produzca reacciones automáticas malestar todo eso como me dijo la supresión condicionada es difícil porque qué conductas demuestran que ha perdido hasta qué punto la supresión sólo supone parar de hacer algo sino hacer otras alternativas ¿no? el castigo no sólo suprime una conducta sino normalmente aumenta las alternativas y por último o sea es un efecto colateral y por último la agresividad o la agresión que es uno que se ha visto muchas veces le llamamos agresión elicitada malestar o ajustación pueden llevarte a conductas agresivas que no despecen esos son efectos colaterales y por último algunas paradojas que la ley tiene muy problema porque hay masoquismo en ese producto o sea porque hay gente que quiere castigo ¿no? y probablemente porque sea el camino para un contrato permitido por otro lado o sea uno a usted debe aprender que tiene que hablar de este problema aunque sea la atención como el niño de mejor y luego pues que hay un círculo vicioso de eso que a medida de una conducta se aprende si hay una señal que me permite evitar el castigo poco a poco eso se va extinguiendo vamos bien en fin todo ese juego como he visto antes las conductas alternativas bueno en la fase de escape evitación el círculo vicioso sería ese el mas claro ¿no? se está en extinción la señal esa poco a poco deja de tener efectos de alivio y ya está y luego en la omisión que es el entrenamiento de reducción de conducta mediante la retirada de un estímulo positivo bueno pues también se puede hacer un entrenamiento parecido al de Sigmund aunque haya periodos al revés este si le hace una consecuencia lo mismo que Sigmund ¿no? lo que no quiere hay consecuencias y si no si no hay respuestas malas pues tienes estímulo igual no lo digo porque no es muy complicado porque no es ¿no? que tiene que haber respuestas alternativas incompatibles más bueno que se pueda analizar las situaciones de omisión como eso como la competición de respuestas que hemos hecho en el castigo al final acabo de decir lo que hay y que se prueba también la extinción del estímulo discriminativo de la misma forma porque no no vamos a evitar consecuencias y puede ocurrir lo que vimos en el experimento si cambiamos de contexto puede haber una restauración de la respuesta y todo eso y además la parte motivacional los modificadores motivacionales están siempre el miedo por ahí la dependiendo de la saciedad más o menos efectivo acordar también que hay necesidades primarias y secundarias o sea el dinero es lo mismo claro las secundarias están sometidas a devaluación de extinción si el dinero deja de tener valor poco a poco no va a poder la devaluación del reforzador ¿os acordáis? cuando quito la extinción todo esto por último los reforzadores generalizados son el dinero es uno de los reforzadores generalizados porque se aplica en tantas situaciones que tiene muchísima fuerza ¿de acuerdo? es un secundario efectos de intensidad una intensidad y efectos de contraste cuando cambia uno a otro la parte motivacional digamos la necesidad de intensidad en las funciones es primaria o secundaria del reforzador y por último los paradigmas de la escena tienen lo mismo que los excitatorios los positivos en los que el castigo se iguala la tasa de respuesta en función de la tasa de refuerzo esta vez negativa a más castigo haya menos respuestado y hay una ley de igualación paralela y negativa funciona bastante bien ya que hablaríamos de autocontrol imposible la parte que vimos en la lección un castigo perdón un premio pequeño ahora o uno más grande demorado aquí sería al revés un castigo grande ahora o un pequeño muy fácil de decir ¿entendéis no? entonces la elección de ahí jugarás con los mismos factores y más o menos es para que lo veáis eso es lo el capítulo 5 o sea una especie de reflexión concreta sobre los efectos de los aversivos y por qué se producen dos otros elementos teóricos que no son muy complicados y dos otros procedimientos que sí son importantes Sidman entender cómo es el gesto entender cómo es y claro las consecuencias ya está son siete ya hemos terminado malos dos experimentos 33 preguntas para la segunda semana o para la primera hasta la próxima adiós