Vamos a ver el tema de... Bueno. El adhesivo. Este tema... Hola. ¿Te has
llegado bien o no? No. ¿No has visto el tema 7? ¿Tampoco? Te voy a hacer
una introducción más bien de fondo, de aspectos más geniales, porque si
lo miraría, pues iríamos más al detalle y... El tema habla, y nos
podemos hacer una idea de qué va, de eso que hablábamos al principio de
que los condicionamientos aversivos, el castigo y todo eso, tienen
consecuencias paralelas a las deseadas, porque generan dolor, frustración
y todo eso interfiere de alguna forma. Este tema se dedica a ver
exactamente eso. De qué forma interfiere, qué teorías hay, qué
resultados hay. Entonces, empezamos la primera parte del tema viendo o
repasando qué eran los aversivos, comparándolos con los otros, qué
consecuencias tiene cada uno y luego vemos algunas teorías que dicen qué
es lo que ocurre cuando castigamos. ¿Qué diferencia hay cuando castigamos
a cuando creemos que algo ocurre en medio? Hay una emoción en el medio que
tiene defecto. Y explicando por qué es de una forma diferente y hay una
serie de experimentos que varían un poco en la forma para ver quién tiene
la emoción. La veremos con eso. Luego vemos el castigo en detalle, qué
factores hacen más efectivo los castigos y menos, la admisión en detalle
y por último, el mismo programa que vimos de elección es una pequeña
consideración de si tenemos que elegir entre dos premios, ya vimos en el
capítulo A o B lo que hacíamos, la ley de igualación, y si hay dos
castigos, pues yo creo que lo ves. Si hay menos o más castigos, pues son
pequeños. Vamos con la primera parte. Dice Aversivo siempre es un
aprendizaje que consiste en evitar algún estímulo que es malo, se refiere
a aquellos métodos en los que se utiliza alguna consecuencia mala para el
individuo. Por lo tanto, vamos a evitarnos. Entonces, ¿qué solemos evitar
los seres vivos? Aquellos caminos. Que amenazan nuestra salud y nuestra
vida. Eso le llamamos aversivos primarios. Dolor y todo ese tipo de cosas.
Y llamaremos secundarios aquellos que, por asociación con los primarios,
los evitamos también. Por ejemplo, si me ha morido un perro, me alejo de
todos los animales que tengan pelo. Aunque sean buenos, aunque no me digan
nada, ¿eh? Pero cualquier cosa. Secundarios y primarios. Ese aprendizaje
de qué estímulo es aversivo sigue la lógica del condicionamiento
clásico. Uno secundario se convierte en aversivo por asociación con uno
primario. ¿No? Y poco a poco genera el mismo efecto. Si usted se ve mucho
en positivo, pues negativo es lo mismo. Muchas veces las fobias vienen de
un aprendizaje de este tipo. ¿No? Por lo tanto están sometidas a los
procedimientos de extinción como una fobia se puede curar mediante la
desensibilización sistemática, que no es más que un proceso de
extinción. ¿Habéis oído hablar de eso? Si tú le tienes miedo, pongamos
a las serpientes, la desensibilización sistemática consiste en ponerte
una serpiente primero lejos, aislada con un cristal, segundo más cerca,
primero con el cristal levantado un poquito, cuarto sin cristal, y así
poco a poco se va extinguiendo el miedo, el miedo condicionado. ¿No? Hay
otro método que es la inundación. Me sentí una sola vez en serpientes.
Que también o se extingue o te muere. Bueno, eso también sería un
contracondicionamiento, es presentarte una serpiente y darte un caramelo
cada vez. O algo que te guste mucho y con el efecto contrario se va contra
ti. ¿Qué ocurre cuando aprendemos un condicionamiento adversivo? Pues que
suele haber una conducta que denominamos defensiva. La conducta que evita
es defensiva. Tanto en condicionamiento clásico, cuando apartamos la pata,
saltamos, nos paralizamos para recibir, como en condicionamiento operante,
la huida, el ataque, la reacción... Las principales, las que hemos dado en
condicionamiento operante son siempre la huida, la agresión y la
inmovilización. Y dependerá el animal y dependerá de lo que haya vivido
Bien. Repasamos los procedimientos de condicionamiento para ver cuáles son
aversivos. Pues la clave es esta. Estímulo o consecuencia que se utiliza
en cada uno de ellos. ¿Cuál es en el reforzamiento positivo? Un premio.
Ponemos aquí un signo más y tiene... Lo que se utiliza aquí es
agradable. En el reforzamiento negativo, escape o evitación, ¿qué se
utiliza como consecuencia? Al revés. Eso es en la admisión. En el escape.
¿De qué te escapas? ¿Cuál es la consecuencia que se utiliza? Ah,
perdona, has dicho no tener dolor. Bueno, dolor es la palabra. ¿Qué se
utiliza? ¿La descarga o algo que produzca dolor? Por lo tanto, a ver si...
¿En el castigo? En el castigo, es obvio. Aversivo. Y en la admisión, si
no te callas, te apago la tele. Positivo, porque la tele es positiva solo
que la quitamos, pero es positiva. Por lo tanto, estos dos del medio son
los aversivos de por sí. ¿Os acordáis que el primero incrementa la
posibilidad de una conducta? ¿Qué hace el reforzamiento negativo?
¿Quién sabe bien? De huida y escape. Lo que estamos entrenando es la
huida y el escape. Y nosotros dos, porque estás quieto en tu castigo,
porque estás quieto en la tele, adivina. Y, por último, hacíamos las
relaciones. ¿Os acordáis? De la conducta con la consecuencia. Esto es una
multiplicación. Si sabéis multiplicar, ya está hecho. Más por más.
Más. Relación positiva. Menos por más. Menos por menos. Más. Y, por
último, más por menos. Es decir, es la interpretación. En el refuerzo
positivo se aumenta la conducta, aumenta la consecuencia. En el negativo se
aumenta la conducta, disminuye la consecuencia, porque a más escapo, menos
descarga recibe. En el castigo, a más me porto mal, más castigo. Aumenta,
aumenta. Aquí está. Este es el cuadro, otra vez. Ahora, hoy vamos a
hablar de estos dos, que son aversivos, porque utilizan consecuencias
aversivas. Por esta parte. Y entre ellos, y entre positivo y negativo, pues
podemos hacer una serie de matices de semejanzas y diferencias. ¿Qué
diferencia hay entre el castigo y el refuerzo negativo? La huida o la
dictación. No son lo mismo. Obviamente, la diferencia es que en el
refuerzo negativo primero aparece una consecuencia negativa. La conducta
obviamente se estimula. En el castigo, sólo aparece después si hay
conducta. Por lo tanto, no hay una diferencia. Es el tipo de matices que
hace. Lo leéis que no tiene mayor dificultad, pero ver simplemente cuál
es la diferencia. Entonces, ¿qué es lo específico de estos dos que
tienen en común que producen? Bueno, pues todo condicionamiento operante
con un estímulo aversivo produce además un estado emocional. Por lo
tanto, fijaos lo que está ocurriendo. Como en el condicionamiento clásico
estamos haciendo una descarga, está produciendo miedo. Esto en el
clásico, si hubiera una señal, sería inhibitorio. ¿Lo veis? Hay
señales. Sí, el ambiente. El ambiente en sí mismo, donde se lleva a cabo
el experimento, puede funcionar como señal. Y también vimos que en muchos
estímulos de condicionamiento operante se utiliza el estímulo
discriminativo. Entonces, actuará como señal inhibitoria. ¿De acuerdo?
Si en un condicionamiento operante yo utilizo una luz, diciendo, cada vez
que aparezca la luz, como un salto, este va a dar una descarga. Esa luz
acaba siendo una señal de la descarga en términos clásicos, del miedo.
Aparece la luz y aparece el miedo. ¿Lo veis? O sea, hay un
condicionamiento clásico paralelo. Y aunque no hubiera luz, aunque no
hubiera estímulo discriminativo, la habitación en sí misma se asocia o
cualquier cosa del contexto, que me llame la atención, se asocia con eso.
Y le pide miedo. Que no te pasa alguna vez que te pasa algo malo en un
lugar y luego cualquier cosa que te recuerde ese lugar te genera una
sensación parecida. Pues eso sería. ¿Cuáles son los estímulos
incondicionados de este condicionamiento clásico que se producen paralelo
sin querer? En general, o bien son positivos o son negativos. Cuando yo
recibo un premio, siento una especie de alegría, el estado emocional que
se condiciona a la alegría y cuando recibo un castigo, miedo. Por lo
tanto, en refuerzo positivo, en un mensaje de refuerzo positivo, las
señales del ambiente o el estímulo discriminativo se condicionan. ¿Me
produce alegría ya ver esa señal? ¿De acuerdo? Cuando voy a cobrar a fin
de mes, el día que llegan y reparten y se ve la señal de que van a pagar,
¿me produce alegría? Bueno, pues eso. Y lo contrario, el miedo. Ese es el
estímulo incondicionado. ¿Y el condicionado cuál será? Pues
dependiendo. El experimento se excita a todo el mundo. Es decir, si la
señal va a ser efectiva, va a haber una señal efectiva de que va a
ocurrir algo, por ejemplo, en el reforzamiento positivo, una señal de que
me van a pagar, todavía no produce la alegría de cobrar, pero sí la
esperanza de que me van a cobrar. Y una señal de que me van a castigar,
todavía no produce el dolor, pero produce la tristeza. Y un entrenamiento
inhibitorio, si te dicen que este mes no vas a cobrar porque hay problemas
con los fondos, no va a haber consecuencia, lo que hay es una ansiedad. Una
señal de que no vas a cobrar o una señal de que no te van a castigar,
alivio. Esto, hagamos lo que hagamos, ocurre en paralelo. ¿De acuerdo?
Entonces, sobre todo esta parte de aquí abajo, los negativos, tienen un
efecto emocional destructor o que interfiere en gran medida en la
mentalidad. Entonces, el papel del estímulo discriminativo positivo y del
estímulo delta a la discriminación negativa, que os acordáis que era,
condicionamiento operante, alguna respuesta tiene una consecuencia. Si
hubiera una señal de cuando la respuesta es coherente o es operativa, es
un estímulo discriminativo. Pues ese estímulo discriminativo es el E.C.
del condicionamiento clásico en paralelo de lo que está produciendo.
Porque acaba produciendo alegría, miedo, esperanza. Bueno, analizando eso,
lo que tenemos aquí es miedo. Miedo es lo que generan los estímulos
aversivos. Por lo tanto, en este tema, estamos hablando de que en todo
condicionamiento que utiliza aversivos, hay una reacción de miedo o un
aprendizaje clásico que produce el miedo paralelo a lo que estemos
haciendo. ¿Y el miedo cómo lo medíamos? ¿Os acordáis? ¿Cómo medía
yo la reacción emocional negativa en un aprendizaje inhibitorio, por
ejemplo? En el condicionamiento clásico decíamos el aprendizaje de miedo
se tiene que medir con la supresión de la conducta. ¿Por qué? Porque
había muchas conductas que no tenían una línea base para subir y bajar,
sino que bajaban a cero. ¿Hago o no hago? ¿No hacer qué significa? ¿Que
tengo miedo o que estoy cansado? No hay una explicación clara. Entonces lo
que hacíamos era en todo aprendizaje inhibitorio una señal de la negativa
teníamos una tasa de conducta base que la habíamos provocado. Teníamos
una señal de la rata y una señal de la palanca. Y luego soltábamos el
condicional que era señal de algo aversivo. En la medida en que paralizaba
la actividad normal, la que había más inducido, era una medida del medio
inducido. O sea, la supresión condicional de la conducta. Y la medíamos
con una fracción que decía arriba lo que hace ahora dividido por lo que
hacía un minuto antes y lo que hace ahora. Es decir, si no ha suprimido la
conducta daba 0,5. Uno para dos. Y si la ha suprimido se iba aproximando a
cero. Más abajo, más miedo. ¿De acuerdo? Bueno, pues acordado eso. Y
ahora tenemos una teoría nueva que dice esto es. Nos proponen que lo que
ocurre en todo condicionamiento aversivo es una respuesta emocional
condicionada de miedo que suprime la conducta. ¿De acuerdo? O sea, esto
estaría en las páginas 356, 357 donde explica lo que se da en paralelo
cuando estamos aprendiendo algo operante. Por ejemplo, la tabla 1, 356 dice
condicionamiento operante hay una señal que actúa como F. Ciertas
reacciones de mi cuerpo también pueden actuar como F. Más allá de eso.
En mi libro que tiene otras páginas. 356. Sí, ese es el cuadro. 366.
Bueno, el otro se hizo la tía. Es que mi libro es una diciembre. Es una
diciembre. No, no, sí, pero lo han revisado y este tiene más ratas que el
tuyo. ¿No? No más ratas, sino más ratas. Bueno, pues la teoría de este
es la teoría del final simplemente dice teoría de respuesta emocional
condicionada. Es lo que hemos dicho. Toda situación de condicionamiento ha
sido provocado por una reacción emocional que muchas veces provoca su
presión y, por lo tanto, contamina los resultados porque hay una
incompatibilidad entre la conducta que debe llevar a cabo y la que el niño
le está provocando. ¿De acuerdo? Bien. Seguimos viendo en detalle ahora
la evitación. Escape de evitación. Pensar que el escape es una primera
fase de la evitación. Este es a veces confuso nombre reforzamiento
negativo. Lo podemos llamar mejor huida de evitación o simplemente
evitación. La primera fase es huida, la segunda es de evitación porque ya
no ocurre más el estímulo agresivo del antecesor. ¿Cuál es la
característica más llamativa de este aprendizaje? Pues que ocurre o se
mantiene sin consecuencias. Una vez que se ha establecido la huida empieza
la evitación y una vez que empieza la evitación ante cierta señal evito
la consecuencia y como no hay consecuencia esa es la paradoja. ¿Qué
podemos esperar? Que con el tiempo se extinga porque no hay consecuencia.
¿No? Pensad un momento una persona que está muy habituada a conducir se
confía mucho pero ya tiene un susto porque está a punto de y vuelve a
ponerse en tensión. Esa evitación que aprendió en su momento las
primeras veces cuando llega muy tenso se automatiza y poco a poco algo
así. Eso es la idea. Los primeros experimentos este es el aprendizaje que
se produce sin consecuencia. Dentro de la evitación tenemos dos
procedimientos básicos una es discriminada otra es indiscriminada. ¿Qué
quiere decir discriminada? Que hay una señal que anticipa que va a ocurrir
algo malo y que crece. En la norma discriminada no hay señales hay otros
procedimientos que nos permiten aprender pero no es una señal explícita.
Bien la señal nos lleva a las dos fases primera fase voy aprendiendo que
la siguiente consecuencia escape la segunda fase aparece la señal y me voy
nunca percibo la consecuencia. Normalmente hay una serie de reacciones que
podemos considerar en este paradigma siempre que hay señal las reacciones
de la señal con la conducta y con las consecuencias. Al principio del
aprendizaje cuando está la señal suele haber consecuencias ¿verdad? Al
final no cada vez que está la señal como yo hago lo que debo no hay
consecuencia pero esa relación cambia. ¿Qué ocurre con la señal y mi
conducta? Pues que al principio poco a poco la señal va asociada a mi
conducta señal movimiento señal movimiento y con mi movimiento y las
consecuencias pues que al principio tengo una relación negativa y al final
tengo una relación de extinción porque cuando me muevo no hay
consecuencia esos son los parámetros de esta aprendizaje Claro hay cierta
interferencia hay cierta dificultad en el aprendizaje lo que he aprendido
en positivo que mi huida me quita una consecuencia luego deja de tener
consecuencias la descarga en cierto modo tiene una consecuencia de
parálisis que impide la huida también en la fase de escape yo recibo una
descarga ¿qué produce una descarga? miedo condicional ¿qué produce
miedo? Parálisis ¿Qué me está impidiendo? Que salte hay interferencias
en el aprendizaje o sea es un todo complejo ¿no? y al final vemos que es
de los más difíciles que hay a pesar de ser discriminado el aprendizaje
de evitación cuesta mucho más relativamente hablando que los otros tipos
de castigo ¿eh? probablemente por estas razones que estamos escuchando
entendéis por qué ¿no? bien obviamente al final el estímulo de estudio
negativo positivo la señal actúa como estímulo discriminativo positivo
en el de de evitación ¿por qué? poco a poco la señal va siendo una una
señal de seguridad bien ¿cómo explicamos esto? hay dos teorías
básicamente que habrían que distinguir o por lo menos caracterizarlas
bien la primera es muy fácil se llama bifactorial se produce un miedo en
los primeros ensayos de escape la descarga produce miedo y en la segunda
fase me escapo de ese miedo que me produce la primera es decir pensar un
momento la lógica ¿por qué se mantiene una conducta si no hay
consecuencias? pues él pone primero la descarga produce miedo y luego el
miedo condicionaba la señal es lo que está produciendo la huida sí que
hay una consecuencia un miedo y me escapo del miedo ¿de acuerdo? la
teoría dice que hay una variable intermedia que es el miedo que permite
mantener la la conducta cuando pasa mucho tiempo y el miedo cada vez es
más más leve yo me subo al coche cada vez voy más confiado para que
tenga menos miedo se pone una extinción hasta el momento tengo otro asusto
y se reactiva el miedo o sea una especie de ciclo ¿vale? eso dice la
teoría intermedia la teoría alternativa dice que no hace falta un miedo
condicionado clásicamente interno en medio sino que basta con que la
señal asumamos que adquiere un valor reforzador de la misma manera que una
cosa que tú asocias con algo malo es un valor castigo la señal
discriminativa se asocia con el escape a algo positivo y por lo tanto tiene
un valor reforzador la señal por sí misma tiene un valor reforzador
secundario no hace falta hablar de miedo y para el something es un
aprendizaje aversivo secundario y la señal de seguridad o sea el estímulo
discriminativo es lo que provoca el aprendizaje es decir hay una teoría la
bifactorial alude al miedo y something no hace falta ponerle miedo porque
dice que es innecesario la más simple es una teoría mejor para él la
señal podría ser una asociación con la posible descarga libre de esa
señal porque normalmente cuando huyes a pensar en el miedo cuando empiezas
a pensar o sea voy a llevar al hambre lo que hay que pensar si salgo soy
bien pero no es no es reflexionado simplemente que no hace falta el miedo
es la señal en sí misma igual que cuando ves una señal de algo que te
gusta esa señal de por sí ya te gusta también sería algo así el
reforzo de llevar la señal mismo cuando falta lo están funcionando huir
de la señal o sea la señal está asociada con la descarga es que lo digo
a lo mejor me explico me da la señal está asociada con la descarga huir
de la señal es reforzante la señal es algo malo huir de la señal ya es
reforzante vale dice no hace falta que la señal produzca miedo la señal
por sí misma adquiere un aversivo secundario ¿de acuerdo? bueno los
procedimientos de Sidman y los siguientes de Heister y Finnegrin son un
pelín crueles en el sentido de que éstos no avisan es fácil
distinguirlos del otro Sidman te pone en una caja y normalmente es de tipo
variable o de tipo fijo cada diez segundos se muestra una descarga si tú
haces algo pues la señal la conducta buscada de huida o evitación en vez
de la descarga cada diez segundos ocurre cada treinta es decir te dan una
seguridad de treinta segundos ¿de acuerdo? o sea si tú no haces nada cada
diez segundos descarga ahora si haces lo que se te pide la descarga tarda
treinta segundos claro si tú haces lo que se te pide cada veinte o
veinticinco segundos nunca recibes descargas o sea luego es la evitación
porque te da treinta segundos de margen ese es el método Sidman el método
Sidman lo único que tiene que cambia de unas sesiones a otras son la
cantidad de segundos de descarga y la cantidad de segundos de seguridad el
de descarga le llamaría de estímulo a estímulo de descarga a descarga y
el otro de respuesta a descarga cada vez que hay una respuesta ¿cuánto
tiempo de seguridad? bueno pues qué pensáis ¿cuándo se aprenderá más
fácil? pues cuando cuando hay muchas descargas se aprende más fácil
cuando el tiempo de seguridad también es más largo se aprende más fácil
y cuando la relación entre este y este este es mucho menor que este
también se aprende más fácil claro en un ambiente que hay mucho peligro
una conducta que te dé mucho tiempo de seguridad se aprende muy rápido
¿no? o sea es bastante lógico el procedimiento de Sidman lo importante es
esto los intervalos sin respuesta cada cuánto tiempo hay descarga si no
haces nada y los intervalos con respuesta cuánto tiempo de seguridad para
cada y en función de esos intervalos cambia la efectividad del
procedimiento datos con este condicionamiento es muy diferente perdón
difícil no es diferente creo que es muy difícil se aprende muy lentamente
se necesita mucho tiempo y la segunda es que dependiendo de cada animal
puede haber mucha variabilidad algunos se aprenden más rápido que otros
con lo cual es una pregunta que dependerá más de habilidades
ontogenéticas de cada no tanto de la especie sino de la historia de cada
uno de las capacidades de cada uno o sea una aprendizaje difícil ¿de
acuerdo? ¿de qué depende que aprendamos esto? ¿de qué pensáis que
depende? que yo anticipe que tengo que hacer algo justo 25 segundos pues de
un reloj interno ¿no? lo más lógico es pensar en una especie de reloj
interno que te permita estimar cuánto tiempo ha pasado aquí la variable
clave es el tiempo entonces hay dos teorías una que dice lo que ocurre es
que hay la proprioceptiva dice hay estímulos internos que por sí mismos
mi cuerpo mide el tiempo y anticipa empieza a haber cierta inquietud a los
25 segundos y ese estímulo interno esa inquietud me hace reaccionar otra
teoría dice que es un reloj biológico que tenemos dentro y que nos
permite medir el tiempo ¿no? son dos teorías que dicen entonces la hay
otra tercera teoría que claro lo que sea que ocurre es el estímulo
interno o el reloj temporal te da una señal de seguridad de la conducta
hacer la conducta con cualquier estímulo interno que indique que hay un
periodo de seguridad es algo positivo que me dice la gente en un rato que
no lo cree ¿no? la hipótesis de señal de seguridad es limpia dice todo
lo que provoca la respuesta de huida el salto lo que te hagan hacer es una
especie de señal de un periodo de tranquilidad y eso es lo que se realiza
tenemos un sistema interno de estímulos internos porque efectivamente un
reloj interno o un condicionamiento del movimiento de huida que genera un
periodo de seguridad y por lo tanto adquiere un valor de periodo tranquilo
el segundo procedimiento no es discriminado aún es más claro que el
primero en el sentido de que no es que no sólo te avisen sino que las dos
posibilidades son automáticas es decir haces lo que hagas en las dos
posibilidades hay un castigo cada x segundos ahora bien en uno de los
programas es cada 10 segundos pongamos yo necesito cada 20 segundos
entonces cuando tú respondes lo que yo quiero que aprendas lo que hace es
cambiar del programa duro a blando y si no respondes vuelve al blando al
duro pongamos que el a es cada 10 segundos mi respuesta provoca que cambia
al b que es cada 20 segundos y si no respondo vuelve al a entonces ¿qué
puedo lograr yo como mucho? mantenerme en el b mantener un programa con
menos descarga no evitarlas ¿de acuerdo? con el tiempo claro se produce un
aprendizaje y se responde para evitar volver al a ¿qué diferencia tengo
en el anterior? pues que en este caso en el anterior cada movimiento era un
periodo de seguridad que podía condicionarse en este procedimiento lo que
se condiciona es un cálculo global de qué me conviene cada movimiento no
evita necesariamente la descarga pero sí en global me conviene responder
por lo tanto es un aprendizaje tipo molar y demuestra que el estímulo el
procedimiento que sea te ayuda a la evitación es molar y que hay un
mecanismo de aprendizaje que es capaz de calcular pero que conviene con
probabilidades a largo plazo ¿de acuerdo? ¿entendéis cómo se programa
no? bien nos propone al final qué factores del condicionamiento de
refuerzo de huida o evitación son los que lo hacen más efectivo o menos y
habla de algunos así en reflexión más o menos abierta la intensidad
claro si el castigo que se utiliza es más intenso por lógica el
aprendizaje va más rápido ¿no? la consecuencia es más costosa segundo
la familiaridad también dependiendo de si yo tengo mucha experiencia con
el castigo ese que me ofrece pues a lo mejor no es tan efectivo ¿no? como
si te ponen una multa de un euro cada vez que te pasas de velocidad y luego
te ponen una de 50 bueno pues tardarás más en aprender que el que no ha
pagado nunca ninguno de un euro te sorprende más algo así eso la
habituación a la descarga te puede hacer tardar más en aprender y bueno
también los periodos de que has estado en extinción si durante mucho
tiempo no te ocurrió nada la familiaridad depende de eso y por último los
intervalos que hemos hablado de ellos en función de mayor sea el intervalo
de seguridad que da la respuesta más rápido se aprende en función que
sea más corto el tiempo descargante estímulo más rápido aprende y todo
eso vamos con el castigo el castigo también se llama a veces castigo
positivo para diferenciarlo del otro procedimiento agresivo porque positivo
porque si haces algo hay una consecuencia o sea castigo efectivo explícito
si haces algo consecuencia entonces la teoría de un castigo se remonta
históricamente a von may que lo consideraba como un aprendizaje paralelo
pero opuesto en el sentido al reforzamiento positivo en vez de hacer algo
sabes hacerlo pero claro si luego se veía que eso no era perfectamente
simétrico y para nada porque el castigo tiene su propia implicación y
ahí viene las teorías de éste que hemos visto antes la respuesta
emocional no sólo se aprende a hacer algo sino que también aparece una
respuesta emocional que genera unas asociaciones clásicas y que puede
contaminar la respuesta habitual porque la respuesta condicional emocional
paraliza la naturaleza de todo el mundo y por último hay un análisis del
castigo más moderno que dice que no hay en realidad el castigo lo que hace
es reforzar alternativas lo explico ahora mismo también en este caso dice
no ni respuesta emocional ni paralelo tú siempre estás haciendo algo
cuando haces algo es porque te conviene que alguna consecuencia positiva
tiene algún refuerzo implica para ti y cuando una parte de las conductas
que te hacen las castigan esto no lo toques lo que estás haciendo es
encarcelo a otro es decir cambias el refuerzo que te daba esto al refuerzo
de otra cosa un castigo lo que hace es reforzar la alternativa eso es lo
que se aprende según bismuth en un paradigma de castigo se aprende haz la
alternativa estudia y no molestes o algo así ¿de acuerdo? eso como
análisis te lo ponemos rápido factores de castigo ¿os acordáis de
premak en el refuerzo positivo? que era un reforzador o que podría ser un
reforzador en principio sin saber nada de él porque dijimos que el
reforzador es aquello que incrementa una conducta como puedes saber si una
cosa incrementa la conducta o no previamente premak decía si el animal
libremente hace una cosa nueve veces y otra una las que hacen nueve veces
las preferidas y se puede usar como refuerzo ¿de acuerdo? dejarle hacer
eso bueno por el principio de premak se aplica al castigo la cosa que no
prefieres pues es un castigo si te obliga a hacer algo que tú prefieres
menos pues es un castigo se puede aplicar ¿de acuerdo? y luego lo que
ocurre cuando podemos hacer una siempre que hay un castigo hay que tenerlo
claro también siempre que hay un castigo tiene que haber previamente una
situación de premio de refuerzo positivo porque el animal está haciendo
algo que vamos a castigar realmente siempre estamos en una situación que
estamos cambiando lo normal que es conducta refuerzo con habitual ¿de
acuerdo? siempre el castigo es en contexto de refuerzo positivo bien
factores que afectan al castigo y todo esto es bastante lógico pero hay
ciertos detalles ¿no? y aquí los he puesto así todos juntos la
intensidad ¿qué os parece? peor descarga más funciona ¿no? el cáncer
que a la gente perfecto la inmediatez ojo con la intensidad porque también
decíamos que cierta intensidad puede provocar una interferencia grande
Skinner decía que los castigadores deben hacer lo menos posible porque
interfieren con el aprendizaje esa frustración esa emoción impide las
resoluciones correctas el cálculo correcto bien segundo la inmediatez el
castigo sí que a más rápido mejor si carga demora el efecto demora
parecido al de detect mayor porque fijaos en el castigo si hay un tiempo
largo lo que estás castigando mal que tú pienses sino lo que está
haciendo en el medio ¿no? malinterpretar fácilmente tercero el cambio
gradual del castigo hacia más y hacia menos va produciendo un aumento y
una disminución si al principio voy acostumbrándome al castigo suave
luego me cuesta más el efecto del puerto es lógico el efecto la
experiencia previa si he estado mucho tiempo con refuerzo el castigo
también se da menor si la conducta la tengo muy bien reforzada efectos
discriminativos del efecto del condicionamiento agresivo es decir si hay un
estímulo discriminativo que indica cuándo te van a castigar sólo si
está el profesor y te ve si no está y no te ve no te castiga nadie el
profesor va a hacer estímulo discriminativo bueno pues llamaremos
estímulo discriminativo al profesor discriminativo o negativo si con el
tiempo se puede lograr que la mera presencia del profesor sustituya al
castigo programa de castigo según el programa que utilicemos hemos visto
que son de intervalo fijo intervalo variable y todo eso tiene un efecto
más o menos el castigo igual que el reforzamiento parcial es más efectivo
el castigo debería ser continuo el castigo si falla una especie de
inhibitorio que compite el castigo es más efectivo si es continuo
programas compuestos qué ocurre si hacemos como hemos dicho que siempre
desde que hay un programa de reforzamiento positivo qué pasa cuando
después de un programa de reforzamiento positivo castigamos pues hay una
especie de suma resta se suaviza qué pasa si hemos enseñado primero
mediante evitación la conducta y luego la castigamos ese la línea base o
sea la conducta que haces con la evitación lo mismo hay una especie de
suma de resta va disminuyendo pero como está sumado hay un contrapesión
parecido y la tercera si estamos en un periodo de extinción ya no hay
premio una conducta que antes se premiaba y ya no se premia y empezamos a
castigarla pues que la extinción será más rápida que uno puede pensar
¿no? salen más de extinción puede estar esos son los tres contingencias
puede haber pensar que tiene algún contexto de reforzamiento positivo si
es reforzamiento positivo simple a la medida del castigo hay una
contradicción que igual con la evitación produce una suma y la tercera
posibilidad es que esté en periodo de extinción haya habido una
penitencia en extinción el castigo ahí sí que contribuye bueno último
las alternativas si hay una conducta alternativa posible ya no sólo el
castigo te impide hacer algo o sea el castigo es mucho más efectivo como
puedes pensar ¿no? porque te doy una posibilidad alternativas positivas no
y por último la motivación ¿qué ocurre? la motivación la vamos a medir
de forma técnica el hambre o el miedo o lo que sea ¿qué ocurre si uno
tiene mucha necesidad de comer el reforzamiento positivo es más rápido
¿qué ocurre si uno tiene poca hambre cuando le castigo positivo?
obviamente el efecto es menor si hay menos motivación en un aprendizaje
siempre el castigo pasa lo mismo si hay menos necesidad el castigo a menos
¿cómo sería aquí? sería si lo estudias ¿cuál es el lugar si estudias
habría que tener un castigo para rellenar no pero si no estudias no puedes
jugar no es un castigo eso es una omisión el castigo sería si no estudias
ten con la regla en la mano y para si estudias no hay pero si estudias en
vez de darte con la regla en la mano te doy un caramelo mejor que si nos
das caramelo es obvio ¿no? un poco dicho así parece obvio pero es bien o
sea en el caso del castigo si hay más necesidad el castigo si hay menos
necesidad el castigo es más eficaz a ver si uno tiene hambre y lo castigas
sin comida es más efectivo que si tiene poca no claro no me importa
respetar el castigo porque no tengo el charme o sea y a terminar la
eficacia relativa mirad según la teoría que asumamos depende de la
atención de los que la atención del castigo lo que estamos atendiendo de
los tímidos salientes dependen de la atención entonces ojo a dónde se
hace el castigo pero eso ya un poco la idea lo que no mirad vamos a verlo
de esta forma un niño que no come y lo castigas porque no come ¿cómo lo
castiga? le grita no sé qué te enfadas con él y ahora me enfado y cómo
no te está ganando periodos de atención desde su progenitor es que eso a
lo mejor lo que está buscando porque no le hacen mucho caso el resto del
tiempo entonces qué hará el niño el día siguiente no lo mirará y
venden a darle efecto paradójico que no nos damos cuenta bueno pues eso
sería por ahí la atención es un refuerzo positivo el mero hecho de que
acudan al castigante es un refuerzo positivo bueno pues para mí es una
cosa pero eso es un refuerzo positivo claro que no haya en ese caso lo
mejor sería decir no me come que no me come al día siguiente ya no estoy
usando algo así segundo bueno dice que normalmente el castigo ha habido
muchos trabajos que han dudado de que sea estable en un tiempo los efectos
ni siquiera que sea eficaz para decir las conductas y ahí entraba todo
este juego de teorías de skinner de que interfiere todo lo que hemos
hablado hasta ahora luego hay otros trabajos que sí que dicen cuidado con
los parámetros adecuados teniendo en cuenta ciertas cosas si es eficaz esa
discusión y por último los efectos colaterales que pueden aparecer pues
bueno el condicionamiento del contexto es uno de ellos lo que hablábamos
antes el contexto castigador puede ser un condicionamiento clásico que a
la larga no produzca reacciones automáticas malestar todo eso como me dijo
la supresión condicionada es difícil porque qué conductas demuestran que
ha perdido hasta qué punto la supresión sólo supone parar de hacer algo
sino hacer otras alternativas ¿no? el castigo no sólo suprime una
conducta sino normalmente aumenta las alternativas y por último o sea es
un efecto colateral y por último la agresividad o la agresión que es uno
que se ha visto muchas veces le llamamos agresión elicitada malestar o
ajustación pueden llevarte a conductas agresivas que no despecen esos son
efectos colaterales y por último algunas paradojas que la ley tiene muy
problema porque hay masoquismo en ese producto o sea porque hay gente que
quiere castigo ¿no? y probablemente porque sea el camino para un contrato
permitido por otro lado o sea uno a usted debe aprender que tiene que
hablar de este problema aunque sea la atención como el niño de mejor y
luego pues que hay un círculo vicioso de eso que a medida de una conducta
se aprende si hay una señal que me permite evitar el castigo poco a poco
eso se va extinguiendo vamos bien en fin todo ese juego como he visto antes
las conductas alternativas bueno en la fase de escape evitación el
círculo vicioso sería ese el mas claro ¿no? se está en extinción la
señal esa poco a poco deja de tener efectos de alivio y ya está y luego
en la omisión que es el entrenamiento de reducción de conducta mediante
la retirada de un estímulo positivo bueno pues también se puede hacer un
entrenamiento parecido al de Sigmund aunque haya periodos al revés este si
le hace una consecuencia lo mismo que Sigmund ¿no? lo que no quiere hay
consecuencias y si no si no hay respuestas malas pues tienes estímulo
igual no lo digo porque no es muy complicado porque no es ¿no? que tiene
que haber respuestas alternativas incompatibles más bueno que se pueda
analizar las situaciones de omisión como eso como la competición de
respuestas que hemos hecho en el castigo al final acabo de decir lo que hay
y que se prueba también la extinción del estímulo discriminativo de la
misma forma porque no no vamos a evitar consecuencias y puede ocurrir lo
que vimos en el experimento si cambiamos de contexto puede haber una
restauración de la respuesta y todo eso y además la parte motivacional
los modificadores motivacionales están siempre el miedo por ahí la
dependiendo de la saciedad más o menos efectivo acordar también que hay
necesidades primarias y secundarias o sea el dinero es lo mismo claro las
secundarias están sometidas a devaluación de extinción si el dinero deja
de tener valor poco a poco no va a poder la devaluación del reforzador
¿os acordáis? cuando quito la extinción todo esto por último los
reforzadores generalizados son el dinero es uno de los reforzadores
generalizados porque se aplica en tantas situaciones que tiene muchísima
fuerza ¿de acuerdo? es un secundario efectos de intensidad una intensidad
y efectos de contraste cuando cambia uno a otro la parte motivacional
digamos la necesidad de intensidad en las funciones es primaria o
secundaria del reforzador y por último los paradigmas de la escena tienen
lo mismo que los excitatorios los positivos en los que el castigo se iguala
la tasa de respuesta en función de la tasa de refuerzo esta vez negativa a
más castigo haya menos respuestado y hay una ley de igualación paralela y
negativa funciona bastante bien ya que hablaríamos de autocontrol
imposible la parte que vimos en la lección un castigo perdón un premio
pequeño ahora o uno más grande demorado aquí sería al revés un castigo
grande ahora o un pequeño muy fácil de decir ¿entendéis no? entonces la
elección de ahí jugarás con los mismos factores y más o menos es para
que lo veáis eso es lo el capítulo 5 o sea una especie de reflexión
concreta sobre los efectos de los aversivos y por qué se producen dos
otros elementos teóricos que no son muy complicados y dos otros
procedimientos que sí son importantes Sidman entender cómo es el gesto
entender cómo es y claro las consecuencias ya está son siete ya hemos
terminado malos dos experimentos 33 preguntas para la segunda semana o para
la primera hasta la próxima adiós