La Ninteka, pero además la pondré también en el foro para que podáis acceder a la grabación y también al audio de la grabación cuando vosotros queráis. En los documentos que he subido para la clase tenéis el tema 4 en PDF. También voy a subir, no sé si lo tenéis ya en el foro, no sé si lo he subido el otro día, si no lo he subido el otro día lo miraré esta tarde. Voy a subir el tema 4 con todos los vídeos porque aquí tenemos un problema. Este tema tiene unos cuantos vídeos que añadí a la presentación y que íbamos a ver en clase para que veáis ejemplos de cada una de las diferentes técnicas básicas de condicionamiento operante. Son vídeos bastante divertidos con ejemplos prácticos de cómo funciona el condicionamiento operante, pero no los podemos ver aquí en esta plataforma. Realmente sí se puede ver. Puedo compartiros mi escritorio a través de la plataforma, pero no sé si arriesgarme porque puede ser que bloquee la plataforma y entonces tengamos que volver a conectarnos. Así que quizás no me arriesgue y lo que haga será subiros las diapositivas completas con cada uno de los ejemplos que hay puestos. Os voy a ir explicando según vayamos avanzando en el tema en qué consisten esos ejemplos para que luego podáis verlos desde casa. Como los vais a tener disponibles tanto en las presentaciones como el audio y el video. Así que si os parece, vamos a empezar. Ya sabéis que me encanta hacer dibujitos y voy a seguir haciendo dibujitos. Lo que pasa es que ahora los haré con el ratón en la pantalla, así que si ya eran malos, los que voy a hacer ahora son todavía peores. Pero bueno, yo creo que más o menos va a quedar clara la cosa. Además, como aquí tengo goma para borrar, goma virtual, pues puedo quitar el desastre que haga. Bueno, vamos a comenzar. Ya sabéis, vamos a cambiar de tercio. Desde el condicionamiento clásico, de ese tipo de aprendizaje en el que un estímulo, un estímulo que es biológicamente significativo, se asocia a la presencia. Un estímulo que tiene un significado biológico es asociado a la presencia de otro estímulo. Es decir, un estímulo neutro, un estímulo que no provoca ninguna respuesta, aparece antes de que aparezca un estímulo que sí es biológicamente relevante. Y eso hace que al final el estímulo que no es biológicamente relevante se condicione y provoque una respuesta que es similar a la respuesta normalmente, que es similar o que tiene que ver con la respuesta que provocaba el estímulo que sí que es biológicamente relevante, lo que llamamos estímulo incondicionado. Este tipo de aprendizaje tiene una característica y es que las respuestas no son emitidas o no hay ninguna respuesta emitida por el sujeto, sino que son respuestas elicitadas, respuestas que son provocadas automáticamente por el estímulo condicionado. En primer lugar... En primer lugar por el estímulo incondicionado y una vez que se ha asociado el estímulo incondicionado a nuestro estímulo condicionado, provocadas directamente por el estímulo condicionado. Ahora vamos a cambiar de perfil. Vamos a ver un tipo de aprendizaje en el que el sujeto opera sobre la ambiente, en el que el sujeto realiza una conducta que no está determinada por la aparición de ningún estímulo, no está desencadenada de manera automática por la aparición de ningún estímulo, pero que sí tiene cierto control estimular. Habrá estímulos que controlen esa conducta, pero no provocarían... No provocarán esa conducta, lo que vamos a denominar control por el estímulo. Ya lo veremos, lo veremos más en profundidad en otros temas, pero ahora veremos algo de esto. Bueno, vamos a empezar con ella, vamos a empezar con los fundamentos del condicionamiento operante. Este es un tema bastante sencillo. Muchos de los procedimientos os sonarán, los habréis visto muchas veces y los habréis utilizado en multitud de ocasiones, algunas veces sabiendo lo que hacéis y otras veces sin ni siquiera daros cuenta. ¿Cuáles son los antecedentes históricos o cómo comienza esto? ¿Cuándo son las grandes influencias del condicionamiento operante? Ya lo vimos en el primer tema, la teoría de la evolución de Darwin es la principal influencia, es el factor de influencia más grande para el condicionamiento operante o para el aprendizaje por condicionamiento operante. Acordaros, cuando hablamos de selección, cuando hablamos de evolución, hablábamos de mutaciones aleatorias, de cambios en determinadas características de los individuos y el ambiente se encargaba de seleccionar qué características permanecían y qué características eliminaban en función de lo útiles que fuesen, de lo adaptativas que fuesen para la supervivencia del individuo. Si tenemos rasgos diferentes, por ejemplo, diferentes colores de una mariposa, recordad que vimos ese ejemplo respecto al ambiente, a un ambiente industrial y preindustrial. Si tenemos diferentes colores de una mariposa, en función de cómo sea el ambiente y de lo que sea adaptativo a ese color para evitar, por ejemplo, la depredación, pues se seleccionarán unos colores o se seleccionarán otros, es decir, una característica concreta o pervivida otra. Bueno, para el condicionamiento operante, para los conductistas, para Skinner en particular, que es el que más desarrolló este tipo de aprendizaje o las teorías sobre este tipo de aprendizaje, lo mismo ocurre cuando hablamos de conducta. En este caso, la variación y la selección también ocurren en nuestra conducta, en todas nuestras conductas. La conducta no es siempre igual, la conducta está sujeta a variaciones, no todos actuamos de la misma manera, sino que podemos actuar de maneras diferentes, podemos variar nuestra conducta. Y cada variación de esa conducta da lugar a consecuencias diferentes y son esas consecuencias las que selecciona la conducta. Es el ambiente, a través de determinados elementos seleccionadores, básicamente los reforzadores los que seleccionan, los que aumentan la probabilidad de que esa conducta aparezca en el futuro. Por ejemplo, si nosotros realizamos cualquier conducta, pongamos, por ejemplo, realizar cuando éramos pequeños o si tenemos hijos y realizan cualquier conducta, por ejemplo, realizar un examen y nosotros cuando sacan buena nota les damos un premio, la probabilidad de que estudien, que es la conducta para lograr esa nota, se repita en el futuro va a ser mayor. Es decir, en función de las consecuencias ambientales, la probabilidad de una conducta aumentará o disminuirá si las consecuencias son positivas, hará más probable la aparición de la conducta. Si las consecuencias son negativas, hará menos probable la aparición de una conducta. Es decir, el ambiente, las consecuencias seleccionan la conducta igual que el ambiente, el ambiente natural, selecciona los caracteres de los individuos. Aquellos que son más útiles, aquellos que son más adaptativos y que pasarán a la siguiente generación. Bien, perfecto. Esta es la principal influencia. De hecho, es en la base sobre la que se sustenta este tipo de aprendizaje o las teorías sobre este tipo de mecanismo de aprendizaje. No sé si he pasado de página. Ahora sí, que tarda un poco en pasar. Bueno, vamos a ver quiénes son los teóricos que desarrollaron las teorías sobre este tipo de aprendizaje. Van a ser dos, Thorndike y sobre todo Skinner, que es el que produjo un avance teórico mayor en el condicionamiento operante o condicionamiento instrumental. El primer abordaje, sin embargo, lo llevó a cabo Thorndike. Seguramente ya os sonará bastante. Él lo denominó condicionamiento instrumental. Se denominaba condicionamiento instrumental porque la conducta es un instrumento para conseguir algo. Se utiliza para conseguir alguna cosa, para conseguir alguna consecuencia. Bueno, ¿cómo lo abordó Thorndike? Thorndike lo abordó de una manera particular basándose en lo que él denominaba aprendizaje por ensayo-error. Cómo afectaban los aciertos y los fracasos sobre la conducta. A todos seguramente os suena la caja problema de Thorndike. En la pantalla tenéis una imagen de cómo podría ser. En las diapositivas que os voy a dejar también tenéis un vídeo de una caja problema para que veáis cómo era la original, la caja problema original y cómo funcionaba. ¿En qué consistían sus experimentos? Bueno, era algo bastante sencillo. Él utilizaba gatos normalmente y lo que hacía era meter un gato dentro de una caja. Una caja que además tenía un mecanismo, un mecanismo que permitía abrir una puerta. El sistema era muy sencillo. Dejaba la puerta cerrada, metía al gato dentro y fuera había comida. El gato al principio no sabía qué tenía que hacer. Lógicamente estaba dentro de la caja, sabía que fuera había comida y quería conseguir la comida porque tenía hambre. Simplemente eso. Pero con el paso del tiempo iba realizando ciertas conductas. Conductas generalmente aleatorias sin ningún propósito. Pero por casualidad podía accionar el mecanismo que abría la palanca. Cuando accionaba el mecanismo la puerta se abría y conseguía comida. Con el número de ensayos o con diferentes ensayos o según iban avanzando los ensayos, lo que ocurría es que el gato iba tardando cada vez menos en abrir el mecanismo. Iba aprendiendo qué conductas llevaban a la consecuencia. Es decir, abrir la caja y por tanto conseguir el premio. Bueno, pues esto es básicamente el mecanismo original del condicionamiento instrumental. Se realizaba un número de ensayos, solo se podía hacer un ensayo cada vez y poco a poco el gato iba aprendiendo qué conductas llevaba una caja. Lo que vino a la conclusión a la que llegó Thorndike fue lo que él denominó la ley del efecto. Que venía a ser algo muy sencillo y es que cualquier conducta que se seguía de algo agradable era más probable en el futuro o sería más probable en el futuro. Fijaros que aquí a lo que alude es una serie de situaciones o una serie de explicaciones que son de origen interno, algo parecido al hedonismo. Es decir, cuando algo es agradable, cuando el gato consigue algo agradable, entonces repite la conducta. Cuando la consecuencia es desagradable, entonces no la repite. Pero es una explicación interna, una explicación en términos mentalistas. ¿Os acordáis lo que hablábamos sobre qué ocurría con los conductistas y el mentalismo? Bueno, pues aún así Thorndike todavía en estos primeros, en estos inicios del condicionamiento instrumental todavía alude a explicaciones que son puramente mentalistas. Es decir, al placer. Al placer de obtener una consecuencia positiva, de que la consecuencia de tu conducta sea positiva. ¿Cómo medía el nivel de aprendizaje? Pues a través de la latencia en la respuesta. Es decir, cuánto tardaba el gato en salir de la caja. Cuanto menos tardaba se asociaba a un mayor nivel de aprendizaje. Al principio la cuestión era azarosa, pero poco a poco el gato iba tardando cada vez menos y al final conocía perfectamente el mecanismo que le permitía salir de la caja. Luego lo hacía... Muy rápido. Bueno, esto en cuanto a lo que hacía Thorndike o al tipo de entrenamiento que hacía Thorndike en las diapositivas que os voy a pasar... Es que no me acuerdo si las subí ya al foro. Si no, no os preocupéis porque lo voy a mirar esta misma tarde. Vais a encontrar un vídeo en el que sale exactamente cómo era la caja original de Thorndike y cómo eran los experimentos. El problema que tenía es que para esto se tardaba mucho porque fijaros, al principio el gato no conoce mucho sobre esto. No sabe nada. Simplemente se mete dentro y no sabe qué tiene que hacer. Así que depende de la casualidad. Depende de que el gato por casualidad accione el mecanismo, salga, obtenga la recompensa y poco a poco, a través de muchas casualidades, al final asocie una determinada conducta a la pulsación de un determinado mecanismo o a la consecución de la respuesta. Lo podéis ver. Es un vídeo un poco antiguo, pero ya veréis cómo se ve claramente cómo es la caja problema y cómo se van haciendo ensayos individuales y midiendo el tiempo que tarda desde que se mete en la caja hasta que sale de ella. Bueno, siguiente. El que desarrolló estos procedimientos, el que realmente elaboró un marco teórico, aunque Skinner nunca diría eso, nunca diría que elaboró un marco teórico, pero bueno, el que elaboró un marco teórico, el que elaboró toda la teoría sobre aprendizaje, el que desarrolló experimentos y una visión completa del aprendizaje instrumental, que es el término operante, fue Skinner. Ya sabéis, un conductista radical, uno de los psicólogos más influyentes en la historia de la psicología, no solamente dentro del aprendizaje, sino entre la psicología en general y también en el ámbito educativo. Y él empezó realizando una distinción. Skinner realizó su tesis doctoral sobre aprendizaje y sobre los mecanismos, sobre diferentes mecanismos asociativos. Y lo primero que hizo fue una distinción, una distinción entre dos tipos de aprendizaje, dos mecanismos de aprendizaje que son en teoría diferentes. El condicionamiento respondiente, que es el condicionamiento clásico pauloviano que ya conocemos, y el condicionamiento operante, que para él era el que realizaba Zornach. Lo llamó respondiente porque en el condicionamiento clásico pauloviano los sujetos no operan sobre el ambiente, no tienen que realizar ninguna conducta, sino que solamente responden o la conducta es una respuesta automática a la presentación de un estímulo. No tienen que realizar ninguna conducta volitiva, ninguna operación sobre el ambiente, ninguna operación sobre el entorno. Eso es por lo que se llama condicionamiento operante al condicionamiento que estamos estudiando ahora. Porque los sujetos operan, no solamente la conducta es un instrumento para conseguir algo, sino que además el individuo necesita operar sobre el ambiente. Y él se centra en algo distinto a lo que se centra Zornach. Se centra en las relaciones funcionales que hay entre la conducta que ocurre y las consecuencias que se obtienen. Es decir, cómo se puede establecer una función, una función que relacione lo que yo hago y lo que yo obtengo. Y cómo eso afecta a la conducta futura. Se olvida de otras variables relativas al hedonismo y cualquier variable intermedia. Es decir, ya no es una cuestión de placer o displacer de si esto le gusta o no le gusta al organismo, sino que sólo habla de funciones que relacionan qué hago y qué obtengo. Y lo que ocurrirá es que las consecuencias positivas, las consecuencias agradables para el organismo, aquellas consecuencias que suponen un refuerzo, aumentarán la probabilidad de conducta. ¿Cómo se define lo que es un reforzador o cómo se define el refuerzo positivo? Simplemente a través de sus consecuencias. Por eso es una relación funcional. Lo único que define es la conducta y qué ocurre con la probabilidad de esa conducta en función de lo que se presente. Si aumenta la probabilidad tenemos un reforzador, si disminuye la probabilidad tenemos un castigo. Luego hay algunas combinaciones más, pero luego las veremos tranquilamente. Así que Skinner solamente se va a centrar en aquellas cuestiones que son observables, en las relaciones observables entre cuáles son las consecuencias y la conducta que realiza el sujeto. Ya hemos visto estos dos conceptos, el de operante y el de instrumental. El concepto de operante se refiere a la operación del individuo sobre el ambiente, el que haga cosas en el ambiente de una manera voluntaria, y el concepto de instrumental se refiere a la conducta como instrumento para conseguir algo. No es una conducta finalista, sino es un instrumento para conseguir lo que el organismo quiere conseguir. ¿Cuál es su principal innovación? Una de las principales innovaciones no es teórica, sino metodológica. Aunque describe perfectamente todos los procedimientos, lo que realmente caracteriza la innovación de Skinner es el procedimiento de operante libre. Recordáis, la caja de Skinner es una caja en la que hay algún mecanismo. A diferencia del mecanismo utilizado por Thorndike, en el que se metía un gato dentro de una caja, sólo podía realizar una respuesta y después había que volver a reiniciar todo el experimento. En este caso, Skinner inventa un procedimiento que denomina operante libre y que consiste en introducir un animal, un organismo, en una caja con un mecanismo que además da o lleva alguna consecuencia. Así que en este caso los organismos pueden realizar todas las respuestas que deseen sin necesidad de volver a reiniciar el aparato o cambiar de ensayo. Así que cambia lo que se mide. Antes medíamos la latencia de respuesta, eso es lo que medía Thorndike. ¿Cuánto se tarda en accionar el mecanismo? Ahora Skinner va a medir la tasa de respuesta, cuántas respuestas se dan por unidad de tiempo. El procedimiento se simplifica, se hace mucho más rápido y permite medir de manera mucho más precisa el grado de asociación de una respuesta con una consecuencia. Ya tenemos el procedimiento general de Skinner. Vamos a ver qué características tiene el condicionamiento operante y también algunos de los diferentes parámetros y de los diferentes elementos que componen este tipo de aprendizaje. Bueno, en el condicionamiento clásico teníamos una circunstancia muy particular. Eran circunstancias en las que un estímulo ya fuese el condicionado o al inicio el estímulo incondicionado que es biológicamente relevante provocaba la aparición de una respuesta. Una respuesta que no era emitida sino que era elicitada, no se podía evitar. El perro de Pavlov no podía evitar salivar cuando veía comida igual que no podía evitar salivar a otro estímulo, por ejemplo un tono o la aparición de una luz. En este caso vamos a ver algo totalmente distinto y algo que es mucho más normal y que es mucho más usual en la vida de los individuos en la vida de los diferentes organismos. Las situaciones en las que la conducta no tiene un estímulo evocador claro un estímulo que provoque la conducta de una manera clara. Si hablamos de humanos podemos pensar en un montón de ejemplos que no tienen un evocador claro. Cuando una persona, por ejemplo se pone a tocar el piano no lo hace porque haya aparecido un estímulo No creo que conozcáis a nadie que se ponga a tocar el piano siempre que aparezca un tono o que aparezca una luz o que suene un tono y que automáticamente toque el piano sin plantearse nada más. La conducta de tocar el piano está controlada por variables muy complejas Lo que sí está claro es que esa conducta futura o la probabilidad de esa conducta sí queda determinada por las consecuencias que ha tenido en el pasado Cuando uno aprende a tocar el piano la probabilidad de que toque el piano es mayor si cada vez va aprendiendo más y siente la satisfacción de controlar o de ser mejor tocando el piano También si le han aplaudido si le han dado halagos si ha tenido consecuencias positivas en el pasado Sin embargo, si su experiencia tocando el piano es muy mala si ha obtenido reproches, si no se le da bien si no ha mejorado la probabilidad de que la conducta ocurra disminuye. ¿Qué quiere decir esto? Que esas conductas no son provocadas directamente por un estímulo sino que son emitidas por el sujeto en función de las consecuencias que hayan tenido en el pasado Aún así, ya veremos que en el condicionamiento operante las conductas sí que pueden estar controladas por los estímulos Es decir, nosotros lo que hacemos es poner al sujeto en unas determinadas circunstancias Imaginaros la rata en la caja de esquinas lo ponemos en unas determinadas circunstancias y en esas circunstancias la aparición de un evento o la emisión de una conducta en presencia de algún estímulo hace que aparezca una consecuencia y eso cambia la probabilidad de emisión de la conducta en el futuro Es decir, el organismo en una situación opera sobre el ambiente lo que da lugar a unas consecuencias y eso a su vez modifica la probabilidad de que la conducta ocurra en el futuro ¿Qué busca el organismo? Obtener consecuencias favorables y eliminar las desfavorables Y vamos a ver cómo ocurre esto y cuáles son los términos en los que ocurre Fijaros, aquí tenemos un vídeo de una caja de Skinner Esta es una caja de Skinner típica creo que sí que podéis ver por lo menos la imagen Es una caja de Skinner típica El suelo es un suelo que se puede electrificar para dar descargas Yo os dije que en la facultad ya no se hace esto solamente se da estimulación positiva Tenemos varios mecanismos palancas, luces, tenemos un comedero para servir comida Hay varios estímulos Esta es la situación habitual En el vídeo vais a poder ver cómo la rata oprime una palanca y cae comida La rata a través de las consecuencias aprende o modifica la probabilidad de que ocurra esa conducta en el futuro Como al pulsar la palanca obtiene comida la rata irá pulsando cada vez más la palanca Es decir, la probabilidad de pulsación de la palanca respecto a otras conductas irá aumentando la rata en relación a sus consecuencias Lo podéis ver tranquilamente cuando tengáis las diapositivas Los vídeos están todos sacados de Youtube Tenéis un montón de ejemplos de condicionamiento tanto en humanos como en animales en un montón de vídeos de Youtube que también explican cómo funciona el condicionamiento operante Vamos con lo siguiente Con lo que se denomina la contingencia de tres términos ¿Por qué se denomina contingencia de tres términos en el condicionamiento operante? Primero, os acordáis de lo que era la contingencia una relación o correlación entre la aparición o la asociación entre los diferentes estímulos que aparecen en una situación de condicionamiento Ya lo vimos para el condicionamiento clásico Pero en este caso vamos a centrarnos en la contingencia de tres términos que aparece en el condicionamiento operante Lo que hemos visto hasta ahora lo que ocurre en el condicionamiento operante parece ser una contingencia de dos términos Una contingencia entre la respuesta que damos, la conducta y la aparición la aparición de un reforzador vamos a llamarlo un estímulo reforzador Así que lo importante es la relación, la correlación que hay entre la aparición de una respuesta y la aparición subsiguiente de un reforzador, de una consecuencia que modifica a su vez las probabilidades de misión de esa respuesta Pero ocurre una cosa, y es que esta conducta puede ponerse bajo control de determinados estímulos Imaginaos una situación muy sencilla Una situación en la que tenemos una caja de Skinner y tenemos una rata dentro con una palanquita y de nuevo el comedia Perfecto, fijaros ahora Ahora podemos hacer una cosa simplemente dejar que la rata pulse la palanca y obtenga comida, pero también podemos hacer algo diferente una luz que indique que cuando está encendida la pulsación de la palanca dará lugar a la comida y cuando esté apagada, no Esto es poner la conducta bajo el control de estímulos antecedentes En este caso, el que aparezca una luz es decir, una circunstancia específica nos indica cuál es la conducta adecuada para obtener la consecuencia O dicho de otra manera la aparición de la luz nos indica que realizando la conducta el reforzador está disponible En este caso, el estímulo el estímulo antecedente controla la aparición de la conducta nos indica cuándo puede darse la conducta para obtener la recompensa, pero no provoca directamente la conducta. Este estímulo no provoca como en el condicionamiento clásico la respuesta por sí solo, sino que está tomando el control de esa conducta, nos indica la posibilidad de hacerlo, no provoca de manera automática la respuesta Una vez más, como hicimos en el ejemplo del taxi cuando queremos parar un taxi la conducta usual es levantar la mano, si tú levantas la mano cuando aparece un taxi generalmente para eso sería el reforzador que el taxi pare para poder cogerlo pero la luz verde en este caso sería el estímulo discriminativo El estímulo discriminativo de la luz verde nos indica cuándo estará disponible el estímulo reforzador la consecuencia nos indica cuándo podemos realizar la conducta para obtener la consecuencia si no hay luz verde el taxi no parará por mucho que nosotros levantemos el brazo, así que tenemos un estímulo discriminativo, la luz verde una conducta, levantar el brazo y una consecuencia que para el taxi pero este estímulo por mucho que controle la conducta que nos indique la posibilidad no nos hace emitir directamente la respuesta porque nosotros sólo emitiremos la respuesta si queremos un taxi por mucho que veamos luces verdes por la calle no vamos a ir levantando el brazo, veis como hay una diferencia entre elicitar la respuesta provocar la respuesta de manera automática y tomar el control de una respuesta no provocar la respuesta sino señalar la situación en la que esa respuesta puede dar lugar al reforzador, así que ya tenemos los tres términos el estímulo antecedente que en el condicionamiento apelante se va a denominar estímulo discriminativo la respuesta que es la conducta que realizamos y la consecuencia, el reforzador que obtenemos ¿cómo los unimos? pues bajo esta definición algo que engloba esta situación, en presencia de un estímulo específico, de un estímulo antecedente de lo que denominamos un estímulo discriminativo nuestro reforzador se presentará sólo si la respuesta adecuada sucede en ese momento, así que tenemos un estímulo discriminativo, una respuesta adecuada y un reforzador y los tres se relacionan entre ellos y vamos a ver cómo es esta contingencia de tres términos vamos a ver cómo tienen que correlacionar estas tres cosas cómo solamente ocurrirá lo que queremos si se dan las circunstancias adecuadas, vamos con lo siguiente y vamos a ir analizando cada uno de los tres términos del condicionamiento apelante, de esta contingencia primero, el estímulo discriminativo bueno, es importante las respuestas o las conductas no siempre se componen de respuestas discretas no es una cuestión solamente de responder en cualquier circunstancia, sino que las ejecuciones como hemos dicho antes tienen que darse en un momento determinado cuando aparecen determinados estímulos y como resultado se da una consecuencia particular dicho de otra manera, diferentes estímulos antecedentes por ejemplo, una luz roja y una luz verde nos pueden indicar la disponibilidad de diferentes conductas, no es sólo una cuestión de ejecutar conductas discretas indiscriminadamente sino que diferentes estímulos nos señalarán la oportunidad de que ocurra una cosa u otra imaginaros ahora que tenemos dos luces una señala la disponibilidad de agua y otra señala la disponibilidad de comida, y diferentes mecanismos que pulsar para obtener una y otra en función del cual tengamos iluminado, el sujeto ejecutará una conducta u otra es decir, la presión de una palanca o la presión de un botón por ejemplo, para obtener cada uno de los reforzadores si estamos en presencia de una luz verde nunca se ejecutará esta conducta porque aquí no dará lugar a un reforzador se ejecutará la otra que sí dará lugar a la aparición de comida, lo mismo para el otro, así que la clave del estímulo discriminativo es servir de estímulo antecedente y de señal para discriminar entre determinadas entre diferentes conductas que van a dar lugar a una consecuencia, así que funcionan como claves contextuales, como claves discriminantes, y las tenemos de dos tipos para ejercer dependiendo del tipo de control que ejerzan sobre la respuesta lo que se llaman estímulos discriminativos ya lo hemos visto, los EDS son estímulos discriminativos, que son estímulos que señalan la disponibilidad del reforzador, es decir, un estímulo discriminativo es el estímulo que aparece antes de ejecutar la respuesta y que nos señala que el reforzador está disponible pero también tenemos otro tipo el estímulo delta el estímulo delta es justo lo contrario es un estímulo que aparece antes de la conducta y que señala la no disponibilidad del reforzador es lo que llamamos reforzamiento diferencial imaginaros el ejemplo de antes, tenemos luz roja y luz verde, pero ahora la luz roja señala que va a aparecer la comida y la luz verde que no va a aparecer comida en este caso la luz roja se convierte en un estímulo discriminativo en un ED pero la luz verde se convierte en un estímulo delta un estímulo que señala la ausencia del reforzador es lo que se ha denominado un procedimiento de reforzamiento diferencial ciertas conductas se refuerzan en unas ocasiones y no se refuerzan en otras así que la probabilidad de la conducta aumentará en ciertas circunstancias pasando a un ejemplo humano que se ve muy bien imaginaros una máquina de refrescos en la que realicéis una conducta o dos conductas una conducta compleja echar una moneda con la cantidad de dinero necesaria y pulsar un botón para obtener una medida sin embargo esta conducta está controlada por un estímulo discriminativo y un estímulo delta que son las luces que aparecen en cada uno de los pulsadores cuando la luz es verde señala que hay refrescos de ese tipo así que si echamos dinero y pulsamos obtendremos el reforzador sin embargo si la luz es roja señala que no hay disponibles reforzadores de ese tipo así que da igual que realicemos la conducta o no no vamos a obtener reforzador así que nuestra conducta queda determinada o queda controlada por esos estímulos sólo la realizaremos si el estímulo discriminativo está aparecido y nos señala que la conducta dará lugar a la consecuencia que nosotros queramos eso es el reforzamiento de diferencia reforzamiento de una conducta en una situación o en otra un ejemplo más extremo, imaginaros en un recinto de ópera es alguien a quien le gusta mucho cantar así que imaginaros las diferentes situaciones en un recinto de ópera trabajando cuando el cante le ovacionaran resultará en una gran ovación la probabilidad de que esa conducta ocurra en presencia del estímulo discriminativo que en este caso es perdón el hecho de estar en la ópera el estímulo contextual, es decir el ambiente de trabajo hará que aumente la probabilidad de cantar ópera pero imaginaros ahora que se pone a hacerlo en mitad de un partido de tenis todo el mundo en silencio y se pone de pie y empieza a cantar en mitad de un partido justo antes de que empiece un punto lo que recibiría en ese caso seguramente sea abucheo por parte del público una bronca por parte del árbitro y también malas caras por parte de los jugadores la probabilidad de que esa conducta ocurra en el futuro en presencia de los estímulos contextuales de los estímulos delta en este caso de los estímulos discriminativos o antecedentes que son el ambiente del partido de tenis es decir, el contexto disminuirá eso también es control estimular una persona que canta ópera se pondrá a cantar en una ópera pero no en un partido de tenis y está controlado por los estímulos contextuales que determinan aunque no provocan directamente la conducta que se va a realizar vamos con lo siguiente con la respuesta cómo definimos la respuesta esto es algo importante porque en el condicionamiento operante lo que define la respuesta es la forma específica de la respuesta no importa si pulsamos con una mano si le damos con el codo si damos con un pie no importa, lo que importa es a qué consecuencias lleva así que cualquier respuesta que lleve a las mismas consecuencias o a los mismos cambios en el ambiente es la misma respuesta tiene una relación funcional luego lo importante es la función y no la topografía de la respuesta lo importante es qué provoca y si muchas respuestas provocan las mismas consecuencias se consideran la misma respuesta da igual que yo eche la moneda a la máquina y pulse el botón yo o se lo mande a hacer a un amigo si la consecuencia es la misma la respuesta es la misma es decir, ordenar a alguien a hacer algo y hacerlo tú si lleva las mismas consecuencias sería lo mismo operante pero hecha de maneras distintas llevar a cabo de maneras distintas de diferentes topografías pero forman parte de la misma clase de respuestas que es cualquier forma de ejecutar una conducta que lleva una función similar si buscas algo en la mochila la misma operante es meter la mano dentro que volcar la mochila para encontrarlo las consecuencias son las mismas luego son la misma clase de respuesta y por último el reforzador, y aquí entramos en la parte más difícil de definir veremos en otros capítulos y veremos un poco más adelante qué constituye un reforzador y las diferentes maneras en las que diferentes autores han explicado o han intentado definir qué constituye un reforzador la principal dificultad es que casi cualquier cosa puede ser un reforzador puede ser un estímulo puede ser por ejemplo la comida puede ser un estímulo condicionado que en principio no tendría por qué ser reforzador por ejemplo el dinero pero también pueden ser propias conductas o nuestras propias conductas cuando a un niño le decimos que si termina los deberes puede jugar a la videoconsola al jugar a la videoconsola la conducta está actuando como reforzador o cuando el gobierno nos dice que nos quedemos en casa para eliminar o bajar la probabilidad de transmisión de un virus, la propia conducta está actuando como reforzador una conducta actuará como reforzador de otra conducta nos quedamos en casa disminuiremos la aparición del virus eso va a hacer que en el futuro podamos realizar otras conductas que ahora no podemos hacer así que las conductas futuras que podremos realizar actúan como reforzamiento de la conducta no deseada que tenemos que seguir utilizando veis hay un montón de cosas que pueden actuar como reforzadores la cuestión es cómo definirlo así que lo definimos por sus efectos sobre la conducta no por el tipo de estímulo sino por la conducta que constituye ¿qué es un reforzador? pues es cualquier evento, cualquier suceso cualquier estímulo que si lo hacemos contingente con una respuesta es decir, que si ocurre después de la respuesta si aparece cuando o siempre que se realizará la respuesta cambia la probabilidad de aparición de la respuesta en el futuro es decir un reforzador será cualquier cosa que si aparece después de la respuesta cambia la probabilidad de aparición ya sea de manera positiva o negativa, ya sea aumentándola o disminuyéndola cualquier cosa, da igual lo que sea así que sabemos lo que es un reforzador por sus efectos sobre la conducta a priori no podemos decir que es un reforzador y que no, sólo lo podemos decir por los efectos que ha tenido en la conducta pasada y tenemos varios tipos de reforzamiento y tenemos algo denominado el reforzamiento condicionado secundario ¿os acordáis del condicionamiento clásico? de estímulos o de condicionamiento secundario, de segundo orden hablábamos de que ciertos estímulos condicionados una vez condicionados podían adquirir las propiedades de un estímulo incondicionado y actuar como tales provocando una respuesta bueno, pues lo mismo ocurre aquí en muchas ocasiones la conducta no está controlada por reforzadores primarios, por ejemplo la comida reforzadores que tienen un valor por sí mismos sino por otros eventos que han adquirido su valor por la historia del reforzamiento su valor en función de la historia o del contacto que hemos tenido con ellos por ejemplo el dinero el dinero puede actuar como reforzador pero no actúa igual para todo el mundo como reforzador esa capacidad de reforzar depende de la historia personal del sujeto para unas personas es más importante el dinero y para otras menos, y eso depende de la historia personal que han tenido con ella porque el dinero en sí mismo no es un reforzador muchos de estos reforzadores adquieren esta capacidad de reforzamiento porque se hayan asociado con algún estímulo que ya lo era esto es exactamente lo mismo que vimos en el condicionamiento clásico cuando el dinero adquiría su capacidad a través de la asociación con otros bienes cuando tenemos dinero podemos adquirir bienes que si son de primera necesidad son estímulos que son biológicamente relevantes, por ejemplo la comida, así que el dinero adquiere una capacidad específica para llevar a determinadas respuestas o para provocar determinadas respuestas ese estímulo que ha adquirido su capacidad a través del acondicionamiento clásico puede resultar o puede utilizarse después para una situación de reforzamiento, para ser un reforzador, es decir muchos reforzadores también son estímulos que en principio no tendrían por qué serlo pero que han adquirido su capacidad a través de asociaciones derivadas del condicionamiento clásico muchos mecanismos para adquirir o para que algo sea un reforzador muchas situaciones diferentes y sólo podemos definir qué es un reforzador a través de su influencia o de la forma en que cambia la conducta, o la forma que afecta la conducta. Vamos con ciertas aclaraciones o ciertos términos antes de meternos en los principales mecanismos de condicionamiento que vamos a ver. Primero la diferencia entre reforzador y reforzamiento el reforzador es el evento, lo que ocurre es decir el estímulo, la conducta, aquello que se presenta después de nuestra respuesta, después de nuestra conducta y que provoca un cambio o que va a provocar un cambio en la probabilidad de esa conducta. El reforzamiento es el proceso por el que después de mucho tiempo y a través de ciertas conductas y la obtención de ciertas consecuencias en esas conductas modificamos la probabilidad de determinadas o de las conductas en las que estamos interesados. Los reforzadores son los eventos que permiten o que posibilitan el reforzamiento, que se produzcan los efectos de reforzamiento si son positivos aumenta la probabilidad de la conducta si son negativos o son eventos aversivos disminuirán la probabilidad pero los reforzadores siempre son los que permiten que ocurra el reforzamiento. Evento y proceso Respuestas discretas y operantes libres Esto queda bastante claro. Cuando hablamos de respuesta discreta hablamos de un solo ensayo de la respuesta que se da en un momento dado y que generalmente se mide a través de la latencia, cuánto tiempo se tarda en dar una respuesta. Cuando hablamos de operante libre del procedimiento de Skinner hablamos de múltiples ensayos y de lo que solemos hablar o como lo solemos medir es a través de la tasa de respuestas. ¿Cuántas respuestas por unidad de tiempo se dan en una situación determinada? Cuando hablamos de respuesta discreta el procedimiento de caja problema de Zordex se medía a la latencia porque solo podíamos hacer un ensayo y acababa el problema. En la operante libre de Skinner podemos realizar múltiples ensayos sin reiniciar absolutamente nada así que lo que podemos medir es la tasa de respuesta y eso lleva un análisis mucho más preciso. Mira, se acaba de parar la grabación así que voy a tener que volver a ponerlo a grabar No, sigue grabando, me había salido un cartelito. Bueno, seguimos. Tengo algunas circunstancias más, algunas aclaraciones más. La diferencia entre topografía y función. Ya hemos visto algo de esto ya hemos visto antes justo antes algunas diferencias entre la topografía de una respuesta y la función de una respuesta y la importancia de la función respecto a la topografía Cuando hablamos de topografía o de forma hablamos solamente de características físicas de cómo son los movimientos que llevan una respuesta, ya sean vocales si yo estoy hablando o manuales si estoy empujando una palanca o lo que queréis pensar pero características topográficas características físicas de la respuesta secuencias de movimientos hay veces que las consecuencias a las que lleva una respuesta pueden modificar su forma es decir, imaginaros que yo refuerzo una determinada forma de respuesta lo que sería el reforzamiento diferencial de una forma de respuesta en particular imaginaos que estoy en una situación experimental y solamente refuerzo una rata si pulsa la palanca con comida con la pata derecha en vez de con la pata izquierda en este caso el reforzamiento no sólo está afectando a la conducta en sí o a la clase de conducta sino a la topografía específica de la conducta porque le estoy exigiendo al organismo que realice una conducta específica y no otra o una forma de conducta específica y no otra para obtener el reforzador así que también puedo modificar la forma a través del reforzamiento sin embargo, cuando hablo de función hablo de la relación de la respuesta con las consecuencias lo que hemos visto justo antes una situación en la que lo que me importa son las funciones o las consecuencias a las que lleva la respuesta con independencia que se realice de una manera u otra así que en este caso tendríamos que respuestas con diferentes topografías podrían llevar a la misma función y respuestas con la misma topografía es decir, con la misma forma por ejemplo, imaginaos que yo estoy en dos circunstancias diferentes por ejemplo levantar el brazo como hemos visto antes para el taxi si yo doy esa respuesta en un contexto por ejemplo, si yo veo a un amigo de lejos y levanto la mano estoy saludándole las consecuencias de esa respuesta serán diferentes a si yo levanto la mano en presencia de la luz verde de un taxi en un caso tardará un taxi en otro saludaré a un amigo y el reforzador será que vendrá a saludarme entonces, misma topografía de respuesta misma forma de respuesta dos consecuencias diferentes son operantes diferentes porque sus funciones son diferentes a pesar de compartir la misma forma la misma topografía y lo mismo puede ocurrir al revés si yo saludo a un amigo lo puedo saludar levantando la mano o pegando un grito en ambos casos las consecuencias son las mismas así que en este caso lo que tengo son dos topografías diferentes que llevan a la misma función a la misma clase de respuestas o a la misma función de respuesta a la misma operante puedo tener los dos casos diferentes topografías misma función diferentes funciones misma topografía son dimensiones independientes de la respuesta y por último la instancia de respuesta y la clase de respuesta puesto en contraposición a la clase de respuesta la instancia de respuesta es simplemente la ocurrencia específica de una respuesta en un momento dado y en un ensayo concreto la respuesta particular incluyendo también la forma física en que se da la respuesta es decir, en este ensayo la rata ha pulsado la palanca con la mano derecha como sea la clase de respuesta se refiere a todas las respuestas aunque tengan topografías diferentes que dan lugar a una función similar en un ensayo de condicionamiento operante en una caja de Skinner podemos definir una instancia de respuesta específica diciendo exactamente cómo ha sido en un ensayo pero cuando hablamos de todo el procedimiento no nos importa si la rata ha pulsado con la mano derecha o con la pata izquierda o con el hocico o lo ha hecho saltando o con las dos patas o con una lo que nos importa es que en todos esos casos esa pulsación da lugar al reforzador así que lo que se refuerza es toda esa clase conductual sin importarnos cuál es la topografía específica esto en cuanto a las características o diferentes aclaraciones que ocurren y parámetros que ocurren en el condicionamiento operante vamos con algo bastante relevante que es la interacción que se produce entre el condicionamiento clásico y el condicionamiento operante en todos los momentos hemos hablado antes, hemos hablado al principio de que el condicionamiento clásico es un aprendizaje que en teoría es pasivo el sujeto no tiene nada o no mucho al menos que hacer no tiene que emitir respuestas de manera voluntaria simplemente se expone a estímulos y a través de esa exposición a estímulos que ya provocaba una respuesta de manera automática se asocia a otro estímulo que no la provocaba y este último termina provocando una respuesta que antes no provocaba se convierte en un estímulo condicionado sin embargo el condicionamiento operante es un proceso más activo en este caso necesitamos que el sujeto, que el organismo, que la persona emita una respuesta de manera voluntaria para que se pueda reforzar algo importante esto es que lo vamos a ver más adelante también en otros capítulos es que estos dos procesos suelen ocurrir de manera simultánea en el tiempo, es difícil distinguirlos de una manera práctica está bien una distinción teórica de estos dos procedimientos porque se supone que dependen de mecanismos cerebrales mecanismos fisiológicos mecanismos mentales diferentes pero en la realidad, en cualquier situación los procedimientos o las circunstancias o los aprendizajes desde el punto de vista clásico y operante se están dando de manera simultánea luego veremos algún ejemplo respecto al castigo ya veréis cómo ocurren asociaciones clásicas y operantes en la misma situación pero en todo momento están interaccionando así que la distinción es algo arbitraria pero es muy útil para la investigación porque nos permite investigar cada uno de esos procedimientos que se supone que involucran mecanismos diferentes de manera separada pero en la realidad, en nuestra realidad cotidiana ambos procesos están completamente mezclados ambos procesos ocurren de manera simultánea mientras nosotros aprendemos si se producen a la vez se producen asociaciones de los dos tipos una cuestión particular que afecta al condicionamiento operante es el hecho de que necesitemos que el organismo emita una respuesta como necesitamos que el organismo emita una respuesta nos plantea un problema qué ocurre si esa respuesta no se suele dar mucho o qué ocurre si esa respuesta tiene o no es parte del repertorio conductual del sujeto imaginaros una paloma y la requerimos a la paloma que para obtener comida gire dos veces sobre sí misma eso no es un procedimiento no es una respuesta que esté en el repertorio conductual de la paloma una paloma no suele hacer eso cómo conseguimos establecer esa respuesta cuando no forma parte del repertorio conductual una de las soluciones la más sencilla es esperar que sea por azar ponemos una palanca una caja de skinner metemos una paloma dentro y solo reforzamos con comida cuando dé dos vueltas sobre sí misma podemos esperar a que la paloma por casualidad dé dos vueltas sobre sí misma y que luego otra vez por casualidad vuelva a dar dos vueltas sobre sí misma y que al final lo vaya aprendiendo el problema es que a lo mejor nos tiramos tres o cuatro años hasta que la paloma consigue hacer eso o dios sabe cuánto tiempo otra posibilidad es un fenómeno que hemos utilizado ya o que hemos visto ya que es lo que denominamos automoldeamiento si recordáis cuando hablábamos de automoldeamiento que hablábamos en una situación experimental en la que teníamos una caja de skinner y apareció una lucecita durante veinte segundos y después una bola de comida la paloma que estaba aquí dentro terminaba acercándose a la lucecita para picotearla porque creía o pensaba no se debe decir lo de creía o pensaba pero cuando ocurrió esta situación la paloma se acercaba y picoteaba la luz que aparecía como si su respuesta tuviese alguna consecuencia sobre la aparición de comida recordad que cuando hablamos de automoldeamiento la comida caía después de la aparición de la luz roja con independencia de la conducta de la paloma por eso es un condicionamiento clásico hemos asociado la aparición de un estímulo a la aparición de otro, un estímulo incondicionado que provoca una reacción determinada pero podemos utilizar este procedimiento clásico para introducir en el repertorio conductual una conducta que en principio no lo estaba, podemos hacer esto podemos hacer que la paloma asocie la aparición de la luz roja a la aparición de comida y realizará una conducta de acercamiento y de picoteo y después una vez realizado esto podemos hacer que la aparición de comida quede supeditada al picoteo de la luz que aparecía antes antes no tenía ninguna relación pero ahora si lo tiene como hemos enseñado a la paloma a picotear es mucho más fácil que establezca la asociación entre su respuesta y la obtención esta es una de las formas de hacerlo otra forma de hacerlo es mediante aproximaciones sucesivas es decir, si no tenemos una conducta en el repertorio conductual de un sujeto y la conducta es compleja podemos ir reforzando aproximaciones sucesivas otra vez me vuelve a salir un mensaje de que la grabación se ha detenido pero parece que continúa, esperemos que vaya todo bien podemos hacer aproximaciones sucesivas de esa conducta por ejemplo, el ejemplo que os he puesto antes sobre una paloma que necesita dar dos vueltas sobre sí misma para poder conseguir la comida podemos esperar a que ocurra por sí misma pero también podemos hacer otra cosa podemos reforzar primero un pequeño giro hacia la izquierda cada vez que ocurra un pequeño giro o un pequeño giro de cuello reforzamos con comida una vez que lo hemos hecho podemos limitar el reforzamiento a cuando el giro sea un poco más amplio y solo reforzamos los giros más amplios luego lo hacemos cuando se gire 180 grados luego es cuando de una vuelta completa y poco a poco, por aproximaciones sucesivas vamos reforzando algo más cercano que realmente queremos reforzar hasta que al final llegamos a reforzar solamente cuando la paloma gira dos veces sobre sí misma y esto es más fácil de hacer que si simplemente esperamos por azar a que ocurra la conducta bien vamos a ver algunas cosas más sobre esto vamos a centrarnos ahora en los procedimientos básicos yo os adelanto que en los siguientes temas vamos a ver algunos procedimientos más complejos de reforzamiento diferencial de control por el estímulo que van a ser más interesantes respecto a qué tipo de procedimientos podemos utilizar tipos de reforzamiento los efectos que tiene cada tipo de reforzamiento la forma en que se administran los reforzadores vamos a centrarnos ahora solamente en los procedimientos básicos la mayoría conoceréis los procedimientos básicos del condicionamiento operante los vamos a centrar en cuatro específicamente bueno, en primer lugar antes de empezar con esto yo os he dicho antes en la anterior diapositiva y en relación a las interacciones entre clasicoidoperantes que la conducta en general es muy compleja y es resultado de muchísimas variables y muchas de ellas no están bajo control del experimentador nosotros no podemos controlar todo lo que ocurre pero lo que sí podemos definir es una serie de fenómenos que tienen un patrón que sí es identificable una serie de situaciones que podemos controlar en situaciones específicas y que podemos llamar procesos conductuales reproducibles es decir, situaciones o patrones de presentación de estímulos que siempre siguen una secuencia concreta y que dan lugar a una serie de fenómenos que son los que vamos a estudiar una serie de procedimientos básicos de procesos conductuales específicos que siempre dan lugar al mismo resultado con independencia de otras variables que estén en el ambiente a pesar de ellas siempre que tengamos estas situaciones darán lugar a estos resultados vamos a ver cuáles son hemos visto que es la importancia de la contingencia de tres términos vamos a centrarnos ahora en dos de ellos en la conducta y en la consecuencia y vamos a ver que estos procedimientos básicos del condicionamiento operante dependen de la relación de contingencia es decir, de la dependencia que hay entre estos dos términos puede ser una contingencia positiva cuando da lugar a la aparición de una consecuencia sea del tipo que sea o puede ser una contingencia negativa y por otro lado tengo además dos tipos de reforzadores los que son apetitivos o los que son agradables y los que son aversivos si mezclamos esas dos cosas las contingencias positivas y negativas con el tipo de reforzador nos encontramos con cuatro diferentes procedimientos dos de ellos van a servir para aumentar la probabilidad de una conducta y los siguientes disminuirán la probabilidad vamos a empezar con el más conocido el reforzamiento positivo en el reforzamiento positivo se produce esta secuencia de acontecimientos contingencia positiva es decir, hay una relación positiva entre la aparición de la conducta y la aparición de la consecuencia y la consecuencia es agradable el resultado un incremento en la respuesta vamos a verlos uno a uno aquí tenéis un resumen de las cuatro podemos incrementar conductas también con consecuencias aversivas siempre que la contingencia sea negativa es decir, que incrementaremos una conducta si esa conducta hace desaparecer algo desagradable y al revés podemos disminuir la frecuencia de una conducta tanto con consecuencias aversivas como apetitivas el más típico es la consecuencia aversiva cuando algo que quieres que desaparezca una conducta que quieres que desaparezca va a seguir siendo un castigo esto es castigar proporcionar una consecuencia desagradable tras una conducta pero también lo podemos hacer de otra manera podemos retirar algo positivo si se realiza una conducta que nos deseara que queramos eliminar si te portas mal no te dejo jugar a la videoconsola ¿qué hemos hecho? retirar un reforzador positivo retirar una consecuencia positiva que es poder jugar a la videoconsola porque ha tenido un comportamiento que no es adecuado vamos a verlos uno por uno vamos a empezar con los dos primeros con los procedimientos para incrementar la fuerza de una respuesta para incrementar la probabilidad de aparición de una respuesta en el futuro y el más sencillo y el que más habréis utilizado es lo que comúnmente sería conocido como dar premios por portarse bien o por hacer algo que queremos hacer si vamos a trabajar durante un mes nos dan un sueldo parece que con esta situación que tenemos a muchos no les va a pasar por lo menos será temporal pero esta es la situación más usual el reforzamiento positivo cuando una consecuencia agradable sigue o se presenta de manera contingente es precedida y sigue a la aparición de una respuesta a una conducta determinada hemos visto muchísimos ejemplos tanto ir a trabajar y obtener un sueldo como echar dinero a una máquina pulsar un botón y obtener un refresco lo que sea como pulsar una palanca y obtener comida el ejemplo clásico dentro de una caja de esquinas por supuesto hay que tener en cuenta la definición que tenemos del reforzador cuando hablamos de que algo aumenta la probabilidad de una conducta tenemos que asegurarnos de que funcione como reforzador de que aumente realmente esa probabilidad si por ejemplo utilizamos la comida como reforzador tenemos que asegurarnos de un cierto grado de deprivación es decir, de que el organismo tenga hambre porque sino no va a funcionar como reforzador recordad que los reforzadores se definen por sus efectos sobre la conducta por mucho que yo crea que la comida es un reforzador si la administración de comida no modifica la probabilidad de una respuesta no es un reforzador para ese sujeto para una rata que está llena de comida y que no quiere comer más la comida no es un reforzador así que recordad que los reforzadores se definen por sus consecuencias sobre la conducta no es un reforzador a no ser que veamos los efectos bueno, muy importante la conducta debe existir en el repertorio del animal ya hemos visto que si no existe esa conducta en el repertorio del animal difícilmente podremos asociarla a la aparición de una consecuencia si yo quiero que una rata dé palmas para obtener comida lo voy a tener bastante difícil porque las ratas no suelen dar palmas o conseguimos que dé palmas mediante aproximaciones sucesivas así que lo primero más importante es saber que nuestro reforzador va a funcionar y lo segundo y también muy importante es que esa conducta exista o al menos pueda obtenerla a través de diferentes procedimientos en el repertorio del animal en la siguiente diapositiva tenéis un ejemplo ya os digo el vídeo completo lo tenéis en la presentación que tenéis en el foro la tenéis también aquí la que tenéis aquí no lleva los vídeos porque no podía subirse un archivo de más de 20 megas y la presentación son como unos 60 por los diferentes vídeos que lleva bueno, este es un ejemplo clásico que también podéis encontrar en Youtube en este capítulo de Big Man Theory seguramente muchos lo habréis visto ya o seguiréis la serie en este capítulo lo que hace Sheldon es intentar que Penny realice las conductas que él quiere es decir, refuerza las conductas que él quiere básicamente el procedimiento que utiliza él es cada vez que Penny hace algo que él quiere que haga o que él considere una conducta correcta le da un bonbon, en este ejemplo ahora que está recogiendo la comida cuando recoge la comida le ofrece un bonbon y Penny lo coge cuando se sienta en su sitio y se levanta para dejarle su sitio a Sheldon que ya sabéis que es bastante maniático con los sitios le vuelve a dar otro bonbon en el vídeo también se ve como sus compañeros de piso se dan cuenta de lo que está haciendo con Penny la situación es graciosa lo último es el reforzamiento positivo el condicionamiento operante es decir, conductas o reforzar conductas que él cree agradables deseables en Penny y que obtenga Penny un reforzador positivo que en este caso es un bonbon para que esa conducta se haga más probable en el futuro podéis ver el ejemplo concreto en las diapositivas que subiré en el foro también lo podéis ver en Youtube si queréis verlo antes y seguir viéndolo durante la tutoría esto en cuanto al reforzamiento positivo pero tenemos otro método, otra forma de aumentar la probabilidad de aparición de una conducta utilizando reforzadores que no son positivos sino que son aversivos eventos, consecuencias que no son deseables ¿cómo? pues mediante el procedimiento que se denomina escape o evitación de esta manera aumentamos la probabilidad de una conducta no porque presentemos un reforzador positivo o un evento positivo un evento agradable sino por la evitación o la eliminación de un evento desagradable de un reforzador negativo de algo que no es agradable para el organismo en este caso la respuesta aquí cuando pongo R.O.I ya sabéis que va a ser el diminutivo o el acrónimo para respuesta operante en este caso, cuando la respuesta operante ha resultado el que desaparezca o que no aparezca perdón, la detención o la eliminación es decir, que desaparezca un evento aversivo, por ejemplo si yo pulso una palanca y desaparece la descarga que me están dando lo llamaríamos procedimiento de escape escapo de un evento aversivo el evento aversivo ya está presente me están dando una descarga mediante la pulsación escapo de ese evento, sin embargo cuando una respuesta operante impide que se presente el estímulo aversivo denominamos al procedimiento evitación es decir, pulso una palanca y no aparece la descarga pero en ningún momento me han dado la descarga, luego veremos algunas explicaciones sobre estos fenómenos, no en este tema sino en los siguientes, tenemos algunas explicaciones curiosas sobre estos dos tipos de condicionamiento, pero aquí lo importante es que veáis la diferencia entre el escape, cuando un evento aversivo ya está presente y se elimina y la evitación, cuando evito que aparezca, generalmente suelen ir juntos en los experimentos, porque cuando presentamos un procedimiento experimental en el que por ejemplo una rata tiene que pulsar una palanca para evitar la descarga que le están dando en el suelo o para que pare, al principio siempre será un procedimiento de escape porque la rata todavía no sabe que tiene que hacer para evitar la descarga, así que de casualidad da la palanca y ve que desaparece la descarga, se vuelve a dar la descarga permanece la descarga hasta que da la palanca y desaparece pero que va a ocurrir con el tiempo con el tiempo y según vaya aprendiendo la función de la palanca, irá dando la palanca antes de que aparezca la descarga y entonces ese aprendizaje de escape se convierte en un procedimiento de evitación en el que la rata ha aprendido a dar a la palanca para evitar que aparezca algo. Ojo, este procedimiento no es un castigo se denomina procedimiento de refuerzo negativo, así que tenemos refuerzo positivo y refuerzo negativo recordad que cuando hablamos de refuerzo positivo y negativo, hablamos de procedimientos que permiten aumentar aumentar la probabilidad del número de conductas es decir, aumentar la probabilidad de que se produzca una conducta. En ambos casos en el anterior y en este, lo que conseguimos es que esa conducta se haga más probable en el futuro en el caso de un reforzador positivo si presiono la palanca, cae comida esa conducta se hace más probable en el caso del refuerzo negativo si doy a la palanca evito que me den una descarga también se hace más probable esos son los dos procedimientos básicos para aumentar la probabilidad de una conducta en el futuro en el ejemplo que os había puesto es un vídeo de la película cazafantasmas os tengo que avisar el procedimiento es erróneo realmente, es decir en este caso el doctor Beckman Bill Murray en los cazafantasmas está realizando una serie de estudios en la universidad sobre el efecto se supone el refuerzo negativo en determinados hábitos en determinadas cuestiones pero realmente el procedimiento está mal los productores de la película, el director y los guionistas introdujeron mal el procedimiento, lo he puesto como ejemplo porque hay una parte que sí que es verdad que es refuerzo negativo pero otra parte no es refuerzo negativo y no está bien hecho como refuerzo negativo lo aviso para que lo toméis como un ejemplo y para ver si sois capaces de detectar dónde está el fallo de hecho en el siguiente vídeo en el que veremos el castigo es otro vídeo de Big Bang Theory y en él los propios protagonistas hablan sobre este vídeo sobre el vídeo de cazafantasmas hablando de que no está bien implementado el proceso o el procedimiento de refuerzo negativo os explico un poco cómo va el vídeo para que luego podáis verlo tranquilamente y entenderlo bien en este vídeo hay dos personas dos sujetos experimentales que están en un procedimiento de percepción extrasensorial es bastante curioso tienen que adivinar en este caso es Bill Murray tiene unas tarjetas que tiene dadas la vuelta la tarjeta tiene una figura pero ellos no pueden verla así que lo que les pide el experimentador es que adivinen la figura que hay en la tarjeta cuando se equivocan les da una descarga y cuando aciertan no da la descarga hay un chico y una chica lógicamente el experimentador que en este caso es Bill Murray quiere que la chica siempre acierte y quiere darle descargas al otro siendo el que no ha acertado y le da una descarga sin embargo al otro sujeto experimentador a la chica le dice que siempre acertaba a pesar de que no acierta nunca y nunca le da la descarga aquí hay dos situaciones la situación del chico es una situación de castigo porque al final lo que está aprendiendo o lo que está consiguiendo es disminuir una conducta la conducta de continuar en el experimento o de decir la carta de hecho al final el chico se va para la otra persona si funciona como un escape de acertar es decir el decir o decir una figura geométrica o decir lo que cree que aparece en esa carta sí que está evitando la aparición de una descarga que ella solo está experimentando de manera vicaria porque solo lo está experimentando a través de la otra persona así que veis que aquí está un poco mezclado y hay un error en el procedimiento pero es útil para ver claro cómo funcionaría el refuerzo negativo pero también para ver las deficiencias en cómo han interpretado los guionistas de la película este como no lo han implementado de manera correcta vamos a pasar a lo siguiente en este caso a los procedimientos para disminuir la probabilidad de aparición de conductas tenemos también otros dos en función de cómo sean las contingencias tanto las contingencias como el tipo de reforzador que se administre el primero y más conocido es cuando una respuesta o una conducta específica tiene como resultado una consecuencia negativa si yo cada vez que pulso una palanca en la caja de Skinner como hemos visto antes si ahora pulso una palanca y como consecuencia me dan una descarga con el suelo electrificado la consecuencia de todo esto va a ser que la probabilidad de que yo pulse esta palanca en el futuro va a disminuir en una descarga sobre todo si esa descarga me resulta desagradable así que es un procedimiento muy sencillo es el castigo de toda la vida el niño se porta mal le doy una torta puede ser más ético o menos ético pero es el procedimiento que se ha utilizado muy a menudo de hecho Skinner tiene un libro sobre este tipo de procedimientos luego hablamos un poco de ellos es importante recordar que un castigo se define por la función igual que cualquier otro reforzador o que cualquier otra situación en el condicionamiento operante definimos los castigos definimos los reforzadores por su función es decir un castigo lo es si realiza la función que se supone que debe realizar si un castigo un supuesto castigo no disminuye la aparición de la conducta no es un castigo si un niño se porta mal y tú le zurras cada vez que se porta mal pero se sigue portando mal con la misma intensidad no estás aplicando un castigo porque no está funcionando como castigo no está disminuyendo la frecuencia de aparición así que no es un reforzador aversivo no está funcionando como reforzador aversivo esa es la primera situación eso es importante tenerlo en cuenta definimos las cosas por su función así que si no tienen efecto no estamos aplicando correctamente ni estamos haciendo lo que se debe hacer se debe hacer en términos de condicionamiento no quiero decir que se deba pegar al niño ni que se deba aplicar este tipo de procedimientos de hecho vamos a ver luego algunos efectos secundarios de los procedimientos aversivos y por qué no deben utilizarse y por qué muchos investigadores entre ellos Skinner estaban totalmente en contra de la aplicación de procedimientos que involucrasen estímulos aversivos segundo, para poder castigar una respuesta para poder disminuir la probabilidad de aparición de una respuesta primero la hemos tenido que reforzar y eso es lo que suele ocurrir en el comportamiento de muchas situaciones que previamente se refuerzan respuestas y luego nos vemos obligados a castigarlas para eliminarlas pero como en el condicionamiento clásico cuando hablábamos de que es necesario un contexto excitatorio para poder realizar un condicionamiento inhibitorio en el condicionamiento operante es necesario reforzar algo que una conducta esté instaurada y se emita ante determinadas circunstancias para poderla castigar en el futuro el ejemplo que he elegido o el vídeo que había elegido para poder mostraros es otro vídeo de Big Bang Theory os explico también un poco el vídeo es bastante sencillo además contiene esa referencia que os he comentado al vídeo de Cazafantasmas sobre cómo está el procedimiento mal implementado en este caso Sheldon y el resto de sus compañeros están en un laboratorio están investigando algunos procedimientos están haciendo ciertos experimentos diseñando ciertos experimentos sobre entrelazamiento cuántico no me acuerdo sobre física cuántica y el problema que tienen es que están los cuatro y se van del tema constantemente cuando uno empieza a hablar de algo empiezan a divagar y a irse del tema del experimento hasta que terminan hablando de otra cosa y lo que proponen es implementar una forma de castigo para que cada vez que alguien se vaya del tema no lo vuelva a hacer más disminuya la conducta de evadirse o de separarse del tema y cada vez que alguien se vaya del tema alguien tire de esa tira para castigar esa conducta y así evitar irse del tema luego el resto os dejo que lo veáis para que veáis cómo funciona pero básicamente el castigo consiste en que si alguien realiza una conducta no deseada que es irse del tema irse por la tangente empezar a hablar de otra cosa recibe una consecuencia negativa lo que en el futuro disminuirá la probabilidad de aparición de esa conducta y se irán menos del tema como acaba todo esto y por último el último de los procedimientos o el segundo procedimiento básico para disminuir la probabilidad de aparición de una conducta tanto en el caso anterior cuando presentamos un evento negativo como en este en el que vamos a presentar vamos a retirar un evento positivo en ambos casos estamos disminuyendo la probabilidad futura de aparición de la conducta veamos en qué consiste en este caso una respuesta operante la respuesta que emitimos da como resultado que desaparece un evento o consecuencia es decir, un reforzador positivo caso típico si te portas mal no te dejo o te quito la consola realizas una conducta que se quiere evitar, que se quiere disminuir y lo que hago no es castigar fijaros que aquí hay muchas confusiones porque cuando uno habla o le dice a un niño que le va a castigar quitándole la videoconsola no está castigando realmente está realizando un procedimiento de omisión o castigo negativo está retirando un reforzador no está aplicando una consecuencia aversiva y esto es importante hay mucha diferencia entre retirar un reforzador positivo y aplicar una consecuencia aversiva sobre todo en las consecuencias derivadas y en los efectos secundarios que tienen ambos procedimientos en este caso lo que estamos haciendo es algo que es positivo un reforzador es un aprendizaje por omisión y en este caso disminuye o pretende disminuir la frecuencia de aparición de una conducta si alguien se porta mal y le quitan su videoconsola se supone que en el futuro disminuirá la frecuencia de la conducta inadecuada para poder conseguir o mantener el estímulo positivo que tenía por supuesto hay que asumir que los eventos que quitamos son reforzantes para la persona con valor de reforzador esto de nuevo solo lo sabemos por las consecuencias si al aplicar nuestro aprendizaje de omisión no vemos cambios a la conducta quiere decir que el reforzador que estamos retirando no es tal o no funciona como tal para ese sujeto vamos a ver el ejemplo que en este caso había elegido tenemos un vídeo de Doraemon el vídeo lo ejemplifica bastante bien el aprendizaje por omisiones lo podéis ver tranquilamente en lo que consiste es en que la madre de Nobita ha hecho unos pasteles típicos deben ser unos pasteles típicos japoneses ha hecho una serie de pasteles y ha cometido el peor error que se puede cometer por supuesto están Doraemon y Nobita están en su cuarto y están jugando y se le ha ocurrido la maravillosa idea de hacer pasteles pero en un número impar así que no tocan a los mismos cuando entran a la habitación van cogiendo pasteles hasta que llegan al último y cuando llegan al último empiezan a pelearse por el último empiezan a gritar, a pelearse, a pegarse y entonces entra la madre de Nobita y lo que hace la madre de Nobita es quitarles el último pastel lo que está haciendo en este caso es reducir la frecuencia del comportamiento indeseado de la pelea a través de retirar un reforzador de algo que les gusta mucho así que retira el reforzador retira aquello que les gusta retira un estímulo positivo para disminuir la frecuencia de aparición de una conducta que no quiere que aparezca que en este caso es la pelea o la lucha por conseguir el propio reforzador lo podéis ver yo os digo tranquilamente también lo tenéis en Youtube si queréis poner aprendizaje omisión condicionamiento operante y Doraemon veréis que aparece este mismo ejemplo todos los que tenéis puestos están sacados de internet bueno con esto terminamos los 4 procedimientos aquellos que sirven para aumentar la probabilidad de una conducta y aquellos que sirven para disminuir vamos a meternos yo creo que nos da tiempo en 15 minutos podemos ver por lo menos algo de esto en los efectos en los posibles efectos colaterales en los efectos secundarios en las derivadas que tiene la utilización de procedimientos aversivos cuando hablamos de procedimientos aversivos nos referimos a aquellos procedimientos en los que de una u otra manera aparecen estímulos que son desagradables para la persona descargas ya sean golpes ya sea algo malestar ya sea cualquier otro tipo de estímulo que pueda ser desagradable para el sujeto no tiene porqué ser solamente físico a qué nos referimos con esto ya sabéis a dos al escape o evitación en los que tenemos que realizar una conducta para evitar que aparezca un estímulo doloroso o un estímulo desagradable y al castigo en el que ocurre lo contrario podemos reducir la aparición de una conducta a través de la aparición o de su contingencia con un evento que es negativo uno sirve para aumentar la frecuencia de una conducta y otro para disminuirla bueno, ante todo la primera razón para utilizar estos procedimientos es ética presentar estímulos negativos puede tener connotaciones éticas bastante importantes pegar a un niño o pegar a un adulto o pegar a una persona o administrar estímulos desagradables o hacer sufrir a una persona o a un animal para poder conseguir una modificación de su conducta desde luego es algo que por lo menos es cuestionable éticamente así que esta es la primera razón tenemos que tener muy en cuenta las implicaciones éticas de nuestros procedimientos y en este caso cuando utilizamos procedimientos adhesivos tenemos que tener muy en cuenta si se utilizan qué implicaciones éticas tenemos para esto esto es un debate que está en la sociedad en todos los ámbitos, cuando metemos a alguien en la cárcel tenemos que tener en cuenta por qué se le mete en la cárcel y cuáles son las razones que justifican que utilizamos ese tipo de eventos adhesivos de limitación de libertad en este caso o de limitación de otra serie de actividades de la vida cotidiana lo mismo que nos ocurre ahora por cierto, ahora que no podemos salir a la calle tenemos que tener muy en cuenta desde el punto de vista ético qué situaciones justifican el hecho de que las personas puedan ver restringidas sus libertades en este caso su libertad de movimientos el aspecto ético en cuanto a la aplicación de situaciones adhesivas siempre va a estar abierto es una cuestión social que no sólo tiene que ver con el condicionamiento operante sino con cualquier situación social pero bueno, esto es algo aparte, es un a priori que es necesario hay otra serie de circunstancias otra serie de condicionantes que no recomiendan o que hacen poco recomendable la utilización de estos procedimientos adhesivos Skinner definió muchas de ellas de hecho Skinner fue uno de los principales defensores de la utilización de estímulos positivos de eventos agradables y de eliminar de los procedimientos de condicionamiento y sobre todo eliminar tanto de la escuela como de otros lugares en los que se utiliza la modificación de conducta o este tipo de aprendizaje eliminar, como digo, este tipo de estímulos aversivos de esos procedimientos y lo dice desde un punto de vista teórico no por una cuestión ética aparte las cuestiones éticas están siempre presentes, pero lo dice además por una cuestión teórica en primer lugar porque no son una manera fiable de hacer disminuir conducta si no lo son por una serie de efectos que producen con independencia de que nosotros controlemos muy bien el castigo en primer lugar los efectos emocionales cuando uno castiga no solo se produce una disminución de la conducta sino que se produce una reacción emocional si uno pega a un niño no solamente se produce una disminución de la conducta sino una reacción emocional del niño y eso va a afectar a la efectividad del aprendizaje, no solo va a afectar a la efectividad del aprendizaje sino que puede entorpecer aprendizajes futuros podemos enseñarle cosas y puede aprender cosas y puede asociar estímulos que nosotros no habíamos previsto puede incluso desarrollar una especie de indefensión aprendida en la próxima tutoría veremos qué significa esto además, y esto también es muy importante además ejemplifica muy bien la interacción que hay tanto este como el siguiente punto entre el condicionamiento clásico y el condicionamiento operativo cuando nosotros castigamos a alguien lo que pretendemos es que esa conducta se asocie al castigo, al evento aversivo y por lo tanto disminuya su probabilidad de aparición, imaginaros que cada vez que un niño grita su padre o su madre le dan un azote nuestra idea es si le damos un azote que es agradable cada vez que se presenta esta conducta esta conducta deja de aparecer y a lo mejor lo consiguen a lo mejor disminuye la conducta esto está ocurriendo también en un procedimiento de aprendizaje no sólo está lo que nosotros queremos también está lo que nosotros no controlamos y cada vez que damos un azote no sólo está presente la conducta hay otra cosa presente la persona que da el azote y por un procedimiento simple de condicionamiento clásico el azote que es un estímulo incondicionado que provoca dolor es decir, que provoca una respuesta en el sujeto una respuesta emocional, una respuesta de evasión una respuesta de miedo se asocia con otro estímulo que siempre antecede al azote que es la figura paterna el padre o la madre así que, ¿qué va a ocurrir? que otros elementos quedan asociados, otros elementos que están presentes en la situación quedan asociados al castigo que estamos dando es decir, en este caso el castigo aparte de asociarse con la conducta que queremos eliminar se asocia con quien lo ejecuta con la persona que está ejecutando el castigo o con la situación en la que se está ejecutando, así que cuando pegamos a un niño por tener una mala conducta, no sólo va a asociarlo o va a reducir su conducta sino que va a asociar el pegar con la figura que le está pegando y va a evitar, o va a terminar evitando o teniendo miedo o evitando de alguna manera a la figura que ejecuta el castigo si me pegan por gritar lo que tengo que hacer es evitar cuando no esté delante para que esa persona no me pegue o evitar esa persona de cualquier manera si en el colegio me dicen cosas malas o me insultan, lo que tengo que evitar es el colegio si la profesora me trata mal cuando no hago determinadas tareas o cuando no hago los exámenes o me deja en ridículo no solamente está disminuyendo la conducta de no realizar los deberes, sino que además está asociando de manera negativa el estímulo, que es el colegio la situación del colegio con eventos negativos así que cada vez que se presente en el colegio es un procedimiento de condicionamiento clásico esencial cada vez que nos presentemos en el colegio o que el niño se presente en el colegio va a tener una respuesta condicionada automática que va a ser de miedo o de rechazo o de vergüenza así que hay que tener mucho cuidado con la presentación o con la aplicación de estos castigos porque sus efectos secundarios tanto emocionales como en el plano de otros aprendizajes puede ser muy importante y lo vamos a dejar ya aquí no nos vamos a meter en la extinción la extinción en el condicionamiento operante que es el siguiente punto lo veremos en la siguiente tutoría la siguiente tutoría también será online esperemos que sea la última lo dudo, pero esperemos que sea la última y nada, cualquier pregunta podéis formularla a través del foro y me imagino que esta noche o mañana subiré la grabación junto con las diapositivas y no están subidas, que ahora no recuerdo si las he subido pero lo subiré todo junto para lo que tengáis disponible tener en cuenta además que las grabaciones también se graban en audio así que si queréis escucharlas en cualquier lado podéis descargaros el audio en mp3 para poder escucharlo o para cualquier cosa lo que queráis en ese aspecto y ya sabéis, estamos cogiendo contacto por el foro y la próxima semana continuamos justo donde lo hemos dejado así que nada, muchísimas gracias por atender a la tutoría, mucha suerte y ánimo con el aislamiento social y con el confinamiento muchas gracias chicos, hasta la semana que viene