Hola, bienvenidos al tema 7 de diseño de investigación y análisis de datos. El tema 7 sigue la tónica del tema 5 y 6, con una diferencia fundamental. Esa diferencia es que ahora, en vez de tener un factor, tenemos dos factores. Recordemos, en ANOVA un factor es una variable independiente. ¿Por qué limitarnos a una única variable independiente? Obviamente, ya la manipulemos de manera intrasubjeto o intersubjeto. En un experimento, si nos lo podemos permitir, en términos de tiempo y de costo, es más útil disponer dos variables independientes, dos factores, y ver qué efectos tienen sobre la variable dependiente. En un único experimento obtenemos más información. Obviamente podemos pensar, ¿y por qué solamente dos? ¿Por qué no tres, cuatro, cinco? Podemos. De hecho, el anuncio... El anuncio de ANOVA de tres factores, de cuatro factores, es usual. Pero obviamente en el tema, en el temario, no lo vamos a ver. Pero sigue la misma lógica de lo que estamos planteando en el tema 7, que es no limitarse a un único factor, sino coger más de una variable independiente. En este caso, dos. Y vamos a ver lo que eso nos permite. También debo indicar, después de mi experiencia en la investigación, que no es recomendable tener más de, yo diría, cuatro factores. Ya cuatro me parecen muchos en un experimento. La razón es muy sencilla. Y tiene que ver con las interacciones. Yo recuerdo una tesis de un compañero, en donde uno de sus experimentos manipuló seis factores. Le salieron interacciones quíntuples. Yo no fui capaz de interpretar. Por eso, es por lo que siempre recomiendo con los experimentos, que no se hagan demasiado complejos. Un estadístico dijo que cuanto más sencillo, mejor. Pero no tan sencillo. En el sentido de que dos factores, por ejemplo, es un número de variables independientes admisible y en donde las interacciones son relativamente sencillas de analizar. Es de lo que va el tema 7. Diseños con más de dos grupos independientes. Análisis de Vanessa Nova con dos factores. Y además, estos dos factores, son dos factores completamente aleatorizados, intrasubjetos. Porque podríamos tener dos factores intrasubjetos o uno intra y otro inter. En este caso se dice que los diseños son mixtos. No vamos a ver ese tipo de diseños. Solamente este. Entonces, diseños de un factor intrasubjeto. Los diseños que hemos visto en los temas anteriores tenían solamente un factor. Ya fuese inter, tema 5, o intra, tema 6. Tienen una utilidad muy amplia, pero no permiten abordar cuestiones complejas como son las interacciones. Vamos a ver qué son eso de las interacciones porque es el punto fundamental de este tema y en el que se distancia forzosamente los temas 5 y 6. Porque en los temas 5 y 6 no puede haber interacción. Vamos a ver qué es eso de la interacción. Obviamente solamente puede haber interacción cuando manipulamos como mínimo dos variables independientes. Dos factores con un único factor. No podemos hablar de interacción. El ejemplo que está en el texto es sencillo. Supongamos que en un departamento policial de una gran ciudad esté interesado en mejorar la actitud de los nuevos oficiales hacia las minorías radicadas en esa ciudad. Esto, por ejemplo, es muy frecuente en Inglaterra. Quizá en España no sé si tanto. Los responsables de este departamento piensan que la mejora la mejora de esa actitud de los oficiales de policía hacia las minorías étnicas va a depender de, por un lado, la duración del curso. Ya tenemos un factor, una variable independiente que podemos manipular. El curso va sobre relaciones humanas, pero la variable es duración. Y el otro es el lugar. El lugar en donde ese policía, ese oficial, va a desarrollar su actividad. No es lo mismo desarrollar la actividad en una zona de clase alta, baja o media. Bueno. Creemos que no. Recordemos que estamos manipulando dos factores, lugar y duración del curso. Lo que queremos es ver si afecta a esa variable dependiente, actitud, de los policías, de los oficiales, hacia las minorías étnicas. Para dar respuesta a esta pregunta, contacten a un constructor estadístico. Esto me ha hecho gracia porque normalmente te traen ya los datos y te piden cómo se analiza. Sería mucho mejor de esta forma. Primero consultar al estadístico pidiéndole, oye, quiero hacer esto, quiero responder a esta pregunta. ¿Qué debo hacer? Normalmente es al contrario. Cuando ya se ha hecho el experimento, ya se tienen los datos, te vienen y el constructor estadístico normalmente detecta errores graves en el propio diseño que ya no se pueden corregir. Pero bueno. Contacta con un consultor estadístico para que le diseñe la experiencia, el experimento, de modo que se puedan tomar decisiones a partir de esos resultados. A partir de ese momento, lo que se tenga en este experimento va a dar información sobre la duración del curso que debería utilizarse en futuras policías en función de quizás de la zona. Entonces tenemos dos factores o dos variables independientes. Uno es duración del curso y otro zona de la ciudad en la que va a estar prestando su trabajo el policía. Entonces, el constructor elabora un diseño en el que por un lado juega con la zona de la ciudad, lógicamente, y por otro con la duración. Eso de jugar significa simplemente que asigna valores a esos factores, asigna niveles. En concreto, en el factor A, vamos a llamar factor A la zona de la ciudad donde se va a impartir el trabajo del policía. El curso se imparte en un... barrio de clase alta, de clase media o un barrio económicamente deprimido. Más que que se imparte yo diría que es donde están trabajando los policías. El factor B, que es la duración del curso, se establecen tres niveles, de 5, de 10 y de 15 horas. Se ha elaborado el diseño y ahora tenemos nueve combinaciones. Tres zonas. Y tres duraciones nos dan nueve posibilidades. A cada una de esas posibilidades, a cada una de esas celdas del diseño, hay que asignar un número determinado de policías. Si disponemos de 45 policías, vamos a asignar 5 a cada combinación de zona y duración. 9 por 5, 45. Esto quiere decir que el diseño es intersujeto. Cada policía... ...solamente... ...solamente asiste, trabaja en una zona determinada de la ciudad y solamente le dan una duración determinada del curso, 5, 10 o 15 horas. Ya tenemos las variables independientes con sus tres niveles cada una de ellas, el número de sujetos que tenemos totales y el número de sujetos que tenemos en cada celda del diseño. La variable dependiente es lo último que nos quedaría por determinar. En este caso... ...eh... ...en el ejemplo se nos dice que es la puntuación alcanzada en un test. Para evaluar la actitud de los policías hacia las minorías étnicas se utiliza un test. Un test de los que se haya validado previamente y que miden de forma fiable y válida esa actitud hacia los grupos minoritarios. Lo de psicometría lo verán, se ve en el segundo cuatrimestre del segundo curso. La psicometría simplemente trata de... ...eh... ...es la técnica... ...eh... ...la disciplina que trata de investigar los requisitos técnicos que se exigen a cualquier test para evaluar capacidades, aptitudes de las personas y por ello básicamente trata sobre la fiabilidad, el grado de error de los test y su validez. Es una disciplina muy importante. ...eh... ...pero no vamos a entrar aquí en ella. Solamente creémonos con que la variable dependiente, las puntuaciones que vamos a ver en el ejemplo se han recogido con un test que previamente ha demostrado que es válido y fiable. Bien. Entonces, en este curso, en este diseño vamos a poder alcanzar conclusiones sobre los dos factores que hemos manipulado, duración del curso y ubicación del curso. De la oficina policial donde se imparte este curso, es decir, donde están los policías prestando su servicio. Si hacemos referencia al efecto de cualquiera de las dos variables que hemos manipulado, de los dos factores, de las dos variables independientes, decimos que estamos hablando de los efectos principales del factor. Una variable independiente u otra variable independiente. Punto. Esos son los efectos principales. Sin embargo, parece lógico pensar que quizá la duración, esos dos factores que estamos manipulando cuando se combinan también tienen un efecto. A esa combinación, a ese efecto que tenga la combinación de ambos factores es lo que se llama el efecto de interacción. Esto es lo que nos permite un diseño factorial. Un diseño factorial es más eficiente que varios diseños simples. ¿Por qué? Yo podría haber utilizado un diseño simple como el del tema 5 para evaluar el efecto que tiene la zona donde se imparte el curso. O podría haber utilizado otro diseño, igual al del tema 5, en donde hubiera manipulado la duración del curso. Habría recibido una conclusión en el primer estudio referente a la zona y otra en el segundo estudio referente a la duración del curso. Nada más. Eso quiere decir que no se han manipulado. No sabemos si esas dos variables, cuando se combinan, tienen algún efecto adicional a los dos factores iniciales, que es la interacción. Por eso, combinar en un único experimento los dos factores nos permite hablar sobre esa interacción. En este sentido, es más económico. Proporciona más información con menor número de sujetos y menor tiempo. Entonces, básicamente, este es el esquema. Vamos a verlo. Vamos a ver el esquema de un diseño factorial con dos factores. Vemos que las columnas reflejan el factor duración. Tenemos tres columnas porque hemos manipulado el factor duración a tres niveles. Las filas representan el factor zona y tenemos tres filas porque lo hemos manipulado a tres niveles. Por consiguiente, tenemos una serie de celdillas. Estas celdillas, por ejemplo, estarán todos los sujetos, todos los oficiales de policía que hayan sido sometidos a un curso de cinco horas y que estén prestando sus servicios en una zona alta. Esta celdilla corresponderá a los policías que han sido sometidos a una duración del curso de diez horas y están en una zona deprimida. Por consiguiente, si atendemos a las medias, por ejemplo, globales. En este sentido, nos cogemos todas las puntuaciones que hay para cinco horas, para diez y para quince sin atender a la zona y entonces tendríamos una serie de puntuaciones correspondientes solamente a la duración. Esas medias nos estarían indicando qué efecto tiene la duración por sí sola. Lógico pensar que si ahora atendemos a las filas, voy a ponerlo en otro color, el rosa por ejemplo. Si atendemos a las filas y nos quedamos con todos los oficiales de policía que están trabajando en la zona alta, independientemente de la duración del curso, tendremos una media y tendremos otra media para los oficiales de policía que están realizando su trabajo en una zona de clase media. Si atendemos a estas medias, tendríamos tres medias obviamente, si como hemos colapsado la duración estaríamos hablando del efecto principal zona. Y si miramos, voy a eliminar todo lo que he hecho antes para poder ver, si miramos solamente a filas y columnas. Veremos los efectos principales. Pero también podemos mirar solamente a ese grupo de valores de la variable dependiente y en este caso estaremos hablando del efecto simple, del factor zona, porque estoy viendo las tres zonas posibles, para un nivel concreto de la duración, cinco horas. En este caso estaré hablando de los efectos simples. Y en este caso tendríamos los efectos simples del factor. Tendríamos entonces, tantos efectos simples como la suma de los niveles de ambos factores. Aquí tendríamos un efecto simple, ya lo he señalado en rosa, otro efecto simple y otro efecto simple. Luego tendríamos, voy a cambiar de color, amarillo ahora, este sería otro efecto simple, otro y el último. En este caso tendríamos seis efectos simples, que vienen reflejados fuera de la tabla, aquí y aquí. Los efectos simples lo que nos van a permitir determinar es la interacción. Entonces, a ver si lo había hecho en las siguientes transparencias, es decir, en este caso por ejemplo estaría viendo simplemente el efecto principal de la zona, porque las flechas verdes que estoy viendo aquí me están diciendo que estoy colapsando, agrupando todas las puntuaciones. No me importa la duración, entonces si agrupo todas estas puntuaciones, aquí tendré una puntuación media solamente para la zona alta. Otra puntuación media solamente para la zona media y otra puntuación solamente para la zona deprimida. Si miro solamente a estas medias marginales de la tabla estaría hablando del efecto principal del factor zona. Y en este caso solamente tendremos en cuenta los datos de los 15 oficiales asignados a cada una de esas flechas. Lo mismo podemos decir para la duración. Si vemos las columnas, vemos que si agrupamos todos los datos de esta columna y vemos su media, lo mismo hacemos con la segunda columna y evaluamos su media o la tercera columna y evaluamos su media, está claro que estas columnas lo que estamos agrupando es la zona, por consiguiente estamos eliminando en estas medias la zona, quedamos solamente con la duración. Si hacemos esto estamos viendo el efecto principal del factor duración y ello nos permitiría evaluar los efectos principales de los dos factores. Habrán tantos efectos principales como factores tengamos. Además de estos efectos principales hemos hablado de los efectos simples. Los efectos simples normalmente solamente se contrastan en el caso de que la intersección sea significativa. En este caso son contrastes más focalizados en el que se tiene solamente en cuenta o una fila o una columna, pero a un determinado nivel del otro factor. Se contrastan los tratamientos de un factor, pero en un nivel específico, no agrupamos todas las puntuaciones del otro factor. Aquí por ejemplo estaríamos viendo si tratamos de ver a qué tendríamos que evaluar los En este caso tendríamos las puntuaciones de los oficiales que están en zona alta y media y que solamente han sido sometidos a un curso de cinco horas. Aquí vamos a ver unas cinco puntuaciones, los cinco oficiales en ese grupo, otros cinco oficiales y otros cinco oficiales. Si sacamos la media de esas tres puntuaciones estaremos viendo un patrón para el factor zona habiéndose ido sometido solamente a un nivel del otro factor, cinco horas del factor duración. Esto es un efecto simple. Lo mismo sería este. En este caso estamos viendo el efecto de la duración a un determinado nivel del otro factor, zona. En este caso aquí habrán cinco oficiales, aquí otros cinco y aquí otros cinco. Las medias de esas puntuaciones nos van a permitir determinar el efecto de la duración cuando la zona en donde trabaja el oficial es media. Por consiguiente, como hemos visto anteriormente, en este gráfico se refleja un diseño factorial de tres por tres. Tres por tres recuerden que es la forma que tenemos. Vamos a ponerlo en azul que se verá mejor. Tres por tres es una forma rápida de indicar qué tipo de diseño tengo. Me tengo que fijar en cuántos dígitos estoy indicando cuando digo el diseño. Esto significa que hay dos factores y los números concretos de esos dígitos nos indican los niveles en que se han manipulado cada uno de esos dos factores. Entonces tenemos un diseño tres por tres intersujetos en donde vamos a ver el efecto de los dos factores principales, duración y zona, y si la interacción es invertida lo vamos a ver a través del análisis de los efectos simples. El tercer y último efecto es el que se produce con los cruces de los tratamientos. De cada uno de los factores. Obviamente está relacionado con los efectos simples y se llama el efecto de interacción. Imaginemos en el ejemplo que estamos poniendo que para el caso de la zona alta la actitud de los oficiales se incrementa conforme se incrementa la duración del curso. Y lo mismo sucede para las zonas medias y bajas. En este caso, ¿qué estaríamos diciendo? Que el comportamiento de la variable dependiente, actitud de la variable dependiente, es igual a la actitud de los oficiales, solamente está relacionado con la duración del curso. Y es independiente de la zona. Porque sucede lo mismo en todas las zonas. En este caso las líneas del gráfico de medias de la variable dependiente respecto de la duración serían más o menos paralelas. Si no se cumple este paralelismo de las líneas es cuando indicamos que hay interacción. En este caso podríamos observar comportamientos diferentes en la variable dependiente, la actitud de los policías, respecto a la duración en función de la zona. En este caso las líneas del gráfico tienden a cruzarse. No tienen por qué cruzarse, pero tienden a cruzarse. O si el experimento tuviera más niveles veríamos que en algún lugar del pano se cruzan. En este caso decimos que hay una interacción. Si surge la interacción tenemos que confirmarla analíticamente. Porque la gráfica simplemente nos va a dar una indicación de si los factores interactivos, actúan sí o no. Pero eso hay que confirmarlo analíticamente. Forzosamente la gráfica nos puede engañar. Aquí tenemos, por ejemplo, patrones usuales en donde podríamos decir que hay interacción. Obviamente estos ejemplos no se refieren al ejemplo que estamos siguiendo. ¿Por qué? Porque este es un diseño de dos por dos. Si nos damos cuenta, aquí tenemos una variable pre-post. Y luego tenemos otra variable. No tengo el ejemplo concreto. Pero tiene dos niveles. G subed y G, supongo que será grupo control. Y grupo experimental un pre y un post. Lo clásico. El caso es que en este caso tendríamos un diseño de dos por dos. Se están manipulando dos factores. Una evaluación antes de un tratamiento y una evaluación después de un tratamiento. Y tenemos dos grupos. Un grupo que ha sido sometido al tratamiento. Y otro grupo que sirve de control. Es un diseño dos por dos. Bien, pero sabemos que aquí las líneas se cruzan. Voy a quitar estas dos. Recordemos en primer lugar. Esta es la puntuación que ha obtenido el grupo experimental en el pre. Y esta es la puntuación que ha obtenido el grupo experimental en el post. Esta sería la puntuación que ha obtenido el grupo control en el pre. Y esta es la que ha obtenido el grupo control en el post. Si unimos los grupos correspondientes vemos que se cruzan. Significa que hay una interacción. Significa que no podemos hablar que el factor pre o el factor grupo, experimental o control, tienen tal o cual efecto. Sino que depende del otro nivel del factor. Aquí tendríamos que indicar, por ejemplo, que el grupo experimental mejora del pre al post. Mientras que el grupo control empeora del pre al post. Vemos que no podemos afirmar nada en concreto sobre el efecto del tratamiento si no hacemos también referencia al grupo al que nos estamos refiriendo. Algo similar sucede aquí. Esto también, en el segundo gráfico, es otra interacción. Tenemos un diseño similar al anterior. Un experimento pre-post. Se ha evaluado. Tenemos aquí alguna variable antes y después de realizar un tratamiento. Y tenemos dos grupos. El experimental y el control. De nuevo vemos que esta sería la media en el pre. Y esta es la media en el post del grupo control. Y esta sería la media en el pre. Y esta es la media en el post del grupo experimental. ¿Qué podríamos decir en este caso? Pues podríamos decir claramente que el grupo control no se ha visto afectado entre la primera evaluación y la segunda, entre el pre y el post Vemos que no ha variado su puntuación, mientras que el grupo experimental ha mejorado del pre al post Hay más implicado aquí, pero lo importante es que si las líneas de medias se cruzan o tienden a cruzarse Vemos aquí que si seguimos estas dos líneas habría un punto en que se cruzarían Nos está indicando que hay una interacción O sugiriendo que hay una interacción, recuerden que esto hay que forzosamente evaluarlo analíticamente Es decir Es decir, con números Como no me gusta mucho el ejemplo del texto para comprender intuitivamente que es una interacción En términos de la calle, ¿qué es una interacción? Pues yo diría que a una persona que no supiera nada de estadística le diría que una interacción es una matización Una matización En el caso anterior, por ejemplo, yo diría En el segundo... en el primer grado Si yo me pidiera informar de forma no estadística, sino con palabras simples y llanas de lo que está sucediendo en el primer gráfico, diría Oye, el tratamiento que yo ya he introducido entre el pre y el post Tiene un fuerte efecto en... un efecto positivo en el grupo experimental Pero en el grupo control no se ha producido un efecto positivo, sino todo lo contrario Ha disminuido su valor Estoy matizando En el sentido de que una variable tiene un efecto en un nivel del factor de la otra variable Tienen efectos distintos en distintos niveles de la otra variable Como esto es un poquito difícil de ver con lo que estamos viendo Me he permitido traer un ejemplo que a mí me gusta, nada más Viene en un libro llamado How to make anyone forget a variable In love with you Es de una chica, Leila Loftes Bueno, casi no puedo leer el nombre Parece un libro de la Alfa-Libra Yo cuando lo vi, de los muchos libros que... Que revisó, digo, ah, esto es... No parece que sea muy científico Pero como nunca, e intento no prejuzgar Antes de ver Lo revisé Y me quedé con el libro Me encontré con una gran sorpresa Me encontré con la sorpresa de que todas las referencias bibliográficas de este texto Son de este tipo Son Sessual attraction Personalidad Boletín de psicología social y personalidad Igualdad de vida e investigación Conducta sexual British Journal of Social and Clinical Psychology Toda la bibliografía que se cita en este texto es bibliografía científica Eso ya empecé a sospechar que el libro podía valer la pena Y... Vamos, pero solamente considero que sí Que es bastante... A mí me gusta El inglés es... Horroroso Debo comentarlo Porque parece Con lo cual yo tuve dificultades para leerlo De lo que he leído, tuve dificultades Pero bueno Merece la pena El caso es que en uno de los capítulos del texto Cita a esta investigación del Journal of Research in Personality Del 1975 ¿Ya es antigua? Sí, es antigua Básicamente hacía referencia a las preferencias de las mujeres Del físico masculino Es decir, en términos llanos Estaban tratando de determinar qué tipo de físico masculino gustan las chicas Casi de sencillo Si es un libro de atracción obviamente trata ese tipo de temas y otros En el capítulo que trata... Que tiene esa cita Dice lo siguiente Como está en inglés lo traduzco ¿Qué tipo de cuerpo les gustan las mujeres? Las mujeres americanas normalmente prefieren hombres de construcción promedia Pero superiores, bigger, más fuertes En la parte del pecho que por debajo Los estudios nos dicen que prefieren las uves a las peras Es decir, uves es el tipo... El chico, el chico, el chico, el chico El chico de este tipo Que tiene más pecho Las peras serían todo lo contrario Serían de este tipo, chicos Que tienen barril ¿Vale? Este tipo de afirmaciones son las que te llevan a decir ¿Qué me estáis diciendo? Que prefieren uves a peras Bueno Sin embargo Fías creo que no espera Pero bueno Está claro lo que están diciendo Sin embargo Y aquí es donde... Vi un ejemplo de interacción muy claro Un ejemplo de interacción no Un ejemplo en donde nos está diciendo En términos llanos Lo que nosotros estadísticamente vamos a traducir como interacción Veamos lo que dice aquí El taste, el gusto Pero no es el gusto gustativo Sino la preferencia de las chicas Varía dependiendo de la clase social de la mujer Que está juzgando una determinada anatomía masculina Las mujeres De clase socioeconómica Baja el final inferior de la clase socioeconómica Aunque fíjense como lo dice La parte final del polo totémico socioeconómico Anda que sí Bueno Las mujeres de la parte inferior Socialmente Prefieren hombres musculosos Y a la inversa Las mujeres Eh Con un Altamente eh Pagadas Es decir Con un buen suelto Profesionales Encuentran A los Happy Big cave Es una forma de decir A los musculitos Claramente Desagradables Prefieren el otro extremo Si nos damos cuenta lo que nos están diciendo aquí es Que hay una interacción Es decir Eh En Esta señora Nos está Indicando que Hay Se manipuló En ese estudio Que no lo ha conseguido Por cierto Es bastante activo No está en las bases Usuales Eh Se está Investigando La clase social de la mujer Se está manipulando La clase social de la mujer Alta Por ejemplo yo Asumo que Lo manipularían Mediante clase social alta, baja y media Y el físico masculino Y pondrían Físico Delgadito Normal Y musculoso Variable dependiente en este estudio El juicio que emiten las mujeres Sobre el físico masculino Entonces Tendríamos esta situación Un experimento Donde tenemos como variable dependiente La evaluación que han Eh Realizado Una serie de De señoras Se han presentado tres tipos de físicos El resto debe meterse igual Por ejemplo Ratos faciales Ropa Cabello Etcétera Todo igual Excepto El físico Y La clase social Eh Yo aquí he puesto Vale Me disculpo por lo anterior Solamente clase alta y baja Que es de lo que nos habla Eh El libro Supongamos Que este fuese el patrón de resultados Para la clase baja A la clase baja Que es lo que nos está diciendo esta señora Eh No le gusta Evalúa De forma Mmm Baja Y A los chicos delgaditos A los chicos normales Una evaluación intermedia Y a los chicos Los V Los evaluan Con un alto grado De eh De atracción Sin embargo Nos está diciendo Que los de Las chicas de clase alta Hacen lo contrario Su evaluación es Eh Alta Para chicos Delgados Es Media Supongo Que Estos dos valores No definirían El valor Para los chicos normales Y es baja Para Los chicos Beefcakes Como dijera ella Los chicos Eh Musculosos Esto es una interacción En el sentido De que yo no puedo Decir Que tipo De Eh Físico Prefiere una mujer Sin más Porque En ese caso Estaría hablando Del efecto principal Del Físico Si hay una interacción Tendré que decir Que Es Lo que hemos leído Anteriormente Tendré que matizar Mi afirmación Sobre Los gustos Las preferencias De las chicas En función De la clase social De esa chica Esa es la interacción Y tendré que decir Mira Las chicas de clase Eh Social baja Prefieren los chicos Muy musculosos Cuanto más musculosos Mejor Mientras que Las chicas de clase Alta Es justamente Al contrario Tengo que matizar Mi afirmación Sobre las preferencias Eso es una interacción No puedo hablar De uno de los factores Clase social O del otro Que efecto tienen De por sí En la evaluación Sin más Sin matizar Algún nivel Del otro factor Cuando suceda eso Tenemos una interacción Por ejemplo Si yo me cojo Eh Los eh Los resultados anteriores Y Eh Colapso Agrupo Eh Lo que me han dicho Las chicas de clase social Eh Perdón Colapso Las puntuaciones Eh De las clases De las chicas de clase social Y alta Para cada nivel Del eh De físico Tendré la línea negra Que vemos aquí Si yo colapso Lo voy a poner En amarillo Esta puntuación Y la agrupo Con esta El término medio Va a ser este Si yo colapso Eh El rojo Y el verde Pues Si yo colapso En la clase social Alta y baja Para chicos normales Tendré Esta puntuación Y lo mismo sucederá En esta otra situación Si colapso Agrupo Lo que han dicho Las chicas de clase alta Y las de clase baja Con respecto A Chicos Eh Musculosos La medida va a ser Va a estar aquí Esto quiere decir Que Si no atiendo A la clase social Aproximadamente Voy a obtener Que las chicas De clase alta Les da igual El tipo de físico Eh Masculino Lo cual no es cierto Porque hay una interacción Entonces Esto es una interacción No podemos decir Sin más Que a las mujeres Les gustan los hombres musculosos Con forma de V Si Sino que su preferencia Depende De la clase social A la que pertenece Tengo que hacer Una matiz Como regla general Podemos decir Que si las líneas Que conectan Las medias De los niveles De los caracteres No son paralelas En términos estadísticos Entonces Tenemos Una interacción Aquí por ejemplo Si tuviéramos Este patrón de resultados Que no es el que nos ha hecho Eh La autora del texto Este es otro Lo estoy inventando yo Si tuviéramos Este patrón de resultados Habría interacción Porque Yo aquí lo que veo Es que Si este fuera el patrón De resultados Obtenido En la vida real En el experimento Obtendría Que las chicas De clase alta La línea roja Evalúan por igual Cualquier tipo De físico masculino Les da igual Que sea Delgado Normal O musculoso Las medias No difieren Sin embargo La chica de clase social Baja Cuanto más musculoso Mejor Esto es una interacción Las líneas No son paralelas Aquí tendríamos Otra interacción Aunque no se cruzan Realmente Vemos que Las diferencias Entre Las puntuaciones Se van haciendo Cada vez Una interacción Aquí en este caso Diría que Interacción En Se tuviera Que formar El doctor Estas diría Para chicas De clase Social Baja Y para chicas De clase Social Alta Cuanto más Musculoso Sea el chico más atractivo lo encuentra. Sin embargo, las chicas de clase social alta se incrementa mucho más esa preferencia en relación a las chicas de clase baja. También es una interacción. Veamos que la pendiente de esta línea, en otro color, la pendiente, el grado de incremento del atractivo en función del físico para las chicas de clase social baja, la pendiente es inferior a la de las chicas de clase alta. Si este fuera el patrón de resultados que hubiéramos tenido los investigadores, también aquí habría interacción. Estos últimos casos lo estoy poniendo, me estoy inventando obviamente el patrón de resultados para ver tipos de interacción, para que entendamos lo que es una interacción. Y en este caso, he puesto aquí que no es interacción. Con lo cual ya se sabe. Básicamente, las líneas son paralelas. ¿Qué podríamos decir aquí? Pues no sé si este pequeño incremento que se observa es significativo, pero probablemente la diferencia en global entre la chica de clase alta y baja, esta diferencia, probablemente sea significativa. Entonces, lo más seguro es que en el ANOVA, si tuviera estos resultados, que me los estoy inventando, vuelvo a decirlo, lo más seguro es que el factor clase social fuese significativo. Y en este caso tendría que indicar que las chicas de clase social baja puntúan y evalúan de forma superior el físico del chico en relación a las chicas de clase social alta. Si este pequeño incremento que se produce en ambos fuese también significativo, también tendría que indicar que las chicas de clase Y también tendría que indicar que el factor tipo de físico es significativo, en el sentido de que cuanto más se acerca al polo de los chicos musculosos, mayor atractivo encuentran las chicas en ellos. Este patrón de resultados me indicaría que hay dos factores, los factores principales significativos, clase social y tipo de físico, pero no hay interacción. Y por tanto puedo decir sin más que si este fuese el patrón de resultados real... ...que a las chicas cuando van musculosos los chicos les gustan más. Punto. No tendría que introducir necesariamente el otro factor, la clase social. Y también podría hacer alguna afirmación sobre la clase social independientemente del tipo de físico. Aquí por ejemplo vemos que las dos líneas están claramente sobrepuestas. Estas dos líneas se refieren a clase social baja y alta. En este caso yo diría que mira, la clase social baja, la clase social baja, no hay diferencias en función del tipo de físico. En este caso, todo lo contrario, solamente la clase social parecería tener un efecto, porque si nos damos cuenta, por ejemplo, que la clase social baja, no hay diferencias en función del tipo de físico. Y tampoco la hay en la clase social alta. Pero las evaluaciones son claramente diferentes en función de la clase social. Aquí es un caso más claro, en donde ambos factores principales tendrían efecto, tipo de físico y clase social, pero no habría interacción. Las líneas son aproximadamente paralelas. ¿Por qué hemos dicho anteriormente que hay que... comprobar lo que vemos en el gráfico con los análisis numéricos? Pues por una sencilla razón. Porque el gráfico nos puede engañar. Por ejemplo, en los gráficos anteriores yo no he puesto intervalo de confianza. Si pusiera un intervalo de confianza y obtuviera este patrón, observemos que aquí tenemos una media, la media de evaluación del grupo de chicas de clase alta cuando han evaluado a chicos musculosos, pero el intervalo de confianza... se superpone con la media de las mismas puntuaciones, pero en chicas de clase baja. Eso quiere decir que estadísticamente estas dos medias no difieren. Es por eso que gráficamente cuando veamos un patrón que no es exactamente paralelo, tenemos que irnos procesalmente a los análisis numéricos. Vamos al cálculo analítico. Es lo único que nos pueden indicar. Las gráficas nos pueden dar una sugerencia, pero no nos pueden confirmar la existencia de una interacción. Aquí habría otra interacción, creo que esta la hemos visto. Aquí habría otra interacción. Retomamos entonces el tema. La presencia de una interacción en un diseño factorial, obviamente con dos factores o más, nos obliga a ir más allá de las conclusiones que se puedan sacar de los efectos principales. Pues estos, para cada factor, deben ser interpretados, teniendo en cuenta los factores principales. Los niveles del otro factor. Es lo que hemos estado viendo en el ejemplo anterior. Yo no, si hay interacción, yo no puedo decir sin más qué efecto tiene el tipo de físico o la clase social sobre la evaluación de las chicas. Lo tengo que matizar en relación a algún nivel de la otra variable independiente o factor. Hay muchas diferencias de interacción, muchísimas. Deberíamos saber desde mi punto de vista lo más obvio. Lo más obvio sería dar una definición analítica, pero si le damos una definición analítica probablemente la mayor parte de las personas se queden sin ver el meollo de la cuestión. De hecho, luego comentaré algún trabajo en donde incluso los investigadores se pierden muchas veces parte de ese meollo. Vamos a ver las definiciones de interacción, que es lo nuevo de este capítulo. Una interacción está presente cuando los efectos de una variable independiente son sobre la variable independiente, sobre el objeto de estudio, cambia en los diferentes niveles de la otra variable independiente. Esto no significa que una variable independiente influya sobre la otra variable independiente. Las variables independientes no influyen entre sí. Influyen e interaccionan en relación a la variable dependiente. Segunda definición. Una interacción está presente cuando los patrones de las diferencias asociados a una variable independiente cambian con los diferentes niveles de la otra variable independiente. Como nos estamos dando cuenta, estamos metiendo qué efectos tiene una variable en función de los niveles de la otra variable, en función de patrones de diferencias, en función de efectos simples. Una interacción está presente cuando los efectos simples de una variable independiente, de un factor, no son los mismos en todos los niveles de la otra variable independiente, del otro factor. Para mí esta es la más clara porque además hemos hecho hincapié al principio del tema en qué son los efectos simples. Cuarta definición. Una interacción está presente cuando los efectos principales de una variable independiente no representan a los efectos simples de esa misma variable. Es ver la definición tercera desde otro punto de vista. Quinta definición. Una interacción está presente cuando las diferencias entre las medias de las celdas que representan el efecto de un factor en algún nivel del otro factor, no son iguales a las correspondientes diferencias en otro nivel de ese factor. Yo creo que no es necesario seguir con... ...con definiciones. Vamos a entonces ver qué podría suceder en el diseño experimental que hemos utilizado en el tema 7. Es un diseño factorial 3x3, como ya hemos comentado anteriormente. Diseño factorial 3x3 donde tenemos dos factores, primero y segundo. El primero tiene tres niveles y el segundo tiene otros tres niveles. Vamos a ver ejemplos de lo que pudiera suceder. Aquí. Si tuviéramos este patrón de resultados, bueno, en primer lugar, en la primera, en la parte superior de la pantalla se muestran las medias hipotéticas de este experimento. Por ejemplo, a1 y b1. a1, b1 sería esta puntuación que vemos aquí en la gráfica que es, vale, la unidad. El resto, aquí tenemos a2, b1, a2, b1, b2, b3, b4, b5, b6, y b6. Aquí tendríamos entonces, en la gráfica, lo que nos representa son las medias para cada combinación de niveles de los dos factores. Entonces tenemos 3x3, 9 medias. Las hemos unido mediante tres líneas con diferentes colores para visualizar, para que gráficamente sea sencillo visualizar. El caso es que las líneas no son paralelas. Si no son paralelas, significa que probablemente haya interacción. No se cruzan las líneas porque los niveles se han quedado en el a3. Si siguiéramos a un nivel a4 probablemente se cruzarían. En este caso tendríamos una interacción pero aquí las líneas se cruzan. Vemos, por ejemplo, que el... ... ...el efecto en el nivel b3 del factor a es distinto que el efecto de a3 en el nivel b1. En el nivel b1, perdón, en el nivel b3, que es verde, es esta línea, en el nivel b3 vemos que las puntuaciones de la variable dependiente tienden a incrementarse, parece incluso que linealmente. Mientras que en el nivel b1, que es la línea azul, esta línea azul, el efecto de a parece no diferir entre a1 y a2, pero se incrementa para a3. Hay interacción. Aquí vemos que no hay interacción. Las líneas son aproximadamente paralelas. El patrón del factor a se incrementa. ... ...para b1 es el mismo aproximadamente que para b2 que para b3. Eso indicaría que no hay interacción. Entonces, en los diseños factoriales de dos factores, que es el que estamos tratando, vamos a denominar genéricamente a los factores a y b. Y vamos a seguir con un patrón de análisis similar a lo que hemos hecho anteriormente. ... ...en esta ocasión... ...la suma de cuadrados entre grupos... ...se divide a su vez en tres componentes. La suma de cuadrados entre tratamientos para el factor a es fc de a. Recuerden siempre que esto es subíndice. El problema es que Inteka me lo pone... me quita el subíndice. Suma de cuadrados de b y suma de cuadrados que representa la interacción. Es decir, estamos diciendo que la suma de cuadrados total, el numerador de la varianza... Los datos de un diseño factorial, de dos factores, se pueden representar en una tabla de doble entrada, de este tipo. En donde ponemos el factor A con sus niveles correspondientes. En este caso tenemos tres niveles, pues A1, A2 y A3. Vemos que denominamos al factor, como tal factor, como tal variable independiente, con la letra mayúscula A y a sus niveles con la letra minúscula A, la misma, pero minúscula, y con un subíndice que indica el nivel. Lo mismo sucede con el factor B y en este caso sus tres niveles. Cada una de estas celdillas, de las nueve celdillas que hay, va a agrupar las puntuaciones, en este caso, de cinco individuos, de cinco sujetos porque son los que tenemos en el ejemplo. Es decir, tantos sujetos. Es decir, tantos sujetos como elementos tengamos en cada una de esas nueve combinaciones. Entonces, realmente, en cada una de estas celdillas habrán cinco puntuaciones. El N lo único que indica es el número de puntuaciones que hay. Esta es la misma tabla que antes, pero ya con los datos. En vez de decir que en cada combinación habían cinco datos, los estamos dando. Entonces, observemos. Aquí tenemos los tres niveles del factor A. A1. A2 y A3. Y tenemos tres niveles del factor B. Entonces, para A1 tenemos tres combinaciones. A1 combinado con B1. A1 combinado con B2. Y A1 combinado con B3. Lo mismo sucede para las otras combinaciones de A. Y en el grueso de la tabla tenemos las puntuaciones de esos cinco sujetos en cada celdilla de A. De la tabla. Por consiguiente, vemos que hay nueve celdillas. Estoy subrayando, estoy agrupando las puntuaciones para esas nueve celdillas. Que es idéntico a lo que sucedía antes. Lo que pasa es que ahora en cada una de estas agrupaciones tenemos los datos de los sujetos. Y esto se refleja en que tenemos ahora tres subíndices. El primero nos indica... El nivel de la variable A. El segundo, el nivel de la variable B. Y el tercero, el sujeto dentro de ese grupo. Por eso tenemos este 1, 1, 1. Refleja que esa puntuación de la variable dependiente, I. Se refiere al primer nivel de la variable A. Al primer nivel de la variable B. Y es el primer sujeto dentro de ese grupo. Esta otra puntuación, I. En la variable dependiente. Tiene los subíndices 2, 1 y 3. Y esto refleja que se refiere... Esta puntuación es de un sujeto que ha estado sometido al nivel A2 de la primera variable. Al nivel B1 de la segunda. Y es el tercer sujeto dentro de ese grupo. Por último, en la parte inferior de la tabla. Tendríamos los sumatorios. Para todos los sujetos. De esas puntuaciones. Y a esto le vamos a llamar AB con dos subíndices. Dos subíndices porque ahora lo que hemos hecho ha sido... Colapsar, agrupar las puntuaciones de todos los sujetos dentro de esa combinación. Por consiguiente solamente nos queda... Nivel de A y nivel de B. El sujeto lo hemos agrupado. Y esta es la... La forma más precisa de tener las puntuaciones... De un diseño factorial... 2x2. Aunque... Perdón, 2x2. De un diseño factorial, en este caso 3x3. Tenemos dos factores con tres niveles. En el factor A, tres niveles. En el factor B. Y cinco sujetos. Aquí he puesto una S. En cada cruce de tratamiento. Entonces al tener tres niveles de cada factor. El número de tratamientos es obviamente 9. 3x3, 9. Recuerden. Una cosa es el número de combinaciones de tratamientos. Y otra es el número de efectos simples. El número de combinaciones de tratamientos viene dado por el producto entre los niveles. 3x3, 9. Sin embargo, el número de efectos simples es la suma de ellos. En este caso tenemos 6 efectos simples. De nuevo. Esto debe ir como subíndice. Especificado esto. Una observación genérica. Recordemos que las observaciones normalmente las vamos a llamar I. Las observaciones se refieren a la variable dependiente. A lo que yo estoy midiendo en el ejemplo del texto. Se está midiendo la actitud de los oficiales de policía. Entonces esa I refleja la puntuación que ha tenido un determinado oficial de policía. Y los subíndices. I se refiere al nivel del primer factor. Que puede ser en este caso 1, 2 o 3. J al nivel del segundo factor. Que en este caso también puede ser 1, 2 y 3. Y K se refiere al sujeto dentro de ese grupo. Si hay 5 sujetos puede ser de 1 a 5. A partir de esta metodología de datos vamos a obtener las sumas de los tratamientos de cada factor. Y la suma total de todas las observaciones. Que vamos a representar por T. Esto le vamos a llamar las sumas marginales de B y las sumas marginales de A. Si sumamos todas las puntuaciones que están bajo la columna A1. Lo único común a ellas es A1. Entonces vamos a reflejar en mayúscula con el subíndice 1. La suma marginal para el nivel 1 del factor A. A2 cuando A está en mayúscula. La suma marginal. Es decir, sin considerar la otra variable. De todas las puntuaciones para el nivel A2 del factor A. Y lo mismo para A3 cuando A está en mayúscula. En este caso la suma marginal es de A. Lo mismo sucede para B. Si cogemos y sumamos todas las puntuaciones que hay en esta tercera fila. Estamos determinando la suma marginal del factor B en el nivel 3. Para el nivel 2 sería sumar la segunda fila. Y obtendríamos ese valor numérico B2. Y para el primer nivel de la variable B. B1. Esta sería su suma. En este caso estamos sumando independientemente de lo que sucede en el factor A. Y a partir de ello obtendríamos las razones básicas. En este caso, a partir de los sumatorios podemos tener las medias generales para cada factor. En este caso, media. Recuerden que si es una razón básica. Tiene que ir entre corchetes. La media total. Está claro que es T. El valor T de la tabla anterior. Que no lo hemos comentado. Pero se refiere a el sumatorio de todas las puntuaciones. Vamos a ponerlo en amarillo. Si yo sumo todas las puntuaciones del grueso de la tabla. Este valor va a ser T, el total. Si quiero calcular la media de ese total. Será. El sumatorio. T partido por el número de puntuaciones que se han incluido ahí. ¿Cuántas puntuaciones tenemos? Pues el producto de A. El número de niveles del factor A. Por B. Por el número de sujetos. Que hay en cada celdilla. 3x3x5. En este caso. Si quiero determinar la media de A del factor A. En un determinado nivel. Utilizaré esta fórmula. Es decir, el sumatorio de A partido por el producto de B por N. El número de puntuaciones que se han incluido. La media de AB y la media de B. Cuando veamos los datos con el ejemplo vamos a ver más claro. Pero es simplemente hacer cálculos medias. Teniendo en cuenta A, B. El grueso de la tabla. AB o el total. Como esto lo vamos a ver mejor con los números numéricos. Lo dejamos para más adelante. Cortamos aquí la clase y nos quedamos. Transparencia 63. Nos queda aún. Veamos el chiste de hoy. Sobre la interpretación de las estadísticas. Tenga mucho cuidado. Con la interpretación. Observen esta. Que es un chiste pero que está bien. En Nueva York, un hombre se ha atropellado cada 10 minutos. El pobre tiene...