Hola, bienvenidos a la tercera parte del tema 5 sobre análisis de varianza. Nos habíamos quedado en el ejemplo 5.3 en donde vamos a plasmar todas las fórmulas que hemos visto teóricamente en las dos primeras partes de este tema, del tema 5. Lo vamos ahora a concretizar en un ejemplo, el ejemplo 5.3. Supongamos que tenemos una muestra aleatoria de nueve sujetos que puntúan alto en ansiedad, es decir, ansiedad será la variable dependiente. La hemos medido mediante algún instrumento objetivo, fiable, válido, normalmente un cuestionario, pero con características psicométricas apropiadas. A cada uno de los nueve sujetos se les ha medido esa variable dependiente y se le distribuye aleatoriamente entre grupos. De tal forma que n sub 1 igual a 4, n sub 2 igual a 3 y n sub 3 igual a 2. Eso significa que es un modelo no equilibrado, porque hay distintos números de sujetos en cada grupo. Observemos que n indica números de sujetos, pero como tenemos tres grupos, es lo que hemos dicho aquí, tres grupos, si todos tuvieran el mismo número de sujetos, n sub 1 sería igual a n sub 2 igual a n sub 3. Sin embargo, aquí nos dicen que el primer grupo, n sub 1, el subíndice de la n nos indica, el grupo, tiene cuatro sujetos. El segundo grupo, n sub 2, tiene tres sujetos y el tercer subgrupo, n sub 3, tiene dos sujetos. Diseño no equilibrado. La variable experimental, el factor que vamos a manipular es cantidad de droga que se les proporciona. Nos dicen que hay tres dosis, por lo tanto tenemos un factor, droga, con tres dosis, 0,05 miligramos, 0,10 miligramos o 0,20 miligramos. Tenemos un diseño, como los sujetos son distintos de medidas independientes, con un factor con tres niveles. Una variable independiente con tres niveles. Lo que queremos ver, el experimentador que haya realizado este experimento, si fuese cierto, quiere ver si estas dosis influyen. El estado de ansiedad de los sujetos, en concreto estas dosis, por lo tanto estamos en un diseño no aleatorio, sino de efectos fijos. Y ahora nos dicen, se cumplen los supuestos de independencia de las observaciones, normalidad de las distribuciones y homocertidad. Recordemos que estos tres supuestos son básicos para poder aplicar en la ANOVA. Bueno, en la ANOVA se puede aplicar, son unos cálculos que se pueden aplicar sin más, se cumplan o no se cumplan los supuestos, pero obviamente si no se cumplen, la información que nos va a dar la ANOVA no está sustentada, no tiene validez, nos puede estar engañando. Es como un arquitecto puede construir un edificio en un terreno que no pueda soportar ese edificio. ¿Lo puede construir? Sí, pero se lo va a caer. Lo mismo sucede aquí. ¿Podemos hacer el ANOVA con datos que no cumplan estos supuestos? Sí, pero los datos no van a ser válidos. Estos son los supuestos básicos de la ANOVA. Independencia de las observaciones, normalidad de las distribuciones y homocertidad. Es decir, que este último se dice que la varianza poblacional en los tres grupos sea la misma. Hemos colocado en esta pantalla las puntuaciones originales que nos proporcionan en el texto para cada uno de los niveles. Ahora, A1 significa el primer nivel, que es 0,05 miligramos. A2 el segundo nivel, 0,10 miligramos. Y A3 el tercer nivel, 0,20 miligramos. Tenemos cuatro puntuaciones en el primer nivel, los cuatro primeros sujetos. Tres puntuaciones en el segundo nivel y dos puntuaciones en el tercer nivel. En correspondencia con el número de sujetos que tenemos en cada grupo. Abajo hemos colocado exactamente lo mismo. Esas mismas puntuaciones, pero con la simbología que se indica en el texto. En donde los subíndices nos indican. El primer subíndice nos indica el nivel de esa puntuación y el segundo nos indica el sujeto dentro de ese grupo. Por ejemplo, la puntuación 5 es la variable dependiente a ansiedad. Por tanto, se la representa con la I latina, mayúscula. El primer subíndice es 1 porque está sometido ese sujeto al primer nivel, 0,05 miligramos. Y es el primer sujeto. La puntuación 8 es del segundo sujeto que está sometido también al primer nivel. La puntuación 4 es el tercer sujeto sometido al primer nivel del factor. Y la puntuación 3, el cuarto sujeto dentro del grupo 1, primer nivel. Luego, la puntuación 6 es el primer sujeto de ese segundo grupo. Grupo 2, sujeto 1. La puntuación 7, sujeto 2 del grupo 2, del nivel 2. Puntuación 8, tercer sujeto del grupo 2. Nivel 2 del factor. Y lo mismo sucede con el resto de puntuaciones. La puntuación 2 es el primer sujeto del nivel 3. La puntuación 4 corresponde al segundo sujeto del nivel 3. Mientras estos subíndices ahora, con los sumatorios, vamos a poder identificar unívocamente cada una de estas puntuaciones y vamos a poder trabajar simbólicamente en una única ecuación representando lo que queremos sumar, lo que queremos dividir, etc. Una vez que tenemos las puntuaciones, lo más adecuado es, que es lo que se ha hecho en esta tabla, es sacar los estadísticos que vamos a necesitar. El primer estadístico que corresponde con la primera fila n sub i, n era el número de sujetos y el subíndice i se refiere al nivel, tenemos que n sub 1 es 4 sujetos, n sub 2 3 sujetos y n sub 3 2 sujetos. Ahora a continuación. Aquí vemos el índice sumatorio, sigma. Es una letra griega que en nuestra área nos indicará sumatorio. En otras áreas se suele representar también, se suele utilizar para representar matrices, pero no nos interesa en este momento. Entonces, el sumatorio significa simplemente que nos cogemos para cada grupo, para cada nivel del factor y sumamos las puntuaciones de ese nivel. Entonces, el sumatorio de todas estas puntuaciones es a sub 1 y nos da 20. 5 más 8 más 4 más 3, 20. El sumatorio de todas estas puntuaciones del segundo grupo es a sub 2 y nos da un total de 21. El sumatorio de estas puntuaciones que corresponden al tercer grupo, a sub 3, nos da 6. El sumatorio general, sumatorio de a, no nos indica subíndices ni índices porque se sobreentiende que hay un solo subíndice, el i. Y lo mismo está indicando entonces, cuando no ponen el sumatorio se sobreentiende. Es suma todas las as. Las as hemos visto que a mayúscula 1, a mayúscula 2, a mayúscula 3. 20 más 21 más 6, 47. Esto también se le conoce como, se le suele representar como t. El total. 47. Y luego, como tenemos el sumatorio de cada subgrupo y el número de sujetos que hay en ese subgrupo, podemos calcular su media. La media se representa en este caso como la letra latina i con la rayita encima, media. Luego veremos que como su media se le va a poner de a sub 1, de a sub 2 o de a sub 3. Entonces, la media del primer grupo, da 5. 20 dividido entre 4 es 5. La media del tercer grupo, da 7 y la media del tercer grupo da 3. Y luego, la media global la vamos a representar por la media de i y como subíndice vamos a poner t de total. Calculamos la media de todas las puntuaciones. La media de todas las puntuaciones será 47 dividido entre 9 porque la media total es, nos cogemos todas las puntuaciones sin considerar el grupo y lo dividimos por el total de sujetos que es 9, n mayúscula. 47 dividido entre 9, 5.22 Una vez que tenemos estos datos que son sencillos y directos de obtener vamos a aplicar las fórmulas. Vamos a tener como recordatorio los cálculos anteriores en la parte superior de la pantalla para poder visualizarlo. Entonces vamos a calcular en primer lugar las sumas de cuadrados de a. Es decir, recuerde el numerador de una varianza que es la suma de cuadrados y como subíndice a a recordemos que en este caso representa el factor que estoy manipulando. ¿Qué variabilidad me aporta ese factor? Para ello lo que se hace es el sumatorio desde el primer nivel desde i igual a 1 hasta el último nivel. Perdón. i mayúscula. Como tenemos tres niveles i irá, el subíndice, desde 1 hasta 3. Obviamente será entonces i igual a 1, i igual a 2, i igual a 3. Entonces tendremos que realizar tres sumatorios. Este primero un segundo aquí que todavía no se ha especificado y un tercero. Este será para i igual a 1 este será para i igual a 2 y este será para i igual a 3. No es fácil dibujar con con el ratón. Necesitaría una tableta. Bien. Entonces lo que nos indica nuestro primer sumatorio es que hay tres sumatorios porque va desde i igual a 1 hasta 3. ¿Y qué hay en cada sumatorio? Hemos especificado el primero y vemos que hay n sub i por la puntuación de diferencia entre la media de ese nivel y la media global. Entonces el primer sumatorio sería 4 porque hay cuatro sujetos en el primer grupo multiplicado por 5 que era la media del primer grupo, menos la media global que es 5.22 elevado al cuadrado. Sumas de cuadrados. Eso para i igual a 1 Ahora seguimos haciéndolo para i igual a 2 es n sub i del grupo 2 que vale 3 multiplicado por la diferencia entre la media de ese grupo que vale 7 menos la media global que vale 5.22 la media global en este caso se va a mantener siempre la misma elevado al cuadrado. Lo mismo para el tercer subíndice exactamente lo mismo. Tenemos en este caso que n sub i para i i igual a 3 el tercer nivel vemos que hay dos sujetos multiplicado por la diferencia entre la media de ese grupo que es 6 menos la media global elevado al cuadrado. En estos cálculos y obtenemos si no hemos cometido ningún error en los cálculos 19.556 tiramos solamente 19.56 Este es el numerador de la varianza aportada por el factor a y observen que la fórmula ahora tiene sentido es simplemente desde el primer nivel hasta el último súmame una serie de factores. Cada uno de estos sumandos contendrá el producto del número de sujetos que haya en ese nivel del factor por el cuadrado de la diferencia entre la media de ese nivel y la media global. Eso que representa no se ve aquí muy bien aquí hay tres puntos por alguna razón me los ha borrado un poquito. Este es exactamente lo mismo que hemos visto anteriormente pero abajo lo que he puesto ha sido una forma de encontrar sentido a los cálculos que hemos hecho anteriormente Los cálculos que hemos hecho anteriormente lo que están calculando es la suma de cuadrados de factor a, el numerador de la varianza aportada por mi factor bajo el supuesto de que no hay variabilidad dentro de cada grupo porque estamos viendo solamente qué aporta mi factor si todos los sujetos del primer grupo han sido tratados iguales teóricamente si no hubieran factores de error variables extrañas todos los sujetos deberían puntuar exactamente lo mismo y qué es lo que deberían puntuar ese mismo cuánto debería ser parece lógico asumir que debería ser la media la mejor estimación que podríamos realizar si no hubiera variabilidad de error sería la media de ese grupo entonces la suma de cuadrados de a se calcula asumiendo que dentro de cada grupo no hay variabilidad y que todas las puntuaciones valen la media son iguales a la media de ese grupo por consiguiente lo que vemos aquí es que las cuatro primeras puntuaciones del primer grupo que eran varia 5 en el segundo grupo consideramos que hay tres puntuaciones que valen 7 y en el tercer grupo consideramos que hay dos puntuaciones que valen 3 si calculamos entonces ahora el numerador de la varianza de estos datos la suma de cuadrados es lo que hemos hecho anteriormente con respecto a la media a la media global que hemos dibujado en rojo siempre cuando se calcula una varianza siempre hay un punto de referencia y en este caso para la suma de cuadrados del factor ese punto de referencia es la media global por tanto se calculan las puntuaciones de diferencia de los cuatro sujetos del primer grupo considerando que todos han obtenido la misma puntuación con respecto a esta media se hace lo mismo para el segundo grupo en relación a la media global y lo mismo en relación al tercer grupo ese es el numerador esa es la suma de cuadrados de la varianza que aportan que aporta el factor lo que estoy manipulando sin que se vea afectado por la varianza de error ya que estamos asumiendo en este cálculo que todas las puntuaciones dentro del grupo son la misma espero que esté claro lo que está haciendo esta fórmula es simplemente calcular el numerador de la varianza por simplificar está calculando la varianza de estos datos con respecto a la media global considerando que dentro de los datos dentro de cada grupo dentro de cada nivel del factor no hay variabilidad por tanto estamos viendo la varianza que aporta mi factor bueno realmente lo que estábamos calculando anteriormente era la suma de cuadrados de A el numerador de una varianza ahora tenemos que calcular la varianza, es decir la media cuadrática de A recuerden que ahora las varianzas se llaman medias cuadráticas y que siempre que hablemos de varianza van a ser varianzas insesgadas cuando estemos hablando de ANOVA para ello vamos a tener que dividir por algo recuerden que para calcular una varianza siempre era un sumatorio de cuadrados partido por algo en primer curso se dijo que algo era N el número de datos, aquí en alza inferencial vemos que no es exactamente el número de datos sino que son los grados de libertad en este caso ¿cuáles son los grados de libertad? los grados de libertad son el número de puntuaciones diferentes que tengamos en nuestro conjunto de datos y en nuestro conjunto de datos hemos visto que solamente hay 3 puntuaciones diferentes tantas como niveles tengamos del factor, por consiguiente 3 y restamos un grado de libertad porque hemos hecho una estimación la estimación de la media global de todos los datos y por consiguiente para calcular la media cuadrática de A se divide la suma de cuadrados de A que hemos calculado anteriormente partido por I-1 el número de niveles que tengamos menos la unidad porque hemos restado un grado de libertad debido a la estimación de esa media global y esto nos da entonces una media cuadrática de 9.7778 es decir 9.79 esta es la variante ensalzada de este conjunto de datos me representa por consiguiente la variabilidad que mi factor está aportando al experimento ahora vamos a pasar a la otra variabilidad al cálculo de la suma de cuadrados de error es suma de cuadrados sub S barra A que significa la suma de cuadrados de los sujetos dentro de cada uno de los grupos y vemos la fórmula en ya lo hemos visto teóricamente vemos que hay dos índices de sumatorio el primer índice de sumatorio nos dice cógete desde el primer nivel al último, es decir cógete desde el primer nivel al segundo y al tercero y dentro de cada uno de esos niveles para I igual a 1 para I igual a 2 y para I igual a 3 dentro de cada uno de esos niveles desde el primer sujeto hasta el último que haya en ese grupo entonces dentro del primer sujeto irá desde el primer sujeto hasta el cuarto cuando pase a I igual a 2 J irá desde 1 hasta 3 cuando pase a I igual a 3 J los sujetos irán desde 1 hasta 2 es decir lo que me está diciendo es que vaya que recorra todos los datos y una forma simbólica y simple de hacerlo es mediante esos dos sumatorios porque mediante esos dos sumatorios recorre todo el conjunto de datos entonces una vez visto esto vamos a tener que hacer este cálculo I por Nsuit bueno como Nsuit no es constante vamos a tener que hacer este cálculo 4 más 3 más 2 9 veces tantas como datos haya y este cálculo vemos que es como siempre una suma de cuadrados en donde lo que se suma son puntuaciones de diferencia de cada puntuación individual I sub IJ puntuaciones menos la media pero que media la media de ese nivel la media del nivel I cuando calculemos la puntuación de diferencia I igual a 1 cogeremos la media de ese grupo de I igual a 1 cuando cojamos el segundo grupo cogeremos su media correspondiente y cuando calculemos las puntuaciones de diferencia del tercer grupo cogeremos su media correspondiente es lo que he señalado aquí las puntuaciones originales están en azul mientras que las medias dentro de cada grupo están representadas por la línea en rojo entonces he representado la misma fórmula que hemos visto anteriormente y ahora cada una de estas líneas de datos me representa un I distinto tenemos 3 niveles por tanto la primera línea son los cálculos I igual a 1 esto para esta segunda línea para I igual a 2 y esta tercera línea para I igual a 3 entonces observemos en cada uno de esos niveles ya estamos haciendo el primer sumatorio luego tendremos en I igual a 1 tendremos 4 sumatorios porque tenemos 4 sujetos cuando I igual es a 1 vale 4 en la segunda línea como N sub 2 vale 3 tendremos 3 sumatorios y en la tercera línea igual a 3 tendremos 2 sumatorios porque hay 2 sujetos en el tercer grupo y los sumatorios que son la primera puntuación vale 5 la puntuación del primer sujeto en el primer grupo vale 5 y la media de su grupo vale 5 observemos que las medias dentro de cada fila son la misma porque se corresponden con esa media la media de ese grupo y entonces se calculan las puntuaciones individuales de cada sujeto menos la media de ese grupo elevado al cuadrado cuando pasamos al segundo nivel observamos que la media cambia ahora vale 7 entonces calculamos las puntuaciones de diferencia con respecto a su propia media y lo mismo sucede cuando calculamos las puntuaciones de diferencia en el tercer grupo cuya media vale 3 tenemos 9 puntuaciones de diferencia al cuadrado pero lo más importante es que ahora la media que se utiliza como referencia no es la media global sino la media de su grupo por consiguiente lo que estamos calculando es la variabilidad dentro de cada grupo estamos eliminando el efecto de la media que ya hemos considerado la suma de cuadrados del factor A y por consiguiente el resultado de este cálculo que nos da 18 nos proporciona el numerador de la varianza debida a los factores de error por último nos queda simplemente dividirlo por el grado de libertad de esa suma de cuadrados para calcular la media cuadrática es decir, la varianza insasgada debida a los factores de error los factores dentro del grupo los factores que estamos operando dentro de cada grupo dividimos la suma de cuadrados intra de error que hemos calculado anteriormente que vale 18 la dividimos por su grado de libertad ¿y cuánto grado de libertad tendremos? pues tantas puntuaciones diferentes tendremos 9 puntuaciones diferentes 9 puntuaciones menos puntuaciones que tengamos 3 porque hemos estimado 3 medias las medias dentro de cada grupo que eran las puntuaciones que nos servían de referencia en este cálculo de suma de cuadrados tenemos 3 estimaciones de media por consiguiente restamos 3 9 menos 3 18 dividido entre 6 nos da 3 esa es la varianza insasgada la media cuadrática del error y por último calculamos la suma de cuadrados total es el numerador de la varianza tal y como se vio en análisis de datos 1 la varianza de los datos directos ahora si tenemos como única estimación de media la media global que es 5.22 y tenemos 9 puntuaciones de diferencia ahora da igual haber diferenciado los 3 subgrupos porque ahora calculamos la varianza de los datos originales con respecto a la media global esa es la suma de cuadrados total de nuevo se simplifica su expresión matemática simplemente utilizando los dos formatorios que hemos visto anteriormente y observamos que la única diferencia es que las puntuaciones de diferencia las calculamos con respecto a la media global y esto nos daba 37.5556 vale ahora calculamos la varianza porque el calculo anterior era el numerador de la varianza las sumas de cuadrados y para ello tendríamos que dividir la suma de cuadrados total que hemos calculado anteriormente por sus grados de libertad ¿cuánto grado de libertad tendremos? bien, ahora tenemos nueve puntuaciones pero hemos hecho una única estimación de una media, la media total para calcular esta varianza por consiguiente le restamos solamente un grado de libertad 37 dividen 8 aproximadamente 4.69 con esto ya podemos rellenar y completar la tabla de la nueva la tabla de la nueva lo único que nos hace es, todos los cálculos anteriores nos los representa en una única tabla los tenemos todos en conjunto en primer lugar ponemos cinco columnas algunos añaden una tercera columna para el tamaño del efecto pero eso no se ve en el temario así que lo dejamos y la segunda columna nos indica las fuentes de variación ¿qué fuentes de variación hemos estado indicando que tenemos en nuestro experimento? dos, la que apuesta mi factor cuya estimación es mediante la varianza entre los niveles y la que hay dentro de los niveles dentro del grupo la varianza de error dentro de los niveles el total es la suma de los dos anteriores entonces hemos calculado que la suma de cuadrados SC entre los niveles era 19.556 y SC dentro de los niveles es 18 en la tercera columna ponemos los grados de libertad el numerador de la varianza dos para entre niveles y seis para dentro de los niveles ahora, para calcular las medias cuadráticas en la tabla de la nueva es muy sencillo la suma de cuadrados entre los grados de libertad correspondientes de su propia fila entonces para la primera fila la fuente de variación entre sería 19.55 dividido entre 2 9.778 y para dentro de los niveles tendríamos 18 dividido entre 6 3 las medias cuadráticas son dos la media cuadrática que aporta mi factor 9.77 y la media cuadrática intra intranivel 3 ahora las colocamos las dos en un cociente, en una razón la razón entre la variedad que aporta mi factor 9.78 y la variedad que aportan los factores extraños 3 nos da 3.26 ese 3.26 es un cociente entre varianzas y en la análisis de datos 1 se vio que un cociente de varianzas se distribuye según la razón F por tanto a esta última columna se le llama F que es el estadístico resumen de todos los cálculos anteriores de la tabla de la nueva, es lo que más nos interesa es el estadístico de contraste que hemos estado viendo en los capítulos anteriores pero en este caso aplicado a la nueva obviamente si tenemos un estadístico de contraste necesitamos algo más el valor crítico para saber si esta F es compatible a un determinado nivel de probabilidad con la hipotesis nula de que todas las medias por la final son iguales o no entonces tendremos que irnos a las tablas y buscar la F crítica nos han dicho que utilicemos un alfa del 0.05 entonces nos vamos a la tabla del 0.95 recuerden 1 menos alfa notará 0.95 en esta tabla buscamos con los grados de libertad del numerador y del denominador ¿de qué numerador y qué denominador? de este si aquí hemos calculado una F con 2 y 6 grados de libertad tendríamos que buscar una F con 2 y 6... aquí me he equivocado serían 6 grados de libertad, no 7 entonces sería esta 5 punto lo que sea no es 4,737 es este valor voy a ponerlo en azul cuando lo he dibujado me he ido al 7 en vez de al 6 recuerden que los grados de libertad tienen que corresponder con los que aparecen en la tabla de ANOVA para que sean comparables con la F que hemos calculado pero como 5 y pico el resultado es el mismo aunque este valor esté equivocado 3,259 es la F que hemos obtenido en nuestro experimento y 5 y algo es la F crítica veamos un poco lo siguiente que nuestra F empírica es inferior a la F crítica no podemos rechazar H0 esta sería la F con 2 y 7 grados deberían ser 6 grados pero bueno, ya está hecho la F de 2 y 6 grados de libertad con alfa 0.05 era 5 y algo hemos dibujado entonces aquí esa F y este sería el valor crítico 5 y algo deja por encima de sí lo he dibujado en rojo el 0.05 del área de distribución y por consiguiente el 3 y algo que hemos obtenido en nuestro experimento 3,26 quedaría aproximadamente por aquí queda en la región de aceptación de H0 y 3,26 este sería el área que deja por encima de sí la P crítica y obviamente es un área superior a 0.05 lo vemos en este gráfico donde hemos dibujado las dos representaciones este área en rojo sería 0.05 y este área observamos que intuitivamente es superior a 0.05 tanto si utilizamos el criterio de la región de aceptación o los valores alfa y P crítico llegamos a la misma conclusión ¿cuánto vale el nivel P crítico? bien creo que no podemos obtenerlo de forma exacta recordemos que teníamos una F de 2 y 7 de 3,26 aquí tendríamos que buscar no en 7 lo voy a hacer en 7 porque ya está hecho pero recuerden que sería este dato que aparece arriba como no tenemos el de 3.26 si, 3.26 no tenemos el valor exacto nos podemos ir a las cuatro tablas aquí he representado la parte de las cuatro tablas de la F que tenemos tenemos las probabilidades para 0.90 para 0.95 para 0.975 vemos que con 2 y 6 grados de libertad en hecho vamos a trabajar con 7 por este error y iremos buscando aquel valor F más aproximado al que hemos obtenido y vemos que sería este 3.257 es aproximadamente 3.26 que es precisamente la F empírica que hemos obtenido y vemos que deja por debajo de sí el 0.90 y por consiguiente por encima de sí deja 1 menos 0.90 que nos daría 0.10 lo hemos hecho aproximadamente porque vemos que este valor nos es muy superior a 3.26 es tanto más este y este por consiguiente más aproximado sería el primero si no tenemos una calculadora precisa tenemos que trabajar con este tipo de aproximaciones y estos son todos los cálculos que tendríamos que realizar para realizar el ANOVA y en este caso el ANOVA nos daría una mala noticia tenemos que no podemos rechazar H0 eso en el contexto de la investigación es una mala noticia pero bueno, el resultado es ese los datos son los datos si el número de sujetos al grupo fuese un poco mayor tenemos solamente 9 sujetos y en algunos de los grupos muy pocos sujetos probablemente si tuviéramos más sujetos los resultados serían significativos que es lo que le interesa a la investigación pero independientemente de ello si tuviéramos un poquito más de sujetos al grupo, los cálculos a realizar serían considerablemente largos es por eso que normalmente se acude a programas informáticos para realizarlos mostraré algunos de estos programas gratuitos no voy a meterme con SPSS o SAS que son de pago R es un programa que no es de pago pero hay que saber programar y sería meternos en más sería complicado entonces hay algunos programas semejantes a SPSS que son gratuitos en la red intentaré utilizar alguno de ellos si tuviéramos un poquito más de datos no podríamos realizar a mano bueno, sí podríamos realizarlo pero sería extremadamente pesado antiguamente es así entonces normalmente se acude a programas informáticos para realizarlos o bien podríamos utilizar sería otra fórmula el desarrollo de la fórmula de cálculo para calcular la suma de cuadrados totales o la suma de cuadrados intra que nos dan cálculos abreviados esto es un cálculo abreviado parece que no, pero lo es vemos aquí sumas de cuadrados totales ya vimos como se calculaban esta era la fórmula teórica a la que le podemos encontrar sentido ahora bien podemos utilizar una fórmula más computacionalmente que es la que pueden ver a mano derecha que es exactamente idéntico a la fórmula teórica observemos que esta fórmula para calcular la suma de cuadrados totales es una diferencia entre este primer apartado y este segundo vamos a ver, el primer apartado nos indica desde I igual a 1 hasta I mayúscula es decir, desde el primer nivel hasta el último sumame algo el segundo sumatorio me indica para cada nivel cogeme a todos los sujetos de ese nivel desde J igual a 1 hasta N sub i y sumame algo que me va a sumar I al cuadrado las puntuaciones individuales al cuadrado nos cogemos las puntuaciones los datos iniciales que tenemos en nuestro experimento los elevamos al cuadrado esto puede parecer un trabajo más complicado que el anterior pero no es así porque las calculadoras de las que disponemos actualmente van a depender de cada calculadora tienen que realizarse manuales de instrucciones e irse a la parte de estadística y eso les va a facilitar mucho la tarea cójase su manual de instrucciones y verán como hay una tecla en la que ustedes meten los datos individuales uno a uno y le dan a una tecla si está en modo estadístico la tecla I al cuadrado y les va a dar el sumatorio de todos esos datos ya elevados al cuadrado con lo cual les facilita mucho la tarea esta primera parte de la fórmula es simplemente el sumatorio de todos los datos originales al cuadrado y la segunda y eso se le resta un cociente ese cociente es de nuevo tenemos un sumatorio en el numerador partido por N N es el número total de datos y en el numerador que tenemos dos sumatorios sumatorio desde T igual a 1 hasta I mayúscula es decir, desde el primer nivel hasta el último súmame algo y ahora dentro de cada nivel ¿qué hay que sumar? otro sumatorio dentro de cada nivel súmame de primer sujeto hasta el último es decir, cójame todas las puntuaciones de lo que me están diciendo estos dos sumatorios ¿y qué es lo que sumamos? sumamos las puntuaciones individuales sin elevar al cuadrado y una vez que hemos obtenido ese sumatorio ese valor ese único sumatorio es el que elevamos al cuadrado entonces la diferencia entre las dos partes de la fórmula está muy clara en el primer caso cogemos las puntuaciones individuales las vamos elevando todas al cuadrado y luego sumamos todos esos cuadrados mientras que en la segunda parte de la fórmula primero sumamos todas las puntuaciones individuales y de ese sumatorio hacemos un único cuadrado y ese cuadrado lo dividimos por el número total de datos aquí lo hemos hecho bueno, hemos hecho parte de la fórmula anterior vemos la primera parte hemos cogido la primera parte del sumatorio desde el primer nivel hasta el último y dentro de cada nivel desde el primer sujeto hasta el último las puntuaciones individuales al cuadrado es decir, obteniendo la puntuación 5 al cuadrado más 4 al cuadrado más 3 al cuadrado hasta el final y esto nos da 283 ahora hacemos lo mismo pero con las puntuaciones individuales sin elevar al cuadrado nos cogemos todas las puntuaciones 5 más 8, más 4, más 3, más 6, más 7 las sumamos y nos da 47 y a ese 47 es el que elevamos al cuadrado y nos da 2209 ya tenemos los dos sumatorios que veíamos anteriormente entonces tenemos este primer sumatorio que nos daba 283 menos el cociente entre el segundo sumatorio 2209 partido por el total de 9 hacemos este cociente y lo restamos 283 menos este cociente nos da 37.5556 que ya sabemos que es la suma de cuadrados total que hemos calculado previamente y por último hacemos lo mismo para calcular la suma de cuadrados de A observen que aquí ahora la segunda parte de la fórmula ya aparecía antes es esta, con lo cual una vez calculado ya sabemos cuánto es no es necesario recalcularlo y la primera parte de la fórmula cambia con respecto a la anterior ¿y en qué cambia? observen que tenemos un primer sumatorio que nos indica suma algo desde igual a 1 hasta el número total de niveles como tenemos tres niveles nos está indicando que sumemos algo hagamos tres sumas ¿y esas sumas a qué se corresponden? pues en este caso se corresponden a tres cocientes este sumatorio está referido al cociente global y no está en el numerador del cociente por consiguiente es sumame tres cocientes es lo que he registrado aquí el primer sumatorio se aplica al cociente por tanto tendremos tres sumatorios uno para i igual a 1 otro para i igual a 2 y otro para i igual a 3 lo he dejado en blanco para indicar que este sumatorio se corresponde con esos tres cocientes dentro de cada cociente ¿qué tenemos? pues tenemos un numerador que son las puntuaciones para ese nivel del sumatorio de los sujetos desde el primer sujeto hasta el último de cada uno de los niveles sumamos esas puntuaciones y las elevamos al cuadrado y partimos por el número de sujetos que hay dentro de ese nivel es decir, que para este primer para i igual a 1 nos cogemos las puntuaciones que hay en ese primer nivel las sumamos 5 más 8 más 4 más 3 lo elevamos al cuadrado y dividimos por 4 porque hay cuatro sujetos en ese grupo para el segundo cociente ahora sumamos las puntuaciones que hay estamos ya en i igual a 2 en i igual a 2 tenemos tres sujetos nada más por tanto sumamos 6 más 7 más 8 que son las puntuaciones del segundo grupo y ese sumatorio lo elevamos al cuadrado y dividimos por 3 que es n sub 2 para el tercer cociente hacemos lo mismo pero con el tercer grupo porque estamos ahora ya en i igual a 3 sumamos 2 más 4 que son todos los sujetos que hay en ese tercer grupo elevamos al cuadrado y dividimos por total de sujetos y es lo que hemos hecho aquí si tenemos los cálculos anteriores que hicimos al inicio es sencillo ver que los sumatorios de cada nivel los tenemos ya calculados 20, 21 y 6 por lo tanto sólo nos queda elevar al cuadrado y dividir por los n sub i pues tenemos tres cocientes tres sumandos uno para cada nivel del factor y cada sumando es el sumatorio de las puntuaciones individuales al cuadrado partido por n sub i y esto nos da 265 ese 265 lo aplicamos a la fórmula inicial como esto ya hemos dicho que lo habíamos calculado previamente y nos da una suma de cuadrados para el factor suma de cuadrados inter igual a 19.55 que es exactamente lo mismo que habíamos calculado previamente y para calcular por último la suma de cuadrados intra no es necesario hacer ningún cálculo como hemos visto porque sabemos que la suma de cuadrados de cuadrados intra es la suma de cuadrados total menos la suma de cuadrados debida al factor si tenemos dos sumas de cuadrados tenemos la tercera por lo tanto la diferencia entre la suma de cuadrados total y la suma de cuadrados de a nos da la suma de cuadrados del error el próximo día seguimos espero que tengáis este ejemplo haya aclarado mucho o bastante lo que habíamos visto del en los dos primeros en las dos primeras grabaciones que era mucho más teórico espero que a ustedes se hayan afianzado los conceptos bueno no preparo hoy ningún chiste pero ayer estuve viendo en casa un documental que se titulaba el virus de la fe de un biólogo entre las varias el documental es estremecedor pero como científicos él plantea que la fe religiosa de cualquier tipo de cualquier área es contraria a la ciencia en el sentido de que invita a no pensar críticamente y por lo tanto como planteaba que la la fe es la raíz de todo mal bien el documental es notable yo no lo voy a criticar pero si como psicólogo planteo que los psicólogos hemos estudiado las raíces del mal y no son sin embargo esos experimentos en 1960 investigó cuáles eran las causas del mal las causas de las conductas agresivas de las conductas violentas de las conductas genocidas no era la fe el próximo día a ver si me traigo el decálogo de Zimbardo en donde se muestra que es lo que nos dice la investigación empírica y no un documental anecdótico que es lo que nos dice la investigación empírica en qué radica el mal según la investigación empírica no según anécdotas y veremos que no depende de la religión el mal se encuentra en cualquier otra institución política, ideológica de cualquier tipo a veces se plasma la religión pero no necesariamente se lo recomiendo está bien pero como científicos piensen críticamente lo mismo que indica el biólogo en el documental se lo pido a ustedes