Buenas tardes, seguimos con el ANOVA. En concreto nos habíamos quedado con el modelo de efectos fijos. Vamos a ver a continuación algunos conceptos que quizá al estudiante le suenen raros porque vamos a imponer un modelo a los datos Es decir, una estructura. Nosotros hemos realizado un experimento y hemos obtenido unos datos, unas puntuaciones en función del diseño, en este caso un diseño con varios grupos independientes, más o menos La pregunta que tenemos que hacer es ¿de dónde proceden esos datos? No, mejor dicho, más que de dónde proceden ¿Cómo se han generado esos datos, esas puntuaciones? A partir de un experimento ¿Vale? Pero queremos una forma de conceptualizar esas puntuaciones matemáticas Y es a lo que le llamamos el modelo El modelo es una forma de pensar en cómo han podido generarse esos datos Y vamos a hablar entonces del modelo de efectos fijos y vamos a imponer una estructura a los datos Cuando veamos el modelo completo, volvemos a la idea de modelo En este modelo de efectos fijos, ya sabemos lo que son efectos fijos Nos interesan solamente los niveles concretos con los que estamos trabajando Nos interesa en este caso estudiar la influencia de un solo factor Vamos a llamarlo factor de forma genérica A Ya sea tipo de tratamiento farmacológico Ya sea momento del día, ya sea tipo de tratamiento de memorización A en este caso es la forma genérica con la que vamos a indicar nuestro factor Nuestra variable independiente Y ese factor tiene una serie de niveles Nos interesa comprobar el efecto que tiene este factor sobre una variable dependiente Que son las puntuaciones al final que obtenemos en nuestro experimento Vamos a considerar que tenemos i niveles I en mayúscula significa el total de niveles que tenemos Mientras que cuando lo pongamos en minúscula hará referencia a un valor concreto de los niveles Por ejemplo, en el caso anterior del tema anterior Bueno, no del tema anterior, de la clase anterior de este tema Teníamos un factor con tres niveles Tres es i mayúscula Porque tenemos un total de tres niveles Ahora nos podemos referir al primer nivel Entonces nos referimos con i minúscula igual a 1 Al segundo nivel nos referimos a i minúscula igual a 2 O al tercer nivel, i minúscula igual a 3 Entonces, I en mayúscula representa el monto total de niveles Mientras que i minúscula hace referencia a uno concreto de esos niveles Por tanto, i minúscula puede ir desde 1 Desde el primero hasta el último Hasta i mayúscula En cada grupo tenemos n elementos Sujetos normalmente en el caso de los experimentos en psicología Aunque no necesariamente Y cada uno de esos sujetos ha sido medido en uno u otro nivel del factor Los elementos o unidades observacionales van a variar desde j igual a 1 hasta n En el ejemplo que estamos tratando Teníamos cinco sujetos dentro de cada uno de los tres niveles Por tanto, j, que va a ser el subíndice de la letra Con la que vamos a indicar, a señalar El sujeto dentro de cada grupo J va a ir desde e1 hasta n Desde el primer sujeto hasta el último dentro de cada grupo Asumiendo que el diseño es equilibrado N va a ser el mismo en los tres grupos En nuestro caso, n será 5 Tenemos cinco sujetos dentro de cada grupo Y por tanto j, el subíndice referido al sujeto Va a ir desde 1 hasta 5 De tal forma que teniendo esos dos subíndices i, que nos indica el nivel y j, que nos indica el sujeto Vamos a poner referencia Cada una de las puntuaciones De mi experimento De la siguiente forma La vamos a referenciar normalmente como la variable dependiente La puntuación que estamos midiendo En nuestro caso ansidad Y mayúscula latina Y como subíndice Le damos los subíndices i y j Que en casos concretos Van a ser valores numéricos Y va a indicar el nivel Y j, el sujeto Una forma de memorizarlo Es la que he puesto en las transparencias Vemos que nivel tiene una i Mientras que el sujeto tiene una j Por consiguiente es una forma sencilla De saber Cada subíndice A qué se está refiriendo Por consiguiente i subij Es la puntuación del sujeto que ocupa el lugar j Dentro del nivel i En el caso anterior Por ejemplo Si nos piden ¿Cuál es la Puntuación i subij3 Esto no es 13 Idealmente hubiera sido apropiado Poner una Una coma entre los dos subíndices Normalmente no va a ser necesario Porque los experimentos Los análisis que vayan ustedes A tener que realizar No son más de 3 o 4 niveles Y no más de 5 o 6 sujetos Por consiguiente no es necesario Poner la coma Esto es el 1 y el 3 Esto me referencia El primer nivel Este De los tres niveles Este sería el primero Este sería el segundo Y este sería el tercero Este 1 hace referencia a ese Nivel Y 3 La puntuación 3, el subíndice 3 Que está en segundo lugar Me indica el sujeto ¿Cuál es el tercer sujeto del grupo 1? Primero, segundo, tercero Entonces vemos que esa puntuación vale 30 Lo único que nos sirve Este sistema de notación Es para identificar De forma no ambigua Univoca Cada puntuación En función del Nivel al que pertenece y el sujeto al que pertenece De la misma forma vemos Que en este caso I sub 3, 2 Está refiriendo 3 Al tercer grupo El tercer grupo Y 2 a la segunda puntuación Dentro de ese grupo Y vemos que vale 40 Esto nos va a ser muy útil porque A continuación Vamos a tener muchas fórmulas Todas ellas trabajando con Suma Desde I igual a 1 hasta Nos estáis diciendo que hagamos Por ejemplo, sumatorios Para determinados grupos Para determinados sujetos Y utilizando estos subíndices es posible Hacerlo de forma Simbólicamente no ambigua De forma directa, clara Aunque al principio Puede costar un poquito Una vez que ya sabemos como referenciar Cada una de las puntuaciones Vamos a ver Que la puntuación I sub IJ Es decir, esto referencia una puntuación genérica No importa en este caso La que referencie una cualquiera Está formada por varios componentes Esto es el modelo Lo que vamos a explicar ahora es Uno de los posibles modelos Que podemos Pensar que subyace A la generación de estos datos Y este modelo en concreto, el que subyace a la nueva Es que toda puntuación está formada Por la suma de tres componentes Un primer componente alfa sub I Alfa Ahora no hace referencia al alfa Hace referencia ahora Al efecto Que tenga el nivel I Del factor Observen que ahora el símbolo alfa Tiene un solo subíndice E I hacía referencia Al nivel del factor Y puede ser 1, 2 o 3 Por consiguiente la puntuación Empírica que hemos obtenido Va a venir dada por El efecto que pudiera tener Mi factor en ese nivel, en el nivel I Y ese efecto lo vamos a Referenciar Como Alfa sub I Mas Un error Este error si va a depender Tanto del nivel I como de sujeto J El error le damos El símbolo griego épsilon Porque puede afectar en distinta medida A todos los sujetos y en todos los niveles Por ello le ponemos Los dos subíndices Y un componente común Para todos los valores De la variable pendiente Este valor Está constante La vamos a estimar entre la media de la población Y La denotamos por mu El caso es que Este es el modelo Esto es lo que hemos estado comentando Vamos a imponer este modelo sobre Nuestros datos, vamos a pensar Que nuestros datos han sido generados Por un proceso antiguo Es decir La suma que vemos aquí En donde hay Tres componentes Todas y cada una de nuestras puntuaciones Han obtenido Ese valor mediante La adición de tres componentes Una media general, común para todas las puntuaciones Mu Más el efecto Que ese nivel Observen que I es el mismo para esa puntuación concreta I alfa Es decir, el efecto que pueda tener Mi variable independiente En ese nivel, en el nivel al que pertenezca La puntuación I sub ij Más un error Aleatorio, vamos a suponer que Este error aleatorio se distribuye De forma Normal Con media cero Y de dirección típica sigma Y vamos a asumir que si H sub c es cierta El sumatorio Desde el primer nivel I sub i igual a uno hasta el último I mayúscula De Este producto Vale cero Este es el modelo Que Vamos a imponer sobre nuestros datos Es el modelo Del que depende el ANOVA Es un modelo Abstracto Vamos a considerar Recuerden que cuando tenemos datos Una serie de puntuaciones, no sabemos De donde han salido esas puntuaciones Y En ciencia lo que se hace es que se les impone un modelo Y en este caso el modelo más simple Que le podemos imponer es este A partir de este modelo, obviamente vamos A tratar de realizar estimaciones Sobre sus parámetros Si no imponemos modelos Cosa que en los temas anteriores han sido mucho más Prácticos Más No han sido tan teóricos Pero es fortalecer cuando la situación Se complica, ya tenemos tres grupos Impongamos modelos Y este es el modelo más simple que podemos imponer Y el resto de clase lo que vamos a Realizar van a ser estimaciones De los componentes Del modelo que suponemos Está a la base Que genera nuestros datos Una vez visto el modelo Vamos a ver el sistema de notación De la ANOVA Tenemos un factor a que genéricamente le llamamos A, el que sea Con una serie de niveles El nivel A1 El nivel A2 Por aquí podría haber Otra serie de niveles porque ahora Nos pasa a AI de forma genérica Otra serie de niveles Y el último AI Para indicar que puede ser el que sea Todas las puntuaciones que hay en el interior De esta tabla Efectivamente Son las variables dependientes Observen que dentro De cada nivel Los sujetos son distintos Por eso son grupos independientes Y tenemos I mayúscula niveles del factor A Una forma De trabajar con estos datos A mano, sin ordenador, etc Es una vez que tenemos esta tabla Que es la forma de registrar todas nuestras puntuaciones Es establecer una serie De cálculos ya, inmediatamente Porque todos los cálculos posteriores Se van a basar en lo que aparece En la parte inferior de la tabla En primer lugar tenemos la suma De las puntuaciones dentro de cada nivel Observemos, por ejemplo El primer nivel Tenemos I1 I12 I13 I14 I1j Esto lo que nos indica es que Vemos que el primer subíndice De todas estas puntuaciones es el mismo 1, porque nos está indicando que Todas ellas pertenecen al primer nivel El primer grupo Mientras que el segundo subíndice Hace referencia A la posición De cada uno de los sujetos dentro de ese grupo Tenemos el primer sujeto El segundo, el tercero, el cuarto De forma genérica, el sujeto j Porque aquí puede caber más Y por último El último, lo vamos a denotar Por N Lo mismo sucederá en el segundo grupo En el segundo grupo tienen todos El mismo subíndice 2 Para referenciar que nos estamos refiriendo Al segundo grupo Y ahora dentro de ese grupo Tenemos el primer sujeto El segundo, el tercero, el cuarto El j El genérico Y el último será N O sea que estamos asumiendo un modelo Equilibrado, todos los grupos tienen El mismo número de sujetos Ahora, si Calculamos El sumatorio De cada uno De las puntuaciones que hay dentro de cada uno De los niveles Obtendremos las A sub 1 A sub 2, A sub i de forma genérica Y A sub i Mayúscula como la última Aquí como hemos Sumado todas las puntuaciones de los sujetos Dentro de cada grupo, no existe un segundo Subíndice, no es necesario Ya que hemos agrupado todas las puntuaciones De todos los sujetos dentro De ese Grupo, porque solamente necesitamos un subíndice Que es El que me referencia El nivel del factor Conociendo Dentro de También podemos calcular el total De las puntuaciones sumando Obviamente Los totales individuales Entonces T será La puntuación, el sumatorio De todas las puntuaciones Que hay en el grueso de la tabla Podemos calcular también las medias Entonces tendremos la media Del primer grupo, vendrá dada por A sub 1 partido por El total de sujetos N Y viene Referenciada por La media de A sub 1 Media de A sub 2 Media A sub I, es la genética Y media de A sub Mayúscula, la última El número de observaciones N sub 1, N sub 2 N sub i mayúscula N sub i mayúscula, el número de sujetos que hay Dentro de cada grupo Y la media global Media sub T Media global es El sumatorio De todas las puntuaciones T partido por el total de los sujetos N N es la suma Del total de sujetos N sub 1 más N sub 2 Más hasta llegar al último Este es el sistema de anotación Necesario para calcular A continuación Lo que necesitamos Lo había explicado en una serie de transparencias No recordaba Vemos que aquí tenemos Por ejemplo, subrayada En rojo La puntuación del tercer sujeto El segundo subíndice 3 La dirección del segundo nivel Aquí tenemos La puntuación del cuarto sujeto Que es el segundo subíndice Participa del nivel I Como recordemos Que A puede tener De tres niveles En adelante Y esto es un sistema de anotación genérico Tenemos que asumir que Pueden haber muchos niveles Entonces, de forma genérica I Estos son sujetos distintos Aunque todos tienen El cuarto como segundo subíndice Estamos en grupos independientes Es el cuarto sujeto De distintos grupos Y eso viene indicado por el primer subíndice Uno, dos Y mayúscula Son sujetos distintos Aunque todos tengan El mismo subíndice 4 Porque el subíndice hace referencia Al sujeto dentro del grupo Entonces, el sumatorio De estas puntuaciones ya lo hemos dicho Nos da A1 El sumatorio de estas puntuaciones nos da A2 y así sucesivamente Podemos calcular las medias Para cada uno de los subgrupos En este caso La que está señalada en rojo Es la media Del segundo nivel De A2 Y esa media será Igual Lo vemos aquí A2, que es el sumatorio de todas las puntuaciones De ese nivel Partido por el número de sujetos N2 pertenecientes a Ese nivel La media global Será la suma de todas las puntuaciones Que esté partido por el total de sujetos Que es N Y hemos dicho que es la suma De todos los sujetos Que tengamos Bien Entonces, de forma genérica Antes lo hemos visto de forma particular Para determinar subgrupos De forma genérica La media De su grupo A su Y Es la media aritmética De cada nivel Del nivel Y, de forma genérica 1, 2, 3, tantos como tengamos Y esta media aritmética Es el resultado sumar Todas las puntuaciones de cada nivel Y dividirlo por el número de sujetos De ese nivel Es decir Esa media Perteneciente al nivel Y Es igual al Producto de 1 partido por NSY Es decir, la media Esto es como si el NSY Lo quitáramos de aquí y lo pusiéramos Debajo de De ese sumatorio 1 partido por NSY NSY es el número de sujetos que hay dentro de ese nivel Y entonces ahora Multiplicado Por El sumatorio Sigma Desde el primer sujeto se ve J igual a 1 Hasta el último sujeto De ese grupo Y que sumamos dentro de cada Que sumamos en ese sumatorio Las puntuaciones individuales De IJ Y eso es lo mismo que 1 partido por NSY Que es este componente Por ASUI Que es el sumatorio De todas las puntuaciones individuales Para ese nivel concreto Ahora vemos La media total La media total es Sumamos todas las puntuaciones Y dividimos por el total de sujetos El total de sujetos es Es N Y está en el denominador De una media, por lo tanto 1 partido por N Lo multiplicamos Por el sumatorio de todas las puntuaciones ¿Y cómo representamos Simbólicamente este sumatorio De todas las puntuaciones? Pues, observen Hay dos signos sumatorio Uno para cada subíndice Para el primer subíndice Y que representa el nivel Tenemos este primer signo sumatorio Que nos indica Suma desde el primer nivel Desde igual a 1 Hasta el último y mayúscula ¿Y qué sumo? Pues todo esto Pero es que aquí hay otro sumatorio Pero este sumatorio tiene un subíndice distinto Que es J, sujeto Dentro de cada nivel Ya hemos pasado el primer sumatorio Dentro de cada nivel Súmame desde el primer sujeto Hasta el último sujeto ¿Y qué me sumas? Las puntuaciones individuales Esto es una forma Habría de decir Súmame las puntuaciones individuales Desde el primer nivel Hasta el último y dentro de cada nivel Desde el primer sujeto Hasta el último de ese nivel Es lo mismo Al final que Multiplicar 1 partido por N Por T Que era el sumatorio total De las puntuaciones Una vez que hemos visto esto Vamos a Volver al modelo Recordemos que en el modelo Teníamos 3 Consideramos que cada puntuación individual Venía dada por la suma de 3 componentes aditivos Bien Pues La teoría nos indica Que el mejor estimador De la constante mu Del modelo Viene dado por La media global La media total de los datos La media total Es una estimación insesgada De la media Poblacional mu Según nuestro modelo lineal Asimismo La media de cada nivel Ahora, la media de cada nivel Es decir Esta La media para el primer nivel, para el segundo, para el tercero etc Viene dada Es una estimación De La adición de dos componentes Mu Que es lo que hemos visto anteriormente Y el efecto que pueda tener ese nivel Sobre la variable dependiente Por consiguiente La media De cada uno de los grupos Es una estimación sesgada De la media O del efecto que pueda tener Ese nivel Del factor Sobre la variable dependiente En ese sentido se dice que está Sesgada Que la media muestral De cada uno de los niveles Si no estuviera sesgada Vendría dada solamente por Alfa subi Pero como tenemos el componente mu Significa que es una estimación Del efecto del factor Pero sesgada en ese componente mu Y por consiguiente Tenemos Las dos Fórmulas anteriores Vemos que la media global es un buen estimador De mu Mientras Que la media De cada uno de los niveles Es una estimación sesgada De mu De la suma de mu Y del efecto del factor Por consiguiente si Restamos Estos dos primeros componentes Lo vemos aquí Tenemos esta recta Mu Mas alfa subi Menos mu Estos dos componentes Como tienen el mismo signo Diferente signo pero son iguales Se elimina y nos queda Alfa subi, por consiguiente Un estimador insesgado de alfa subi Es la diferencia Entre la media Muestral De ese subgrupo Menos la media total Y todo lo que estamos diciendo Está parecido al modelo en donde Alfa subi es el efecto Del nivel i del tratamiento Y mu se refiere A la media global Cuando hablemos de la hipótesis estadística Es decir, cuando hablamos de esto Esto ya nos empieza a sonar Sabemos que aquí tenemos una hipótesis nula Y una hipótesis alternativa O sea que en el texto nos viene dado Como mu sub 1, mu sub 2 Mu sub 3, mu sub i Bien, en ese sentido Cuando hablemos de la hipótesis estadística Hablamos de mu sub i Como la media poblacional En un determinado nivel del tratamiento No lo funcionamos con la mu global De hecho, quizá hubiera sido Mejor haber representado Este mu sub i como alfa sub i Pero como está dado así en el texto Porque es la representación más usual En todos los textos de estadística Que uno pueda ver Se ha puesto como mu sub 1, mu sub 2 Mu sub i Entonces la hipótesis estadística que queremos probar Son h sub 0 Y h sub 1 y la hipótesis alternativa La hipótesis nula Lo que plantea Es que las medias poblacionales De nivel independiente son todas iguales Que la media del primer nivel Es igual a la media del segundo Es igual a la media del tercero Y así hasta llegar al último nivel Del tratamiento, mu sub i La hipótesis alternativa Postula que Al menos para un par de valores de i Hay al menos un par De niveles En las que las medias son diferentes Puede ser entre Mu sub 1 y mu sub 2 O entre mu sub 1 y mu sub 3 O entre mu sub 1 y mu sub 4 Hay al menos un par De niveles En donde existen diferencias Con que exista al menos un par H sub 0 se rechaza Esta es la hipótesis nula La hipótesis alternativa que se pone a prueba En el ANOVA ¿Y cómo realizamos este contraste? ¿Cómo ponemos a prueba Estas hipótesis? Mediante la descomposición De la variabilidad En dos componentes Aditivos Ahora Es importante recalcar Que en ANOVA Cambia la terminología En vez de variable independiente Hemos hablado de factor Por ejemplo Aquí Volvemos a cambiar la terminología Sumas de cuadrados SC Básicamente es el numerador De una varianza Esa es una suma De cuadrados La suma de cuadrados total será El numerador de la varianza Si quisiéramos calcular La varianza total De mis puntuaciones Referentes a la variabilidad independiente Y esa suma de cuadrados total El numerador Y dado por la suma De otras dos sumas de cuadrados Una Entre los grupos Y otra dentro de los grupos Inter e intra Esta es la famosa descomposición De la que hemos estado hablando Todo el tema Vamos a descomponer La variabilidad total En dos componentes Una debida solamente A la variabilidad que existe Entre los grupos Y otra debida a la variabilidad que existe dentro de los grupos Bueno Lo había explicado aquí también ¿Qué es una suma de cuadrados? SC En inglés es SS Que no son las famosas SS Alemanas Sino que significa Sumas de cuadrados La traducción directa Pero como van a ver Me gustaría que viesen Textos O software Probablemente en inglés Le van a referir A esa suma de cuadrados como SS Que son las sumas de cuadrados La suma de cuadrados es el numerador De una varianza Recuerden En el primer curso Para calcular una varianza Sumábamos Siguiendo la nomenclatura Desde J igual a 1 Hasta el último sujeto N Lo que hacíamos era Restar cada una de las puntuaciones individuales X sub J menos la media global Y lo elevamos al cuadrado Observen que esto es una suma Un sumatorio Suma De cuadrados Y lo que estamos sumando son Puntuaciones de diferencia Entonces cuando nos refiramos a sumas de cuadrados Es ese numerador del cociente Entonces SS total La suma de cuadrados total Es la suma De cada puntuación menos la media total Al cuadrado Es como si terminamos calculando El numerador de la varianza De todos los datos Sin considerar el nivel Y esto se simboliza De forma muy Económica Mediante estos sumatorios El primer sumatorio Ya hemos visto que me dice Desde el primer nivel Hasta el último Es decir, desde I igual a 1 hasta I mayúscula Si tenemos 3 niveles Y tendrá que pasar por 1, 2 y 3 Desde el primer nivel Hasta el último suma Ande esto ¿Y esto qué es? Otro sumatorio Ahora, dentro de cada nivel me dice Desde Para ese nivel en concreto Desde el primer sujeto que haya en ese nivel J igual a 1 Hasta el último sujeto que haya dentro de ese nivel Me calculas Me sumas Estas puntuaciones al cuadrado Y estas puntuaciones son Las puntuaciones individuales que habíamos visto En la matriz inicial Menos la media global Por eso se dice La suma de cuadrados total SC inter Inter, sujetos Es la suma Ponderada por NSUI De los niveles de la media De cada nivel menos la media total al cuadrado Veámoslo en SC inter Es igual a El sumatorio Desde el primer nivel hasta el último Y no tenemos más Entonces tenemos 3 Si tenemos 3 niveles tendremos 3 sumas Si tenemos 4 niveles tendremos 4 sumas, nada más ¿Y qué es lo que sumamos? Pues observemos esto Sumamos esto Son sumas de cuadrados Pero Lo que hacemos es La media de ese nivel Del nivel 1 El 2, el 3 Menos la media global Y eso Al cuadrado Y se multiplica por NSUI Que es el número sujeto que hay dentro de ese nivel Cuando veamos el ejemplo lo vamos a entender Más claramente Esta suma de cuadrados inter Nos mide La variabilidad entre los niveles La variabilidad Debida al efecto del factor A Que estamos estudiando Y por último Tenemos la suma de cuadrados intra Dentro de los niveles Observemos que Se parece mucho a la primera fórmula Que hemos visto anteriormente La suma de cuadrados total ¿En qué se diferencia? Observen esta fórmula, suma de cuadrados total Y esta otra Es casi idéntica excepto en esto Que ahora Para cada puntuación No le vamos a restar la media global Le vamos a restar La media de su grupo La media del grupo al que pertenezca Por el resto es lo mismo Lo importante es que Esta cantidad nos mide La variabilidad dentro de cada nivel La variabilidad debida al error Experimental Por lo tanto, la suma de cuadrados Intra representa las difecciones De las puntuaciones de cada sujeto Con respecto a la media de su grupo No con respecto a la media global Más adelante simbolizaremos Esta suma, la suma de cuadrados intra Como S barra A Indicando que es La variabilidad de los sujetos Dentro de cada nivel del factor A Por eso también Estos dos términos Se consideran Equivalentes, son dos formas distintas De simbolizar exactamente lo mismo Suma de cuadrados intra O suma de cuadrados Sub S barra A S de sujetos y A del factor Dentro de cada nivel del factor Ahora Si esta suma de cuadrados Hemos calculado tres sumas de cuadrados La total La inter Y la intra Las dividimos por su respectivo grado de libertad Obtendremos varianzas Si la suma de cuadrados era el número de las varianzas Si dividimos por su grado de libertad Obtendremos varianzas Son insesgadas En el sentido Cuando estudiamos ANOVA Siempre cuando se habla de varianzas Se va a suponer por defecto que estamos hablando De varianzas insesgadas Sin más Y por consiguiente La varianza Vendrá dada por la suma de cuadrados Y su grado de libertad Recordemos que los grados de libertad Son el número de puntuaciones diferentes Menos El número de restricciones Que hayamos introducido Lo veremos más adelante Con el ejemplo Que tenemos Entonces, los grados de libertad Para las sumas de cuadrados Del factor A Son I-1 Es decir, el número de niveles Y Y le restamos Un grado de libertad Pues tenemos I puntuaciones independientes Es decir, 3 puntuaciones independientes Las medias De los I grupos Son independientes Y le restamos un grado de libertad Porque tenemos que estimar la media polacional La media total Recuerden que cuando hemos calculado La suma de cuadrados inter La suma de cuadrados de A Que es lo mismo que la suma De cuadrados inter A ver si me sale Es lo mismo Esa suma de cuadrados Tenía un punto de referencia La media global La hemos tenido que estimar Y por consiguiente Restamos un grado de libertad Y por consiguiente, la media cuadrática La varianza Insesgada de A Viene dada por la suma de cuadrados de A Partido por su grado de libertad I-1 Aquí tenemos un nuevo concepto MC, media cuadrática Que viene a ser Una varianza Cambiamos de nuevo los conceptos Aquí se llama Media cuadrática MC En inglés se llama MS Vamos a ver la otra media cuadrática La media cuadrática Del error Media cuadrática de los sujetos Dentro de cada uno de sus grupos Vendrá dada por el cociente Entre la respectiva suma de cuadrados Y su grado de libertad La suma de cuadrados S Barra A Es la suma de cuadrados intra Y su grado de libertad será N, el número total De sujetos, y por tanto de puntuaciones Que tenemos en nuestros datos Menos el número de niveles que tengamos En nuestro experimento ¿Por qué? Porque cuando hemos calculado La suma de cuadrados De error, la suma de cuadrados intra Hemos cogido todas las puntuaciones Y a cada puntuación le hemos restado Su media particular La media del grupo al que pertenece Por tanto, hemos hecho tantas estimaciones Como medias, como grupos Tengamos Por eso le restamos I Al total de puntuaciones Y esto nos va a dar La varianza o la media cuadrática Error La varianza entre grupos Ahora ya tenemos dos varianzas Dos medias cuadráticas insesgadas Recuerden, no hace mucha distinción Aquí Entre sesgado o insesgado Porque siempre que nos den varianzas Van a ser insesgadas Cuando estamos hablando De ANOVA Sería muy raro que hicieran otra cosa Entonces Vamos a comparar La media cuadrática La varianza debida al factor A Con la Varianza media cuadrática Debida al error Esa comparación va a tener la forma De un cociente El cociente entre Estas dos medias cuadráticas Se distribuye según una F Una distribución que ya sabemos cual es La F Y Por término Medio Si Mi factor no tiene ningún efecto Estas dos estimaciones de la media cuadrática Serán aproximadamente Iguales y por lo tanto Su cociente será aproximadamente La unidad En cambio si mi Factor introduce variabilidad Adicional a la variabilidad debida al error El numerador Será muy superior al denominador Y en ese caso el cociente será Bastante superior A la unidad Cuanto más superior sea Más evidencia tengo De que Mi variable, mi factor Está aportando variabilidad adicional A la variabilidad de error Y por consiguiente Rechazo H0 H0 Se demuestra Que la esperanza matemática Recuerden Que la esperanza matemática Es una media poblacional Entonces esto es una media Se llama esperanza matemática Porque hace referencia A toda la población La esperanza matemática De la media cuadrática intrasujeto Intragrupo Es un estimador exigado de la varianza Poblacional De la varianza de error Entonces Mientras que la varianza central Entre los niveles Que viene estimada entre la media cuadrática Entre grupos Es un estimador sesgado De la varianza poblacional Tiene un sesgo aditivo Que está en función Del factor En la medida en que mi factor Está aportando variabilidad De alfa sui Cuanto más efecto Tenga mi factor si es que lo ejerce Sobre la pendiente Mayor será ese sesgo Es decir Lo vemos aquí En el sentido de que El valor esperado E De la media cuadrática A mi factor ahora Viene dada como la suma De dos componentes Un primer componente Que es la varianza poblacional Debida al error Y un segundo componente A eso se dice que tiene un sesgo aditivo Porque se añade Y ese sesgo aditivo Viene dado por El efecto si lo tiene de Alfa sui El efecto si lo tiene De mi factor De mi variable independiente Por consiguiente si En el numerador de una f Tenemos La media cuadrática inter Cuyo valor esperado es este Y en el denominador tenemos La media cuadrática intra Cuyo valor esperado es Sigma al cuadrado Lo vemos muy claro que Si no hay efecto Quiere decir que Este componente aditivo es cero Y por consiguiente La f Vendrá dada solamente por Un cociente entre cantidades Similares excepto Por Variables de mostreo Y en ese caso Ese cociente valdrá aproximadamente La unidad, esto siempre y cuando No haya efecto Y por consiguiente este Componente Del valor esperado De la media cuadrática Inter Sea cero Ahora bien Si este componente de la media cuadrática Inter es mayor que cero Mi factor Tiene efecto, entonces Ese cociente Será mayor Que la unidad Cuanto más se separe de la unidad Cuanto más elevado sea En relación a la unidad Más evidencia tendré De que mi Variable independiente tiene un Efecto, afecta A la variable dependiente Entonces en el caso de que la hipotesis Nula sea verdadera, es decir No existan diferencias entre la media de los tratamientos Tenemos dos estimaciones Independientes del error experimental Que podemos ver aquí abajo Las diferencias entre la media de los tratamientos Será Una estimación Del error experimental Igual que las diferencias entre los objetos Dentro de cada tratamiento Si la hipotesis nula es cierta Ambas estimaciones serán Similares Y tendríamos dos estimaciones del error experimental Su cociente Aproximadamente en la unidad Si repetiremos el experimento Un gran número de veces Asumiendo que el hecho es cierto Con nuevas muestras Extraída de la misma población En promedio este cociente valdría La unidad Si H0 fuera cierta Pero en el caso de que La hipotesis nula Sea falsa Entonces en el numerador del cociente En el numerador de la F Tendremos Una estimación del error experimental Más El efecto del tratamiento Que yo he introducido Mientras que en el numerador tendremos solamente Una estimación del error experimental En este caso La hipotesis nula es falsa El numerador será superior al denominador Y por consiguiente la F será superior A la unidad Entonces si repitiésemos el experimento Con muestras extraídas de la misma población En promedio La razón será mayor que la unidad ¿Cómo determinar si la media cuadrática La vallanza Y esta secada de vida A mi factor es o no grande Con respecto a la media cuadrática Del error El denominador a F Pues comparándola con la distribución F Se demuestra que dicho cociente El cociente entre la media cuadrática de A Y la media cuadrática Intrasujeto Se distribuye según la F Con los grados de libertad del numerador Y el denominador de las medias cuadráticas Correspondientes Y todo esto al final Para obtener una única tabla La tabla del ANOVA Aquí lo vamos a resumir todo En donde vamos a tener Un primer Una primera fila Que nos va a indicar Recordemos que Toda nuestra Discusión radica En que hay fuentes de variación En concreto tenemos Según nuestro modelo Que hay dos fuentes de variación Una debida a nuestro factor Y por tanto a las medias A la variabilidad que aporta Mi variable independiente Entre niveles Y la variabilidad que aporta Los factores daños Dentro de los niveles Tenemos dos fuentes de variación La primera fuente de variación Entre los niveles Calcularemos Su suma de cuadrados Según las fórmulas anteriores Los grados de libertad Es decir el denominador Es I-1 Tanto niveles como haya Mi diseño menos la unidad Y luego calculamos Diviendo suma de cuadrados por I-1 Calculamos la media cuadrática Debida a mi factor Entre niveles Lo mismo hacemos ahora Dentro de los niveles, calculamos la suma de cuadrados Intrasujeto Dentro de los niveles Dividimos por N-I Tanto sujeto que tengamos menos En el número de niveles Que tengamos para obtener La media cuadrática La variancia insesgada Del error Y a continuación Dividimos Esas dos componentes De variabilidad Para obtener la F La F empírica En la última fila Son simplemente los totales Que en los dos primeros casos Tanto la suma de cuadrados como Los grados de libertad Deben coincidir con la suma De sus respectivas filas Para la siguiente clase Vamos a ver todo esto Muy detenidamente Con el ejemplo 5.3 Lo vamos a ver muy claramente Nos hemos quedado en la transparencia 88 Próximo día vemos Las siguientes Por último Vamos a Eh... A ver Este es un chiste No es fácil de A mi me cuesta un poquito Entenderlo pero Viene en parte Por como se pronuncia squaw En inglés Squaw significa Mujer india o Eh... Cuadrado Entonces De ahí viene la confusión Para este chiste Habían dos squaw Dos mujeres indias Cada una de ellas tenía dos hijos Que estaban Durmiendo dentro de dos Tipis Tipis son las típicas Tiendas indias Y cada una de las dos tipis Estaban a 20 metros la una de la otra Había una tercera squaw Una tercera mujer india Que tenía tres hijos jugando fuera Entre Los dos tipis Un profesor de estadística Observó que este escenario Demuestra De forma muy clara El teorema básico de Lanova Que la The total sum of squaw Es igual a la sum of squaw Dentro Mas la sum of squaw Entre 7 igual a 4 mas 3 La confusión esta en que Eh... Sum of squaw Se puede entender como suma de cuadrados O como hijos De las indias Entonces el total de los hijos de las indias Era igual al total de hijos de indias Que estaban dentro de las tiendas Mas el total de hijos de indias Estaban entre las tiendas Entendió hijos de indias Como suma De cuadrados Es obvio que si no conoces el inglés Este chiste no lo puedes coger Eh... Por desgracia la mayor parte De los chistes tienen un fuerte componente lingüístico Por eso Un ingles no se va a reir de un chiste Español Un español no se va a reir De un chiste de un inglés Hasta el próximo día