La misma variable dependiente, pero en dos momentos temporales distintos o alguna variación, pero hay dos puntuaciones por cada sujeto y en este sentido tenemos muestras relacionadas porque ese conjunto de puntuaciones, tenemos dos muestras de puntuaciones y para cada una de las observaciones tenemos dos observaciones y por consiguiente esas dos observaciones tienen relación entre sí Si pertenecen al mismo sujeto, por ejemplo comparten todas las variables de personalidad, situacionales de inteligencia de ese sujeto por eso dice que son muestras relacionadas tenemos dos grupos de puntuaciones un único grupo de sujetos o de unidades de observación pero tenemos dos grupos de puntuaciones lo vamos a ver en los ejemplos En las muestras independientes que vimos en temas anteriores, teníamos dos grupos de sujetos por ejemplo, habíamos visto a ver si lo consigo hacer bien en un caso de temas anteriores teníamos un grupo experimental teníamos cinco sujetos en ese grupo experimental teníamos una puntuación para cada uno de esos sujetos y luego teníamos otro grupo el grupo control, por ejemplo y cada uno de esos sujetos tenía su propia puntuación en este caso tenemos dos conjuntos de puntuaciones efectivamente este conjunto y este otro conjunto que se equiparan con dos conjuntos de sujetos pero ahora cuando las muestras son dependientes la situación cambia la situación cambia porque ahora tenemos un único grupo de sujetos se me ha ido demasiado hacia la derecha la tabla tenemos este grupo de sujetos un único grupo de sujetos pero para cada sujeto, por ejemplo, para el sujeto 1 se le ha medido dos veces a una variable por ejemplo en ciertas condiciones se le puede pasar al mismo sujeto una puntuación a la otra una condición control y una condición experimental aquí lo de grupo quizá no es lo más adecuado sino condiciones si no hay interferencia entre las mismas yo le puedo pasar al mismo sujeto esas dos condiciones entonces para ese sujeto tendré dos puntuaciones lo mismo sucederá para el segundo sujeto el segundo sujeto si lo he sometido a dos condiciones tendré dos puntuaciones para él por consiguiente ahora el segundo sujeto lo de las muestras relacionales se refiere a las puntuaciones no a los sujetos porque vemos que aquí tenemos un solo grupo de sujetos no tenemos dos grupos de sujetos como pudiera dar a entender el título del tema es decir, se refiere a las puntuaciones tenemos dos muestras no de sujetos sino de puntuaciones y estas puntuaciones están relacionadas con lo que he dicho anteriormente si el segundo sujeto es bueno en tiempo de relación es rápido lo será rápido tanto en la condición experimental como en la condición de control si el experimento va sobre inteligencia sus puntuaciones serán buenas tanto en la condición de control como en la condición experimental por eso esas puntuaciones están relacionadas y por consiguiente tendremos dos muestras de puntuaciones relacionadas en esta situación a diferencia de las anteriores tenemos dos conjuntos de puntuaciones con lo cual la situación se complica un poquito para simplificar la situación para poder manejar la misma no vamos a trabajar con las puntuaciones originales con estos dos grupos de puntuaciones relacionadas no vamos a trabajar con las diferencias entre esas puntuaciones es decir las muestras relacionadas tienen una norma eventual y es que la varianza de error disminuye notablemente porque ahora los sujetos son su propio control esa es su ventaja en relación a las muestras independientes la varianza de error es más pequeña y por consiguiente la distribución muestra de las diferencias de las puntuaciones es más pequeña va a ser esa distribución va a tener una menor varianza va a estar más centrada alrededor del punto medio por lo tanto si hay menos varianza en la distribución muestral del estadístico con el que vamos a trabajar ahora que son las diferencias entre esas puntuaciones eso significa que a igual de condiciones el estadístico de contraste va a ser mayor ya sabemos que a mayor de las puntuaciones el valor del estadístico de contraste más probable será que podamos rechazar H0 que el test no sea significativo que es en definitiva lo que pretendemos cuando realizamos una investigación entonces en este caso vamos a contar dos medias una para la primera muestra de puntuaciones y otra para la segunda muestra de puntuaciones y la distribución muestral que vamos a obtener es diferente a la que se obtuvo en temas anteriores para ejemplificarlo se presenta un ejemplo que nos ayuda a comprender cuál es la distribución muestral de las medias cuando tenemos muestras relacionadas este es un ejemplo y como tal ejemplo es más que sencillo es muy sencillo y es muy fácil tiene que ser forzosamente muy simple aquí tenemos la simpleza en que tenemos solamente cuatro sujetos en la población es difícil que tengamos una población de cuatro sujetos en la realidad pero si no es imposible porque construir la distribución muestral de las diferencias sería extremadamente complicado cuando tengamos unos pocos sujetos más entonces tenemos una población de cuatro sujetos a ellos le hemos medido una teoría variable dependiente nos han dicho que no importa para el ejemplo lo que sí importa es que para cada sujeto se la hemos medido antes y después se la hemos medido eso me recuerda un chiste algo sucedió en un programa de radio de estos programas de la voz de música, música clásica un programa muy serio y se oye a la persona que estaba radiando el programa de música decir ahora entra el director de orquesta seguido por todos los músicos con su instrumento en la mano instrumento musical se entiende se entiende las puntuaciones le he medido una variable dependiente no sabemos qué variable dependiente es no importa lo importante es que le hemos medido para cada sujeto antes y después de una terapia por consiguiente son puntuaciones relacionadas tenemos dos grupos de puntuaciones y están relacionadas porque pertenecen al mismo sujeto y la terapia y es la distribución son los datos poblacionales realmente aquí no necesitaríamos hacer inferencia si tenemos los datos poblacionales pero lo necesitamos para mostrar un ejemplo estas son las puntuaciones de antes de la terapia y después de la terapia vemos que normalmente bajan de 7 baja 3 entre 6 baja 5 esta sube de 4 a 6 y de 10 baja 8 el segundo sujeto puntuación 6 y 5 el cuarto sujeto 4 y 6 y el cuarto sujeto 18 al cambiar de trasparencia powerpoint a inteca también me cambia un poquito la situación de los, elementos gráficos que he añadido curioso vale pero ahora no vamos si queremos trabajar con la distribución muestral tendríamos dos distribuciones muestrales una para las puntuaciones de antes y otra para las puntuaciones después de la terapia evitamos esto utilizando en vez de las puntuaciones antes o y después tenemos que elegir o una u otra o ambas no lo que se hace es otra cosa más sencilla se calcula la diferencia entre ese conjunto de puntuaciones la diferencia entre antes y después con lo cual al final nos quedamos con un único grupo de puntuaciones las puntuaciones diferencia entonces 7 menos 3 4 6 menos 5 1 4 menos 6 menos 2 y 10 menos 8 2 trabajamos con las puntuaciones diferenciales al trabajar en esa puntuación tenemos un único grupo de puntuaciones de diferencia en concreto la población de puntuaciones de diferencia son las que ven en pantalla menos 2 1 2 y 4 por tanto la población sobre la que vamos a trabajar ahora hemos conseguido reducirla y ya no está formada por dos conjuntos de puntuaciones relacionadas sino por un único conjunto de puntuaciones que son las diferencias entre los pares de puntuaciones relacionadas que vimos anteriormente ahora esta sería la población de diferencias población de esta población es muy fácil calcular sus estadísticos simplemente aplicamos la fórmula por ejemplo la media observemos que ponemos mu para indicar que es la media de una población de diferencia de una población y como subince de para indicar que es una media de diferencias una media población de diferencias como toda media es el sumatorio desde el primer dato desde igual a 1 hasta el último de las puntuaciones diferencias partido por el total de datos que tengamos hacemos los cálculos y conocemos la media de esa población de puntuaciones diferencia también podemos calcular su varianza ponemos de nuevo la varianza sigma al cuadrado porque es una varianza de una población y como subíndice ponemos de para indicar que es una varianza de puntuaciones diferencias la varianza se puede calcular de muchas formas es igual entonces la fórmula directa aunque matemáticamente o en términos de cálculo un poquito más complicada de ejecutar es la que ven en pantalla el sumatorio desde la primera puntuación a la última de un conjunto de diferencias al cuadrado y estas puntuaciones diferencias son la diferencia la puntuación diferencial valga la redundancia que hemos calculado anteriormente menos la media que hemos calculado previamente partido por el total de datos esta primera fórmula se puede simplificar mediante la que ven en pantalla en la que es el sumatorio de las diferencias individuales al cuadrado es decir de esas diferencias al cuadrado las elevamos al cuadrado y las sumamos partido por n y a ese cociente se le resta la media que hemos calculado previamente al cuadrado utilicemos lo que utilicemos tiene que salir lo mismo en este primer caso hemos visto que hemos utilizado la fórmula simplificada la fórmula en donde ponemos la suma como pueden ver en pantalla de cuatro puntuaciones todas las puntuaciones diferencias todas ellas elevadas al cuadrado partido por cuatro y todo ello a todo ello se le resta el cuadrado de la media que hemos calculado anteriormente y esto da 4.68 4.69 si queremos con lo cual ya tenemos los parámetros poblacionales mu y sigma de la población de diferencias con las que estamos mostrando el ejemplificando la construcción de una distribución muestra de diferencias esta es la población la población de diferencias si conocemos sus parámetros mu y sigma ahora vamos a suponer que suponernos vamos a calcular a extraer muestras de esa población las muestras obviamente estarán formadas por muestras de un determinado tamaño como tenemos que el tamaño de la población es muy pequeño tampoco podemos irnos muy allá en las muestras entonces vamos a elegir un tamaño que va a ser n igual a 2 de las muestras que extraigamos de esta población para hacer el ejemplo tratable y para cada una de las muestras calcularemos la media de las puntuaciones de diferencia las medias de todas las muestras que podamos extraer de esa población muestra de n igual a 2 formará la distribución muestral de las diferencias vamos a hacerlo en primer lugar como hemos dicho anteriormente elegimos el tamaño de la muestra en este caso n igual a 2 entonces vamos a elegir como ejemplo está bien por consiguiente como tenemos solamente dos tamaños 2 muestras de tamaño 2 ponemos en la parte superior de la pantalla el posible dato poblacional que podamos extraer con la primera extracción y aquí ponemos el posible dato muestral que podamos obtener en la segunda en el segundo elemento que muestremos es decir esto sería para la posibilidad que tenemos para el primer elemento muestral y este para el segundo elemento muestral entonces cada una de las cuadrículas que vemos en pantalla nos dará una posible muestra de la que podamos obtener 4 por 4 16 representará una posible muestra de tamaño 2 extraída de la población anterior entonces si obtuviéramos en un muestreo con reposición en la primera extracción menos 2 y en la segunda extracción menos 2 otra vez esto es posible porque es con reposición tendríamos esta muestra menos 2 su media menos 2 ese será el primer elemento de la distribución muestral del estadístico media si hacemos una segunda muestra supongamos que entonces en la primera extracción obtenemos el elemento con valor 1 y en el segundo elemento tenemos un elemento con valor menos 2 la muestra en este caso estará formada por las puntuaciones 2 y 1 su media menos 0,5 en la tercera extracción podemos obtener que el primer elemento valga 2 y el segundo menos 2 entonces la muestra transformada por los elementos menos 2 2 y su media será 0 y así seguimos con todas las posibles combinaciones de elementos poblacionales que puedan formar parte de nuestra muestra estas serían todas las muestras posibles que podríamos obtener de la población anterior y en cada una de ellas observen que hemos calculado su media y por consiguiente tenemos todas las medias posibles de tamaño que podemos obtener con muestras de tamaño n igual a 2 y podemos entonces obtener los parámetros de medias es decir la distribución estas son todas las medias de muestras de tamaño n igual a 2 obtenidas de la población anterior por consiguiente la distribución muestra del estadístico media en muestra de tamaño 2 para las diferencias las puntuaciones de diferencia de los 4 elementos más que hemos visto inicialmente transformada por estos valores 16 valores si ahora de esos 16 valores calculamos su media y su varianza será la media y la varianza de la distribución muestral del estadístico media para n igual a 2 entonces eso la distribución muestra es un parámetro porque hemos obtenido un estadístico con toda la población de medias posible por eso hemos puesto mu cuando hablamos de la distribución muestral de un estadístico estamos hablando de una población y como subíndice indicamos que se refiere a distribución de diferencia de medias que eran las puntuaciones originales que teníamos las cuatro puntuaciones originales entonces la media de la distribución muestral de las diferencias para n igual a 2 se calcula como cualquier otra otra media sumatorio de las puntuaciones que tengamos en este caso de estas puntuaciones partido por n no he podido desarrollar el sumatorio completo y he dejado puntos ofensivos menos 2 más menos 0.5 más 0 más 1 más estos puntos ofensivos representan todos los datos que yo no he podido incluir aquí y se finaliza con los últimos para indicar que llego al final dividido por 16 esto me da una media de 1.25 observamos que esta media de las medias del estadístico media de todas las muestras posibles de tamaño n igual a 2 de las puntuaciones diferencias coincide con la media poblacional de las diferencias cosa que ya no nos resulta extraña o sorprendente de la misma forma calculamos para esta población de medias obtenidas de muestras n igual a 2 de la población anterior la varianza de nuevo ponemos varianza en letras griegas para indicar que hace referencia a una población una población de un estadístico y en el subíndice hacemos referencia a que las puntuaciones de las que se ha obtenido estas medias son puntuaciones diferencias aplicamos la fórmula rápida que vimos anteriormente es decir el sumatorio de las puntuaciones de las que estamos tratando al cuadrado es decir menos 2 al cuadrado más menos 0.5 al cuadrado hasta llegar al final partido por n sería este cociente 62.5 partido por 16 menos la media de las diferencias al cuadrado esto nos da una varianza de la distribución mostral del estadístico medial igual a 2.34 y esto es lo que hemos comentado anteriormente observamos que la media de la distribución mostral de las puntuaciones diferencias coincide con la media inicial la media poblacional de esas puntuaciones 1.25 mientras que la varianza de la distribución muestral de las puntuaciones diferencias con n igual a 2 coincide con el cociente entre la varianza de la distribución poblacional que si la conocemos en este caso porque la hemos calculado anteriormente partido por n el tamaño muestral en este caso era 2 hemos trabajado con muestras igual a 2 y nos da exactamente lo mismo que hemos visto previamente 4.68 partido por 2 2.34 es decir que la distribución muestral del estadístico media para muestras de tamaño n igual a 2 de las puntuaciones diferencias poblacionales tiene una varianza menor que la varianza de la distribución poblacional y cuanto más fuese n al estar dividiendo en esta ecuación la distribución sería mucho más centrada alrededor del punto 1.25 aquí vemos todo lo que hemos hecho de forma general teníamos una población de puntuaciones diferencias recuerden que estas puntuaciones se extrajeron a partir de un experimento en el que utilizamos cuatro elementos muestrales y de esos cuatro elementos muestrales teníamos dos un par de puntuaciones para cada uno de ellos este caso antes y después de una alteración por consiguiente estas puntuaciones estaban relacionadas y en vez de trabajar con estas puntuaciones relacionadas trabajamos con sus diferencias y estas puntuaciones diferencias son la población con la que vamos a establecer el ejemplo de la distribución muestral esta población de puntuaciones diferencias tiene sus parámetros los parámetros más importantes de la misma eran su varianza 4.69 y su media ahora si de esta población extraemos muestras de tamaño n igual a 2 podríamos obtener 16 muestras distintas si en cada muestra en cada una de estas 16 muestras calculamos el estadístico media tendríamos una distribución de valores para el estadístico media en las 16 muestras posibles estas muestras su distribución se conoce como la distribución muestral del estadístico media para n igual a 2 y hemos comprobado que la media coincide con la original de la población mientras que su varianza es la varianza original partido por n el tamaño de cada muestra entonces una vez visto el ejemplo podemos apreciar como el contraste de hipótesis sobre dos medias relacionadas es muy parecido al que tenemos con una sola media cuando tenemos una sola media inicialmente no nos planteamos ningún problema porque tenemos un único grupo de puntuaciones pero aquí sí porque inicialmente no tenemos un único grupo de puntuaciones inicialmente tenemos dos grupos de puntuaciones pero lo hemos transformado en un único grupo de puntuaciones al establecer su diferencia y es con ese grupo de puntuaciones con el que trabajamos es decir ahora partimos de dos muestras pero no muestras de sujetos no muestras de puntuaciones relacionadas esas puntuaciones al estar relacionadas en último lugar al trabajar con esa diferencia trabajamos con una única variable que son las diferencias entre cada par de puntuaciones por eso se habla de puntuaciones en el caso de las muestras relacionadas trabajamos con puntuaciones relacionadas y la semejanza entre los estadísticos va a ser también muy clara cuando tenemos una única media el estadístico z por ejemplo era el cociente entre en el numerador una diferencia entre la media de la muestra menos la media postulada en la hipótesis nula todo ello partido por la derivación científica de la distribución muestral de las medias y era igual a la raíz cuadrada del cociente entre la varianza poblacional partido por n sabemos que aquí pasa lo mismo lo que pasa es que ahora no tenemos puntuaciones directas sino que ahora nuestras producciones son puntuaciones diferencia y por eso se le da otro término la b pero es una media la media de las diferencias menos la media planteada en la hipótesis nula media de diferencias que postulamos la hipótesis nula veremos ahora que el la analogía es similar de forma intuitiva básicamente que a diferencia de los casos anteriores ahora trabajamos con una población de diferencia porque tenemos muestras relacionadas muestras de puntuaciones relacionadas ahora vamos a ver dos casos vamos a ver el cálculo de contraste como siempre para ver si aceptamos o rechazamos H sub 0 la hipótesis nula y los dos casos van a ser los que estamos viendo de forma continua cuando conocemos la variación poblacional o cuando no la conocemos y lo vemos todo con un ejemplo el ejemplo 4.1 lo vemos con un ejemplo usualmente en los libros de texto primero te presentan la teoría del contraste, hipótesis nula supuestos, estadístico decisión, interpretación luego te ponen un ejemplo aquí vamos desarrollando la teoría con el ejemplo un psicólogo escolar está interesado en estudiar si la presión de los padres por el rendimiento escolar es igual en chicos que en chicas ayer cuando estuve preparando las transparencias estuve leyendo una noticia en un periódico creo que fue El País en el que me sorprendió en la última página el caso de una profesora universitaria americana norteamericana de origen asiático ya sabemos y quien no lo sepa lo comentamos no sé si habrán hecho estudios científicos sobre ello es decir, rigurosos pero la intuición entre todos los profesores de secundaria es que los estudiantes asiáticos trinden mucho más tiempo para estudiar que los europeos es decir, que los nuestros ¿por qué? yo pensé que era quizá por el lenguaje los asiáticos tienen un lenguaje pictográfico y esto les facilita por ejemplo mucho la resolución el trabajo con las matemáticas parece ser que no esta mujer postulaba que esa no era la explicación sino que la explicación es que culturalmente los asiáticos, en concreto los chinos no sé si se extenderá a otros países a otros países de Asia asumo que sí los padres asiáticos en concreto las madres asiáticas exigen mucho a los niños y a las niñas y utilizan el castigo además en términos que aquí en la sociedad occidental y por supuesto americana casi podría ser considerado delito es decir, según decía esta mujer y lo decía también en el libro defendía a toda costa le llamaban creo la madre tigre defendía a toda costa el uso de castigos humillaciones todo tipo de lo que los psicólogos llamamos que es castigo negativo, no positivo esta chica por ejemplo esta profesora decía que no admitía que su hija trajera de clase notas inferiores al 10 y que si las traía se estaba con ella el tiempo que fuese trabajando el temario o haciendo que ella trabajara el temario sin dejarla siquiera ir al servicio hasta que todo terminara y consiguiese puntuaciones las que ella consideraba apropiadas según parece había tenido algún conflicto con su marido de origen judío porque su marido consideraba que este tratamiento de los chicos no era apropiado la sociedad americana está discutiendo este tipo de cuestiones nosotros como psicólogos lo que tenemos que plantear es hay muchas cuestiones hay planteadas en concreto según parece el rendimiento es clarísimamente muy bueno en esas condiciones supongo que si a un occidental le sometiera a esas condiciones lo haría igual ellos están dispuestos a pagar el precio según parece las hijas de esta profesora cuando se han hecho mayores según parece han alabado la conducta de su madre cuando eran pequeñas y las obligaba de forma exagerada al estudio, al trabajo no les dejaba ver televisión por ejemplo no les dejaba salir con sus amigas tenían que trabajar tenían que rendir al 101% decía el artículo como psicólogo lo único que me interesa es los aspectos positivos y negativos del testigo el tipo de educación es obvio que ese tipo de educación está consiguiendo rendimientos excelentes el precio que se pague es otra cosa y los efectos emocionales que pueda tener si los quiere aceptar esa familia libres son pero es curioso me resultó muy interesante ese artículo ustedes juzguen lo que quieran pero yo no puedo juzgar solamente pediría a los psicólogos educativos que investigaran si no lo han hecho ese tema que seguro que lo han hecho pero investigación no ideología viendo de aquí me estoy yendo de tema sigamos ejemplo 4.1 me lo ha recordado el ejemplo la presión de los padres en este caso me lo ha recordado porque la presión de esta mujer era con sensibilidad desde el punto de vista oriental excesiva para mejorar para que el rendimiento escolar de chicos pero aquí en concreto el ejemplo propone que si esa presión es igual para chicos y para chicas toman una muestra aleatoria de 36 parejas de hermanos chico y chica observen ahora que la unidad de observación es la pareja no son sujetos distintos pero a ser hermanos quiere decir que comparten al menos el ambiente familiar y por consiguiente las puntuaciones que sostenga van a estar relacionadas entonces a diferencia del ejemplo que hemos visto en el primer caso no es necesario que las dos mediciones hagan referencia al mismo sujeto sino que la unidad de observación sea el sujeto o sean parejas de algún tipo nos permita asumir que hay relación entre esas parejas ese par de puntuaciones aquí está claro porque los hermanos comparten algo comparten un ambiente educativo una situación económica un conjunto de patrones educativos etc. mediante un test se les se les evalúa mediante un test la variable presión para el rendimiento escolar y nos dicen que SETES y esas puntuaciones se miden en una escala de intervalo intervalo entonces nos dan la media para los chicos que le llaman grupo 1 da igual fue 21 en la variable presión y para el grupo de chicas fue 19 significa esto que las chicas tienen menos presión que los chicos que nos diferencian nada más simplemente los estadísticos descriptivos nos dicen que sí pero hay que utilizar la inferencia porque esa diferencia de dos puntos puede no ser significativa puede ser simplemente debida al azar entonces hay que utilizar la característica inferencial suponemos que conocemos la varianza de las diferencias de las puntuaciones y que esta varianza de las diferencias de las puntuaciones vale 64 no nos dan las puntuaciones de chicos y de chicas por un lado para que nosotros podamos calcular las diferencias no, nos dan directamente la varianza de las puntuaciones de diferencia a continuación nos dan el nivel de confianza 99% la pregunta ¿es igual la presión para el rendimiento escolar en chicos y en chicas? bien ponemos todos los datos que nos han dado en el esquema clásico la variable x la variable que se está midiendo podemos llamarla la variable y pero da igual es nivel de presión para hacerlo bien a nivel escolar hay familias que no presionan para los niños y otras que les exigen mucho en ese rango esta variable medida mediante un test determinado nos mide ese nivel de presión y nos dicen que es la variable x esta medida a nivel de intervalo además nos han dado también que la variada poblacional de las diferencias sigma al cuadrado sub d para indicar que la diferencia vale 64 ahora esto es con referente a la población a continuación vemos lo que sucede en la muestra en la muestra tenemos 36 pares de puntuaciones no lo he puesto el 36 ni aquí para indicar que son 36 pares de puntuaciones que pertenecen son puntuaciones dependientes y que nos han dado la media para el primer grupo de chicos 21 le hemos puesto como subíndice 1 la podemos haber puesto también chicos o u o es decir simplemente el subíndice nos indica el grupo entonces lo que mejor nos indique posteriormente no nos confunda posteriormente yo le he puesto para hermanos la o y para hermanas la a como subíndice porque eso me evitaría posteriormente cometer algún error de desplicación para las hermanas nos dicen que la media en esas 36 pares de puntuaciones vale 19 y en las hermanas el código se va a utilizar va a ser 2 esto es referente a los datos muestrales por consiguiente tenemos que trabajar con la distribución para establecer la inferencia tenemos que trabajar con la distribución muestra de las puntuaciones diferencia que ya hemos visto como era entonces las muestras de chicos y chicas estas son las condiciones y los supuestos están relacionadas ya que están compuestas por parejas de hermanos y hemos dicho que podemos asumir con cierto grado de verosímil de forma intuitiva podemos asumir que chicos y chicas al tener un mismo ambiente familiar esas puntuaciones van a ser van a estar relacionadas es decir si un padre y una madre por término medio exigen mucho a un chico también le exigirán bastante a una chica a lo mejor menos o quizá más no lo sabemos pero irán a la par por término medio recuerden estamos en estadística todo el mundo ahora puede saltar diciendo que yo conozco a una familia que al chico le exigen mucho y a la chica no trabajemos con anécdotas trabajamos con poblaciones conocemos la varianza de las diferencias en la población estos son los supuestos las condiciones la variable dependiente es también un nivel de intervalo y no sabemos nos han dicho si la población de diferencia se distribuye normalmente pero la muestra supera las 30 observaciones tenemos 36 pares de observaciones por consigue se cumplen los supuestos para aplicar esta prueba concretos los supuestos son que la variable dependiente se haya medido a un nivel de medida de intervalo o de razón se cumple la población de las diferencias se debe distribuir normalmente no sabemos si se cumple este caso o n es mayor igual que 30 este caso sí se cumple y como el signo lógico que está uniendo estas dos condiciones es la O significa o una cosa o la otra o ambas en cualquiera de los dos casos se cumple ese supuesto y luego tenemos la variante poblacional de las diferencias la conocemos por consiguiente se cumplen las condiciones y los supuestos hipótesis inicialmente no hemos observado en el enunciado que nos digan nada en absoluto acerca de si conocemos si tenemos alguna indicación de que a un grupo chicos por ejemplo les presionen más que a las chicas o a la inversa no tenemos ninguna en el enunciado ninguna referencia acerca de que la hipótesis vaya en un sentido o en otro por consiguiente debemos utilizar una hipótesis que admite que la realidad sea en un sentido o en el otro que a las chicas les presionen más o que a los chicos les presionen más no tenemos ninguna indicación para suponer un determinado sentido del contraste por consiguiente bilateral al ser bilateral quiere decir que la hipótesis alternativa propondrá que la diferencia entre las medias de la primera población y la segunda entre chicos y chicas será distinta de cero puede ser superior a cero o inferior a cero no lo sabemos y por consiguiente la hipótesis nula es justamente la inversa que no existen diferencias algunas entre unos y otros por tanto las medias la diferencia de medias será cero esto se puede expresar así o se puede expresar de esta otra forma es lo mismo simplemente nos cogemos el busultor lo pasamos aquí sumando y ya tenemos la misma eh sistema de hipótesis nula y alternativa pero expresado de una forma ligeramente distinta pero significa que el sistema de hipótesis nula es igual a cero la diferencia cero en el numerador tenemos la diferencia de dos puntuaciones la diferencia de medias entre los dos grupos menos la media de las diferencias planteado por la esto es lo que eh no esto representa lo empírico lo que hemos observado en la muestra y este valor representa lo que asumimos en la hipótesis nula cuanto más diferencias existen entre lo que hemos observado y lo planteamos más probable es que z sea significativo que lo que planteamos en la hipótesis nula no sea correcto entonces esto es el numerador representa la discrepancia entre lo que observamos y lo que planteamos en h sub cero y lo tenemos que estandarizar por la eh una tenemos que estandarizar esa diferencia como simplemente una diferencia como tal no nos indica nada sino la ponemos en su escala y esa escala nos viene dada por la derivación típica de la distribución muestral de las diferencias que es raíz cuadrada del cociente entre la varianza poblacional de las diferencias partido por n este n debería haberlo puesto mayúscula pero bueno no hay confusión es igual este denominador es la derivación típica de la distribución muestral de eh estadístico media para las diferencias poblacionales aquí tenemos los cálculos los superpuestos sobre la situación anterior sobre todos los datos que teníamos anteriormente tenemos la diferencia de medias veintiuno para los chicos menos diecinueve esto es d la diferencia eh de medias menos en la medida de las diferencias la media poblacional planteada por la hipotesimula que hemos plantado en la hipotesimula que vale cero o sea es como si no lo hubiéramos puesto realmente pero queda mejor eh poniéndolo dividido por la varia eh la red cuadrada de la varianza poblacional que sabemos cuánto vale sesenta y cuatro y tenemos que n vale treinta y seis z en consiguiente vale uno punto cinco lo que cero cinco y por debajo de menos uno punto cinco y ese es el p crítico es decir la que queda por encima de uno punto cinco y por debajo de menos uno punto cinco 668. Esto es solamente una de las áreas en rosa que hemos puesto en la gráfica. Si la buscamos en las tablas, buscamos la Z de 1.5, 0, y la intersección es 0.993 aproximadamente. Como este es el área que queda por debajo de la curva, y lo que estamos buscando es el área que queda por encima, haremos en total 1 menos ese valor, menos 0.933, y nos sale 0.0668, que es ese área. Ahora tendremos que multiplicarla por 2 para considerar también esta parte del área. Y nos da la suma de estas dos áreas en rosa, el valor pre-crítico para una puntuación de 1.5 en un contraste bilateral. Vemos que ese 1.13 es, a 1.14 si aproximamos, no, si aproximamos 1.13 sigue siendo 1.13, es una probabilidad, y es una probabilidad superior a 0.05, que es normalmente el valor alfa que utilizamos como criterio. Por consiguiente ya sabemos que no vamos a rechazar H0. Y menos 0.05, que es la probabilidad superior a un nivel de confianza del 99%. A un nivel de confianza del 99% tenemos que alfa es 0.01. Y además, si es bilateral, tenemos que dividir ese valor por 2, 0.05 de alfa. Tendríamos que encontrar una probabilidad para la zeta que hallemos en el estudio, una probabilidad menor que 0.005, para encontrar el significativo del resultado. Entonces, al nivel de confianza del 99%, los valores críticos que delimitan la zona en la que podríamos mantener H0 estaría entre más o menos 2.58, cosa que no sucede en el ejemplo que estamos poniendo. Este más o menos 2.58 lo encontraríamos yéndonos a la tabla, y vemos que el 0.005 es igual a 0.05. la que podríamos mantener H0 estarían entre más o menos 2.58, cosa que no sucede en el estudio. Entonces, al nivel de confianza del 99%, los valores críticos que delimitan la zona en la que podríamos mantener H0 estarían entre más o menos 2.58, cosa que no de H sub 0 algún tipo de aceptación de H sub 1 cosa que no es cierta mientras que los resultados empíricos los vemos en la misma gráfica pero aquí abajo tenemos más o menos 1.5 que quedaría justamente aquí, en este gráfico obviamente no podemos rechazar H sub 0 en esta gráfica es como si juntáramos las dos anteriores aquí tenemos el valor de Z que hemos encontrado empíricamente que está en la región de aceptación a un nivel de confianza del 95% conclusión a un nivel de confianza del 99% no existen diferencias significativas entre la media de chicos y de chicas puesto que el estadístico en traste se encuentra comprendido en el intervalo que define los valores críticos por lo que mantenemos la hipótesis nula y el resultado es que no existen diferencias en cuanto a la presión para terminar el entrenamiento escolar entre chicos y chicas obviamente este resultado habría que darle apellidos en el sentido de si fuera cierto de indicar en qué región en que comunidad autónoma se ha conseguido y en qué fecha se ha conseguido cuando yo era niño por ejemplo este resultado no hubiera sido el mismo por razones obvias en aquel momento se pensaba mucho más a los chicos creo que a las chicas porque las expectativas eran otras por último el intervalo de confianza siempre el intervalo de confianza es ya lo hemos dicho muchas veces el estadístico más menos el producto entre dos factores el estadístico que utilizamos para el contraste y la distribución muestral de ese estadístico hemos utilizado una zeta pues aquí lo tenemos y la distribución muestral del estadístico es decir si conocemos el estadístico y el contraste es relativamente sencillo construir el intervalo de confianza porque nos cogemos siempre el estadístico que hemos obtenido en nuestra muestra que es la diferencia de medias más menos el estadístico que estamos utilizando en este caso una zeta utilizando el alfa requerido multiplicado por el denominador de estadístico y contraste que hemos utilizado siempre tiene esta forma el producto de estos dos factores se llama también el error máximo entonces en este caso aquí tenemos de nuevo la fórmula tenemos que la diferencia de las medias era 21 menos 19 dos puntos más menos el producto entre estos dos factores 2.58 que era la zeta a nivel crítico al alfa estipulado nos salía 2.58 lo habíamos visto en la gráfica por la red cuadrada de la zeta de la varianza poblacional partido por el n y esto nos da si hacemos los cálculos 5.44 y menos 1.44 son las limitas superior e inferior con respecto a la diferencia de medias que es 2 si lo graficamos vemos tendríamos en el eje de 2.44 ordenadas el y las puntuaciones de la variable dependiente que le hemos dado x 5.44 sería el valor límite superior menos 1.44 sería el límite inferior y en el centro estaría la diferencia de medias que hemos obtenido en nuestra muestra 2 observamos que ese intervalo de confianza es el intervalo de confianza en el punto cero con lo cual a un nivel de confianza del 99% no podemos rechazar la hipótesis de que la diferencia de medias sea cero es por eso por lo que muchas veces se dice que los intervalos de confianza son equivalentes a un contraste de hipótesis no siempre pero en la mayor parte de los casos sí ¿por qué? pues porque aquí si el intervalo de confianza incluye el valor cero no podemos rechazar al 99% que 0 no sea el verdadero valor polacional de la diferencia de medias si este intervalo de confianza fuese de este tipo no incluiría al cero y por tanto sería equivalente a en el contraste de hipótesis nula rechazar h sub cero porque no incluiría ese valor dejamos el siguiente caso que es comparación anterior pero no conocemos la apariencia por la final de las diferencias lo dejamos para el siguiente caso estamos en la apariencia 49 casi la 50 le voy a comentar como les he comentado algunos chistes durante la clase simplemente esto es una anécdota el otro día estaba leyendo un texto de física concreto del experimento de Rutherford Rutherford si lo decimos en inglés y Rutherford si lo decimos me sorprendió lo que decía el texto es un texto de física conceptual muy bonito está muy bien que decía que en el experimento de Rutherford en el que se empezó a investigar la estructura del átomo había mucho más investigadores implicados en este experimento más investigadores que Rutherford había mucho más sin embargo simplemente se cita a Rutherford ¿por qué? porque es una práctica muy habitual muy ampliamente extendida de plantear a un único científico como si fuese el único investigador de un determinado trabajo que se publica en Nature o en cualquier otra revista de prestigio eso no es cierto ese investigador actualmente es la cabeza de un equipo que puede estar formado por un equipo por decenas de investigadores es la cabeza ya a principios de siglos cuando Rutherford empezó a bombardear una lámina de oro finísima con partículas subatómicas él era la cabeza de un equipo y se atribuye el estudio pero no solamente fue él es decir raramente sucede que en una sola persona se haya la responsable de un de un resultado y esto más que niega oculta la implicación de los otros investigadores pero es una práctica habitual siempre recuerdo que Julio y Skinner dos famosos conductistas alguien decía que había habían puesto habían tratado las páginas de los journal que escribían de una de una especie de tinta marrón del sudor de sus becarios y pero nadie oye hablar de sus becarios todo el mundo oye hablar de Jul y de Skinner sucede lo mismo y luego dice en este texto hay terreno para decir que hay dos cosas más importantes para la gente que es eso y el sexo el dinero que reconocimiento y apreciación es curioso pero es cierto el otro día en una comida un una profesora universitaria decía que en relación con otros profesionales de nuestro mismo estatus ganamos muy poco bueno eso es la queja general obviamente hay otras personas mucho peores que nosotros no voy a implicar en términos absolutos no no es cierto en términos relativos si lo es pero eso no lo importa lo importante es que lo que añadió en términos relativos cuando nos comparamos con otras personas de nuestro nivel ganamos poco lo único que nos queda dijo es el reconocimiento de nuestros compañeros y es cierto el profesor universitario vive en un mundo de sus compañeros ya sean profesores de otras universidades o del extranjero porque obtiene de ellos si puede si lo tiene la suma de inteligencia prácticamente y solo reconocimiento y apreciación he visto a muchos profesores luchar por no por el sexo y el dinero sino por el reconocimiento y la apreciación luchar en el sentido de quedarse muchísimo más quedarse sábados domingos fiestas de guardar etcétera trabajando en sus artículos que en definitiva es lo único que se nos valora tanto por el ministerio como fuera del ministerio