Vale, pues nada, ya está grabando. Bueno, lo que estaba diciendo, que en vez de seis sesiones, este año ha cuadrado que hay siete. Entonces nos hemos ganado una y entonces este tema que lo tenía un poco más corto para hacer dos temas, pues he puesto más ejemplos. Y supongo que esta clase la dedicaremos solo a contraste de hipótesis y las clases que quedan, pues yo creo que ya nos dará tiempo a ver el resto de temas. Bueno, el tema este de contraste de hipótesis es bastante importante saberlo hacer bien porque suele caer bastante en los exámenes y además los temas posteriores que veremos, en casi todos hay que hacer un contraste de hipótesis. Entonces entender bien cómo funciona esto, pues es importante. Muy bien, pues si no hay ninguna pregunta ni nada, pues empezamos ya con esto. No sé cómo lleváis la PEC, pero habría que ir haciéndola y si tenéis alguna duda, pues me podéis preguntar. Bien, pero bueno, aún hay tiempo para entregarla. Hasta enero se puede entregar, creo que hasta el 15 o una cosa así. Bueno, pues vamos a repasar la introducción que vimos el otro día y así nos centramos más, aunque ya lo expliqué en los últimos cinco minutos, fue muy rápido y así lo explicamos con más calma. Después veremos cómo hacer contraste de hipótesis y finalmente, pues veremos ejemplos. Bastantes ejemplos. Bueno, primero, los test de hipótesis se utilizan para tomar decisiones acerca de características poblacionales. Una hipótesis estadística es cualquier afirmación, ya sea verdadera o falsa, realizada sobre alguna característica desconocida de la población. Dicha hipótesis puede referirse a un valor de parámetro desconocido, se llama contraste paramétrico, por ejemplo, pues la media o la varianza. O la forma de la función de cuantía o de densidad de la población. Esto sería un contraste no paramétrico y esto lo estudiaremos en temas posteriores, no en este tema. Y en este siempre supondremos que la función de cuantía o de densidad es conocida. Esto el ejercicio ya nos lo dirá. Vale, pues para eso hay que seguir varios pasos. El primer paso, pues uno lee el problema y tiene que formular la hipótesis nula y la hipótesis alternativa. ¿Vale? Tiene que ser mutuamente excluyentes y complementarias. Hay de varios tipos. Uno, la primera sería, la nula es que un parámetro es igual a un número, un número fijo. Y la alternativa es que ese parámetro no es igual a ese número. La segunda sería que el valor de parámetro es mayor o igual que un número. Y la alternativa es que es menor. Otra opción. Que el parámetro es menor o igual que un número. Y la alternativa es que es mayor. Y por último, que este no se autoriza, no creo que salga en el examen. Siempre sale en uno de estos tres. Pues sería que el valor del parámetro está acotado entre dos valores y, o sea, que está entre estos dos valores. En ese intervalo, en el intervalo... cita 1 y cita 2 y la alternativa sería que no, que es menor que este primer valor y mayor que este primer valor o mayor que este primer valor. Ese sería el paso 1. Primero formular cómo es el problema. El paso 2. Hay que determinar el estadístico apropiado para realizar el test. Los más típicos son estos tres que paso aquí a decir, pero hay muchos más. Ahora después veremos ejemplos. Todos están aquí, no hay que aprender nada de memoria porque en el formulario este se deja en el examen. Acordaros que no valen fotocopias, hay que traer el librito original y tampoco puede tener anotaciones. Aquí están todas las opciones. Todas las que pueden salir en el examen están aquí y uno no tiene que aprender fórmulas ni nada. Simplemente ser hábil y saber dónde buscar. Haber hecho ejercicios antes. Y no dejarlo para el día del examen, si no haber probado varios ejercicios antes. Bueno, si lo que contrastamos es la media y la población es normal con la desviación típica conocida, entonces estaríamos en este caso. La zeta x menos mu cero partido sigma partido al raíz de n seguiría una normal 0,1. Ahora después cuando veamos el ejemplo os diré cómo hacer esto, cómo encontrar cuál es. Si contrastamos una media y la población también es normal, pero ahora la desviación típica es desconocida, es decir, el ejercicio no nos lo da. Pues ahora sería la misma expresión esta de aquí, pero ahora no sería una normal, sino que sería una ed student con n menos un grados de libertad. ¿Cuál es la n esa? Es el tamaño de la muestra. Si nos dan una muestra de tamaño 10, sería una t de student n, de orden n, con n grados de libertad. A ver, si es de 10, sería con 9 grados de libertad. Si la muestra es de tamaño 5, sería con 4 grados de libertad, 1 menos. Después, si la n fuese mayor o igual que 30, es decir, una muestra muy grande, sí que podríamos utilizar que esto sea una normal 0,1. Pero eso solo sería para muestras grandes, para n mayor o igual que 30. Si contrastamos una proporción y n es grande, pues entonces utilizaríamos esta expresión de aquí. Esto de aquí sería una normal 0,1. Vale, ahora vamos al paso 3. Bueno, estas de antes son, digamos, como las más sencillas. Pero si os fijáis aquí en la venda, hay un montón de casos más. Ahora después en los ejemplos veremos más casos. Bien, tercer paso. Seleccionar el nivel de significación, que sería alfa. Esto lo establece el problema y es la probabilidad de rechazar la hipótesis nula cuando es cierta. Ahora después veremos esto qué significa. Normalmente siempre se toma como nivel de significación 0,1, 0,05 o 0,01. Vale, serían los típicos tres niveles de significación, no solo para cosas académicas, sino para un test de hipótesis que se utiliza pues por ejemplo para probar un nuevo medicamento. Si uno mira los resultados, igual que lo que, por ejemplo, cuando se estudió la vacuna para el COVID y ese tipo de vacunas, pues uno siempre verá que el nivel de significación que se toma o es 0,1, 0,05 o 0,01. Son los más típicos. Eso no quita que puedas tomar 0,06, pero típicamente se toman estos. Entonces, hay que intentar hacer problemas con los tres tipos de niveles de significación porque después hay siempre cosas parecidas que aparecen, o sea, que nos surgen al tomar estos tres niveles de significación. Igual que hacíamos con los intervalos, cuando sacamos el intervalo de confianza, que ya sabíamos la alfa que era 1,6 no sé qué o 1,9 no sé qué, pues si uno tiene práctica en eso, en el examen se equivoca menos. Porque ya le suena y dice, pues voy bien encaminado. Es una recomendación. Bueno, paso 4. Esta sería como la parte más importante, que sería determinar la región crítica o de rechazo de la hipótesis nula. Esta región crítica depende del nivel de significación, la distribución muestral del estadístico y del tipo de contraste. Entonces, el primero sería... El de la igualdad, ¿vale? Que sería este de aquí. Cuando el parámetro es igual a otro parámetro, es igual a otro número y la hipótesis alternativa cuando es distinto. Bueno, pues en este caso saldría... Saldría este dibujito de aquí. Voy a ver un poco, que me estoy ahí atragantando. ya está tenía otra clase antes bien vale, pues entonces para este de aquí sería cuando el parámetro es igual a un número y la hipótesis alternativa es cuando es distinto a ese número vale, lo que tendría que hacer es cojo la por ejemplo, imaginemos que nos dicen que la distribución sea una distribución normal lo que tendría que hacer es en función de esta alfa pues yo según la alfa que me dicen yo encontraré alfa medios un área de alfa medios aquí y un área de alfa medios aquí y aquí en medio quedaría un área de uno menos alfa entonces esa sería la que está activada aquí resaltada la que no está blanca esa sería la región de rechazo de la hipótesis nula y esta que está en blanca de aquí en medio sería la región de aceptación de la hipótesis nula vale, vamos al siguiente contraste si el parámetro es mayor o igual que un número o si es alternativa es cuando es menor que el número este fijado bueno, pues ahora lo que tendría que hacer es encontrar un área de tamaño alfa en la cola está de la izquierda y esta sería la reacción de rechazo de la hipótesis nula es decir si ésta sería como que aceptó la h1 y esta sería en la que aceptó la h 0 y por último en este último tipo de contraste que esto es menor o igual que un parámetro que un número y la alternativa mayor que ese número pues entonces tendría que encontrar un área en la cola de la derecha de tamaño alfa y en la cola izquierda 1 menos alfa entonces esta de aquí sería la región de rechazo de la h 0 y esta de aquí sería la reacción de aceptación de la h 0 bien vale lo siguiente que tendría que hacer es calcular el valor del estadístico aplicado a una muestra y por último si el valor del estadístico cae en la región crítica entonces se rechaza h 0 y si el valor del estadístico cae fuera de la región crítica se acepta h 0 y finalmente tengo que interpretar los resultados bien esta parte de aquí determinar estas regiones críticas pues digamos lo más complicado o lo que más lía en el examen pero resulta que en esta asignatura no es tan complicado porque tenemos la formulita de estas de adenda que estas regiones ya están calculadas simplemente tengo que mirar el caso en el que estoy hay asignaturas de estadística de otras carreras que esto no aparece o sea uno no tiene no no tiene esta chuleta digamos y entonces según sea el tipo de contraste pues tiene que determinar qué cola será la adecuada y entonces tiene que determinar esto y a ver si cojo una cola o la otra pero no es tan sencillo porque si por ejemplo ahora cuando veamos los ejemplos los miraremos pero por ejemplo en la primera que sería en esta primera página en la página número 13 pues aquí hay como un cuadro el cuadro este de aquí esto que está recuadrado eso sería para hacer los test de hipótesis y están los tres casos que no pueden salir y entonces si yo por ejemplo estoy haciendo el primer caso este de aquí este entonces lo único que tengo que hacer es mirar ahí que pone se acepta h cero sí módulo de x menos media de un sub cero partido por algo es menor o igual que zeta alfa medios pues simplemente tengo que calcular la parte de la izquierda tengo que calcular el zeta alfa medios y si es menor que eso aceptó h cero y si no lo rechazó ya tengo aquí en la tabla está digamos la chuleta hecha de cuál región tengo que ojalá y entonces según aparece aquí pues resuelve el problema bien o sea que esta parte de aquí uno no tiene que estar pensando si tengo que hacer una cola dos colas sí directamente mirando en la tabla puedo resolver el problema yo de todas formas ahora en un ejemplo completo y después uno simplemente mirando las tablas vale bien vamos a explicar lo que es el p valor esto también es un concepto importante porque también suele salir bastante los exámenes y también en la práctica en la p Pero en exámenes suele salir bastante. Este concepto hay que tenerlo claro. Alternativamente, se puede tomar la decisión utilizando el concepto de p-valor. ¿Qué es el p-valor? Pues el p-valor representa el mínimo nivel de significación necesario para rechazar h0. Un contraste no significativo significa que el p-valor es mayor que alfa y entonces no rechazamos h0. Y un contraste significativo es que el p-valor es menor o igual que alfa y sí que se rechaza h0. Vamos a verlo con un dibujito y se quedará más claro. Voy a borrar esto. Imaginemos que estamos, por ejemplo, en este caso. Vamos a imaginar este caso de aquí, por ejemplo. Entonces, la idea es, con el alfa yo hago esta representación de aquí. Y yo después tengo que calcular el zeta, un zeta alfa medio, digamos. ¿Qué sería? Que lo saco a partir de la muestra. A partir de los datos que me dé el ejercicio, yo sacaré un zeta, que yo aquí lo llamo zeta experimental. Resulta que si este zeta me cae aquí, pues lo que será es que yo acepto esta hipótesis. Y si el zeta me cae, por ejemplo, aquí, pues yo rechazo h0 y acepto el h1. ¿Qué significa lo del p-valor? Pues el p-valor significa que si... Olvido esta alfa. Y calculo esta zeta experimental, pues el p-valor sería, ¿cuál sería? El alfa, que hace que... Sería como el valor límite. para calcular toda esta área de aquí esta área sería fijado esto que alfa tendría que tener para que éste lo aceptase pues eso sería el p valor con un valor límite quizás en este caso de aquí se ve más claro si yo por ejemplo saco el z experimental este la pregunta sería qué alfa tengo que utilizar para que yo acepte este ejemplo concreto que me ha salido pues el valor límite sería cuando el área está marcada con de aceptación llegase hasta aquí pues esa alfa digamos sería el p valor por eso aquí dice que si el p valor es mayor que esa alfa pues no rechazamos h0 mientras que si el p valor es más pequeño que esa alfa sí que se rechaza h0 de todas formas donde tiene más interés del p valor es cuando nos dan un ejercicio y no nos dicen el nivel de significación es decir nos ponen un ejercicio y no nos fijan en el nivel de significación y entonces debemos decidir si la hipótesis que escogemos es la h 0 o la h 1 en base al p valor porque esto no nos lo da el ejercicio bueno lo que hay que hacer en el libro es si el p valor aunque esto estos valores a veces son discutibles según el autor del libro pero en esta asignatura según lo propone el libro vamos a utilizar que si el p valor es mayor o igual que 0,2 entonces se acepta h0 si el p valor es menor o igual que 0,01 entonces se rechaza h0 Y si el p-valor está entre 0,02 y 0,2, pues no hay una decisión clara. Y entonces ya depende del investigador que aceptará o no h0. Esto con los ejemplos que veremos a continuación será un poco más claro. Vamos a ver los tipos de errores. Si aceptamos h0 siendo falsa, se comete un error de tipo 2. Mientras que si se rechaza h0 siendo verdadera, se comete un error de tipo 1. El nivel de significación alfa lo que nos da es la probabilidad de rechazar la hipótesis nula cuando es cierta. Y eso se le llama error de tipo 1. La probabilidad de aceptar la hipótesis nula cuando es cierta será 1 menos alfa. A esto se le llama coeficiente de confianza. A la alfa se le llama nivel de significación. Y a 1 menos alfa se le llama coeficiente de confianza. Son notaciones diferentes pero equivalentes. Y si denotamos por beta la probabilidad de cometer un error de tipo 2, es decir, no rechazar h0 siendo falsa. Entonces la probabilidad de rechazar h0 siendo falsa es 1 menos b. Y a esto se le llama potencia del contraste. Lo que a nosotros nos interesa es un nivel de significación pequeño. Y una potencia de contraste. Y una potencia de contraste elevada. Si el nivel de significación es pequeño, el error de tipo 1 sería pequeño. Que es lo que buscamos. Y la potencia del contraste también la queremos elevada porque querríamos que 1 menos beta, siendo beta la probabilidad de cometer el error de tipo 2, sea alta. ¿Vale? ¿Cómo formulamos la hipótesis nula y la hipótesis alternativa? Porque claro, cuando uno tiene un problema lo puede plantear de dos maneras diferentes. Puede plantear h0, pues el parámetro menor o igual que 3. ¿Vale? Y la alternativa puede plantear que el parámetro sea mayor que 3 o un problema equivalente sería pues el parámetro menor que 3 o el parámetro mayor o igual que 3. ¿Cuál planteo? ¿El de arriba o el de abajo? Uy, he puesto lo mismo. Esperaos. Voy a borrar esto. Este. Vale, sería mayor o igual que 3. Mayor que y menor o igual. ¿Vale? O incluso mayor o igual y menor. Bueno, como norma general, si estamos intentando demostrar algo, debemos de poner lo que queremos demostrar en la hipótesis alternativa. ¿Vale? La alternativa debe de ser lo que queremos demostrar. Si lo que queremos demostrar está en la hipótesis alternativa, el error de equivocarnos lo tendremos medido porque sería el nivel de significación. ¿Vale? Por eso se pone. Aquí. Aquí, en la hipótesis alternativa, lo que queremos demostrar. Bueno, pues vamos allá a ver los ejemplos. Bien. Bueno, pues el primer ejemplo. Vamos a empezar con ejemplos más sencillos y después haremos uno un poco más complicado. ¿Vale? Vale, primer ejemplo. Según un estudio publicado por una agencia de medios, menos del 15% de los usuarios de Internet y móvil utilizan nuestra app o nuestra página web para reservar los hoteles. Con la información que tenemos creemos que ese dato es mayor, por lo que decidimos realizar un estudio con el objeto de contrarrestar dicha información. Tomamos una muestra de 400 potenciales usuarios, de los cuales 880 contestaron que eran usuarios habituales de nuestra web. Y lo que nos pide el ejercicio es realizar un contraste de hipótesis con nivel de significación 0,05. Bueno, pues primero que nada hay que intentar extraer los datos que hay aquí y realizar un contraste de hipótesis. Bueno, primero que nada observamos que tenemos aquí un 15%, que tenemos aquí que de 400 potenciales usuarios, 80 contestaron que eran usuarios habituales. Entonces esto nos da pistas para afirmar que... Esto pues será una proporción. Entonces, si tenéis a mano la adenda, esto de aquí, pues vamos a ver cuál sería lo correcto aquí. Nosotros empezamos con la página número 13 y aquí ponen inferencias sobre la media de una población normal. Y nos preguntamos, ¿aquí nos están preguntando por la media de una población normal? Pues no, no nos ha dicho en ningún momento que tengamos una población normal. Pues vale, pasamos de página. Aquí después pone, inferencias sobre la media de una población no necesariamente normal. Muestras grandes. Vale, aquí ya puede ser que este es lo que buscamos. Si vamos mirando, vemos primero con sigma conocida y con sigma desconocida. vale, aquí no nos dan ni la desviación típica ni nada de esto, pero después continuamos en la página 15, si lo tenéis aquí a mano y pone población x sigue una binomial 1p, entonces esto sería para una proporción vale, si vemos aquí bueno, ahí no se ve, pero estoy en la página 15 vale, pues como hemos dicho que el problema este nos ofrecen datos en forma de proporción pues, entonces sería una población binomial, porque la pregunta que nosotros hacemos a nuestros individuos de la muestra es si usted utiliza o no nuestra web entonces esto es o la utilizas o no la utilizas y eso es una binomial bueno, pues entonces vamos a continuar bien, pues como hemos dicho estamos ante una proporción y entonces el estadístico apropiado pues es el que tenemos aquí en adenda no tengo que aprender nada de memoria sino que si miramos aquí directamente pues tenemos que esta expresión de aquí sigue una normal 0,1 esto es válido si las muestras son grandes pero en este caso la muestra es muy grande porque tenemos 400 potenciales usuarios a los que le hemos preguntado entonces la muestra es suficientemente grande siempre que la muestra sea mayor que 30 pues ya podemos utilizar este apartado de muestras grandes bien, pues nada, vamos a ver ahora los datos que tenemos primero que nada tenemos que de 400 usuarios 80 nos han contestado que si que eran usuarios habituales de nuestra web es decir, que nuestra p la proporción que tenemos de la muestra es 80 partido 400 Y esto es lo que ponemos aquí. Nuestra P es 0,2. ¿Cuál sería el P0? Pues el P0 es que, según el estudio publicado por la agencia de medios, menos del 15% de usuarios de Internet utilizan nuestra app. Y nosotros queremos demostrar que es más. O sea, nuestra hipótesis alternativa tiene que ser que más del 15% de usuarios utilizan nuestra app o nuestra web. Vale, pues entonces el contraste o el test de hipótesis a plantear es, la hipótesis nula sería que nuestra proporción es más pequeña o igual que P0, que es 0,15. Y la hipótesis alternativa, que es lo que queremos demostrar, es que la proporción es mayor que 0,15. Bueno, pues el valor experimental del estadístico sería Z experimental. Z experimental sería 0,2 menos 0,15, porque estoy utilizando primero este P con gorrito. Es el 0,2 por 0,2. Menos P0. Pues P0 es 0,15, que me lo da la acreditación, el 15%. Dividido de P0, que es 0,15, por 1 menos P0, 1 menos 0,15, que es 0,85. Y dividido de P0. Y dividido por la n, que es el tamaño de la muestra, que hemos quedado que era 400. Entonces, el valor experimental es 2,8. Bien. Vale, ahora tenemos que buscar el área esa que he dicho antes. Entonces, al 5% de significación... Y dado que el contraste que hemos planteado, debemos buscar el valor crítico, el z sub alfa, que deja a la derecha. ¿Por qué a la derecha? Pues porque en mi test que he planteado aquí, vamos a borrar esto, esta parte de aquí que es la alternativa, aquí pone p mayor que p sub cero. Entonces tengo que buscar que a la derecha de mi z, de mi valor crítico, quede un 5% del área. Es decir, el dibujito sería este que aparece aquí. Y lo que busco es que en este trocito de aquí aparezca un 5% del área. Dicho de otro modo, lo que queremos es que la probabilidad de que z sea mayor que este valor crítico. Sea 0,05. O también podríamos verlo de esta manera. La probabilidad de que z sea menor que el valor crítico, sea 0,95. Bien, depende de las tablas que tengamos, buscamos una expresión u otra. En nuestro caso, la expresión correcta es esto. Porque si vamos a la tabla de la página de la normal, es decir, la página 33. Está la tabla de la distribución normal. Vemos que aparecen expresiones de este tipo. Las probabilidades de la cola de la derecha. Entonces, yo ahora lo que tengo que hacer es buscar este valor 0,05 a ver dónde lo encuentro aquí en los valores de medio de la tabla. Pues si empiezo a buscar por aquí, observo que... Ahora lo que estoy haciendo es, tengo la tabla esta de aquí. A ver si se puede mostrar de aquí. de la normal tengo que buscar aquí en medio el valor 0.05 no en los extremos de arriba sino en medio vale pues me doy cuenta que en 1,604 resulta que me sale 0.0505 y para 1,606 me sale 0,4 para 1,65 sale 0,0495 es decir que está justo en medio entre uno y otro entonces el valor ese que busco es 1,645 que sería el valor que dejaría un área de 0,05 el área que deja en la cola derecha es la que deja en la cola derecha y el área que deja en la cola derecha es la que aparece en el centro del recuadro y los valores de los extremos de la columna y el de la fila sirve para formar el valor este del valor crítico pues bueno una vez que tengo hecho esto si cae aquí el zeta experimental lo que tengo que hacer es rechazar la h0 y si cae aquí lo que tengo que hacer es aceptar la h0 en mi caso el zeta experimental me había salido 2,8 que es mayor que 1,645 en el centro del recuadro y los valores de los extremos de la columna y el de la fila entonces como cae en la reacción región crítica o de rechazo pues rechazaría h0 y me quedaría con la conclusión de que efectivamente más de un 15% de los usuarios a un 5% de significación utilizan la nuestra web y entonces rechazaría la hipótesis nula de que es menos de un 15 por ciento vale pero esto que he dicho ahora de intentar buscar el área buscar a ver si es la cola derecha la cola izquierda cosa pues es un trabajo que no hace falta que haga. Porque resulta que en las tablas, si yo he hecho aquí una captura de pantalla de la página 15 del principio, pues aquí ya lo tengo todo hecho. Lo único que tengo que mirar es de qué tipo es mi contraste. Pues resulta que es como este. Entonces tendré que mirar esta columna de aquí. Esto de aquí es el zeta experimental. ¿Vale? Pues yo calculo el zeta experimental, que me ha salido 2,8, según he calculado aquí. 2,8. Entonces ya sé que esta parte de aquí es 2,8. Y el zeta alfa resulta que es el valor de esta cola. Eso sí que lo tengo que mirar en las tablas. Tengo que calcular probabilidad de que zeta sea mayor que zeta alfa tiene que ser 0,05. Que sería el nivel de significación que eso lo da el ejecutivo. Bueno, pues mirando esto me sale que esto es 1,645. Vale, pues ahora la pregunta es ¿2,8 es menor que 1,645 o mayor? Pues resulta que es mayor. Es decir, que la hipótesis que aceptaría yo es la H1, la alternativa. Y rechazaría la H0. ¿Vale? O sea que con las tablas es bastante fácil de ir... solucionando esto. Vale. Siguiendo con el mismo ejemplo, vamos ahora a tratar de explicar qué es el p-valor para entender lo que significa. Os vamos a imaginar que nos piden que realicemos el contraste pero a un nivel de significación del 1% y que utilicemos el p-valor. Vale. Para nuestro contraste, el p-valor es el área que deja a la derecha el z-experimental. Es decir, lo que busco yo ahora es la probabilidad de que z sea mayor que 2,8. Es decir, si yo antes tenía esto, experimental, y esto tenía que ser igual a la alfa, antes yo conocía alfa y sacaba este valor de aquí, ¿vale? La z, la z alfa, digamos. Mientras que ahora con el p-valor lo que tengo que hacer es, me dan este valor de aquí, que es el 2,8, el experimental que he sacado, y lo que tengo que sacar es esta alfa. Y esa alfa será el p-valor, ¿vale? Sería como el valor límite de aceptación de la I, de H0, o de rechazo. Bueno, entonces, yo ahora tengo que hacer el proceso contrario. Yo me voy ahora a mi tabla de la normal. Y tengo que mirar 2,8, aquí, donde pone 2,8. Y resulta que me sale 0,0026 de las tablas. Entonces, como mi p-valor, este, es más pequeño que 0,01, que es el nivel de significación, el contraste es significativo y se rechaza H0, ¿vale? Bien. O sea, esto lo que significaría es... Voy a ponerlo aquí con una gráfica. Con el p-valor, yo sacaría que esta área, vamos a poner que es esta. El p-valor le ponemos que es... en 28 digamos esta área de aquí sale 0.00 26 como esto es más pequeñito que 0.01 si fuera alfa así si el azo estuviera aquí yo tendría que esta región sería la de rechace en la que rechazó el h 0 pero yo calculo el p valor y me ha salido aquí dentro pues entonces el contraste sí que significativo cae dentro de rechazar h 0 y entonces cogería h 1 qué pasaría si no me diesen el 0 0 1 vamos a borrar esto vale pues lo que pasaría sería que si yo tengo aquí fijado el p valor todos los contrastes qué que me den con un alfa mayor o sea mayor que este p valor serán contrastes que voy a aceptar h 0 y si no pues lo rechazaría si sirve como el valor límite para que todos los contrastes que plante con un alfa más grande que ese p valor pues me saldrían que aceptaría h 0 bueno ahora vamos a hacer como una prueba por probar y esto pues me ha planteado vamos a ver qué pasaría si me equivoco y en el test intercambio la h 0 y la h 1 es decir vamos a plantear ahora mayor o igual que p 0 y p menor que p la hipótesis nula mayor o igual que p 0 y la alternativa menor que p 0 Bueno, pues en este caso el estadístico sería el mismo. La P0 sería el mismo y el valor del estadístico según la muestra también sería el mismo. Lo único que cambiaría ahora sería la región crítica. En este caso lo que buscaríamos sería el valor crítico que deja a la izquierda un 5% de área. Es decir, esto de aquí. Dicho de otro modo, también sería que a la derecha de Z me quede 0,95. Si miramos la actuación de las tablas sería esto de aquí. Que Z sea mayor o igual que Z1 menos alfa sea igual a 0,95. Es decir, yo lo que estoy buscando todo el rato es un valor aquí que sería Z1 menos alfa. Que aquí me deje un 95% de área y aquí me deje un 5% de área. Pero bueno, este valor de aquí de las tablas no lo puedo calcular. Porque si nos fijamos... El 0,95 yo miro por aquí en medio y no aparece. Entonces el valor correcto que tendría que buscar sería el 0,05. Que ese sí que me aparece. Y yo después le cambiaría el signo al número que obtengo. Porque como las dos colas son simétricas, pues realmente yo calcularía este. Pero conociendo este le cambio el signo y le pongo menos 1, lo que salga. Menos Z alfa. Y entonces ya tendría este valor. En este caso concreto ya lo tenía calculado de antes. Y yo aquí había sacado que este era el valor que tenía que buscar. Este trozo de aquí era el área 0,0. O sea, el área de un 5% sacaba 1,645. Pues simplemente ya tengo que cambiarle el signo y este sería mi valor que busco. Total, que si cae aquí el Z experimental rechazaría H0. Mientras que si cae aquí, en todo esto de aquí. Voy a ponerlo en rojo. En todo esto de aquí. aceptaría H0. ¿El por qué es así? Es porque ahora el P mayor que algo es donde acepto y el P menor que algo es donde rechazo. Pues muy bien, en este caso el Z experimental resulta que ha salido 2,8, que evidentemente es mayor que menos 1,645 y por tanto acepto la hipótesis nula que realmente es el mismo ejercicio, es la misma solución que antes, porque aceptar la hipótesis nula es aceptar que sí, hay una proporción mayor que el 15% de usuarios de Internet que utilizan nuestra app. Bien, vamos a ver otro ejemplo. La cotización de las acciones de un banco durante el pasado año se ha observado que se distribuye normalmente, es decir, tenemos una distribución normal con desviación típica, sabemos la desviación típica 800 unidades monetarias. Se selecciona una muestra aleatoria de la cotización alcanzada en 100 días, obteniendo como cotización media 18.800 unidades monetarias. Y queremos contrastar la hipótesis de que a la vista del valor que toma la media de la muestra, nosotros creemos que la cotización media de esa acción es 19.000 unidades monetarias. Realizar un contraste de hipótesis con nivel de significación 0.05. Pues muy bien, en este caso la población ya sabemos que es normal con media desconocida y desviación típica 800. Ya tenemos mucha información. Y el contraste que queremos plantear es que la media sea la que me dan, 19.000 y la alternativa que no sea ese 19.000. Bueno, pues una vez más ahora tenemos que ir mirando en mi tabla a ver dónde se ajusta a algo que sea una normal con desviación típica conocida. Bueno, pues en la primera página esto sería inferencia sobre la media de una población normal. Evidentemente es este apartado porque la ejercicio nos dice que es normal. Y además hay dos apartados, uno es que nos pone sigma conocida y la otra sigma desconocida. En este caso será la primera tabla, que sería sigma conocida. Pues bueno, voy a calcular ahora el zeta experimental, que sería la media que nos dice el ejercicio, que es 18.800. Sería la media experimental de la muestra menos la media real, que es la que yo quiero contrastar, o sea, la media esta que quiero contrastar, 19.000. Partido por la desviación típica por raíz de 5. Y sería menos 2.5. En este caso se acepta H0, sí. Bueno, ¿cuándo se acepta H0? Pues yo voy a mis tablas, a ver si las he puesto aquí. Bueno, sí. Entonces, ahora es un contraste, cuando tiene una igualdad, es un contraste que se llama bilateral. Y lo que tengo que hacer es repartir ese 0.05. ¿Vale? Tengo que repartirlo entre estas dos colas de aquí. ¿Vale? Aquí tengo que poner un alfa medios de área y aquí un alfa medios de área. ¿Vale? Esta sería la respuesta de aceptación. Y la que marco en azul sería la región de rechazo. Bien, entonces, y ahora lo que tengo que hacer es buscar aquí, en las tablas de la normal, como me han planteado 0.05, pues realmente tendría que buscar que aquí quedase 0.025. 0.025. Entonces, si voy a mi tabla de la normal y busco el 0.025, pues me saldrá en 1.96. Si lo comprobáis, veréis que, si vais a la tabla de la normal, voy a comprobarlo en 1.96, pues resulta que sale eso de ahí, 0.025. Es correcto. Vale. Entonces, ¿se acepta H0? Si la Z experimental cae entre esos dos valores y si no, se rechaza. ¿Vale? O, similares. Si miro mi cuadrito, ¿vale?, de adenda, pues estaría en el primer caso, en la primera columna, y se acepta H0 si X menos mu sub 0, ¿vale?, que sería esta. ¿Vale? Aquí faltaba una mu sub 0. Partido por alfa partido raíz de n, este sería mi Z experimental, es menor o igual que Z alfa medios, que es mi 1.96. ¿Vale? Muy bien. Pues, bueno, en este caso, el Z experimental me sale menos 2.5, tal cual he calculado antes. Menos 2.5 es más pequeño que menos 1.96, entonces cae en la región esta de rechazo de la H0. Si lo hiciese con módulos, pues sería igual, porque yo haría el módulo de esto, sale 2.5, y 2.5 es mayor que 1.96. Entonces, también, lo mismo, sale que se rechaza H0. Bueno, pues lo que hemos visto hasta ahora parece que sea bastante sencillo, pero vamos a ver ahora un problema real de los que han salido en los exámenes y veremos que esto es un poco más complicado. O sea que después del examen, yo pido ahí ejemplos más sencillos, pero que cabe la posibilidad que en el examen salga algo más complicado como esto que vamos a hacer ahora. Bueno, podemos ver un ejemplo de examen que salió en el 2014-2015 segunda semana. El rectángulo de oro es un rectángulo en donde el cociente Q entre el lado menor y el lado mayor es igual a 1 partido 0,5 por raíz de 5 más 1, que es 0,618. Esto se lo conoce como razón áurea y es utilizada, por ejemplo, por los griegos en el Partenón y hoy en día utilizada en las tarjetas de visita. Se cree que las empresas con tarjetas de visita de valor Q mayor que la razón áurea son conservadoras en sus negocios. Mientras que las empresas con tarjetas de visita con valores Q menor que la razón áurea son agresivas. Con esta idea se eligieron al azar 5 compañías del IBEX 35 consideradas como conservadoras y se obtenieron los valores de Q, estos 5 valores. 6, perdón, 1, 2, 3, 5, perdón. Y 5 compañías consideradas como agresivas en las que se observaron los valores de Q siguientes, estos de aquí. y que los valores de Q siguen una distribución normal, nos dan esta suposición. ¿Es significativamente mayor la media de valores Q de las empresas del primer grupo conservadoras que las del segundo agresivas? Vale, pues esto sería el problema que salió en el examen. Bien, entonces... Lo primero que leo aquí es que tengo que comparar dos medias. Entonces, me voy a mi adenda y voy buscando por aquí. ¿Inferencia sobre la media de una población normal? Pues no, porque es una. ¿Inferencia sobre la media de una población? No, tampoco. ¿Inferencia sobre la varianza de una población? Tampoco. ¿Inferencia sobre la varianza de dos poblaciones normales? Aquí ya vemos que hay dos poblaciones normales. Pero yo voy a hacer inferencia sobre la varianza o sobre la media. Voy a hacer sobre la media. Entonces, pues continúo. Y me encuentro aquí en un apartado que dice inferencia sobre las medias de dos poblaciones normales independientes. Pues este es mi apartado. Esto estaría en la página 18. Bien. Ahora sigo leyendo aquí y tengo una cosa que pone... Bueno, voy a avanzar la diapositiva. Este problema es igual que el ejemplo 7.20 del libro. Es decir, que es recomendable que todos los ejemplos que aparecen en el libro los hagáis. O al menos los... Los estudiéis porque en el examen seguramente van a salir cosas parecidas a ejemplos del libro. ¿Vale? Lo que nos pide contrastar es las medias de dos poblaciones. Y entonces planteamos el contraste siguiente. Si las del primer grupo decimos que tienen media mu sub 1 y las del grupo 2 tienen media mu sub 2, entonces lo que queremos contrastar es si la hipótesis nula es si las empresas del grupo 1 tienen una media menor o igual que las del grupo 2. O por el contrario, la alternativa, si la del grupo 1 son mayores que las del grupo 2. ¿Vale? Este sería el contraste que vamos a aplicar. Bien. Si nos vamos a lenda, lo que he dicho sería el apartado de inferencias sobre medias de dos poblaciones normales independientes. Y vemos que hay dos opciones. Una, si las varianzas son conocidas o son desconocidas. En nuestro caso no nos dicen las varianzas, entonces son desconocidas. Y las muestras también son pequeñas. Entonces estaríamos en la página 19, que sería esta de aquí. Las varianzas son desconocidas y las muestras son pequeñas. Porque las muestras son de 5, son 5 valores. Vale. Pues vemos además que tenemos dos casos más. Una, que las desviaciones típicas sean conocidas o que sean desconocidas. Pues bueno, ¿y ahora qué? ¿Son las desviaciones típicas iguales o son diferentes? ¿Qué apartado elegimos? ¿Este o este? Pues lo que tenemos que hacer aquí es... ...hacer otro contraste para ver si las varianzas van a ser iguales o no. Y entonces tenemos que ir al apartado donde tenemos que hacer inferencias... ...para ver si las varianzas de dos poblaciones normales son iguales o no. Realmente lo que queremos es la desviación típica, pero es lo mismo que las varianzas. Como no conocemos las medias de las poblaciones, pues estaríamos ahora en el caso de la página 18... ...no, mentira. ...a ver, diecimocho... ¿Cómo es esto? Ah, sí, vale. En la parte de arriba estaríamos dentro del apartado de inferencias sobre varianzas de dos poblaciones normales independientes. Queremos ver si las varianzas son iguales o no. ... Entonces, estaríamos ahora en que la mu1 y mu2 son desconocidas. Es decir, tendríamos que hacer ahora un paso previo, que sería hacer este contraste. Aquí no se ve muy bien, pero lo que vamos a utilizar es la f de Snedecor. Bien. Bueno, pues sería este, si son iguales o no son iguales. Y se aceptaría la igualdad de varianzas si cae dentro de este intervalo. Aquí no se ve muy bien, entonces lo he puesto aquí. Sería si S1 al cuadrado partido S2 al cuadrado pertenecen a este intervalo que es la f de Snedecor. Bueno, pues vamos a calcular las medias muestrales y las cuasivarianzas muestrales a partir de los datos de la muestra. Es decir, a partir de estos datos de aquí. Yo calculo la media. La media muestral y la cuasivarianza muestral. Una vez que las tengo calculadas, pues tendría estos datos de aquí. La media, o sea, tengo cinco valores, tanto para el 1 como para N2. Y aquí tendría el X1. Aquí hay un error. Sería X2 y aquí S2. Entonces, con los datos de la muestra, lo que sacaría yo es que este valor de aquí es 1,423465. En este caso, no conocemos el nivel de la muestra. No conocemos el nivel de significación. Es decir, ¿qué podemos hacer? Pues entonces, si no conocemos el nivel de significación, tenemos que recurrir al p-valor. Si vamos a la tabla de amenda y nos vamos a la f de Snedecor. Vamos a la f de Snedecor. Y tenemos que aquí tenemos datos en la 4,4. La f, 4,4. Eso estaría en la página 36, pues en la 4.4 vemos que tenemos valores de 0.1, lo estoy mirando en la parte de izquierda, 0.1, 0.05, 0.025, 0.01 y 0.005, ¿vale? Vamos a empezar cogiendo, suponiendo que mi alfa medios es 0.1, ¿vale? O sea, que sería el que aparece en la tabla, el más grande, ¿vale? ¿Vale? Eso significaría que mi nivel de significación sería 0.2, ¿vale? Vamos a probar qué saldría con eso. Bueno, pues si probamos con eso, la f de SNEDECORP, 4.4, 0.1, si lo miro en mi tablita, es 4.1073, ¿vale? Lo miráis ahí, lo comprobáis y sale eso de ahí. Esta no aparece en la tabla, pero hay una propiedad aquí. Ya les expliqué que si tú intercambias la MLN, en este caso se queda igual porque es 4.4, y en vez de beta pones 1 partido por beta, pues podemos calcular esta a partir de esta, que simplemente es 1 partido por este valor de aquí, ¿vale? Porque en este caso, al ser 4.4, pues sale la misma. Si no, miraríamos en la tabla, ¿vale? Total, que es mirándolo aquí, pues siendo 1 partido por 4, pues me sale este intervalo de aquí, ¿bien? Y la pregunta es, ¿este número? ¿Este número cae dentro de este intervalo? Pues la respuesta es que sí. Es decir, que a nivel de significación 0.2, sí que aceptaríamos la hipótesis de que las varianzas son iguales. Entonces, ¿qué pasaría si considerásemos un valor un poco más pequeño? Es decir... 0.05 y mi alfa fuese 0.1. Pues si repito todo el proceso me sale este valor de aquí, es decir, seguiría siendo que lo acepto. Y si voy haciendo alfas más pequeños, pues sí que se acepta. Entonces, como este cae dentro del intervalo de aceptación, sí que podemos asumir que las varianzas son iguales. Si nosotros nos preguntamos a partir de qué valor de alfa aceptamos la hipótesis nula de igualdad de varianzas, obtendríamos ese p-valor. Que haciéndolo con R, porque en las tablas no están, es 0.7405, con lo cual justifica la aceptación de igualdad de varianzas para valores elevados de alfa. Porque si nos acordamos del principio, si salía mayor que 0.2, sí que cogíamos la hipótesis nula. Mientras que si era menor que 0.01, cogíamos la alternativa. Esto estaba donde expliqué el p-valor, que estaría en la diapositiva. Bueno, ya son las nueve, pero vamos a acabarlo, ya que estamos. Estaba en la diapositiva esta. El p-valor es mayor que 0.2, aceptamos H0. Pues entonces, mirando nuestras tablas, lo único que podríamos decir es que el p-valor es mayor que 0.2. No podríamos decir cuál. Mientras que si lo hacemos con R, que sería poniendo esa expresión de aquí, pues saldría 0.7405. Como es un valor elevado, más grande que 0.2, entonces aceptamos H0. Es decir, que las varianzas son iguales. Y por tanto las desviaciones típicas son iguales. Pues bueno, todo este paso previo es para asegurar que las varianzas sí que son iguales y entonces ya por fin vamos a hacer el contraste que nos pide el ejercicio. Entonces ahora el contraste que teníamos que hacer era este de aquí y si miramos en la tabla correspondiente, que sería la de la página 18, pues estaríamos en la parte de arriba. Es decir, estaríamos en esta de aquí y en el caso que estamos intentando hacer ahora, resolver, sería cuando es menor o igual y este mayor. Entonces estaríamos en la columna del medio. Bueno, pues siguiendo lo que pone aquí, se acepta h0 si todo este valor de aquí es menor que la t de Steven. Con grados de libertad n1 más n2 menos 2. Pues bueno, vamos a calcular eso que hay. Bien, entonces, haría estos cálculos de aquí y creo que aquí me he equivocado. Sí, he cogido el test bilateral, perdón. Y entonces, he cogido el que no es. Pienso aquí. Vale, menos 2, pero aquí no serían alfa medios, sino que aquí sería alfa, ¿vale? Este sería alfa, no alfa medios, ¿vale? Bien, vale, pues calculo este valor de aquí y entonces tampoco haría falta el módulo. Este módulo tampoco haría falta. Bien, esto ya lo revisaré para la próxima clase, yo os lo digo, ¿vale? Y empezaremos con esto. Bueno, entonces, haciendo estos cálculos de aquí, pues saldrá 3,015. Entonces, aquí no nos informan del p-valor, no nos informan del nivel de significación y entonces deberíamos recurrir al p-valor. Entonces, a partir de las tablas, pues observaríamos que la T de Student con 8 grados de libertad saldría 0,01 para este valor de aquí y 0,05 para este valor de aquí. El nuestro nos ha salido entre uno y otro. Eso significa que el p-valor va a estar entre estos dos valores, lo cual significa que es un p-valor suficientemente pequeño como para rechazar la hipótesis nula y quedarnos con la alternativa. Es decir, que la media de los dos valores es significativamente mayor en las empresas conservadoras, ¿vale? Bien, pues vamos a dejarlo aquí y el próximo día este error de aquí os lo soluciono, lo vuelvo a explicar y miramos cómo se hace esto con R. Y lo explico. Esto también se puede hacer con R y se verían las soluciones que sacamos, ¿vale? Pero ahora ya son las 9 y estoy, quiero encerrar aquí el aula. Así que soluciono eso y el próximo día os lo explico, ¿vale? Y vamos a dejarlo aquí. Muy bien. Pues nada, nos vemos el próximo día. Si vais haciendo algún ejercicio de examen y tenéis dudas, me podéis preguntar. Muy bien, cierro esto de aquí y hasta dentro de dos semanas.