Hola, un saludo a todos. Soy David Castilla y soy tutor del Centro Asociado de la UNED en Huelva, donde desempeño mi actividad como tutor en asignaturas del área de Métodos Cuantitativos para la Economía y la Empresa. Concretamente, entre las asignaturas que he tutorizado se encuentran Introducción a la Estadística del Grado de Economía, Estadística Aplicada a las Ciencias Sociales del Grado de Sociología o Inferencia Estadística, que es la asignatura en la que estáis vosotros matriculados. Como tutor intercampus de la Asignatura de Inferencia Estadística, me corresponde a mí impartir las dos sesiones correspondientes a contrastes de tipo paramétrico. Los objetivos pedagógicos perseguidos por esta primera sesión son los siguientes. Conocer el concepto de hipótesis paramétrica, comprender el concepto de contraste de significación y en concreto los contrastes de razón de verosimilitud y aprender a realizar distintos tipos de contrastes sobre la media de una población. Sobre la población normal con varianza conocida y desconocida, sobre la varianza de una población normal con esperanza matemática conocida y desconocida o sobre la proporción de una población de Benuigi de tamaño grande. A lo largo de esta sesión y la siguiente, los alumnos tutorizados pueden contactar conmigo utilizando el chat de webconferencia o bien pidiendo su turno para intervenir en la presentación. Por otra parte, los alumnos que visualicen esta conferencia online podrán plantear todas las dudas que tengan. Los alumnos que les surjan utilizando el foro del grupo de tutoría 5. La bibliografía básica de esta sesión y la siguiente es la recomendada en la guía docente de esta asignatura. Concretamente, el manual de Casas y Gutiérrez 2011, Estadística 2, Inferencia Estadística. No obstante, cualquier manual de estadística que aborde la inferencia es apropiado para los fines de esta sesión, tales como Novales 1997 o Ruiz Maya y Martín Pliego 1999. Como se vio antes, en el tema 1, la inferencia estadística utiliza datos muestrales para llevar a cabo estimaciones, tomar decisiones, realizar predicciones, comprobar hipótesis o hacer otro tipo de generalizaciones acerca de un conjunto de datos más grande, denominado población. A modo de ejemplo, en el control estadístico de calidad, se suele recurrir a muestras más pequeñas que toda la población al objeto de comprobar la calidad total del conjunto. En el caso de un secadero de jamones, sería absurdo ver jamón por jamón, ciertas especificaciones de calidad. De tal modo que lo que se suele hacer es muestrear los jamones y ver la calidad de un conjunto representativo de la totalidad y de esta manera hacer inferencias acerca de la calidad total de la producción total de jamones. Los principales procedimientos de la inferencia estadística son la estimación y la contrastación de hipótesis estadísticas. En lo que se refiere a los contrastes de hipótesis estadísticas, abordados desde el punto de vista teórico en el tema 5, se distingue entre contrastes de tipo paramétrico, los cuales contrastan hipótesis sobre el valor que toman los parámetros de distribuciones poblacionales conocidas. Estos serán abordados en el tema 6. Un ejemplo sería contrastar hipótesis sobre el valor que toma mu o sigma de una familia de distribuciones normal. El otro tipo de contrastes son los contrastes no paramétricos. Estos contrastan hipótesis sobre otras características de la distribución, distintas de los parámetros, tales como la forma, la localización, la aleatoriedad, y serán abordadas en el tema 7. Por otra parte, los alumnos deben recordar, tal y como se vio en el tema 5, que es deseable encontrar el contraste de hipótesis que para un nivel de significación dado ofrece la máxima potencia. Por ello se introdujo en el tema 5 el lema de Neyman-Pearson que permitía construir contrastes de hipótesis simples de máxima potencia. También se observó para el caso de hipótesis compuestas que era posible obtener contrastes uniformes, uniformemente más potentes, en este caso concreto. Desgraciadamente, no siempre es posible obtener contrastes uniformemente más potentes, de tal modo que será necesario recurrir en otras ocasiones a procedimientos alternativos. Concretamente, los contrastes de significación ofrecen una alternativa que para la toma de decisiones acerca de la aceptación o rechazo de la hipótesis nula se basan en el tamaño de la discrepancia existente entre el valor del parámetro formulado bajo la hipótesis nula y el valor que le correspondería según la información que proporciona la muestra. Su procedimiento de resolución sigue en general las fases de realización de un contraste establecidas en el tema 5, de tal modo que si consideramos el ejemplo de un contraste de hipótesis sobre la media de una población normal con varianza conocida, las fases serían las siguientes. En un primer lugar, sería necesario formular las hipótesis del contraste. En este caso concreto, la hipótesis nula sería que el valor de mu fuera menor o igual que 4, mientras que la hipótesis alternativa sería que el valor de mu sea mayor que 4. A continuación, será necesario obtener un estadístico de prueba aprobiado cuya distribución sea conocida. En este caso concreto, un estadístico que mide apropiadamente la discrepancia entre el valor media muestral y media poblacional sería el que se nos muestra en la pantalla, el cual ha sido escalado por la desviación típica del estadístico media muestral. El tercer paso consistirá en que el valor de mu sea mayor que 4, y el tercer paso consistirá en seleccionar el nivel de significación, que en este caso vamos a asumir que es alfa igual a 0,05. Después, habrá que determinar la región crítica, que en el supuesto de que el tamaño de la muestra sea igual a 20, y dado que x media menos mu partido s partido raíz de n se distribuye como una t de Schienen con n menos un grado de libertad, se cumple bajo el supuesto de la hipótesis nula que la probabilidad de que el estadístico de contraste sea superior al valor crítico es igual a 0,05. Sabiendo que el estadístico de contraste se distribuye como una t de Schienen con n menos un grado de libertad, es fácil obtener el valor crítico, sabiendo que sería aquel valor de la variable que deja a la derecha una probabilidad igual a 0,05. Finalmente, sería necesario seleccionar una muestra aleatoria y calcular el estadístico de prueba. Mediante la comparación en el último paso del estadístico de discrepancia y el valor crítico calculado en el cuarto paso, Podremos obtener la conclusión de contraste, que en este caso, dado que la discrepancia experimental o el estadístico de prueba es menor que el valor crítico, concluiremos que es necesario aceptar la hipótesis nula para un nivel de significación de alfa igual a 0,05. Como se observa en el gráfico, el valor del estadístico de contraste cae fuera de la región crítica, sombreada en azul. En el caso en el que ese estadístico de contraste fuera superior al valor crítico y por tanto cayera dentro de la zona sombreada, rechazaríamos la hipótesis nula. Los contrastes de razón de verosimilitud son un caso particular de los contrastes de significación, que miden la discrepancia mediante la ratio de distintas verosimilitudes. Estos contrastes presentan buenas propiedades cuando el tamaño muestral es grande y serán los que emplearemos a lo largo de este curso. Veamos un ejemplo. Sea x1 hasta xn una muestra aleatoria de una población normal con esperanza matemática más alta, o sea, una mu y varianza sigma sub cero conocida. Y deseamos contrastar las siguientes hipótesis. La hipótesis nula de que mu sea igual a mu sub cero y la hipótesis alternativa de que mu sea distinto de mu sub cero. Para llevar a cabo un contraste de razón de verosimilitud, lo primero que tendremos que hacer es obtener la función de verosimilitud de la muestra extraída. Y a partir de ahí, obtener el estadístico lambda x que se define como el cociente de dos valores concretos de esa función de verosimilitud. El numerador L sub cero asterisco no es más que el máximo de la función de verosimilitud en el subespacio paramétrico de la hipótesis nula. Mientras que el denominador L asterisco es el máximo de la función de verosimilitud en todo el espacio paramétrico. En el caso concreto del contraste que se está ejemplificando, esta sería la función de verosimilitud. Por otra parte, L sub cero asterisco se podría obtener fácilmente sustituyendo en la función de verosimilitud el valor mu paramétrico por mu sub cero, dado que es el único valor que toma el parámetro en el subespacio paramétrico de la hipótesis nula. Mientras que L asterisco se podría obtener fácilmente sabiendo que la media muestrada es el estimador de máxima verosimilitud de la media poblacional. De tal modo que simplemente habría que sustituir el parámetro mu en la función de verosimilitud por x media. De este modo, y después de simplificar, obtenemos el estadístico lambda x que se presenta en la función de verosimilitud. A continuación, tendríamos que determinar la región crítica. Para ello, simplemente tenemos que tener en cuenta que la probabilidad de que el estadístico de prueba sea menor que el valor crítico debe ser igual a alfa. En esta expresión, en la que el estadístico de prueba es lambda x y ese valor crítico se denota teóricamente por lambda sub cero, para poder determinar el valor crítico tendremos que conseguir que la expresión que se encuentra en el lado izquierdo de la desigualdad sea una función del parámetro mu. Y tenga una familia de distribuciones conocida. Mientras que a la derecha de esa desigualdad debe haber una constante. Después de operar, podemos concluir que la probabilidad de que la media muestral menos el parámetro mu sub cero partido por sigma sub cero partido por la raíz de n sea menor que lambda prima sub cero donde lambda prima sub cero es menos dos por logaritmo neperiano de lambda sub cero es igual a alfa. De esta manera, sabiendo que x media menos mu sub cero partido sigma sub cero partido raíz de n se distribuye como una distribución normal, es fácil obtener el valor crítico. Concretamente en este caso, y dado que estamos hablando de una región crítica bilateral, los valores críticos serán los valores de una normal estándar que deja a la derecha una probabilidad de alfa medio con signo positivo y negativo. En definitiva, hemos de tener en cuenta que el esquema de aplicación del contraste de máxima verosimilitud presentado en las dispositivas anteriores, se puede repetir de forma análoga para otros casos, como pueden comprobar en el manual al que me remito. Los resultados de la aplicación de este esquema para los distintos contrastes abordados en el tema 6 se encuentran resumidos en el cuadro resumen disponible en las páginas 294-299 que utilizaremos a la hora de llevar a cabo nuestros ejercicios. Vamos a ver a continuación algunos ejemplos de aplicación de este procedimiento a los efectos de contrastar la media, la varianza y la proporcionalidad. Supongamos que queramos realizar un contraste en el que la hipótesis nula sea que la media sea igual a 3 y la alternativa que la media sea distinta de 3 para una distribución normal y utilizando un nivel de significación de alfa igual a 0,01. Para ello tendríamos que obtener una muestra aleatoria en este caso es de tamaño 18 cuyos resultados se muestran en la siguiente tabla. Dado que no se nos indica el valor de la varianza poblacional tendremos que suponer que éste es desconocido y estimarlo a través de la muestra extraída. En adelante, y cada vez que resolvamos un ejercicio de este tipo tendremos que seguir los siguientes pasos. En un primer lugar, formularemos las hipótesis del contraste que son las que ya hemos mencionado. A continuación elegiremos el estadístico de prueba apropiado y calcularemos su valor con los elementos de la muestra. En este caso, y dado que es un contraste de hipótesis sobre la media de una población normal con varianza desconocida el estadístico de contraste apropiado será x media menos mu sub cero partido s partido raíz de n donde s es la cuasi-desviación típica muestral. Sustituyendo los valores en este estadístico obtenemos que su valor es 18,247. A continuación, determinaremos la región crítica que en este caso concreto será el valor que deja a la derecha una probabilidad de alfa medio una telestuden de n menos un grado de libertad esto es, 17 grados de libertad con signos positivo y negativo dado que el contraste es de tipo bilateral. Finalmente, adoptaremos una decisión respecto a la aceptación o rechazo de la hipótesis nula. En este caso concreto, dado que t experimental es igual a 18,247 y por lo tanto mayor que el valor crítico 2,898 rechazaremos la hipótesis nula con un nivel de significación de alfa igual a 0,01 Veamos ahora un ejemplo de contraste de hipótesis acerca de la varianza. Supongamos que la hipótesis nula es que la varianza es mayor o igual que 6 mientras que la alternativa es que la varianza es menor que 6 y que la población sobre la que se quiere realizar el contraste es normal con esperanza matemática mu y desviación típica sigma. Consideremos un nivel de significación alfa igual a 0,1 El resultado de obtener una muestra aleatoria de tamaño 7 se muestra a continuación. De nuevo seguiremos los mismos pasos que en el ejemplo anterior. En un primer lugar formularemos las hipótesis del contraste que son las que ya se han indicado. En segundo lugar elegiremos un estadístico de prueba apropiado y calcularemos su valor con los datos de la muestra. En tercer lugar determinaremos la región crítica que será el valor que deja a la izquierda una probabilidad igual a alfa en un h cuadrado de 6 grados de libertad concretamente en este caso el valor de ese h cuadrado sería 2,204 Finalmente adoptaremos una decisión. Dado que el valor del h cuadrado experimental es mayor que el valor crítico concluiremos que aceptamos la hipótesis nula con un nivel de significación de alfa igual a 0,1 Gráficamente podemos comprobar que el valor del estadístico de contraste 5,8533 cae fuera de la región crítica sombreada en azul en el gráfico que podéis observar en la diapositiva. Finalmente veamos un ejemplo en el que se contrasta una hipótesis sobre la proporción Pernuigi de tamaño grande En un proceso de fabricación se detecta que el 17% de las piezas son defectuosas Mediante una puesta a punto se espera que esta cifra haya bajado Contrastar esta hipótesis con un nivel de significación de 0,001 en una muestra aleatoria simple de tamaño 100 en la que se han obtenido 6 piezas defectuosas Otra vez seguiremos los pasos que hemos recomendado En primer lugar formularemos las hipótesis del contraste que en este caso serán la hipótesis nula de que la proporción sea mayor o igual que 0,17 y la hipótesis alternativa de que la proporción sea menor que 0,17 En segundo lugar elegiremos un estadístico de prueba apropiado y calcularemos el valor del estadístico de prueba con los datos de la muestra El valor de ese estadístico de prueba es, en este caso concreto menos 2,9284 En tercer lugar determinaremos la región crítica que sería el valor de una normal estándar que deja a la izquierda una probabilidad alfa Ese valor es 3,08 Finalmente adoptaremos una decisión dado que el valor crítico es menor que el estadístico de prueba aceptaremos la hipótesis nula bajo un nivel de significación de alfa igual a 0,001 En resumen se han introducido los contrastes paramétricos en el marco de la inferencia estadística como procedimiento para corroborar el cumplimiento de hipótesis estadísticas sobre los parámetros de distribuciones conocidas en contraposición con los contrastes no paramétricos Se han introducido los contrastes de significación como aquellos que se basan a los efectos de aceptar o rechazar la hipótesis nula en la discrepancia entre el valor del parámetro formulado bajo la hipótesis nula y el valor que le correspondería según la información que proporciona la muestra Se han desarrollado los contrastes de razón de verosimilitud como aquellos contrastes de significación que miden la discrepancia por medio de la comparación de funciones de verosimilitud Y finalmente se han ejemplificado algunos problemas de resolución de contrastes de hipótesis paramétricos sobre la media la varianza y la proporción