Preguntas, sugerencias dudas lo tenéis todo claro sugerencias esperada te estás refiriendo a un cuadrado que hace referencia, en este caso la prueba de x cuadrado puede hacer referencia a muchas cosas pero no hacía referencia al, si los datos que teníamos se ajustaban a la curva normal entonces la prueba de x cuadrado en este caso lo que hacemos es comparar las frecuencias que nosotros tenemos, eso serían frecuencias observadas con las frecuencias que tendríamos si los datos se distribuyeran de acuerdo con la distribución normal y eso son las frecuencias esperadas vamos a verlo tenéis el libro no sé en qué página está ahí seis y Vamos a ver, siguiendo un poco el ejemplo del libro, que hace referencia a la tabla 9-1. O sea, la original es la tabla 9-1. Descalificaciones obtenidas por los alumnos de bachillerato de una comunidad autónoma. Entonces se repite otra vez aquí, en las dos primeras columnas tenemos las puntuaciones. O sea, la puntuación 10, la frecuencia observada la han obtenido 74 sujetos. 9-175, 8-219 y así sucesivamente. La página 197. Bien, entonces nosotros si queremos saber si esa distribución que nosotros tenemos se ajusta a la distribución normal, lo tendremos que comparar con una distribución normal. Entonces, lo que... Lo que tenemos que hacer a continuación, es decir, si los datos que nosotros tenemos se distribuyeran como la distribución normal, tendrían unas frecuencias determinadas, las que sean. Que puede que coincidan con las nuestras, que puede que no coincidan. Y eso es las frecuencias esperadas. Me sospecho que la duda va más allá. O sea, decir, bueno, ¿y de dónde saco yo las frecuencias esperadas? Bien. Entonces... entonces siguiendo el ejemplo nosotros queremos saber si esos datos que nosotros tenemos en esa tabla se ajustan a la distribución normal nosotros teníamos la tabla original entonces tendríamos vamos a poner algunos apuntación 10 74 entonces nosotros queremos saber si todos los datos realmente se ajustan a esta distribución entonces para eso nosotros tenemos que comparar estas frecuencias con otras frecuencias Con las frecuencias que tendríamos si realmente estos datos se ajustasen a la distribución normal. A eso es a lo que se llama frecuencia esperada. Entonces, ahora está cómo hallar la frecuencia esperada. Entonces, para llegar a la frecuencia esperada, hay una serie de pasos. Lo que vamos a hacer con la prueba de cuadrados es comparar esta columna. Bien, entonces, para hallar la frecuencia esperada, nosotros lo que tenemos que hacer es hallar primero las puntuaciones típicas. ¿Las puntuaciones típicas de qué? Estamos trabajando, cuando trabajamos con este tipo de datos, estamos trabajando con escalas continuas. O sea... Entre el 10 y el 9 sí que hay puntuación, aunque aquí no figure ninguna puntuación. Entre el 9 y el 8 también hay, entre el 8 y el 7 también hay puntuaciones. O sea, es una escala... Entonces, lógicamente, si os acordáis, en todo intervalo hay un límite, límites aparentes y unos límites reales. No sé si os acordaréis. los límites aparentes son los que aparecen aquí el 10, el 9, el 8 el 7, los límites reales no, ¿por qué? porque entre estas dos puntuaciones entre estas dos siempre hay puntuaciones entonces uno que tuviera un 10 un 9.75 ¿dónde lo metimos? ¿en el 9 o en el 10? en ninguno entonces lo que hacemos es hallar el límite real que en este caso sería 9.5 entonces esta puntuación en una escala continua contendría todas las puntuaciones que van desde 9.5 hasta 10.5 por eso aquí ponemos es 10.5 el límite superior de 9 es 9.5 el de 8 es 8.5 así vamos entonces a continuación lo que hacemos es hallar la puntuación típica del límite superior es una puntuación típica Una puntuación típica es el número de desviaciones típicas que separan a una puntuación de la media. Como se halla, la puntuación típica será igual a la puntuación que yo tengo menos la media de todos los datos, entonces hago esa operación, hallo la media de todos los datos, la desviación típica y hallo las puntuaciones típicas. Entonces la puntuación típica que le corresponde a diez y medio es dos con cincuenta y cuatro. Yo tengo ocho y medio, uno con cincuenta y uno, yo tengo ocho cincuenta y cuatro. Bien, entonces nosotros tenemos unas puntuaciones típicas que serán dos con cincuenta y cuatro, dos con cero tres. ¿Vale? correspondientes a todo el resto de las puntuaciones de la tabla entonces nosotros lo que estamos hallando ahora es cuál sería la frecuencia de cada una de estas puntuaciones si realmente se distribuyeran como una distribución normal eso es lo que estamos hallando entonces una vez hallada la puntuación típica nosotros podemos hallar la proporción la proporción que corresponde a esa puntuación entonces para eso tendremos que recurrir a la tabla entonces nosotros lo que vamos a hallar son puntuaciones que hay por encima de 10 y medio puntuaciones que hay entre 9 y 10 y medio puntuaciones que hay entre 8 y medio y 9 y medio 8, 9, 10 puntuaciones que hay eso es lo que vamos a hallar el número de puntuaciones que hay de cada una de estas puntuaciones si realmente esas puntuaciones se distribuyeran como la curva normal como la distribución normal entonces para hallar esta proporción ¿qué es lo que tenemos que hacer? tenemos que buscar en la tabla de la distribución normal en primer lugar todas las puntuaciones que haya por encima de 10 ¿cómo hallaremos esa proporción? he dicho por encima de 10 porque sabía que cuando yo digo por encima de 10 induzco a una conclusión, si es por encima es lo mayor con el área una cosa es que la puntuación sea mayor y otra cosa es que el número de puntuaciones abarque solo este trozo o sea esta puntuación típica divide a la curva en dos partes una hacia abajo o sea todas las puntuaciones que estén por debajo de 10 y otra hacia arriba que son las puntuaciones que están por encima de 10 ¿cuál es la mayor y cuál es la menor? lo que miraremos en la curva será el área de la parte menor no os confundáis que la puntuación sea mayor con el área de la parte menor entonces el área de la parte menor si está bien el área 0,00 si está bien como estoy cogiéndolo directamente a la tabla No he mirado la tabla. No son de 0,055. A ver. A ver si se veía. Pues estará confundido, espero. Que esté confundido en la... 0,35. Yo la he copiado. Sería la unidad menos la probabilidad de obtener eso. O sea, la proporción de obtener 0,9945. Que sería 0,0055. Ay, perdón. He ido donde no debía. No sabes. Es que si lo borro, borro todo. Entonces, vamos a ver. Entonces lo que hallamos es para hallar todas estas partes. Vamos a ir hallando la proporción que corresponde a cada una. 2,54. ¿Cuántas puntuaciones? O sea, la proporción de puntuaciones que quedan por debajo de 10. Que es 0. O sea, sería el área de la parte mayor. ¿Cuántas puntuaciones quedan por debajo de 2,03? Por debajo de 1,51, 0, 9, 3, 4, 5. Por debajo de 0,99, 0, 83, 84. Seguiríamos una vez que llegamos. A puntuaciones que sean negativas. Entonces tomaremos el área de la parte menor. La parte menor estaría aquí y la parte mayor estaría por encima. Entonces, ahora lo que tenemos que hallar es... O sea, ya tenemos la proporción. Podríamos haberlo hallado de otra manera. proporción de la parte mayor, pero me da igual entonces el área ahora lo que tenemos que ir hallando son las proporciones las proporciones de cada una de las puntuaciones, mayores de 10 1 que es todo, menos 99 45 ahora es 0, 0,00 o sea la proporción de puntuaciones si la distribución que nosotros tenemos se ajustase a la distribución normal, sería 0,0055 entre 9 y 10 ¿qué haremos? pues restaremos a 0, 99 45 0, 0,97 0, 0,157 si no me he equivocado entonces la proporción de puntuaciones que hay entre 9 y 10 es de 0,057 la proporción que hay entre 8 y 9 sería 0, 97 0,88 menos 0, 93 45 0, esa sería la proporción de puntuaciones entre 8 y 9 entonces así seguimos saliendo todo el resto de proporciones una vez que tenemos las proporciones ya podemos saber cuál es la frecuencia esperada ¿cómo? multiplicando la proporción por el total es como un porcentaje esto sería el 4,43% eso suena más fácil pues es lo mismo primero hemos dividido por 100 y luego lo multiplicamos por el total es lo mismo, me da igual no hace falta hacerla primero transformarlo en porcentaje y luego volverlo a transformar en proporción entonces vamos multiplicando cada una de las proporciones por el total que son 2.814 y me saldrán las frecuencias esperadas y mayores de 10 como pone la tabla 15 con 48 entre 9 y 10 habría 44 entre 9 y 10 habría 44 con 48 había 124 con 66 entonces ya tenemos Por una parte, las frecuencias que nosotros tenemos en la distribución. Y por otra parte tenemos las frecuencias que tendríamos si realmente la distribución se ajusta a la curva normal. Entonces ahora, el eje cuadrado lo que hace es comparar estas frecuencias con estas frecuencias. Si no hay diferencia entre estas frecuencias y estas frecuencias, diremos que estos datos se ajustan a la distribución normal. Si hay diferencia entre estas dos frecuencias, dos columnas de frecuencias, entonces diremos que no se ajusta a la distribución normal. Esta es la fórmula del eje cuadrado. ¿Está más o menos claro ahora? ¿Hasta cuándo? Entonces ha quedado claro. Luego cuando veáis la grabación, hacéis la idea de que aquí hay un lío. Bien, a ver, alguna pregunta más. Antes de que se me olvide, ya se me ha olvidado al principio, bueno, veo que hay grupos que están trabajando, pero un aviso que os tengo que dar es que tengáis cuidado con las faltas de ortografía. Hay líneas en las cuales hay hasta dos y tres faltas de ortografía, pero de las que llaman la atención. A de haber sin H, eso lo he visto ya no sé cuántas veces. Ves por Vs y cosas de ese estilo. No hagáis como hacía un profesor mío, decía, no, no, la culpa es de la máquina. Máquina no, por lo menos pasarle la ortografía. Claro, hay algunas cosas que el ordenador nos va a corregir. El A sin H y el A con H le da igual, porque existen las dos, ¿no? Entonces, vamos. Os aviso porque me ha llamado la atención. O sea, bueno, no es una tilde que aún no se lo haya olvidado o cosas que pueden pasar, pero que haya faltas de ortografía repetidas y muy concentradas. No sé de quién son en este momento. No me he entretenido. Me he entretenido a mirarlo, pero podéis mirar vuestros propios. Los propios escritos. Bien, vamos a ir. Vamos a intentar ir rápido, porque lo que sí quiero es daros después una visión general. No vamos a ir viendo prueba a prueba de las pruebas estadísticas, sino en qué os tenéis que fijar para poder seleccionar una prueba estadística u otra. Porque al final las pruebas estadísticas las tenéis ahí. El formulario lo tenéis ahí. Bien, una cosa que tendréis que hacer, me imagino que ya lo habréis hecho más de uno, que es imprimiros el formulario, que lo vais a tener en un examen. Entonces, ahora no hay otro método. Bien, entonces lo que vamos a ver es cómo una parte de la estadística inferencial, eso está en la estimación de parámetros. Ya sé que me he saltado alguna cosa, como el muestreo y demás, pero bueno, no me puedo parar en todo. El capítulo 11 es algo que es fundamental en estadística, porque muchas veces parece magia. O sea, dices, bueno, si este valor es mayor que el que me dan las tablas, resulta que hay diferencias, y si es menor, no hay diferencias. Depende. Hay algunas pruebas donde es al revés. Si el valor es menor que el que me dan las tablas, hay diferencias, y si es mayor, no hay diferencias. Lo que quiero es que entendáis un poco en qué se basa todo eso. Entonces, partimos de lo que es una distribución muestral. No sé si dijimos algo, pero me parece que nos quedamos aquí la última vez, me parece. Entonces, una distribución muestral es una distribución teórica, que asigna una probabilidad a un... a cada uno de los valores de los estadísticos de todas las muestras que se puedan extraer de una población. Vamos a ver, ¿una población qué es? No sé si lo habéis estudiado o no. ¿Qué es una población? Un conjunto de elementos que tienen algo en común, tienen alguna característica en común. Por ejemplo, una población, y no es algo estático además, una población podría ser los 3.900 alumnos matriculados en el centro asociado de Pamplona. Esa es una población. Otra población podría ser todos los alumnos matriculados en la carrera de pedagogía. Esa es otra población distinta. Otra población podría ser todos los alumnos matriculados en estadística aplicada a la educación. Son distintas poblaciones. ¿Qué característica tienen? La primera que ha dicho que son personas que se han matriculado en el centro de Pamplona. La segunda, que se han matriculado en pedagogía. La tercera, que están matriculadas en esta asignatura. Bien. Entonces nosotros si tenemos una población, vamos a suponer que tenemos toda la población de los alumnos de la UNED, los 5.000 y pico que estéis matriculados en esta asignatura. Eso es una población. Eh. Nosotros de esa población y cuando trabajamos en estadística no manejamos toda la población. El 5.900 es relativamente abarcable, pero según que vayamos a hacer, no. Sino que seleccionamos una muestra. ¿Qué es una muestra? Una muestra es un subconjunto de una población. Y no un subconjunto cualquiera, sino, me imagino que lo habéis estudiado, un subconjunto representativo de esa población. Por ejemplo, si nosotros estamos intentando estudiar algún aspecto de todos los alumnos matriculados en estadística aplicada a la educación, vosotros no podéis ser una muestra de esa población. ¿Por qué? Porque no representáis a esa población. Únicamente los de Pamplona. Hay de Vergara, de La Coruña, de Tarrasa y de no sé dónde. Entonces, habría que seleccionar la muestra de una manera determinada. Normalmente se utiliza el azar y aleatoriamente se extrae la muestra y aparecerán personas que unos pertenecen a Pamplona, otros a Tarrasa, otros a Valencia y otros a no sé dónde. Sin embargo, cada vez que nosotros extraigamos una muestra de esa población estará compuesta por sujetos diferentes. Cuando extraemos al azar, aleatoriamente aparecen una serie de sujetos que componen la muestra. Si extraemos otra muestra, no va a estar formada por los mismos sujetos. Habrá algunos que coincidan y otros que no coincidan, pero normalmente sería dificilísimo que sucediese que coinciden exactamente los mismos. ¿Por qué? Porque en cada población nosotros podemos extraer infinitas muestras. De cada una de esas muestras, nosotros podemos extraer una media en la característica que estamos estudiando. estudiando, vamos a suponer el número de horas de estudio de cada uno entonces cada muestra tendrá una media distinta entonces con esas medias lo que nosotros me estoy refiriendo a las medias es un ejemplo porque puede ser otras estadísticas con esas medias lo que nosotros haremos podemos hacer otra distribución si yo tengo vamos a ver, yo tengo la muestra con una serie de sujetos, el sujeto 1, el 2 el 3 y obtienen una media una de 5 horas, otra de 2 entonces de aquí de esta muestra yo obtengo una media de la muestra 1 entonces si yo obtengo una muestra, 100 muestras o 20 muestras yo puedo poner la media de la muestra 1 la media de la muestra 2 la media de la muestra 3 la media de la muestra 4 la media de la muestra 5 y así sucesivamente hasta el final tengo otra distribución distinta. Aquí tenía una distribución de la muestra y aquí tengo una distribución de medias de muestras. Esto es una distribución muestral. Medias, en este caso, de todas las muestras posibles extraídas de la población. Si yo hallo la media de estas medias, ¿qué pensáis que me dará? ¿Qué resultado me dará? A la media de la población. A la media de la población. Bien, entonces partimos de ahí para ver cómo estimamos los parámetros. Nosotros no vamos a tener todo esto. No vamos a obtener 100 muestras o 200 o 500. Vamos a tener una. Y a partir de esta una, lo que nosotros queremos hacer con la inferencia es obtener esa media de la población. Eso es lo que pretendemos hacer. A partir de los resultados de una muestra, nosotros obtenemos una estimación de lo que es el parámetro. O sea, a partir de un estadístico obtenemos el parámetro. Bien. Por ejemplo, el ejemplo que he puesto del estadístico de la media aritmética, el valor de esa media va a depender de cada una de las muestras. En cada una de las muestras tendremos distinto valor. Y de cada muestra, o sea, de una población, nosotros podemos extraer un parámetro. las muestras del tamaño n, de un tamaño determinado que queramos. Entonces vemos que no siempre toma el mismo valor el estadístico, es todo lo que he ido diciendo. Vamos a suponer en un ejemplo una población formada por seis puntuaciones. La puntuación 1, la 2, la 3, la 4, la 5 y la 6. Bien, de esta población nosotros vamos a seleccionar aleatoriamente todas las muestras posibles de tamaño 2. Entonces estas serían todas las muestras posibles. Nosotros seleccionamos, por lo que he dicho con reposición, imaginaos que esto está metido en una bolsa, me saco el 1, vuelvo a sacar y me vuelve a salir el 1, porque yo lo he metido antes. Esa sería la primera muestra que tenemos aquí. O me puede salir un 1 y un 2, un 1 y un 3, un 1 y un 4. Estas serían todas las posibles muestras de tamaño 2 extraídas de esta población. Entonces tendríamos 36 posibles muestras, o sea no hay más posibilidades. Si lo intentáis, cuando lo veáis más despacio veréis que no hay más posibilidad de obtener ninguna otra muestra diferente a las que ya tenemos. Gracias. Bien, entonces lo que hacemos, veis que ha aparecido aquí una columna más, lo que hacemos es calcular la media de cada una de estas muestras. La media de esta primera muestra, que tenemos un 1 y un 1, la media será 1. La media entre 1 y 2 será 1,5. La media entre 1 y 3 será 2. 1 y 4 será 2,5. Y así sucesivamente. O sea, ahora tenemos ya tres columnas. El número de muestra, cuál es la muestra, la composición de la muestra y cuál es la media de esa muestra. Bien, entonces vemos que la probabilidad de obtener cualquiera de esas muestras es igual para todas. O sea, tenemos 36 muestras y de cada una tenemos una. O sea, la probabilidad de obtener un 1 y un 1, la muestra 1 y 1 será 1 partido por 36. 1 y 2. 1 partido por 36 y así sucesivamente. Todas tienen la misma probabilidad de ser obtenidas. Todas las muestras. Entonces, si hacemos un resumen, esto es la misma tabla anterior, si hacemos un resumen, vemos que... la probabilidad de obtener una media de 1, solamente hay un caso, que es este. O sea, la probabilidad será 1 partido por 36. La probabilidad de obtener 1 y medio, tenemos 2. Una que tenemos aquí, y otra aquí. El 1 y 2, y el 2 y el 1. Luego, la probabilidad de que obtengamos una media, al obtener la muestra, una media de 1 con 5, es 2 partido por 36. La probabilidad de obtener una media de 2, es 3 partido por 36. Aquí tenemos una, aquí tenemos otra, y aquí tenemos otra. Y así sucesivamente. O sea, esto es un resumen de todo esto. En lugar de poner el valor muestral, lo que ponemos es el valor de la media. Entonces vemos que las probabilidades son distintas, de obtener una media u otra. En función de los datos que nosotros tenemos. Bien, entonces, si seleccionamos aleatoriamente una muestra. ¿Habéis visto lo que pasa? Pero ahora vamos a suponer que nosotros seleccionamos una muestra de tamaño de la población formada por esos 6 números, 1, 2, 3, 4, 5 y 6. Lo más probable, ¿qué será? ¿Cuál es el valor más probable que podamos obtener? Ahí en la tabla. ¿Cuál es la mayor probabilidad? La mayor probabilidad de obtener una media la tiene 3,5. O sea, nosotros tenemos un... 3,5 es el valor más probable que nosotros podamos obtener. Eso no quiere decir que vaya a aparecer, pero es el valor más probable. Es 3,5, pues la probabilidad es 0,17, que es 6 entre 36, la probabilidad más alta. Y vemos que la media de la población resulta que coincide con 3,5. O sea, el número, la media cuya probabilidad es más alta cuando nosotros obtenemos una muestra coincide con la media de la población. Bien, vamos a ver. Ahora, la probabilidad de que se separe del verdadero valor de la media de la población en no más de medio punto, ¿cuánto sería? O sea, la media de la población sabemos que es 3,5. Ahora, nosotros queremos saber cuál es la probabilidad de obtener un valor que no se separe más de medio punto de esa media de la población. O sea, que esté comprendida entre 3,5... 3,5... y 2,5. Entonces tendremos 2,5, 3, 3,5, o sea la probabilidad sería 15 partido por 36. La suma de las probabilidades de obtener 2,5, 3 o 3,5. Entonces sería 0,47, o sea la suma de las probabilidades asociadas a los tres valores. Bien, entonces si ahora decimos la probabilidad de que un valor obtenido en una muestra no se separe de el valor de la media de la población en más de un punto, pues estará entre 2 y 4. Luego la probabilidad será la suma de las probabilidades de todas esas puntuaciones, o sea sea 0,67. Ahora voy más rápido porque ya hemos visto el razonamiento. Entonces la distribución muestral ¿qué nos da? La distribución muestral nos da la probabilidad asociada a cada uno de los valores del estadístico. Esta es la distribución muestral. Lo que he señalado, pero ya no está. Bien, este es el mismo. Si nosotros representamos gráficamente esta distribución, tenemos una representación rectangular. Todos tienen la misma probabilidad. Si nosotros, sin embargo, si representamos a la distribución muestral, tendrá esta representación. Entonces, ¿eso qué quiere decir? Esto es intuitivo, o sea, tiene demostraciones, pero bueno, es intuitivo. Lo que quiere decir que la distribución, aunque la distribución que nosotros tenemos sea una distribución rectangular, la distribución muestral se va ajustando o se va acercando a la distribución normal. Y eso pasa siempre, en este caso. Entonces, ¿qué es la estimación? La estimación de parámetros. Es la inferencia que nosotros realizamos de un estadístico a un parámetro. O sea, nosotros obtenemos una muestra y obtenemos un valor. Nosotros, es lo que he dicho antes también. De otra forma, a partir del estadístico, a partir del valor de la muestra, nosotros lo que queremos saber es el valor que esa característica tiene en la población. Eso es lo que está diciendo ahí. Bien, entonces, como supuestos está la representatividad de la muestra de la que hemos hablado. Y la inferencia se utiliza para estimar parámetros o para contrastar hipótesis. ¿Qué es esto? Estimar parámetros es lo que he estado diciendo hasta ahora. Es decir, si el valor de la media, en este caso, como ejemplo, de la muestra, coincide con el valor de la población. O si a partir... de el valor que tiene el estadístico en la muestra, yo puedo decir con una cierta seguridad o con una cierta inseguridad, como queréis llamarlo, puedo inferir el valor de la media de la población. Eso sería la estimación de parámetros. Me he referido a la media, pero puede ser la desviación típica, puede ser la mediana, puede ser cualquier estadístico. Y el contraste de hipótesis es lo que hemos hecho antes. Es decir, estos valores que nosotros tenemos, por referirme al ejemplo de la distribución normal que hemos hecho antes. Estos valores que nosotros tenemos en el ejemplo o en la distribución que tenemos se ajustan a la distribución normal o no. Entonces yo puedo plantear una hipótesis. Digo, los valores que yo tengo en mi distribución se ajustan a la distribución normal. Entonces el contraste de hipótesis es... Realizar una prueba estadística de manera que luego puedo decir yo si se ajustan o no se ajustan. Compruebo la hipótesis, verifico la hipótesis o no la verifico. Bien, bueno. Propiedades, la carencia de sesgo. A esto vamos a ir pasándolo rápido. La consistencia, lo veis y si tenéis alguna duda lo preguntáis. La eficiencia y la suficiencia. Una estimación puntual. Una estimación puntual es asignada... ...un valor al parámetro. O sea, si yo digo he obtenido una media de 5 en el ejemplo que he puesto antes en el número de... horas de estudio, luego la población tiene una media de 5 eso sería hacer una estimación puntual, asignar el mismo valor que yo tengo en la muestra se lo asigno a la población lo que pasa es que habitualmente, o sea normalmente no se hace esto porque nos podemos equivocar y estimación por intervalos la estimación por intervalos es atribuir al parámetro un rango de valores un rango de valores entre los cuales nosotros estamos suponiendo que va a estar el parámetro a partir del valor que yo obtengo en una muestra lo vamos a ver ahora, a partir del valor que yo obtengo en una muestra lo que hago es decir, la media de la población está entre este valor y este otro, y supongo que he acertado y realmente está ahí, con una determinada probabilidad ¿qué es el error muestral máximo? ¿qué es error muestral? el error muestral es la diferencia que hay entre el valor que obtengo yo en una muestra de una característica determinada y el valor real de la población, si yo obtengo en el ejemplo anterior una media de 5 en la muestra resulta que la población la media de la población es 7 el error muestral es 2 porque en mi muestra yo me he equivocado en 2 respecto de la población la distancia máxima etcétera, bueno, eso es lo de hoy ¿Qué son los límites confidenciales? Son los límites entre los cuales se va a encontrar el valor del parámetro con una determinada probabilidad. Se obtienen sumando y restando el error máximo al estadístico que hayamos obtenido. Bien, seguimos en la estimación por intervalos. Ahí faltará la última, que no la pasé, la última clave, si os acordáis la ponéis. Bien, aquí tenemos el mismo ejemplo. Vamos a suponer que seguimos trabajando con esta misma población y aquí está el resumo. La media en este caso era 3,5 y la desviación típica era 1,21. Entonces, el supuesto de que partimos es que el valor verdadero, a la hora de extraer una muestra, no se va a alejar del estimado en más de una determinada cantidad. Y entonces vamos a suponer que esa cantidad es una desviación típica. O sea, el verdadero valor, estamos suponiendo que el verdadero valor se encuentra entre el valor verdadero menos una desviación típica y el valor verdadero más una desviación típica. Eso es lo que estamos suponiendo. Entonces vamos a ver qué ocurre. O sea, estamos atribuyendo un rango de valores entre el límite inferior y el límite superior. Entonces, el intervalo confidencial es los valores comprendidos entre el límite inferior y el límite superior. Los límites confidenciales son el límite inferior y el límite superior. El error máximo, en este caso, que estamos dispuestos a admitir, no es mayor que un error típico, o sea, 1,21. Hemos dicho que no se va a alejar más de una desviación típica. Entonces, ¿cuál es la probabilidad de que nuestra estimación sea correcta? Si obtenemos la puntuación, las puntuaciones 1,1, o sea, la muestra 1,1, entonces, ¿qué ocurrirá? La medida aritmética vale 1. Por lo tanto, a partir de ahí, lo que estamos diciendo, el valor de la media en la población, está comprendido entre menos 0,79 y 2,21, porque hemos dicho que no se va a separar más de una desviación típica. Entonces, a 1, a la media 1, le restamos la desviación típica y le sumamos la desviación típica. Bien. Entonces, estimamos que está entre menos 0,79 y 2,21. Si obtenemos las puntuaciones 1,2 o 2,1, cualquiera de los dos, entonces, la media... la desviación típica será 1,5. Y, entonces, estaremos diciendo... Que el intervalo confidencial está entre 0.29 y 2.71. O sea, a partir de esas muestras nosotros estaríamos diciendo que el valor del parámetro está comprendido entre esos dos valores. Si la muestra que obtenemos es cualquiera de estas, 1, 4, 2, 3, 3, 2 o 4, 1, entonces la media es 2. 2.5, perdón. Es 2.5. Por lo tanto, lo que estaremos diciendo es que la media de la población está comprendida entre 1.29 y 3.71. Entonces, lo mismo podríamos hacer una... Bien, entonces, ¿aquí qué ha ocurrido? Aquí está la media de la población, en este caso. Ahí está la media de la población. ¿Incluye la media de la población? No. Luego, si nosotros obtenemos esta muestra y decimos que la media de la población está entre 0.79 y 2.21, nos estaremos equivocando porque no está. En este otro caso, la media de la población está incluida en el intervalo. Aquí tampoco está incluida en el intervalo. Luego con estos valores de la muestra tampoco lo incluiremos. ¿En este caso está incluido o no? En este caso sí nos incluye el valor de la muestra. Luego el valor del parámetro. Luego hemos acertado, luego ahí estaría el valor de la media de la población. Y lo mismo pasaría con todos estos. No vamos a hacerlos todos, pero lo mismo pasaría con todo esto. Entonces, ¿eso qué quiere decir? Que de las 36 muestras posibles, con 24 construimos intervalos correctos. O sea, construimos intervalos en los cuales sí está incluida la media de la población. Con 24 de las 36. 12 nos van a llevar a construir intervalos incorrectos. O sea, no vamos a equivocar. Por lo tanto, hay una probabilidad. De 0,67 de construir un intervalo correcto donde esté incluida la media de la población. O sea, tenemos una probabilidad de 0,67 de acertar con la media de la población. Con el intervalo dentro del cual, no con la media exactamente, porque no estamos haciendo una estimación puntual. Con el intervalo dentro del cual se incluye la media de la población en este caso. Y habrá una probabilidad de 0,33 de construir un intervalo que no capte. Al verdadero estadístico. Representado gráficamente, sería esto. O sea, nosotros teníamos 0,67 la probabilidad de que la media esté incluida. y 0.165 aquí al lado, o sea 0.33, de no incluirlo. Bien, entonces, el nivel de confianza, ¿a qué le llamamos nivel de confianza? A la probabilidad de que el intervalo construido incluya al verdadero valor del parámetro. Y el nivel de significación, o alfa, es la probabilidad de que el intervalo construido no incluya el valor verdadero del parámetro. Eso son decisiones que hay que tomar en todas las pruebas estadísticas. Bien, entonces, si en vez de haber dicho que se separe un error típico, decimos que se separe dos errores típicos, pues nos ocurriría esto, o sea, el proceso es exactamente el mismo. Entonces tendríamos 34 de las 34. 36 muestras nos permiten construir intervalos correctos y 2 nos llevarán a intervalos incorrectos. Por lo tanto, tendríamos una probabilidad de 0.94 de construir un intervalo correcto y 0.06 de construir un intervalo no correcto. Este 0.94 es el nivel de confianza y este 0.06 es el nivel de significación. 0.94, 0.03, 0.03. Bien. Lo dejamos. Lo dejamos aquí.