Bueno, alguna pregunta, algo que aclarar, está todo claro. Bien, voy a intentar hacer un resumen de cómo decidir qué tipo de prueba tenemos que utilizar en cada investigación o en cada problema. De todas maneras, en la guía del curso tenéis dos mapas conceptuales sobre la decisión de las pruebas, yo los he cargado aquí, pero vamos, lo tenéis en la, este no es este, esto lo tenéis en la guía, esto que aparece, y aún había otro, y este es otro que he cargado yo. Vamos a ver, hemos visto los dos últimos días en qué consistía la inferencia, en qué consistía la estimación. Si recordáis, atreveros. Después de un ejemplo que tenía nada más seis observaciones, seis números, hemos ido viendo cómo, al estar en una muestra, qué probabilidad tenemos nosotros de acertar en el ejemplo que poníamos la media de esa población. Entonces, en función de si nosotros admitíamos que se separase o una desviación típica o dos desviaciones típicas de la media, teníamos más probabilidad de acertarlo. Lógicamente, siempre refiriéndonos a la estimación por intervalos. Vamos a poner el, viéndola o sonará, ¿no? Entonces, aquí teníamos la probabilidad de acertar con la media, que en este caso, en el ejemplo, era tres y medio, si no se separaban más de dos errores típicos. Entonces, nosotros teníamos la probabilidad de acertar de cero noventa y cuatro, y la probabilidad de equivocarse. Y la probabilidad de equivocarnos de cero coma cero seis, cero coma cero tres por arriba y cero coma cero cuatro. Esto mismo, nosotros lo podemos utilizar para hallar los intervalos dentro de los cuales nosotros vamos a encontrar un valor determinado. Es lo mismo. Entonces, nosotros tendríamos o diríamos que la media está comprendida entre un límite inferior, que correspondería con una recta que pudiéramos marcar aquí, el límite inferior y el límite superior. O sea, nosotros diríamos la media, el intervalo confidencial, el intervalo en el cual se encuentra la media, me estoy refiriendo a la media porque es el ejemplo que he puesto, podía ser la varianza, podía ser una correlación, podía ser una proporción, podía ser cualquier cosa. Entonces, diríamos que está entre un valor que es un límite inferior y un valor que es el límite superior. Y ahora no recuerdo cuál era, si voy para atrás, la desviación típica era uno con veintiuno. Bien. Entonces, entonces, nosotros podemos, en este caso, en este ejemplo, podemos saber entre qué valores se va a encontrar la media. O sea, si yo obtengo una muestra y me da un determinado valor, si yo obtengo la muestra y obtengo una media, o sea, la media sería tres y media. Bien. En este ejemplo, en este ejemplo, si yo digo que la media no se separe más de... una desviación típica, sabíamos que la desviación típica era uno con veintiuno. La media era tres con cinco. Si nosotros decimos, si nosotros decimos que no nos separemos por poner el ejemplo del gráfico que hemos visto con un alfa igual a cero coma cero seis, acordaos de la imagen que hemos visto. Que ponía cero coma cero tres por arriba y cero coma cero tres por abajo. Entonces, yo lo que estoy diciendo es lo siguiente. Si yo tengo aquí la media que es tres coma cinco, y aquí tengo cero coma cero tres, pues lo tengo que dividir en las dos partes, entre lo superior y lo inferior. Entonces, con esa probabilidad, ¿qué es lo que tengo? Tendría que buscar... qué puntuación típica le corresponde a cero coma cero tres, para poder saber por qué. ¿Qué es una puntuación típica? Una puntuación típica es el número de desviaciones típicas que separan a una puntuación de la media. O la distancia a la media de una puntuación en medida en puntuaciones típicas. Entonces... Yo tengo aquí una puntuación típica determinada. Si la multiplico por las desviaciones típicas, obtendré la distancia que hay de aquí. La puntuación típica es igual a la puntuación que tengo menos la media, partido por la desviación. Entonces, la puntuación será igual a la media, más la puntuación típica que corresponda a esta probabilidad, multiplicada por la desviación típica. Ponéis una cara como diciendo esto, no sé a dónde vamos con esto. Vamos a ver. Si nosotros buscamos ahora en... La tabla de la curva normal, ¿qué puntuación típica le corresponde a 0,03? ¿Dónde...? En realidad es la puntuación... Sí, mira la figura. Respóndete tú misma. Responde a la probabilidad de 0,03. Esta pregunta... No va a coincidir. Exactamente es difícil que coincidan los números que hay ahí con los que hay en la tabla. Por ejemplo, si yo tengo aquí abajo, yo busco en la tabla. Ya vamos a verlo con un ejemplo real. Entonces, no sé si coger el de arriba o el de abajo. Ya lo vamos a ver con un ejemplo real y os diré cuál coger. Muchas veces es indiferente, pero bueno. En este caso, 0,03 le correspondería a una puntuación típica de... Aquí tenemos un ejemplo. 1,88 corresponde a 0,0301. Y... Si miramos en la siguiente, 1,89... 1,89 corresponde a 0,0294. Bien. Voy a explicar primero lo que... Entonces, 0,0301 estaría un poco más a la derecha... Un poco más a la derecha que la Z que hemos marcado, ¿no? Porque es una línea. La diezmilésima sería muy poco, pero vamos a ver. Una diezmilésima que está más a la derecha. Y, sin embargo, 0,0294 estaría más a la izquierda. ¿Eso qué quiere decir? Que si yo cojo 1,88, entonces disminuyo el margen de error. Mientras que si yo cojo 0,0294, aumento el margen de error. Entonces, ¿qué es mejor? Lógicamente, en una investigación... Aquí estamos haciendo directamente el problema. Pero en una investigación, inicialmente yo he elegido un margen de error. Un alfa. He elegido 0,06. Eso lo elijo previamente. No, no es porque a mí me lo digan. Siempre hay que elegir. Y, normalmente, en el área en que nosotros nos desenvolvemos se elige 0,01 o 0,05. No puedes elegir cualquier cosa. Puedes elegir. Pero bueno, ahora voy a explicar la segunda parte. Entonces, si yo disminuyo el error, tengo más probabilidad de acertar. Y si lo aumento, tengo más probabilidad de equivocarme. ¿Qué es mejor? Disminuir el error. Entonces, bueno, es muy poca la diferencia. ¿No? Entonces sería mejor coger el 1,88 que está en la tabla porque hace que disminuyamos la probabilidad de error. Bien, estamos haciendo en paralelo varias cosas. Al final ya veremos a ver dónde salimos. Entonces, lo que has preguntado... Entonces, tiene relación con alfa. Tiene relación con la probabilidad de... Yo cometo un error. ¿Qué es alfa? La probabilidad de cometer un error tipo 1. ¿Os suena? ¿Lo habéis leído en el libro? No sé. ¿Qué es la probabilidad? Un error tipo 1. Un error tipo 1 es rechazar la hipótesis nula cuando es verdadera. Entonces, esa probabilidad lo que me dice es la probabilidad que tengo yo de cometer ese error. O sea, decir... Si yo digo... No existen diferencias. O existen diferencias. Vamos a ver. En el rendimiento académico en función de la metodología que se use. Y tenemos dos metodologías. Entonces, yo... El error tipo 1 sería que en la realidad los resultados no se diferenciesen y yo aceptase la diferencia. O sea, rechazase la hipótesis nula cuando realmente la hipótesis nula es verdadera. O sea, aquí hay dos planos. El plano en el que yo estoy trabajando con las hipótesis. Y el plano de la realidad. A mí el que me interesa es saber lo que va a ocurrir en la realidad. O sea, si yo me equivoco pues no sé lo que hay en la realidad. Entonces... La probabilidad es decir... Yo rechazo la hipótesis nula y digo hay diferencias. ¿Cuándo? En la realidad no había. Ese es el error tipo 1. El error tipo 2 es el contrario. Bien. Entonces... ¿Cómo elegir esa probabilidad? Pues depende de las consecuencias que tenga... Las conclusiones que yo obtenga. Imaginaos... No en nuestro campo porque no suele tener excesivas consecuencias. Pero imaginaos que en medicina según lo que hagan... O sea, dicen sí que produce el efecto o no produce el efecto. O sea, es decir... Produce el efecto cuando no produce el efecto... Pues tiene consecuencias realmente graves. ¿No? Entonces la elección de... El nivel de significación depende de eso. O sea, de con qué estemos trabajando. Y que vaya a pasar después. Entonces según en qué cosas me tendré que permitir muy poca probabilidad de error. Porque si me equivoco va a tener unas consecuencias serias. Si no va a tener consecuencias tan serias... Y lo habitual en nuestro campo es que no tenga consecuencias tan serias... Pues bueno. 0,01 o 0,05. Más error normalmente no se... Y trabaja todo el mundo con ese... Con esos dos tipos. ¿Está más o menos clara? Más o menos. Luego ya sé que se os olvidará porque es un razonamiento muy... Que mezcla dos planos. El plano de la realidad y el plano de la teoría. Entonces... Pero bueno. Bien. Entonces... Aquí tenemos... Y nos quedamos con 1,88. ¿Y aquí qué tendría? ¿Aquí esta zeta? A1. Claro. Es lo mismo. Eso es. En valor absoluto. Pero con signo negativo. Bien. Entonces ya tenemos la puntuación. Entonces ahora sí que podemos obtener cuál es el valor... Que tendríamos aquí y aquí. Entonces aquí tendríamos... La media... Más... 1,88... Por 1,21. ¿Tiene alguien calculadora? Bueno. Tengo yo. Entonces esto nos daría... Entonces justo aquí tendríamos el límite superior. Y el límite superior sería 5... Ya todo el mundo dice dónde salimos. Le sumo a la media el error máximo que yo puedo cometer. Ese es el error máximo que yo puedo cometer. Y aquí... Pero estabas leyendo ahora la puntuación directa. Entonces yo voy a decir... Sin saber cuál era la media... Entre qué valores se va a encontrar esa media. O sea, yo a partir de una muestra... A partir de un resultado que yo he obtenido con 0,03... Digo, bueno, pues va a estar entre 5,77 y 1,23. Entonces yo diré que la media... O sea, el intervalo de confianza que os recomienda el libro como IC... Estará entre 3,5 más menos 2,27. O sea, el límite inferior será 1,23... Y el límite superior será 5,77. A ver... 3,5 menos 2,27... Y 3,5 menos 2,27... O sea, ese es el error... Lo que en el libro os llama error máximo. Lo hace que lo llame así. Que sería igual al error muestral, creo. No, error máximo. Eso no es error muestral. ¿Qué es el error muestral? Ojo con los errores que hay ahí... Os podéis confundir con muchas cosas. El error muestral es la diferencia que hay entre... Entre lo que yo encuentro... La diferencia entre la media, en este caso... La media que yo he encontrado... Y la media de la población. Pero en la estimación por intervalos, el error máximo es... Aquel error máximo que yo me permito cometer en función de alfa. Entonces yo digo que la media va a estar comprendida entre este valor y este otro. Joder, pero eso es un error muy grande. ¿A qué le llamas muy grande? Joder, pues si dices que el error va a ir de 0,03 negativo... O de menos 1,88 a más 1,88... No, el error va de 0,92 a 1,76. No, el error... Es igual, es lo mismo. Estás cogiendo casi toda la muestra, ¿no? La muestra no, ahora no estamos hablando de la muestra. Estamos hablando del valor de la media. De la media de la población. Es que hay varios niveles, o sea, tenéis que pararos a pensar mucho... Para distinguir bien los niveles en los que nos estamos desenvolviendo. Según lo que tú dices... Tú dices que la media de la población basta entre 1,23 y 5,77. Sí, en este caso. En este caso. En el caso que yo elija alfa 0,06. Y no es muy... Eso de 1,23 a 5,77 es una barbaridad. Si la media es 3,5 en la muestra... Aquí no hay ni grande ni pequeño. O sea, nosotros no hablamos nunca ni de grande, ni de poco, ni de mucho. No, pero de porcentaje, de lo más toda la... La curva normal abarca todo el... Si fuese la muestra, abarca toda la muestra, ¿no? Pero bueno, hay que tener en cuenta que estamos hablando de probabilidades. O sea, estamos en otro nivel. Entonces, yo tengo que saber cuáles son mis probabilidades de acertar y mis probabilidades de equivocar. Lógicamente. Cuanto menor sea la probabilidad de acertar, menor sea alfa, o nivel de significación, se llama de todas esas maneras. Lógicamente, mayor va a ser la amplitud. Más puntuaciones va a abarcar. Cuanto menor sea, lógicamente, menos puntuaciones va a abarcar. Y repito, eso va a depender en la investigación real. Aquí estamos haciendo un problema sin más en la investigación real. Va a depender de las consecuencias que pueda tener lo que yo haga. Si yo me equivoco y tiene consecuencias graves, lógicamente tendré que dejar muy poco margen de error. De hecho, en medicina se utiliza no 0,01, sino 0,0001 muchas veces. Según lo que hagan, resulta que a quien sea le pasa lo que le pasa. Entonces, lógicamente... Y en ese caso no son iguales, sino se diría, este medicamento no tiene ningún efecto, o este medicamento tiene efecto. Pero hablar de grande, de pequeño... Ya te digo, yo no suelo hablar de eso. Normalmente no se habla. Ya sé que cuando uno se acerca a esto al principio dice uff, esto es... bien. Entonces, la segunda parte. La segunda parte o la primera. Esta... Ah, el error máximo es igual a esta por la de aquí, que es esto. ¿Qué hemos hecho aquí? El error máximo es esto, gráficamente. Y como lo ha hecho multiplicando la puntuación típica por la desviación típica. Eso también lo tenéis en el libro. Yo he estado mirando ahí a ver cómo lo denominaban para no confundiros y le llaman error. Entonces, me parece que lo pone en algún sitio. Intervalo de confianza es igual al estadístico que sea más o menos el error máximo. Error máximo es igual a esta por esta. No coincide algún símbolo exactamente como lo yo los he puesto aquí. ... A ver... ¿Dónde voy a llamarlo? ... ¿Dónde? En la 267 ya no encuentro a dónde poner. ... ¿O extra? ... yo le llamaba siempre error máximo, pero bueno, además el error muestral me da igual. O sea, es la diferencia entre entre la realidad entre la realidad y la... O sea, en la estimación de intervalos por por intervalos es el error máximo que yo me permito. ¿Que eso es un error muestral? Lógicamente, en función de la muestra pues obtendré un error una cuantía del error u otra. Bien. ... Pero vamos, el error muestral como definición es la diferencia que hay entre el valor que yo obtengo y el valor de la población. En la estimación por intervalos sí es un error muestral, pero hay un error máximo que es el que yo me permito a través del nivel de significado. Pero bueno, ¿que es un error muestral? Sí. Bien. Entonces, todo esto entonces, ¿todo esto de dónde parte? O sea, esa desviación típica la desviación típica no es la desviación típica de la muestra que yo tengo. Acordaos de lo que era una distribución muestral que creo que lo dimos el último día Si nosotros obteníamos infinitas muestras nosotros podíamos obtener la media de cada una de las muestras. Y con esas medias nosotros podríamos hacer otra distribución. ¿Recordáis lo de esto? Entonces, esa es una distribución muestral de medias. Entonces, la media de esa distribución muestral sería la media de la población y la desviación típica de la distribución muestral es a lo que se llama error típico de la distribución muestra. Y entonces en cada... con cada estadístico ese error típico se halla de distinta manera. Para la media se halla de una manera para la desviación típica se halla de otra para la correlación de otra, etc. Por ejemplo en la página 229 tenéis el error típico de la distribución muestral de medias es la fórmula que aparece por ahí. En la 232 aparece el error típico de las proporciones. Vuelve a aparecer desde la media pero junto a él aparecen las proporciones. En la 233 aparece el error típico de estimación o el error típico de medida, perdón. En la 234 aparecerá... en la 234 aparece el error típico de estimación. En la 234 y 235 aparecen los errores típicos de la correlación. Y recordad ahí entonces en cada uno para cada estadístico el error típico se halla de distinta manera. El error típico no es ninguna equivocación sino es la desviación típica de la distribución muestral de medias o la distribución muestral de proporciones la distribución muestral de correlaciones, etc. Entonces eso es una desviación típica y se halla con las ecuaciones que aparecen ahí. Cada uno se halla de distinta manera. Entonces esa S que yo he señalado que sería la desviación típica es la desviación típica que aparece ahí en el caso de la media sería igual a la desviación típica o sea, yo tendría que tener la desviación típica de la muestra y el tamaño de la muestra entonces divido la desviación del tamaño de la muestra menos uno y tendré el error típico de la media y ese será el que utilizaré para obtener el intervalo de confianza no esta desviación típica y en todos los casos pasará lo mismo lo que pasa en cada uno lo hallaré de distinta manera ¿está más o menos claro? bien, entonces vamos a ver, en vez de meternos a ver cómo se decide qué tipo de prueba utilizar vamos a hablar algo del muestreo que es un muestreo creo que lo dijimos que es una muestra una una parte de la población que sea representativa de la población ¿qué es una población? un conjunto de elementos que tienen algo en común y la muestra es un subconjunto de la población representativo no cualquier subconjunto entonces tiene que cumplir esa cosa bien, entonces ¿qué es el muestreo? el procedimiento que utilizamos para extraer una muestra de una población bien, fundamentalmente hay dos tipos de muestreo no sé lo que es, fundamentalmente un muestreo aleatorio y un muestreo intencional lógicamente, si yo selecciono una muestra porque a mí me interesa seleccionar esa muestra esa muestra va a tener un sesgo o sea, los resultados que yo obtenga de esa muestra posiblemente puede que sí, pero posiblemente no van a ser representar a la población entonces, lo lógico a la hora de obtener una muestra es utilizar los métodos aleatorios o sea, seleccionar al azar todos los sujetos de la muestra respecto de la población creo que además puse algún ejemplo ahora estoy recordando y normalmente el azar lo que hace es que estén representadas todas las características de de la población dentro de la muestra o sea, es una especie de población en pequeño que lógicamente respecto de la característica que nosotros estamos estudiando no va a coincidir con los valores que tenga la población es lógico entonces habrá una parte una parte de error en los valores que yo obtenga bien dentro de los métodos de aleatorización o de obtención aleatoria de la muestra, no sé cuál es pone aquí no quisiera saltar bien, lógicamente cuanto mayor sea la muestra más fácil es que represente a la población conforme vayamos aumentando el tamaño de la muestra, más fácil será que represente a la población y más fácil será que los valores que nosotros obtengamos se acerquen a los valores que realmente pero claro, lógicamente tampoco tampoco es necesario aumentar tanto la muestra que coincida con la población entonces hay una serie de muestras una serie de me imagino que habréis corregido porque pone al revés justo la ecuación por una población finita o por alguna población infinita justo está al revés está confundido me imagino que lo habéis corregido me imagino que aparece si no lo habéis corregido, corregidlo bueno, en el formulario no sé si viene en la página 218 en el formulario me imagino que estará bien no lo he mirado no está bien porque fue una de las sí, en el formulario lo tenéis bien bien, entonces lo que normalmente lo primero que hay que hacer es aparte de primero tener clara cuál es la población a la hora de hacer la selección es ver cuál es el número de sujetos que lo va a componer mediante una ecuación de esas aparecen los números bien la E que representa aquí las fórmulas estas infinitas infinitas la E es el error ah, la E el error muestra lo error de estimación el error corresponde con la misma letra se están diciendo fijaos no, la E ahí es la proporción es el error de estimación la E sí, sí entonces sí sí que está equivocada esa frase la proporción de la característica es lo mismo es lo mismo dicho parece que son cosas distintas pero es lo mismo entonces si ahí dice que el error de estimación es un 3% acordaos cuando dicen encuestas hay un error de estimación y un nivel de significación hay dos cosas y en el error de estimación es el que yo digo la diferencia que puede haber entre lo que yo obtenga y la población dice es el 3% entonces esa E es eso esa E es eso bien lo que pasa es que no habla no habla de los tipos de muestreo yo si voy a meter aquí un algo no viene yo pensaba que venía porque hay distintos tipos de muestreo lo voy a decir muy rápido porque veo que no viene ahí o voy a mirar si pone encima aleatorio simple es aquel en que yo cojo y selecciono por por miro azar a todos los sujetos lo que tiene que cumplir cualquier muestreo aleatorio es que todos los sujetos que pertenecen a la población tengan la misma probabilidad de aparecer en la muestra eso es lo que tiene que cumplir que todos los sujetos tengan la misma probabilidad de ser obtenidos en la muestra entonces el aleatorio simple es coger y decir bueno pues con un ordenador le dices bueno búscame 200 sujetos aleatoriamente y salen los 200 sujetos aleatorio proporcional pues depende en función de lo que yo quiera pues a lo mejor me interesa que haya sujetos si yo me refiero a toda navarra pues que haya que sean proporcionales pues a los habitantes de cada zona entonces qué es lo que haré pues es lo mismo que el aleatorio simple pero luego la muestra será proporcional a la cantidad de habitantes que haya en cada zona la misma muestra pero distribuida de distinta manera otro muestreo es el muestreo por conglomerados el muestreo por conglomerados qué es elegir un grupo o sea de todos los grupos que yo pueda tener elegir grupos al azar y la muestra la compondrán todos los sujetos que formen esos grupos por ejemplo si yo estoy haciendo encuesta a toda navarra en toda navarra entonces entonces puedo seleccionar poblaciones enteras aquí sería muy difícil porque tanto pero bueno cuando no lo puedo subdividir de manera que sean bastante homogéneas y al final eso sería por conglomerado luego hay métodos mixtos que yo elijo el conglomerado y luego selecciono al azar los sujetos dentro de los conglomerados pueden ser por conglomerados al azar y proporcionales o sea puedo ir mezclando los conglomerados pero no todos esos tipos de muestras no os los toca nada más que sepáis que existe y el próximo día lo que haremos es ver cómo se decide porque eso sí que vais a tener posiblemente yo no sé cómo va a ser al final del examen sí que tendréis que saber pues se ha aplicado esta prueba y por qué se ha aplicado la prueba eso sí que os lo pueden preguntar entonces eso es lo que vamos a ver o sea cómo yo decido qué prueba aplicar en una investigación en qué me tengo que fijar para decidir esta prueba es la que tengo que aplicar porque no puedo aplicar cualquiera porque se me ha ocurrido porque me gusta más o porque es más fácil sí los últimos que es donde están todos no pero no lo vamos a ver la realización práctica sino ver cómo se decide porque eso sí que os van a preguntar seguro es decir y por qué se ha elegido esta prueba entonces bueno y por qué hay que saberlo es muy fácil es muy sencillo no tiene no tiene mucho misterio