Bueno, pues buenas tardes a todos. Vamos entonces a comenzar con las tutorías. El otro día hicimos un ejercicio rápido como introducción. Hoy vamos a empezar ya los temas formales. El primero es muy parecido a lo que vimos el otro día, por eso lo hago para barrer y hacer otro ejercicio. Cosas importantes que el otro día medio no dije o dije o no me acuerdo. El tema de los libros. Es muy importante el formulario. Ese es básico, tenéis que tenerlo porque es lo que os dejan llevar al examen básicamente. Cuidado porque están los de diseño, análisis de datos, psicometría, son todos iguales. Pero este tenéis que incluso creo que comprarlo. No estoy seguro, pero hay profesores que exigen que sea original. Yo creo que es el que compensa comprar. Los otros yo personalmente no los compraría. Ahora con lo que queráis, claro, por supuesto. Hay copias en la biblioteca, pero bueno, si buceáis un poquillo, por ahí aparecen. Entonces, como os decía, vamos a trabajar con PPTs en cada tema. Este es el primero. Al acabar os subo el PowerPoint, que tenía que haberlo subido antes, pero lo subo al acabar y luego también el link del vídeo para que veáis todo lo que queráis. Vamos allá. Entonces, cosas que pueden pasar. Cosas que pueden pasar son que en algún test nos preguntan cosas relacionadas con teoría o con aspectos más teóricos. Y una de ellas, normalmente yo en las presentaciones pongo lo que veo en los exámenes que pasa o lo que considero más importante los temas. Normalmente más lo primero que lo segundo porque yo le puedo dar importancia a algunas cosas que luego yo no examino. Por lo tanto, lo importante es que no se examina. Lo importante es el método científico, las fases. Yo creo que todo el mundo las conoce, pero básicamente definición del problema y deducción de hipótesis. Y luego a partir de ahí discutir y elaborar. Vamos a ver qué es el objetivo de esta asignatura y dónde se centra esta asignatura y dónde se centra la siguiente. Tenemos que ser capaces de diferenciar descriptiva de inferencial. Y son dos cosas muy diferentes. Cuando yo tengo un conjunto de datos, la descriptiva me saca la media, la mediana, la moda. Es decir, caracteriza o presenta los resultados. Es un poco el enfoque de esta asignatura. Y inferencial, soy capaz de predecir lo que va a pasar a partir de los datos que tengo. Un concepto que me viene muy bien para esta y para psicometría, si lo hacéis conmigo, pues algo que lleváis ganado es... Yo tengo una población, ¿vale? Y esto es un concepto un poco teórico que deberéis cuanto más lo asimileis mejor. Tengo una población, por ejemplo España. Y quiero saber la intención de voto del PP, del PSOE o de lo que sea. Ya no voy a entrar en partidos políticos. Entonces me saco una muestra. Le voy a encuestar a 50.000 personas o lo que sea. En el momento que tengo esa muestra, pues yo puedo describirla y obtengo lo que sacábamos el otro día. La media muestral y, por ejemplo, la varianza o la desviación típica. Hasta aquí es descriptiva. Describo lo que está pasando. En negro. En el momento que diga, oiga, en esta gente al PP lo vota el 35%, pues esto es... Digo PP, me da igual. Mis predicciones sobre la aprobación total a partir de la muestra. Eso ya es inferencia. Insisto, yo sé que decís, bueno, esto es una chorrada. No lo es, porque luego cuando avancemos dentro de 5 o 6 semanas es muy importante y en segundo más. ¿Por qué? Porque puedo tirar varias muestras. Puedo preguntarle a 50.000, puedo preguntarle a otros 20.000, puedo hacer casi lo que me dé la gana. Entonces, estos conceptos de descriptiva es describir la muestra. Inferencial, hago predicciones sobre la población total. Cuanto mejor nos quede esto, mejor que mejor. Seguimos para que al final podamos hacer algún ejercicio. Bueno, escalas de medidas. Completamente teórico, pero lo tenéis que saber. Yo creo que lo más importante es qué es una escala nominal, qué es una escala ordinal y qué es una escala intervalo. Esto es de las tres cosas más importantes. Evidentemente una característica, todo el mundo tenemos que saber lo que es, cuál es la modalidad, cuál es una medición. Esto es trivial. Pero sí que es importante diferenciar nominal, por ejemplo, mi ejemplo siempre es partidos políticos. ¿Por qué? Porque no hay un orden. Ordinal puede ser las notas de clase en el sentido de suspenso, aprobado, nombres que tienen un orden. Y escalas de intervalo son las escalas porque tienen cada número es una unidad de medición. Por ejemplo, podrían ser las propias notas de clase, pero numéricas. Esto es quizás lo más importante. ¿Por qué? Porque para cada uno de los tipos de variables o de escalas tendremos un gráfico u otro. Y esto nos lo preguntan bastantes veces. Y es lo que vamos a ver a continuación para después hacer un ejercicio. ¿Cómo califico todas esas variables? Pues parecido a lo que hemos hecho. Cualitativas si son una cualidad. Casi cuantitativas, esto es un invento de las personas que se dedican a esto, pero se llama ordinal en toda la vida. Y cuantitativas, cantidades. Muy fácil. Cuantitativas, números, palabras o cualquier cosa que no sean números. Cuantitativas, y si tienen un orden, ordinal. Están en el medio. Es muy sencillo, pero por favor no os olvidéis porque esto os lo preguntan muchas veces. Y la segunda clasificación que podemos hacer de variables es, imaginaos que yo quiero ver el peso en función de la altura. Pues evidentemente mi altura es lo que se llama independiente y mi peso es dependiente. ¿Por qué? Porque la quiero poner en relación de una altura. Si yo mido 1.90, ¿cuánto es tu peso asociado? Pues lo que sea. El peso depende de la altura. En este caso. A lo mejor no tiene mucho sentido, pero bueno, es lo que tenemos. Entonces, hemos visto ya clasificaciones de variables, vamos a ver unos cuantos gráficos y tiramos un ejercicio para que trabajemos todos y aprovechemos el tiempo. Cosas que vimos el otro día, que le ponemos el nombre ya que quieren ellos. Da igual, el nombre es lo de menos. Nadie os va a preguntar, yo os di un nombre que era muy parecido. Frecuencia absoluta. Acordaos, las notas de clase, cuántas veces aparece cada nota. N sub i. Frecuencia relativa, P sub i o proporción. Tengo un 25% de 5, un 4% de 7 o lo que sea. Si paso eso a porcentaje, es el porcentaje. No confundáis, para mí es lo mismo, pero hay que seguir lo que dice el que se examina, pues no pasa nada, lo seguimos. La frecuencia relativa está siempre entre 0 y 1, si lo paso a porcentaje está entre 0 y 7. Nada más. Frecuencia acumulada, voy acumulando las frecuencias, luego repasaremos un ejercicio. Y proporción acumulada. ¿Dónde buscábamos la mediana el otro día? Se trata de que participemos, porque si yo suelto el rollo esto es insuflible. ¿En qué columna buscábamos la frecuencia acumulada? Bueno, ya lo he dicho sin querer. La mediana, en la acumulada. La primero que pasaba, el 50%, por lo tanto en la frecuencia relativa acumulada. Y luego lo haremos. Y el ejercicio que os puse el día de la presentación sobre los percentiles, etc. Bien, tabla de frecuencias, ningún problema. Seguimos. ¿Cómo hacemos la distribución de frecuencias? Lo que vimos en el ejemplo, la variable cuantitativa, el número de hijos, no hay problema porque son muy pocos. En el momento que la cosa se dispara, hacemos intervalos. No tiene más. Es lo único que pongo aquí. Cuantos más intervalos hagamos, cuanto más anchos seamos, más groseros estamos siendo. Pero lo importante es que entendamos el concepto de que si tengo un montón de datos, los tengo que agrupar en forma de intervalos. Sin más. Y que mi representante será el punto medio del intervalo a la hora de hacer cálculos. Venga, voy rápidamente. Representaciones gráficas. También lo vimos. Ojo, la pregunta del millón. Diferencia entre el diagrama de barras y el siguiente que es el histograma. Diagrama de barras, acordado siempre. Partidos políticos. ¿Por qué? Porque las barras están separadas. No hay continuidad entre PP y PSOE. Cualquier otro, nada. Barras separadas. Diagrama de barras es separadas. En el eje podemos poner lo que nos dé la gana. Podemos poner MSUB, podemos poner PSUB, podemos poner cualquier cosa que nos permita diferenciar entre las escalas de uno y otro. Diagrama de sectores. Lo conocéis todos. Típico hombre-mujer. También partidos políticos. Solo variables cualitativas o cuasi-cuantitativas. Es decir, lo que no son números. No podría poner aquí notas de clase a no ser que lo ponga en categorías de aprobado, notable, sobresaliente, etc. Es bastante sentido común. Pero vosotros que estáis empezando con esto, apuntároslo. Pictograma. Os lo dejo por ahí porque a veces lo preguntan. Pero bueno, es simplemente hacer un dibujo. A mí lo que me importa es el histograma. Y me importa porque vosotros separáis las barras. Y separáis las barras significa cero. Eso es un carolo. El histograma son barras juntas. Algo tan sencillo como eso. ¿Por qué son juntas? Porque entre el 45 y el 46 no hay hueco. Típico para variables cuantitativas. Notas de clase, lo que queramos. Pero números. Ojo con las notas de clase porque obviamente puede ser visto como cuanti si pongo números o como cuali si pongo categorías. Es una variable dual. Voy muy rápido, pero si no me paráis. Es porque repaso lo del otro día. Diagrama de barras conjuntos. Si pongo varias series. Si manejáis un poquito de Excel esto es automático. Si lo veis enseguida, si no ya lo hacemos pero es muy fácil ir metiendo series. Diagrama de barras conjunto y quizás de los que más os cuesta ver, diagrama de dispersión. Imaginaos que yo cojo a 20 alumnos, a vosotros mismos, y os peso y os mido. Cruzo siempre dos variables cuantitativas. Quedados siempre con este ejemplo o con el que queráis. Pero que sean número y número. Entonces lo normal es que tenga cosas de este estilo. Este señor o señora pesa y mide esto. ¿Para qué se usa? Para ver relaciones entre las dos variables. Si os fijáis aquí hay como una nube, tal y como la he pintado. Hay una nube que relaciona el peso y la altura. A medida que aumento el peso, aumento la altura. Esto significa que evidentemente hay una relación lineal. Lo iremos viendo. Pero lo que buscamos es eso. Yo puedo trazar aquí una recta. Más o menos. Hay una ecuación, etc. Que para una persona que pese esto, puedo ser capaz de predecir cuánto mediría. Ese es el objetivo final del diagrama de dispersión. Vamos rápido. Por último, cosas que tenemos que ver hoy antes de hacer ejercicios. Normalmente yo en clase voy así. Voy 15-20 minutos a cañón para luego hacer ejercicio. Y esto es más que lo vimos el otro día. Tenemos una serie de datos. Quiero saber por dónde andan. Tendencia central. La media de mi clase es 5,5. Tengo una media de 6. Es decir, la mitad de la gente está por encima de 6. Tendencia central. O variabilidad. Mi clase está muy dispersa. Tengo mucha gente de 0, mucha gente de 10. O todo el mundo anda en torno a la media. La media de la clase es entre 5, 5 y 6. Y hay poquita desviación típica. Eso quiere decir que la clase es homogénea. Intentar llevarlo siempre a los ejemplos que vemos en clase. Y así os costará menos cuando lo tengáis que estudiar. Y por último, asimetría o sesgo. Que el otro día no lo vimos. Asimetría significa... Imaginaos que yo tengo mis notas de clase aquí. Estas son las barras. Y de repente caen aquí. Esto es muy asimétrico. Donde está la moda, que es el valor que más se repite, hay más a la derecha que a la izquierda. Es una característica, asimetría positiva, cuando la mayor gente está en la parte baja. Que lo echáis en vista. Vamos a hacer un ejercicio. Entre todos. Parecido al que vimos el otro día. Pero voy a compartir la pantalla un segundo para escribir en el pain que se escribe mejor. Los de casa, si tenéis alguna duda, avisar. Porque esto me pica. Esto lo pones en el chat. No sé qué quieres decir con el chat. No sé qué quieres que ponga. Ah, sí. En el foro. Los pongo en el foro. Sánchez. No sé quién eres. En el foro lo pongo, sí. No te preocupes. Venga, vamos allá. Vale, gracias, Esther. Perdón. Tenemos los siguientes datos. No importa la letra, lo que importa son los números. No os preocupéis. No es muy fácil escribir con este cacharro. El ejemplo es el mismo, pero distintos números para que todos tengamos los mismos. Y voy a ir haciendo preguntas. 2, 4, 6, 8, 10. Creo que van 14. 9. Perfecto. Entonces. A histograma con 4 barras. Moda. Percentil 80. Mediana. Media. No es muy fácil, de verdad. No tengo tan mala letra. Sí, puedo escribir con letra. No lo he pensado. También tienes razón. Gracias. Soy bastante tonto, sí. Gracias. Lo usaré ya todos los días. Ayer en todo el mundo no te he aprendido. Y varianza. Bueno, los números los tenéis. Vale, esto me lo voy a cargar. Dejarme cargar esto para que tenga más... Venga, pues vamos allá. Entonces. Nos piden 4 barras, por lo tanto estos datos los tengo que agrupar a la fuerza en 4 intervalos. Porque si quiero 4 barras, tengo que tener 4 intervalos. Entonces, los intervalos tenemos que ser siempre... Me dieron el libro de diseño. Eres tú. Sí, eres tú. Correcto. Eres tú. Deberíais ver un pain. Vale, perfecto. Entonces, tenemos 4 intervalos. ¿Cuál es el rango que tenemos? Aquí en las notas de clase es muy fácil, pero ¿cómo lo haríamos? Tengo que coger el máximo, que es 10. El mínimo, que es 0. Y entonces mi rango es 10 menos 0. Y esto es lo que he divido entre 4. Para coger 4 intervalos del mismo ancho. En principio en las notas todo el mundo sabe que son 2.5, pero no tendría por qué. Porque si a lo mejor no tuviera el 0, no tuviera el 1, no tiene sentido que empiecen los intervalos en el 0. Siempre cogemos el máximo y el mínimo y calculamos. Esto es lo que se llama el rango o la amplitud. Son diferentes nombres. El rango de... También es una medida de dispersión. Porque si yo tengo una clase que no hay 0, no hay 10 y todo el mundo está entre 4 y 6, pues mi clase es muy homogénea. Entonces empiezo. 0, 2,5. 2,5, 5. 5, 7,5. Y 7,5, 10. Perfecto. Y ahora tengo que construir. Mi n sub i, mi p sub i. Y mi... Ah, perdón. Mi n a. n a. Y mi p sub i. Perdón. Dime. ¿Porque los intervalos entre ellos... Sí. Esa es una buena pregunta. Como lo quieras hacer. Esto es lo estándar. Pero si aquí abres, aquí cierras. O al revés. ¿Por qué? Porque el 2,5 o está arriba o está abajo. Cerrado significa coges el extremo. Lo que no podría ser es el amarillo. Esto no puede ser. Porque si no el 2,5, si estuviera aquí, ¿dónde lo metes? Arriba o abajo. Siempre tienes que estar... Yo suelo hacer... Es el estándar en el libro también. Cerrado a izquierda y abierto a derecha. Porque es lo normal. Salvo el último. Si era lo que ibas a decir por ahí. Es corchete. Claro. Corchete es cerrado. Paréntesis es abierto. Corchete lo engancho. Paréntesis no lo engancho. Entonces si pusieras sería hasta 9,9999. Claro. Eso es. Pero no es correcto porque hay 10. Ya, ya, ya. Entonces, ahora es contar. Una vez que estáis... ¿No hacíamos valores? Teóricamente puede haber más, pero de hecho no. Porque aquí hay infinitos valores. Esto es un poco más profundo. Pero entre 7,5 y 10 hay infinitos valores. Entonces da igual que metas uno más o uno menos. Entonces contamos. Entre 0 y 2,5. Yo tengo este por aquí. Este, este. Y este. 4. Entre 2,5 y 5 tengo este. 5 no. Este. No hay un 4 por ahí. 2. 5. Este. Este. Este. 3. 4. 5. Y entre este, este. Este. Este. 4. Si lo he hecho bien tengo 15 que son los que había puesto antes. La suma da N. Sin ningún problema. Esther, ¿has vuelto y ves? ¿Ya ves el pain o no veis el pain? Esther. Perfecto. Vale. Genial. Vale. Peso B. Dividimos. ¿Me podéis hacer ahí la cuenta entre 4 y 15? Bueno, si no la hago yo aquí. Pero 4 entre 15. Aquí iba a poner 10 pero eran muy pocos. Y no es real. 0,27. Esto será la mitad. 0,13. 5. Esto es un tercio. 0,33. Y 4 es el 0,27. Si esto lo habéis hecho bien, 1. Si no lo habéis hecho bien, eso no puede sumar 1. Siempre intentar aunque no os lo pidan. Coño, si tenemos pequeñas comprobaciones, hagámoslas. Ahora, decisiones que tengo que tomar. ¿Necesito las acumuladas para hacer el histograma de barras? En principio no. No tendría por qué hacerlas. Pero que me pregunten esto me obliga a hacerlas. O que me pregunten esto. Que me pregunten cualquier medida de tendencia central que implica que divido la muestra en porcentajes. Si no, no las haría. De hecho, ya voy a contestar al apartado A y monto mi diagrama de barras sin ningún problema. Yo lo estoy haciendo a mano alzada. Vosotros tenéis libreta y tal. 4, 2, 5 y 4. 4, 2 y 5. Estoy poniendo aquí las m sub i. Me da exactamente igual lo que poner. Lo que busco es ver de una manera gráfica todos mis datos. Fijaos que este diagrama de barras me valdría aunque tuviese 3 millones de datos. ¿Y esto para qué sirve? Pues sirve para eso. De hecho, en la era de Big Data y todo lo que yo trabajo de inteligencia artificial y tal, hay un montón de datos. Necesito trabajar muchísimo en herramientas de visualización. Mi jefe o quien sea sabe perfectamente que tengo bastante gente aprobada del 5 para adelante en relación a los demás. De un golpe de vista, cosa que en el dato no lo tienes ni de broma porque tendrías que ver los datos. Venga, seguimos contestando. Apartado B. Moda. La moda es el valor que más se repite o el valor más frecuente. O lo que es lo mismo, el valor más probable. La moda en mi caso es el intervalo 5, 7, 5. ¿Por qué? Porque es la barra más alta, más que nada. Pero puedo tener varias modas, puedo tener ninguna. Si todas las barras son iguales, no tengo moda. Porque todo el mundo... Puedes responder con cualquiera de las dos cosas. Porque las dos cosas te dan la misma información. Esto es el intervalo y efectivamente si das aquí el punto medio es 6,25. 6,25 es lo que se llama la marca de clase. Luego veréis en el formulario. ¿Alguien tiene el formulario por aquí de análisis de datos? Es que yo me dieron el de diseño porque se han equivocado. Bueno, estamos en la página 2-3. Gracias. Estamos en la página 2-3 del formulario. Entonces la moda, sí, no hay problema. El problema viene después, que ahora es el que vamos. Entonces, ¿qué me piden? Percentiles, insisto, muy importante el concepto percentil porque me pueden preguntar de todo, que es lo que os pregunté en el ejercicio. Repito, el percentil 80 o el percentil P, vamos a poner un número que es más fácil, es la nota que deja a su izquierda el 80% de notas. Entonces en el ejercicio del otro día os preguntaba, oye, el 10% de las mejores notas lleva beca. El 10% de las mejores y dime la nota de córdobe. El 10% de las mejores notas está aquí. Entonces es el punto que deja a la derecha el 10%. Por lo tanto, es el punto que deja a la izquierda el 90. Entonces yo lo que os pedía era el percentil 90 sin preguntaros. Y eso es lo que os van a hacer, de hecho. Entonces es muy importante que pilléis ese concepto de qué dejas a izquierdas y qué dejas a derechas. El percentil 80 sería la nota de corte del 80% de los tíos que tienen la peor nota o el 20% que tienen la mejor. Es un punto que va a andar por aquí, que es el que vamos a calcular. Andará por aquí. Que a la izquierda deja el 80% y a la derecha deja el 20%. Y normalmente os lo van a preguntar como os lo dije yo el otro día. Entonces vamos allá y decimos, vale, c. Para calcular cuando he llegado al 80 tengo que acumular. 4 más 2, 6 más 5, 11 y el último 15. Y aquí no se suma nada, claro, porque estoy acumulando. Si lo hago porcentualmente, lo mismo. 0.27, 0.4 0.73 y 1. Voy acumulando cada vez el anterior. Cualquier cosa, pararme. Yo hablo mucho, pero... Pararme. Entonces, lo primero que digo es mi percentil 80 está, que este es el símbolo de pertenencia, o podéis poner está con letra, da igual. Alguien no te clava. Porque pregunté yo 80. Porque puse yo el percentil 80, pero podéis poner el percentil que os dé la gana. El percentil 28, el percentil que queráis. De 0 a 100, obviamente. Yo he puesto aquí el 80. Vale, nada más. Entonces ¿dónde sé que está? Tengo que buscar aquí el primero que lo pasa. El primero que lo pasa es el último intervalo. Entonces yo sé que está entre 7.5 y 10. Y esta es la diferencia de la moda que preguntabais antes por ahí atrás. No me basta con llegar a esto. Si vais al formulario, que es una de las cosas más importantes que tenéis que hacer, que es leer el formulario, porque si no luego os perdéis. En la página 3 está la fórmula del percentil, el que sea. Déjame la copiar, por fa. Con la misma letra. La fórmula, a ver si soy capaz de ponerla para que la entendáis. Es Pk. Es importante que la leáis vosotros. Li. Por eso quiero que traigáis el formulario cuanto antes. Li n por k partido de 100 menos nd. Esto no lo voy a hacer nunca. Traer el formulario, por favor. Por i. Y ahora dice. Luego te lo paso. Estoy copiando tal cual. No hay misterios. Página 3 índices de posición, percentiles. Y ahora tenemos que saber quién es quién. Pero es que es leer. Tenéis mucho pánico a las fórmulas, pero de verdad que solo es leer. Dice Li. El límite inferior exacto del intervalo crítico. El intervalo crítico es donde estoy. Donde está el percentil. En este caso, 7,5. Donde estoy. El siguiente. N. El número de observaciones. 15. No lo digo yo. Estoy leyendo. Para que no penséis que yo me saco de las chisteras. K. El percentil que estoy produciendo. Pk. P80. 80. Nd. La frecuencia absoluta acumulada por debajo del intervalo crítico. La frecuencia absoluta acumulada por debajo del intervalo crítico. El intervalo crítico es este. Frecuencia absoluta acumulada por debajo. 11. Y Nc. Frecuencia absoluta del intervalo crítico. Perdón, perdón. 5. Ah, no. Sí, sí. Perfecto. Frecuencia absoluta del intervalo crítico. 4. Y. Amplitud del intervalo. 2,5. Sí, sí. Magia potagia. Pero no es difícil. Por eso es muy importante que desde el primer día cojáis el formulario. Porque es muchas cosas que dejáis de estudiar. Conseguirlo. Instruirlo. Entonces, repito. Rápidamente para los que están por ahí fuera o para los de aquí. Límite inferior del... El intervalo crítico quiere decir el intervalo donde estoy. Por eso este proceso es el más importante. Que encuadréis bien en qué intervalo está el percentil que estáis buscando. Porque si no lo encuadráis bien, estáis jodidos. Límite inferior. Bueno, lo que hemos dicho. Número total. El percentil que estoy buscando. El 80. Es un dificult... Ya. Ya lo sé. Ya. Por eso estoy aquí. Para intentar echaros una mano. Pero es importante que lo hagáis con el formulario delante. Porque el límite... Lo único que tenéis que aprender es qué es el intervalo crítico. El intervalo crítico es donde está el elemento que estoy buscando. 7,5 a 10. Y el resto ya es de... Límite inferior. Número de observaciones. Percentil. Frecuencia absoluta acumulada. Por eso el otro día, el primer día de clase, hago tanto hincapié con esto. Cuáles son los nombres y qué significa absoluto, relativo, acumulado o no. Si echamos cuentas aquí. Si alguien lo dice y me lo dice. Fantástico. Si no, no pasa nada porque el numerito es lo de menos. Lo que no puede ser es que me dé 6. Es decir, que me dé fuera del intervalo. Eso es que está mal. Habéis hecho algo mal. Seguro. ¿Vale? Perfecto. Gracias. 8,125 Genial. Pues yo ya me lo creé. Porque está ahí dentro del intervalo. Si metéis un número mal casi seguro que os salga del intervalo. Y eso os va a servir para comprobar. ¿Vale? Entonces, insisto. ¿Qué significa esto? Porque es como nos lo van a preguntar. Significa que a partir del 8,125 están los alumnos que tienen el 20% de las mejores notas. ¿Vale? Esa sería la nota de corte del 20% de las mejores notas. O la máxima nota del 80% de los alumnos más malos. Como lo queráis ver. Pero que deja el 80% a la izquierda y el 20% a la derecha. Sigo. Entonces, percentil 80, apartado C. Listo. A fuera, B fuera, C fuera. Mediana. La mediana es un valor característico. ¿Vale? Cuando no están agrupados tenéis ahí la fórmula que está chupada. Es contar el número de datos y dividir entre dos. No tiene más misterio. ¿Vale? Pero cuando están agrupados que va a ser lo que os va a pasar. Lo que tenéis que tener claro es que la mediana ¿Quién es? Pues es el percentil 50. Porque es el tío que parte a la mitad. O otra cosa que también podemos ver es el segundo cuartil. Los cuartiles son los que parten en cuartos. 25, 50, 75, etc. O el quinto decil. Todo esto es lo mismo. Es el mismo numerito. Pero si os aprendéis los nombres es muy fácil decir que es. Coño, divides en décimos. Cuartil en cuartos. Percentil en lo que te dé la gana. En cientos, pues el porcentaje que quieras. Y mediana en medios. Todas esas 4 letras son lo mismo. La mediana. ¿Dónde estaría la mediana? ¿En cuál es el intervalo crítico de la mediana? No me sé ningún nombre así que no me hagáis sacar voluntarios. En el 5 y 5,5. Eso es. Perfecto. 5 y 7,5. ¿Por qué? Porque busco en los porcentajes acumulados y el primero que pasa, lo voy a poner, ya no me quedan muchos colores en morado, es este señor. Entonces el intervalo crítico es el intervalo que le corresponde. ¿Vale? Morado. ¿Y ahora qué haríamos? No puedo dejarlo así. Metería la formulita que es la misma que esta pero en vez de un K un 50. ¿Por qué? Porque también es un percentil. No intentéis aprenderos fórmulas y fórmulas como bellacos porque es absurdo. Muchas están relacionadas. La mediana tiene su propia fórmula pero es igual que la otra. Solo que con K igual a 50. Porque es el percentil 50, sin más. Y lo que veis. Lo dejáis ahí para resolver. Esto no es lo más importante. El numerito es importante pero ahora mismo no. ¿Entonces se podría decir que la mediana el percentil no es? Sí, la mediana es un percentil. El percentil 50. Y es un cuartil. El cuartil 2. Y es un decil. El decil 5. Igual que el Q3 es el percentil 75. ¿Por qué? Y muchas veces os diréis, joder, ¿cuántas cosas hay? Todas son las mismas. Por eso que si sabéis los percentiles, sabéis todas las demás. Porque el percentil divide en 100 y lo otro son casos particulares. Entonces la mediana, listo. Voy a borrar por aquí. Esto. Seguimos. Estoy en la E. La media. La media es el valor representativo por excelencia. Es x barra y muchas veces os diréis, joder, a veces divides por n, a veces no. Bueno, ahora lo voy a explicar, que el otro día surgió la duda. Es sumar todos los intervalos de clase por las veces que aparece y divido entre el total. Anda por el libro también. El C sub i es la marca de clase. Es que yo no puedo multiplicar un intervalo por nada. Tengo que multiplicar un número. Esto no deberíais poder equivocaros. C sub i es la marca de clase. La voy a poner aquí a la izquierda. C sub i, pues aquí será el 1.25. Aquí es el 3.75. Si me equivoco de decirme, ¿no? 6.25, el punto medio del intervalo. Y 8.75. No se ve muy bien, pero vamos, es el punto medio. Vale. Esta fórmula de aquí es exactamente igual que esta. Bueno, por cierto, la sigma de esta letra griega, que muchos conocéis la letra griega, es sumar. Sumar desde 1 hasta todo. C sub i por P sub i. Y ya no he dividido por n. En función de lo que tenga, me viene bien una cosa u otra. Pero las dos fórmulas son lo mismo. C sub i por P sub i o C sub i por n sub i y partido todos. ¿Por qué? Porque fijaos que cada P sub i que tenía aquí ya era 4 entre 15. O 2 entre 15. O 5 entre 15. Entonces esto me da igual. Hacerlo como queráis. Lo importante es que entendáis lo que estoy haciendo. La media de clase será gente que tiene entre 0 y 2, 5, por 4 veces. Más 2 que había, por 5, por 4, dividido entre el total. Bueno, ¿alguien puede hacer esto, por fa? Para que quede completa la media. Es muy fácil, es 1.25 por 0.27. 3.25 más por 0.13. Y así sumar es 4 tirones. ¿What? ¿Qué es el 5? La media de mi clase es un 5.25. Y con eso, es un dato más. Cosa que ya medio sabíamos con el diagrama de barras. Porque si os fijáis las barras más o menos estaban equilibradas del 5 al no. ¿En el programa? ¿El diagrama de barras? No, no, no. ¿El de barras? No. ¿Eso? ¿Pones 2, 4, 5? Da igual. O sea, lo que tengas, si tú lo pones ahí, da igual. No, no, pongo esto. Pongo esta coluna. Faltaría un 3 y medio, imagínate. No, no, no. Solo pones la altura de la barra que tengas. O sea, si quieres ponerlo, puede ser, pero no es necesario. Vale. Borramos aquí y seguimos. Y por último, F. Muy importante la varianza porque a vosotros os parece una medida absurda y es quizás la más importante y es ¿Esta clase la representa el 5.25 o no? Yo puedo decir que mi clase es de 5.25 que es su media o no. Pues lo será en función de mucha gente está cerca de 5.25 O si tengo 10 ceros y 10 cincos, o sea, 10 ceros y 10 dieces, tengo una media de 5. Y no representa esa clase ni de la otra. Pues la varianza es un poquito más complicada. Pero también se hace, no hay ningún problema. Es C sub i menos la media al cuadrado por N sub i partido de N. Es decir, lo que se desvía cada punto de la media por el número de veces que ha pasado. ¿Qué os parece? Lo empiezo a hacer, eh, para que veáis lo que es. Entonces, por ejemplo, sería 1.25, que es la primera marca de clase que tengo aquí menos la media que acabo de calcular, 5.25 al cuadrado. ¿Por qué al cuadrado? Porque las diferencias que son muy pequeñitas al cuadrado se hacen más pequeñitas. Y las que son grandes se hacen más grandes. Además de que las negativas se convierten en positivas. Por eso es al cuadrado. Por 4 veces, que es las veces que tenía este intervalo. Y sigo sumando. Más, bueno, ya pongo aquí había más. Y la última sería 8.75 menos 5.25 por otro 4 veces ponía aquí un cuadrado, y todo esto dividido entre 15 que es la N. Insisto, lo voy a poner así con colores aunque queda un poco chasullado. 1.25 va aquí este 4 va aquí y así con todos. Puse el primero y el último para que se vea. ¿Tenéis la varianza por ahí? No, vale. Pues nada, lo quedé. ¿Vale? Lo único que nos faltaría sería y ya lo dejamos para completar todo. Es muy fácil a la hora que practiquéis y ya lo tenéis. Oh, me ha tocado. 7.53, gracias. Así queda completo. Y así ya me da pie a decir lo que me falta. 7.53 Porque no había hecho que se lo crea. Ya que yo lo he hecho, vamos a confiar en que está bien. Muchas veces nos pueden preguntar en vez de la varianza, y esto es lo importante, vamos a suponer que tendríamos un apartado G la desviación típica. Es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de 7.53 ¿Alguien tiene el calculador ahí por favor? 2.73 Vale. Y entonces esto me da información que es me desvío de media respecto de la media 2.74 unidades. Es decir, mi aula, que su media es un 5.25 está más o menos 3 unidades a izquierda y a derecha. A izquierda y a derecha, esto no tiene signo. Más o menos esa es la idea intuitiva de desviación típica. Entonces, claro, si a mí me ponen un ejercicio pues usted tiene una clase de media 5 y desviación típica 4 y otra de media 5 y desviación típica 1, pues yo me quedo con estos. Porque son más homogéneos. Todos están en torno a su media. Y de hecho es una prueba que hacéis vosotros muchas veces cuando hacéis un test psicotécnico bueno, psicotécnico, psicológico, perdón. Si los resultados están muy dispersos, mal asunto. Porque quiere decir que el test quizás no está bien orientado al constructo que queréis calcular. Bueno, esa es de la asignatura de segundo. Vale, perfecto. Pues esto ya hemos barrido toda la parte descriptiva. Practicar, practicar, practicar. Esta asignatura va rápido. No va súper rápido, pero va rápido. ¿Dudas? ¿Alguna duda? Yo creo que por ahora es sencillo. Pero no lo dejéis, eh. No lo dejéis porque esto va mal. Bueno, pues nada más. Gracias, chicos. Nos vemos la semana que viene. La clase anterior no está subida porque no funciona el ordenador. Aquí está la grabación. Pero aquí no sale el año pasado. No.