y los datos pueden venir en frecuencia, pueden venir de muchas formas una forma genérica de hablar bueno, ¿se me oye bien? muy bien, lo que se ve en la pantalla de la cámara no importa a la pizarra bueno, pues vamos a seguir con el tema 3 ¿vale? ¿alguna duda en online del tema 3? sí, voy ¿qué duda hay? ¿carmona? sobre el diagrama de caja vale, pues lo vamos, ¿vale? diagrama de caja, ¿alguna otra duda del tema 3? siempre pregunto al principio de los temas, si habéis tenido alguna duda para poner más ¿sabes? ubicar más tiempo a esa parte bueno, como sabéis el tema 3 trata sobre variabilidad variabilidad hace referencia a la dispersión de los datos es decir, si los datos están muy ocupados o muy dispersos había dos formas comentábamos la semana pasada ya, ¿no? de ver los índices estadísticos que miren la variabilidad no se entiende mucho, ¿qué es lo que no se entiende mucho? ¿lo que hablo o que tienes alguna duda? ¿Rodríguez? se escucha muy raro pues, no sé ¿y ahora se me escucha mejor? no sé ¿vale? bueno Bueno, lo siento, no sé qué hacer. Tiene que salir. Pasadito, ya. Muchas gracias. A ver, ¿se me escucha así mejor? Sí, muchas gracias. Era la cámara. Yo aquí estoy dándole al micrófono. Ahora se ve y se escucha mejor. Vale, pues nada, pues gracias. ¿Cómo te llamas? Paco, me han movido la cámara y él le ha dicho... Y una compañera, ¿cómo te llamas? María José. Ha apoyado en la logística del lapicito. La información técnica de su cuerpo. Bueno, pues nada, ahora sí, ya sí, vale. Básicamente la variabilidad, si os fijáis, se basa en dos principios. Uno que es ver un poco cómo las puntuaciones están muy agrupadas, quiere decir que están todas cerca de un determinado punto o se diferencian entre sí, que para eso tenéis los índices de amplitud total, rango o amplitud semi-intercuartil, ¿vale? Y después la más típica es esta que tenéis aquí, la de la varianza y la deviación típica, que es la distancia de cada puntuación con respecto al punto central. Bueno, rápidamente, esto lo vimos el otro día, ¿no? La amplitud es la diferencia entre el valor máximo y el valor mínimo. Recordad siempre, si os dan los datos sin agrupar, el dato es, ¿no? Pues si yo os pregunto la edad y tengo el listado de cada una de vuestras edades, si la persona más joven debe ser de 19 años, la que tiene más edad 55. Y los datos no están agrupados, no están agrupados en el intérvalo, pues claro, es 55 menos 19. Pero si los datos los dan agrupados en el intérvalo, recordad que tenéis que traducirlo en límites exactos, ¿sí? Sumarle más o menos 0.5, normalmente es de unidad en unidad, porque si no os sale uno menos, recordad eso, ¿vale? Bueno, después tenéis el siguiente índice, así como básico, bueno, también además de la diferencia, ¿no? Además de la diferencia entre el valor máximo y el valor mínimo, que es el rango, también tenéis los que se basan en la varianza y la deviación típica. Antes que este, bueno, pues se planteaba la diferencia como medida de dispersión de cada puntuación menos la media. Claro, como ya sabéis, ¿no? Por la propiedad de la media, si yo a cada puntuación le resto la media y la sumo, pues da cero. Entonces, por eso es por lo que la deviación media, ¿veis? Es el sumatorio de cada puntuación menos la media en valores absolutos, sin tener en cuenta el signo, ¿no? Dividido por n. Por eso es la deviación, cada puntuación menos la media, partido, ¿eh? Eso es la desviación, cuánto de distancia hay del dato a la media, partido por el número de casos para sacar el número de desviaciones medias que hay. Lo que pasa es que trabajar en valores absolutos, sin tener en cuenta el signo, pues después era difícil la interpretación. De ahí vino el tema de la varianza y la deviación típica, ¿vale? Es decir, esta es la medida básica de variabilidad que se suele utilizar, que lo que sucede es que, como veis, la varianza es un conjunto de n puntuaciones de la variable x denotada como s cuadrado de x. Esto que yo os estoy diciendo, como siempre os comento, no lo tenéis que saber de memoria. Tenéis que siempre trabajar con el formulario. Si veis, lo único que voy haciendo es avanzando por las fórmulas que tenéis en la página 4 del tema 3. Veis la varianza, el sumatorio de cada puntuación menos la media al cuadrado partido por n. O también tenéis la otra fórmula que tenéis debajo. Aquí no hay problema. Obviamente se le va al cuadrado por el mismo motivo del valor absoluto de la desviación media, para que no se anulen los datos. Porque el sumatorio de cada puntuación menos la media es 0. Pero ¿qué pasaba? Igual, la varianza, trabajar con datos al cuadrado es complicado. Si hablamos del peso, la edad, la personalidad, cualquier variable. Después, el resultado que te da, si es... Está al cuadrado. Si hablamos de peso, pues sería el peso al cuadrado, etcétera. Entonces, por eso es por lo que se plantea la desviación típica, que es lo mismo, pero con la raíz cuadrada. Bueno, esto que tenéis aquí son las otras fórmulas de la varianza. Simplemente cuando... Que son las mismas que tenéis en el libro, ¿sí? Veis que podéis tener... Os podéis basar en puntuaciones, si os fijáis, en frecuencias, en frecuencias relativas o en frecuencias absolutas. Cualquiera de estas fórmulas podéis aplicar y siempre vais a obtener el mismo resultado, ¿vale? Bueno, comentaba que no se trabajaba en valores absolutos por la interpretación, pero al elevarlo al cuadrado también está ignorando el signo. Sí, por eso después, claro, lo que hace es trabajar con la desviación típica que intenta trabajar en la unidad de medida, que es igual, pero eliminando el signo. Entonces, normalmente lo que se suele trabajar es con la desviación típica, que esta fórmula es la misma que tenéis aquí, ¿vale? Bueno, las propiedades de la base. La desviación típica, ¿qué sucede? Que para poderlas calcular, ¿sí? Obviamente, si es el sumatorio de cada puntuación menos la media, necesitáis todos los datos. Si os faltan datos no lo podéis calcular. Necesitáis la media, es decir, que se puede usar cuando es posible calcular la media, es decir, que tienen que cumplirse las condiciones de poder calcular la media. Recordáis que hay una serie de condiciones para poder obtenerla. La media, que los datos fueran simétricos, tener todos los datos, no tener intervalos abiertos, ¿sí? Que no hubiera simetría hacia un lado o hacia otro, ¿sí? Obviamente, bueno, siempre tener en cuenta que el dato son índices que te van a dar siempre iguales o mayores que cero, ¿sí? Bueno, y las propiedades que tenéis aquí que son así como muy básicas. Si en una variable tú le sumas o le restas una constante, pues nada, si tú restas y sumas, tú restas o sumas una constante a esa variable, si le haces la varianza a la deviación típica te va a salir igual, no cambia. Pero sí, hombre, si la multiplicas y los valores de la variable los multiplicas por una constante, la varianza, la que te dé, quedará, lo de antes, quedará multiplicada por esa constante al cuadrado y la deviación típica, obviamente, por esa constante pero sin elevarla al cuadrado. Bueno, esto simplemente por si os lo preguntáis en teoría, os lo menciono. ¿Os presentan esta formulita aquí de la cuasi-varianza? Bueno, ya lo veréis en segundo. Cuando trabajé un poco, me introducían a lo que es la inferencia estadística. Inferencia estadística es tú trabajas con una muestra y quieres inferir sobre la población. Pues hay una serie de estadísticos que son buenos estimadores del valor en la población. Bueno, pues de la media poblacional está bien usar la media en la muestra, pero de la varianza poblacional es un buen estimador en la cuasi-varianza. Que como veis… Es lo mismo que la varianza, que lo tenéis en la página 5 del formulario, pero ahora, igual que antes, es el sumatorio de cada puntuación menos la media al cuadrado, pero ahora lo dividís por n-1. De igual forma… La cuasi-deviación típica es igual, pero es con la raíz cuadrada. Esta es la forma de referirse a la cuasi-deviación típica, o en este caso es la cuasi-varianza. Aquí sobra, aquí no debería estar cuadrado, este cuadrado sobra. Esto es un error. No sé de dónde sacado, porque si me ajusto siempre me he equivocado. Bueno, esta es la fórmula de la cuasi-deviación típica. ¿Vale? ¿Ok? ¿Sí? En el libro también sale el cuadrado. No, si os veía la fórmula de la... Voy a ver, esta la he sacado ahí. Llámame y salva. Si quieres. Mira, si te vas a dar el formulario, ¿sí? Te das cuenta aquí, este simbolito es de la cuasi-varianza. ¿Sí? ¿Lo ves que está al cuadrado? Que es igual que este, ¿ves? ¿Sí? Obviamente, si tú lo que estás dentro de la cuasi-varianza, ¿no? Si tú aquí le haces una raíz cuadrada, ya no es la cuasi-varianza, no es igual a esto. ¿Sí? Sí, sería la... Tienes que quitarle el cuadrado de aquí y ya sería la cuasi-deviación. ¿Vale? ¿Duda hasta aquí? No, ¿no? Sigo. El coeficiente de variación. Esto es algo que preguntan con relativa frecuencia. No sé si habéis visto ya exámenes. Y es porque, por ejemplo, tenéis dos grupos, ¿no? Se trata de un índice de... Tiene un índice de variabilidad relativa. ¿Vale? Es decir, que no depende de la unidad de medida. Imagínate, si tú comparas dos conjuntos de puntuaciones obtenidas en una misma variable, tú dices la variabilidad, estudias la variabilidad. Si tú quieres estudiar si los datos de esa variable en un grupo varían más o menos, directamente no puedes calcular las deviaciones típicas. Tienes que tener en cuenta también la media con respecto al grupo. El ejemplo típico es, si yo comparo la variabilidad del peso de las mariposas con el peso de los elefantes, pues hay más variabilidad en el peso de los elefantes si solo te fijas en la deviación típica. Si lo tienes en cuenta con respecto a la media, pues ya lo haces relativo. El ejemplo que tenéis en el libro es este. Tú tienes un grupo que presenta una media de 11,5 en ansiedad y tiene una deviación típica de 6,9. Y otro grupo presenta una media de ansiedad de 7,5 y una deviación típica de 5,36. Si se os pregunta, a ver, ¿qué grupo presenta más variabilidad? Pues el grupo, ¿no? Hay uno que tiene 5,36 y otro tiene 6,9. Entonces, el de 6,9 tiene más variabilidad. No puedes hacer eso, no puedes calcular directamente las deviaciones típicas. Tienes que utilizar esta fórmula que tenéis aquí, que es el coeficiente de variación. Que es la desviación típica partida por la media multiplicado por 100. Entonces, el coeficiente de variación del grupo 1, ¿sí? Bueno, es decir, 6,9 dividido entre 11. Este que tenéis aquí, si el coeficiente de... Esto no lo tenéis que saber, ¿no? Si el coeficiente de variación es la desviación típica partida por la media multiplicado por 100, pues en el grupo 1, ¿cuál es? La desviación típica es 6,9 partido por la media, que es 11,5 multiplicado por 100. Esto aproximadamente es 60. Y en el otro, igual, si hacéis la misma cuenta, en el grupo 2, ¿qué sería? La desviación típica es 5,36 dividido... Entre su media, ¿sí? 5,36 dividido entre su media, que es 75 por 100, aproximadamente, es 69. Si os dais cuenta, ¿sí? El coeficiente de variación del grupo 2 es mayor que el del 1. ¿Por qué? Porque si os fijáis, ¿sí? La media del grupo 1... No, ¿sí? Es más grande que la media del grupo 2, ¿sí? Entonces, con respecto a la media, la variabilidad, lo multiplicas por 100... ... Y bueno, pues te sale que el grupo 2 tiene un 69% de variabilidad en comparación con el grupo 1 que tiene un 60%. Estas son las preguntas típicas de examen, suelen preguntar por el coeficiente de variación. Bueno, lo siguiente que tenéis es interesante la amplitud intercuartil o rango intercuartil y la amplitud semi-intercuartil. Estos serían los índices de variabilidad que tenéis que aplicar cuando no podéis obtener la media o la varianza, porque si no podéis calcular la media, ¿sí? Por las razones que ya... ...hemos dicho, ¿no? Pues entonces hay que calcular la amplitud intercuartil o rango intercuartil o amplitud semi-intercuartil. Depende de lo que os pidan, ¿no? Depende de lo que os den. Y recordad, igual que cuando en la media no podéis calcular la media, pues bueno, pues entonces puedo calcular la mediana, ¿sí? Pues aquí igual, si no puedes calcular la varianza o deviación típica, puedes calcular este. Un error típico que se suele cometer es... ...te preguntan por el rango intercuartil y normalmente tú directamente no te fijas y haces el rango semi-intercuartil, que es una cosa del rango, que es la diferencia que hay entre el Q3 y el Q1 y ya, simplemente, que simplemente hay que estar informando del... 50% de los datos centrales, porque es el 75% menos el 25%, 50%, ¿sí? Pero en cambio el semi-intercuartil lo que te sale es la media, ¿no? Un poco dividido por dos, ¿vale? Entonces es la mitad, ¿vale? ¿Dudas? Si os fijáis, lo que voy siguiendo es las fórmulas que están en el formulario, ¿sí? Por eso os tenéis que habituar a usar el formulario. Lo siguiente que tenéis son las medidas de los índices de asimetría, ¿eh? Sabéis que la asimetría era, ¿no? Si los datos presentaban una distribución, ¿sí? Más o menos simétrica. Simétrica quiere decir que si yo lo grafico de una manera intuitiva, si tú graficas los datos y divides la gráfica por la mitad, simétrico para el... Simétrico simétrico. Sería que yo plegase la gráfica y se solapara, ¿no? Pues ahí un poco... Esos son los índices con respecto a la asimetría, ¿no? Este es el típico, ¿no? El índice de asimetría. El índice de Pearson que tenéis aquí, ¿veis? Que es la media. La moda a partir de la división típica. Recordad, lo típico... El típico error que se comete aquí es... Recordad, ¿no? La curva es asimétrica negativa, pero los datos están... ¿No? Agrupado hacia la derecha. Y la curva es asimétrica positiva y los datos están agrupados... Con respecto a la izquierda, ¿por qué? Porque si recordáis, y aquí lo veis en la fórmula, el índice de asimetría de Pearson depende de la media, si la media es mayor o menor que la moda, ¿vale? Entonces, fijaros, ¿no? En el de asimetría negativa, la moda es más alta que la media, y en el de asimetría negativa, la media es más baja que la moda, por eso es negativo, y en la asimetría positiva, la media es más alta, está aquí, que la moda. Esto recordad que lo vimos en el tema 1. Y aquí tenéis un poco las formulitas, ¿vale? Obviamente, si os da cero, que esto no lo vamos, esto prácticamente yo no lo he visto nunca, un índice en datos reales, índice de asimetría de cero es, sí que coincide media-media de moda, está todo perfectamente centrado. Normalmente eso ya es en las distribuciones teóricas, ¿no? En la distribución normal, en la distribución, en este de Student, que ya veréis un poco más adelante, ¿vale? Más o menos, ¿estáis enterando de algo? ¿No? ¿Puedes volver a lo anterior o a lo anterior de la gráfica? Aquí, a lo de un grito. Sí. Es que yo estoy diciendo que la moda, cuando estoy usando la asimetría hacia la izquierda, que la media efectivamente es más baja que la moda, pero luego en el otro pasa exactamente lo mismo, la media sigue siendo más baja que la moda. No, se supone que aquí está la media y aquí está la moda. Luego la moda sigue siendo más grande que la media. No, no, se supone que este valor, sí, si esto es un eje... este valor es más alto bueno, bueno, muy bien vosotros preguntad si no sabemos la respuesta pues ya estudiamos eso es un tema importante que tenéis que tener cuidado puede que no lo sepas no pasa nada en Estados Unidos si tú dices que sabes y después no sabes ya estás desfenestrado para el resto de tu vida profesionalmente entonces si sabes, sabes y aquí no tengo claro bueno, asimetría también hay otro índice que es el índice de asimetría de Fitch el índice de asimetría de Fitch es igual pero si os dais cuenta la fórmula es distinta un poco os pueden pedir que calculeis este índice normalmente estos índices no nos suelen pedir que los calculeis porque es un poco tedioso en su cálculo pero sí que os piden la interpretación que sepáis siempre que si el índice de asimetría es cero quiere decir que es simétrica la distribución si es mayor que cero tenéis una asimetría positiva y si es menor que cero pues una asimetría negativa y además ya sabéis que es negativo o positivo en función de si la media es menor o mayor que la mola ¿vale? no dudas, ¿no? bueno, pues ahora el otro índice que tenéis es simétrico es el de la curtosis ¿no? la curtosis es el apuntamiento de la curva ¿vale? si recordé este aquí lo veis más claro como de apuntada está la curva claro si todos los datos están en torno a la media pues va a ser no va a estar muy apuntada sí sí está muy disperso con respecto al punto central va a estar no aplanada y si esta mitad y mitad pues se supone que no está apuntada ni está aplanada ni en meseta si está apuntada sería leptocúrtica y si está aplanada platicúrtica y si está en término medio sería mesocúrtica la fórmula es si es cero si la fórmula de la curtosis si al aplicarla se os da cero eso quiere decir que es un mesocúrtica si es mayor que cero sería leptocúrtica y si es menor que cero platitud vale eso es lo que se dice y que se suele preguntar vale ok de hecho aquí un poco tenéis la diferencia en la simetría en frente al apuntamiento de isla asimetría hace referencia así los datos son simétricos con respecto a un eje y la curtosis apuntamientos de referencias y los datos están más o menos agrupados con respecto al punto central muy bien ahora viene el diagrama de cajas que habían preguntado por aquí bueno la idea del diagrama de caja sobre todo es ver si hay algún porque se denina no no Este valor es un valor extraño, outlier, ¿no? Es decir, un valor que sale fuera de. Pensad que, eso porque es interesante saberlo, porque si tú calculas la media y la media es el sumatorio de cada una de las puntuaciones, la dispersión de cada puntuación con respecto a la media, si hay una puntuación que está muy lejos, eso te sesga un poco la representación. Igual que después ya veréis en el siguiente, cuando veáis la regresión, ¿no? Las restas de regresión. Bueno, el diagrama de caja y bigote, lo primero que tenéis que saber es que la manera de representarlo es, por ejemplo, esto aquí he puesto. Lo primero se representa, tenéis el Q1, ¿sí? El 25%. Y el... Y el Q3, el 75%, ¿vale? Hay una línea recta, representáis una línea recta en el Q3 y en el Q1, ¿vale? Y desde ahí, pues ya, ¿no? Hacéis una caja. Después ponéis una línea en medio que es la mediana, que obviamente, como ya sabéis, la mediana representa el 50% de los datos, ¿sí? O sea, está este valor, pues hacia abajo, ¿no? Estaría el 50%, hacia arriba estaría el restante 50%. La distancia, como ya sabéis, ¿no? Pues la fórmula que vimos antes, entre el Q3 y el Q1 es la amplitud intercuartil, ¿no? Q3 menos Q1. Y lo que te da también el diagrama de caja y bigote es que te dice cuáles son los extremos dentro de tus datos, dentro de tu distribución, para saber si hay algún valor atípico, ¿no? O layer, o valor, ¿sí? O valor extremo. Y esos límites vienen dados por la formulita esta que tenía aquí, ¿veis? Límite superior y límite inferior. Bueno, pues se trata del límite superior y el límite inferior. El límite superior es el Q3, ¿sí? Más la amplitud intercuartil multiplicado por 1,5 y el límite inferior es el Q1 menos la amplitud intercuartil multiplicado por 1,5. La gente que trabaja en análisis experimental del comportamiento, ¿no? Que trabaja... En laboratorio con animales, ¿no? Con ratas, palomas, peces, murciélagos, distintos primates. Utilizan mucho este tipo de gráficos. Fundamentalmente son la gente que trabaja en experimentación con animales, ¿vale? El ejemplo que tenéis en el libro es este, ¿no? Dibuje... ¿Lo veis? Dibuja el diagrama de caja de la variable ansiedad a los exámenes. Tenéis grupo 1 o grupo 2, ¿vale? Grupo 1 o grupo 2. Pues ya te lo dan, ¿no? Pero la puntuación máxima y la mínima no tienen por qué coincidir con los límites superior e inferior, ¿correcto? La puntuación máxima y la mínima, si te das cuenta, para tú calcular el diagrama de... Me preguntan, ¿no? Estoy leyendo la pregunta que me hacen. ¿Le das cuenta? El valor máximo del intervalo no tiene por qué coincidir con el valor, ¿no? Con el valor más alto o el valor más bajo de tus datos, ¿no? Lo que te da el diagrama de caja y bigote es este valor, ¿vale? Lo vemos ahora en un ejemplo, ¿eh? Por ejemplo, ¿no? Aquí estábamos viendo. Fíjate aquí tiene, ¿no? El grupo 1 dice tiene el percentil, ¿no? 25, el 50, el percentil 75. Pues tú primero, ¿no? Calculas la amplitud intercuartil que es 10, ¿no? Q3 menos Q5, Q1, ¿sí? 15,5 menos 5,5, 10. La puntuación máxima en tu distribución es 30 y la mínima 3, ¿vale? Pero bueno, no importa. Después tú calculas el límite superior, digamos, de los bigotes, ¿no? Por eso se llama diagrama de caja y bigote porque supone que esta línea que tienes aquí, ¿no? Se supone que esto es un bigote, ¿vale? Aquí está un bigote un poco, ¿no? Asimétrico, si os dais cuenta, ¿no? Que te va dando un poco, dice, está, tiene el bigote un poco más largo por un lado, ¿no? Pues un poco eso es lo que intenta representar, que hay un cierto, ¿eh? Una más acumulación de datos hacia un lado que hacia otro. Pero bueno, desde ahí tú calculas el límite superior y el límite inferior, ¿sí? Que son los extremos de los bigotes. Límite superior, Q3 más amplitud intercuartil por 1,5. Límite inferior igual, ¿no? Q1 menos amplitud intercuartil por 1,5. y desde ahí tienes los valores entonces igual haces con el otro el otro grupo y veis en la fórmula aplicando las fórmulas con estos datos si das cuenta claro tú tienes en los extremos dentro de los cuales está tu distribución pero aquí tú ves que no hay ningún puntito no ningún circulito porque no hay ningún valor extremo más o menos todos entran dentro que serían si el rango posible de variabilidad se observa aquí que hay más variabilidad en los datos superiores y se observa que hay menos variabilidad en los datos inferiores eso para lo que te sirve si tuviera una caja una línea con la media la mediana justo en medios y con la misma longitud con los dos extremos el superior y el inferior pues sería que no tenéis una distribución bastante simétrica así y si te sirve para ver si hay más o menos variabilidad por encima por debajo de la mediana y sobre todo para identificar a un daño cuando tú dices porque es importante lo de el valor atípico porque después cuando tú vas a hacer los análisis de datos tienes que hacer los análisis de datos incluyendo el aula jet y también quitando el aula jet porque imagínate no estás haciendo una comparación de grupos escolares y a lo mejor tiene dos casos que son muy extremos muy bajos y el resto pues está por en la media por encima de la media Pero al tener dos casos que son muy bajos, pues baja mucho la media de la ejecución de ese grupo y a lo mejor el grupo está bien. Lo único que pasa es que hay dos casos en concreto que son un poco distintos. Hay que ver, es un elemento de análisis. Vamos a ver a estos niños, a estas niñas, qué es lo que les pasa, si estaban malitos, si no hicieron bien las pruebas, si realmente son distintos con respecto al grupo. Pero sobre todo, que como la estadística hace un análisis global de los datos, si estás introduciendo un elemento muy extraño o dos elementos muy distintos con respecto a los demás, te va a sesgar los resultados. Esa es la información. Fundamental que te da el diagrama de cajas y bigotes. Box and whiskers. ¿Dudas? ¿De dónde sale el 1,5 de la fórmula? ¿De finito y superior? En la fórmula, sinceramente no sé este 1,5. Siempre lo ponen esto. Siempre así. Si te vas al libro, te das cuenta. Si te das cuenta, en la página 5, yo creo que tiene una explicación, ¿sabes? Porque esto está... Esto hacen simulaciones y después se estima cuál es la constante que es más homogénea a la hora de establecer los límites en cuanto a la variabilidad. Pero yo, sinceramente, no sé exactamente a qué se debe el 1,5 exactamente. Ese valor, estoy prácticamente seguro que por lo... Pues hacen un procedimiento que llaman bootstrap, que es... Procedimientos de simulación Monte Carlo. Los bigotes representan los límites calculados y eso me confunde un poco. Claro, los bigotes representan los límites a partir de los cuales si hay algún dato que está por encima del límite superior o algún dato que está por debajo del límite inferior, quiere decir que los datos de esas personas son atípicos. ¿Y para qué quieres saber que son atípicos? Pues quieres saber que son atípicos para no hacer un análisis conjunto de todos los datos, incluyendo datos atípicos. Se ha parado el sonido. Vale, bueno, los extremos de los bigotes es para saber si los datos son atípicos. Si tiene algún dato que esté por encima del límite superior o algún dato por debajo del límite inferior, quiere decir que ese valor es atípico y se tiene que analizar. Hay que tratar de forma distinta, ¿vale? ¿Sigo? No tiene por qué. Tienes que ver el caso, ¿sabes? Yo lo analizaría como yo lo haría. La lógica es eliminarlo, ¿vale? Pero no es eliminarlo y ya está, sino analizar por qué. Porque a lo mejor lo que sucede no es que sea un outlier, sino que ha sido un error tipográfico. Entonces te das cuenta que cuando te introdujiste en... ...el dato, lo habías introducido mal. Entonces, ¿sí? Normalmente lo que se hace es no se incluye en el análisis. Pero realmente lo que hay que hacer es estudiar ese dato porque es distinto. Sí, hay una duda por ahí al fondo, sí. Sí. No, no, uno solo. En este caso, ¿ves? Como el límite superior del segundo grupo estaba en... ¿En cuánto? En 18,3, ¿sí? Como el valor máximo, la puntuación máxima que había en ese grupo es 22, es en este punto. ¿Ves? Dos puntos. Un punto, un punto por persona. Por cada valor se pone el punto. Sobre todo porque, claro, pensad que vosotros vais a ser psicólogos, psicólogas, ¿sí? El estudio del comportamiento del individuo, que también puede ser en el grupo, pero es importante el individuo. ¿Sigo? Sí. Bueno, lo siguiente que viene a cotización son las puntuaciones típicas. Las puntuaciones típicas, como os comenté, yo no sé si lo recordáis, básicamente los datos los pueden presentar de tres formas. Puntuación directa, ¿sí? Y el dato que yo registro, si yo paso un test de personalidad, a ver si soy extrovertido o introvertido, pues cada uno de vosotros tendrá un nivel de personalidad. Esto es puntuación directa. Puntuación diferencial es cada una de vuestras puntuaciones menos la media del grupo. Y puntuación típica, si os fijáis, la puntuación típica es... La puntuación de cada una, de cada persona. ¿Veis? Y menos la media partido por la desviación típica. Entonces, eso es algo que tenéis que tener en cuenta en el examen, si lo tenéis que hacer, ver exactamente si estás dando información en condición directa, diferencial o típica. Porque a lo mejor te preguntan en directa y te dan los datos en típico, te dan los datos en típico y te preguntan en directa. Entonces, tenéis que tener en cuenta si tenéis que hacer o no una transformación, ¿vale? Obviamente, la media de las puntuaciones diferenciales es cero, ¿sí? Y la varianza de las puntuaciones diferenciales es igual. A la varianza de las puntuaciones directas, ¿vale? Las puntuaciones típicas a lo que hace referencia es a una puntuación diferencial partido por la desviación típica. Muchas veces en el examen a lo mejor te dan la puntuación diferencial, ¿sí? Y te piden la típica. Si te están dando la puntuación diferencial, te están dando el numerador de la fórmula de la zeta, ¿sí? Como puntuaciones, como las puntuaciones... Las puntuaciones típicas, ¿qué son? Pues es la puntuación directa, ¿no? La que sea, x sub i menos la media partido, ¿sí? Por la desviación típica de la variable x. Hay veces que te informan de la puntuación diferencial. y tú te pones a buscar tiene la media, la puntuación diferencial y tú dices, bueno, pero si no sé el dato no sé cuál es el número me están pidiendo cuál es la puntuación típica de un valor claro, porque este ya es el numerador el numerador es la puntuación diferencial ¿lo veis? ¿sí? bueno es importante si os fijáis aquí para qué se usa, esto es muy típico para ganar redundancia las puntuaciones típicas son muy típicas ¿por qué? porque te permite no sólo comparar las puntuaciones de un sujeto en dos variables distintas sino también comparar dos sujetos distintos en dos pruebas o variables distintas, al tipificar al tipificar estamos utilizando una escala común donde podemos comparar a las distintas personas ¿vale? tipificar lo que dice aquí el proceso de tipificación o puntuaciones típicas es simplemente a cada puntuación de cada uno de vosotros de cada uno de vosotros, el resto de la media lo divido por la desviación típica la puntuación típica si os fijáis, lo que pone aquí en rojito indica, ¿qué indica? el número de desviaciones típicas que se aparta la media de la media de una determinada puntuación en definitiva es un poco como una media ¿no? porque es cuánto se aparta, ¿no? una puntuación con respecto a la media pero en vez de dividirlo, lo divide por la desviación típica ¿sí? Entonces, el número de deviaciones típicas en una puntuación se aparta de su media. Entonces, lo que sucede con esto es que refleja las relaciones entre las puntuaciones independientemente de la unidad de medida. Eso me sirve si yo tengo dos puntuaciones, por ejemplo, ¿no? Algo típico que se hace, ¿no? Te hace un test de inteligencia a uno y a otro y dice, ah, yo soy más listo que tú, ¿no? Pues lo suyo es tipificar la puntuación, ¿no? No es directamente comparable. Entonces, tú tienes el valor del test de inteligencia tipificado menos la media en el grupo partido de la deviación típica. Entonces, ya sabes dónde te encuentras con respecto a una misma escala. Esto es importante, ¿vale? Las puntuaciones típicas todos lo van a preguntar sí o sí, ¿eh? O sí. Entonces, ¿por qué? Porque básicamente, ¿no? La distribución normal de una variable cuantitativa continua, la distribución variable cuantitativa continua, ¿eh? N significa... La distribución típica es distribución normal. Se caracteriza porque su media es cero, ¿eh? El sumatorio, ¿no? De las puntuaciones típicas, ¿eh? Partido por n, ¿no? ¿Vale? Aquí la media en puntuaciones típicas es cero, ¿sí? Y la varianza es siempre uno, ¿vale? Y esta es la típica distribución normal. que vais a ver en psicología mucho es la distribución de la campana de gauss es una distribución simétrica no no mesocúrtica vale si os fijáis el cero como decía antes no la media la media es cero veis por eso el punto central de la distribución veis el punto central es cero en puntuaciones típicas cualquier variable la que sea personalidad ansiedad motivación la que vendáis de una manera cuantitativa yo la puedo tipificar y simplemente con tener un dato de para qué me sirve yo simplemente contener el dato de una persona ya lo puedo situar con respecto al grupo si yo ya sé que se distribuye de una manera de una distribución normal yo paso un test de personalidad inter de inteligencia y como será distribución en el grupo se lamenta yo sé dónde se situaría la persona si os fijáis el cero y el cero que es la media está en el punto central pues por debajo como es simétrica así por debajo del cero tenéis el 50% de los datos por encima del cero hasta más infinito si tenéis el otro 50% de los datos desde menos uno a más uno si desde el cero si hasta el 1 hay un 34 13 por ciento de datos por lo tanto desde el cero hasta el menos uno hay también un 34 13 por ciento de datos porque porque es simétrica Como es, como se solapa, ¿sí? La misma, si del 0 al 1 es la misma distancia que del 0 al menos 1, pues aquí hay la misma cantidad de datos acumulados, ¿vale? ¿Sí? Del menos 1 al menos 2, 13,59. Del 1 al 2, 13,59. Y así sucesivamente. Si sumáis todo esto, pues te va a dar el 50%. 50%, 50%. Esto es muy, se usa mucho, porque si os fijáis, sí, he tenido que volver a un comentario que hacía en el chat que no tiene que ver con esto. Si os fijáis, aquí tenéis, ¿veis esta gráfica de aquí? ¿Veis? En esta gráfica están los valores en puntuaciones típicas, ¿veis? 0, 1, 196, 2,57, ¿vale? Y en la gráfica de abajo, ¿veis? Aquí pone Z, en la de abajo pone XY. Es decir, aquí tenéis las puntuaciones, ¿sí? En puntuaciones directas. Entonces, ¿veis? La media coincide con el 0, ¿vale? Esta puntuación que coincide con la media es 0, ¿por qué? Porque si la puntuación, si Z es la puntuación menos la media. ¿Sí? Pues va a ser 0. Y si os fijáis aquí, cuando está el 1, donde está aquí el 1, que aquí decía el 1, el 34,13%, y por eso es por lo que está importante. desde el 0 al 1 esto quiere decir que siempre hay una misma cantidad esto quiere decir que de 0 al 1 es la media más una desviación típica entendéis eso quiere decir 1 el número de desviaciones típicas que hay desde la puntuación a la media por eso esto es uno vale el ejemplo típico esto lo voy a adelantar esto fijaros esto en el libro tenéis esto vale para que os vayáis acostumbrando porque si varias veces ya no tiene que ver con nosotros en el libro tenéis esta tabla la habéis visto al final del todo fijaros para que entendáis por qué se explica esto y sobre estos van a preguntar el examen seguro vale sobre puntuaciones típicas entonces fijaros tenéis distribución normal tipificada vale esto lo tenéis es la tabla que tenéis si os fijáis en la tabla 3 que la tenéis en la página 38 y 39 de 38 y 39 de la venda vale si os fijáis tenéis aquí la distribución normal tipificada vale Y ahora fijaros, tenéis una columna donde pone puntuaciones Z y dentro tenéis probabilidades, ¿vale? Entonces si yo busco el valor 0, ¿cómo se busca el valor 0 en puntuaciones típicas? ¿Veis? Primera columna, la primera columna es Z. Si yo busco el valor 0, 0,00, ¿sí? Y la siguiente columna que hay es 0, o sea que sería 0,000, ¿sí? Pues si os fijáis lo que hay aquí dentro, ¿veis? Este valor que tenéis aquí, pues no, como lo he ampliado se me borra, perdón. Este valor que está aquí, ¿veis? Que pone 0,5, ¿veis? Pues eso quiere decir que hasta el 0, del 0 al menos infinito, ¿sí? Hay el 0,5 o el 50. El 50% de los datos, ¿vale? ¿Entendéis? Si yo, por ejemplo, la siguiente. Fijaros, si yo busco cualquier valor, por ejemplo, el 1,75. ¿Sí? ¿Tenéis la tabla delante? ¿Sí? Tenéis que traer el formulario. Buscar el 1 puede explicar la transformación. ¿Tenéis la transformación lineal luego, por favor? Sí, sí, yo lo explico. Un momento. 0,95, 9,9. ¿Sí? Me estoy perdiendo, dicen. Claro, mira, lo que estoy explicando, retomo, lo que estoy explicando es la distribución normal tipificada. ¿Sí? ¿Esto por qué? Porque cuando uno tipifica, cuando tú tipificas las puntuaciones, cuando aplicas esta fórmula, esta fórmula que es la puntuación menos la media partido por la desviación típica, los datos que tú obtienes se comportan según una distribución normal, ¿vale? Que es esto que tenéis aquí. Media, el punto medio es un cero, ¿sí? Y por debajo de la media el 50%, por encima de la media el 50%. Eso te sirve porque en el formulario, en la tabla 3, en la página 38 y 39, tenéis las puntuaciones típicas y tenéis el área que queda por debajo de la media. Por debajo de una determinada puntuación. Si yo busco, por ejemplo, 1,70 y ¿cuánto pregunté? Yo pregunté 1,75. Tenemos aquí, ¿no? En esta línea tengo el 1,70 y el 5 está aquí. Pues si más o menos aquí, ¿no? Sería 0,9599, ¿vale? Es decir que un valor en puntuaciones típicas de 1,75, que más o menos estaría por aquí, ¿sí? ¿Vale? Pues deja por debajo de sí, ¿cuánto? Pues deja lo que acabamos de decir. 95,99. Exactamente, 95,99. ¿Vale? Esto os lo van a preguntar en el examen de esta manera. Esto solamente os lo adelanto para que sepáis por qué la parte de las puntuaciones típicas lo tenéis que dominar rápida y brevemente. Fijaros, yo tengo 4.000 alumnos que se presentan en una convocatoria. Los datos se distribuyen según una distribución normal y dicen, yo tengo una media de 4,7 y una desviación típica de 3. Y ahora te preguntan, ¿cuántos alumnos tuvieron una calificación igual o menor que 5? Pues, ¿qué es lo que hace? El 5 lo tipifica, ¿veis? 5 menos la media, que es 4,7, partido. Por la desviación típica, que es 3, es 0,1. ¿Sí? Ahora yo me voy a la tabla y yo busco 0,1. ¿Vale? Y ya dejamos aquí. Y la tabla te dice que por debajo de 0,1 hay 0,53. Bueno, pues aquí lo dejamos.