¿Alguna pregunta? ¿Alguna duda? ¿O está todo claro? ¿Os habéis leído los temas? Sí Entonces si no seguimos con el tema 4 Ya os dije que el tema 1.3 Os lo colgaría Pero cuando pueda Cuando pueda yo crear un foro Porque todavía no puedo O sea, no puedo acceder Yo ni a la creación de foros Ni a nada ¿Cómo? Por eso, sabes que Tengo que acceder yo Para poder crear foros Y grupos Pero todavía no tengo acceso Cada día La semana pasada me dieron acceso Pero solo accedía a ver mi nombre Ahora accedo a la coordinación tutorial Imagino que cualquier día de estos Podría acceder ¿No? Entonces cuando pueda acceder Yo os colgaré los esquemas Tanto del tema 1.3 Como de los que vayamos dando Bien, entonces Si no hay ninguna pregunta No hay ninguna duda Pasamos al tema 4 Que es La organización de datos Bien Si habéis leído los primeros Los primeros temas Los primeros capítulos Los capítulos 1 a 3 Habréis visto O habréis analizado O habréis estudiado ¿Cuáles son los pasos de toda investigación? ¿O no? Os lo digo Planteamiento del problema Primero Revisión de fuentes Planteamiento de hipótesis Recogida de datos Tratamiento de la información Y conclusiones Fundamentalmente Son esas Aunque si veis cualquier otro texto Yo no sé si he dicho exactamente Tal como las mismas que pone aquí Pero son fundamentalmente esas Entonces Nosotros partimos Del planteamiento del problema O sea, lo primero que tenemos que hacer Es enunciar Cuál es el problema que nosotros queremos resolver Y enunciarlo operativamente De manera que sea soluble O sea, que tenga algún Algún tipo de problema Un tipo soluble En el sentido de que tenga Alguna solución Una vez que hemos planteado el problema Realizamos la revisión de fuentes Una vez que revisamos las fuentes Nosotros planteamos las hipótesis Que sean más o menos congruentes Con todo aquello Que Se haya dicho previamente O se haya investigado Sobre el tema O sobre el problema Que nosotros planteamos Una vez revisadas las fuentes Planteadas las hipótesis Establecidas las variables Definidas las distintas variables Tanto variables independientes Como dependientes Como intervinientes o extrañas Entonces nosotros ya tenemos que Lo que tenemos que hacer es La recogida de información Nosotros tenemos Lógicamente en toda investigación Nosotros tenemos que recoger una información Nosotros no podemos En ninguna investigación Inventarnos algo O elucubrar sobre algo Sino que Lo que tendremos que hacer es Recoger la información pertinente A aquel problema Que nosotros nos hayamos planteado Por ejemplo Si nosotros tenemos un problema O nos planteamos el problema De cuáles son los factores Que influyen En El rendimiento académico De los estudiantes Nosotros podemos plantear Por ejemplo Que Uno de los factores Que influyen en el rendimiento De los estudiantes Es la inteligencia Entonces ahí tendríamos que Realizar una recogida de información Nosotros planteamos una serie de hipótesis O planteamos la hipótesis De que el rendimiento académico De los estudiantes Depende de la inteligencia de los mismos Entonces tendremos que recoger Una información ¿Qué tendremos que recoger? ¿Qué información tendremos que recoger? A ver a quién se le ocurre Si yo planteo esa hipótesis O cuáles Si habéis leído ¿Cuáles serían las variables Que tenemos en esa hipótesis? Yo anuncio la hipótesis El rendimiento académico O las calificaciones O como queréis llamarlo De los estudiantes Depende de su inteligencia ¿Cuáles serían las variables Que nosotros tenemos? La inteligencia y el rendimiento ¿Todos de acuerdo? Silencio se rueda Bien Serían la inteligencia y el rendimiento ¿Cuál sería la variable independiente? De esas dos Inteligencia El rendimiento He oído las dos cosas A ver, ¿por qué sería la inteligencia? Eso viene algo ya Algo que no cambia Vamos a ver Si es una variable Algo que no cambia es una constante Una variable por definición Es una característica que cambia de valores Entonces no puede ser independiente Porque no cambia ¿Por qué es una variable independiente? Quienes hayáis dicho que es una variable independiente La inteligencia No estamos en cómo medimos Sino ¿Qué tipo de variable es? Es una variable independiente Han dicho Si es constante Si es constante no es variable Lo mismo Hay que ir un poco Estamos viviendo El rendimiento Para saber Es que no sé La inteligencia es El nivel de inteligencia Va en función de rendimiento Vamos a ver El nivel de inteligencia Va en función de rendimiento Y por ahí se han dicho El nivel de inteligencia Va a influir en el rendimiento Son dos cosas contradictorias Las afirmaciones Bien ¿Y quien ha dicho que la variable independiente Es el rendimiento? ¿Por qué? Es una variable independiente Dependiendo de la inteligencia Va a variar el resultado Si es correcto lo que dices Pero no es porque sea variable dependiente Sino variable independiente La variable independiente es la inteligencia Si más o menos tenéis el concepto Más o menos Aunque tú le has dado la vuelta Y has dicho que el rendimiento Va a influir en la inteligencia Y es justo al revés Porque la variable independiente Es aquella que manipula El experimentador Manipula en el sentido de que Cambia de valores Entonces yo por ejemplo No le puedo cambiar de valor a la inteligencia De un sujeto, lógicamente Pero puedo seleccionar sujetos Con inteligencia alta, inteligencia media Inteligencia baja Puedo seleccionarlos Entonces estoy manipulando No en sí misma esa inteligencia Pero sí Los grupos con los que estoy trabajando Bien Entonces es aquel y aquella Que lógicamente Está produciendo un efecto En la variable dependiente Si teníamos la variable independiente Las variables independientes De rendimiento La variable rendimiento Que es Dependiente ¿Por qué es dependiente? Porque varía en función De los valores que adquiere La inteligencia, o sea Que adquiere la variable independiente Eso es lo que afirmamos nosotros En la hipótesis, luego será o no será cierto Pero nosotros hemos planteado Esa hipótesis Y nosotros tenemos que tomar Tenemos que realizar una recogida de información De información de qué En este caso En este ejemplo ¿De qué tendremos que recoger información? De la inteligencia De los niveles de inteligencia Y de los resultados Esa información nosotros la tenemos que recoger Bien Entonces en la recogida de información Lo que hacemos es atribuir valores A las variables Atribuimos valores a la inteligencia Y atribuimos valores Al rendimiento No es que los atribuyamos nosotros Están atribuidos Nosotros los recogemos Pero las variables Adquieren una serie de valores O tienen una serie de valores Y se transforman En una serie de números Yo no puedo decir inteligencia alta, inteligencia media E inteligencia baja Sí que lo puedo decir Lo que pasa que nosotros en la investigación Lo que hacemos Es que veo Que se ha conectado Uno Lo que hacemos Es atribuir unos números A la inteligencia ¿Cómo vamos a medir la inteligencia? En el ejemplo Estamos poniendo un ejemplo O sea, mediríamos Alguien ha dicho mediante un test Por ejemplo Se puede medir de más maneras Entonces si nosotros medimos la inteligencia Mediante un test Estamos poniendo una serie de números A cada uno de los sujetos O sea, cada uno tendrá en la variable Un nivel de inteligencia Pero tendrá un número adjudicado Que eso luego lo podemos decir Que será inteligencia alta, inteligencia media Inteligencia baja, muy baja, muy alta Lo que sea ¿Y qué más tendremos que medir? Tendremos que medir el rendimiento ¿Y el rendimiento cómo lo mediremos? Con las calificaciones Es una manera de medirlo Otra manera de medirlo sería aplicar una prueba Hay más maneras de medirlo Pero bueno, mediante las calificaciones Y ahí tendremos una serie de números Lógicamente para atribuir Esos valores Nosotros lo que tenemos Que utilizar son instrumentos De medida En el mundo físico es muy fácil Para medir una longitud Tenemos un metro Un decámetro o lo que sea Ahora un rayo láser Para medir volumen tenemos el litro Un metro cúbico, etc. Pero nosotros tendremos que Utilizar unos instrumentos de medida Que pueden ser unos instrumentos Construidos por nosotros O unos instrumentos elegidos Nosotros podemos elegir los instrumentos Entre instrumentos que ya existan O podemos construir instrumentos Porque no existen O porque no se adecuan a nuestras necesidades O por lo que sea Pero no se puede construir Eso lo veremos, no sé si en este curso En otro, ahora no recuerdo La manera de medirlo En el segundo Es cómo construir instrumentos de medida Y qué instrumentos de medida Y qué técnicas nosotros podemos utilizar Para recoger información Bien Y con eso Una vez que nosotros tenemos Todo eso Nosotros realizamos el trabajo De campo Bien Aparece después en el libro Solo pongo aquí Los principios éticos Vamos a ir rápidos Porque eso lo podéis estudiar Es una participación voluntaria Puede ser que sí, puede ser que no El informe consentido Depende de qué De qué estemos estudiando, lógicamente El evitar daños Tanto físicos Como psíquicos La confidencialidad Este sí que es muy importante O sea, el no decir Por ejemplo, yo recojo información De cada uno de vosotros Y os tengo identificados Lo que tengo que hacer Antes Antes de hacer el tratamiento de datos Una vez que tengo recogida toda la información La tengo codificada La tengo He hecho todo lo que tengo que hacer Y ya sé que esa es la información que tengo Lo que tengo que hacer es Normalmente anonimizar O sea, convertir en anónimo Cada uno de los registros De manera que cada uno tendrá un número Una letra Y nadie podrá saber a quién corresponde eso Eso sí que hay que hacerlo Para evitar el que Haya filtraciones Lo que sea En muchos de los casos Lo que hay que utilizar es el anonimato Y el lugar de la realización Para evitar alteraciones Bien, eso lo tenéis por ahí Lo podéis estudiar Nosotros ya hemos realizado El trabajo de campo Nosotros ya tenemos una serie De informaciones Vamos a suponer Que en ese trabajo Que nosotros queremos ver Qué es lo que influye En el rendimiento académico Tenemos además de la inteligencia El tiempo de estudio El nivel socioeconómico El nivel cultural El nivel cultural de los padres Un montón de información Tenemos mucha información Y muy distintas informaciones No sólo una Porque pensamos Que no sólo hay una Una vez que hacemos el trabajo de campo Y ya hemos recogido Toda esa información Entonces lo que nosotros hacemos Es codificar la información ¿Qué es codificar la información? Atribuir a cada uno de sus valores Un código Por ejemplo Si yo estoy recogiendo información Sobre el nivel socioeconómico Y considero el nivel socioeconómico Alto, medio, bajo Hay más, pero bueno Entonces digo Al nivel socioeconómico Alto, medio, bajo Lo codifico como uno Al nivel socioeconómico medio Lo codifico como dos Al nivel socioeconómico bajo Lo codifico como tres Eso es una codificación Transformar toda esa información literal Que nosotros tenemos Una información en códigos Los números ahí No significan nada más Que un código A través del cual vamos a saber A qué nos estamos refiriendo Y con los códigos Lo que hacemos Es un libro de códigos Un libro de códigos En el cual está incluido El orden El orden de los registros O sea, cada sujeto Está el sujeto 1 Y en esa línea Aparecerá toda la información Que tenemos sobre el sujeto 1 El sujeto 2 Y aparecerá toda la información Que tenemos sobre el sujeto 2 El sujeto 3 Y aparecerá toda la información Que tenemos sobre el sujeto 3 Y así sucesivamente Además del orden Lo que tenemos que poner Es el código de la variable Si nosotros Hablamos de nivel de estudios Pues el nivel de estudios Puede ser NIV-ES Por ejemplo Eso es un código Para no poner nivel de estudios Etcétera Para no ponerlo todo O sea, toda la información literal Además del código de la variable Tenemos que poner El nombre de la variable Lógicamente Estamos hablando del libro de código Además del nombre de la variable El código de los valores de la variable Lo que hemos dicho antes Nivel socioeconómico O nivel económico Alto, bajo O medio-bajo 1, 2 y 3 Tendremos que poner También el código de esos valores La etiqueta de los valores O sea, hay 1 Y pondré Nivel socioeconómico El alto 2 Nivel socioeconómico Medio 3 Ese es la etiqueta de valor Bien Y a partir de ahí Lo que tendremos que hacer Es tabular los datos Vamos a ver algún ejemplo Ahí hay un ejemplo Es un ejemplo real Dice el código de la variable CLCASP1P91 Entonces lo que es Lenguaje Castellano Pregunta 1 No, parte 1 Pregunta 9 Item 1 O sea, en vez de poner todo eso Lo que pongo es el código A la U pongo ¿Qué es? Y El código de respuesta es Los códigos de respuesta son 0 y 1 ¿A qué corresponde 0? A 0 puntos Y 1 a 1 punto Código de centro Pues aparece el código de centro Y aquí en vez de poner todos los centros Pueden ser 50, 100 o 200 Pues es el número del centro Que cada centro tiene un número Y aquí estaría la denominación del centro Esa tabla lógicamente la tendré en otra parte Zona geográfica El código es exactamente igual que zona geográfica La única diferencia es que está todo junto Entonces El código de respuesta Son 1, 2 y 3 La etiqueta Sería Al 1 le corresponde zona normal Al 2 le corresponde zona media Al 3 le corresponde ribera Código de variable Código alumno Lo mismo pero unido Entonces ¿Qué es? Número correlativo de cada uno de los alumnos Aquí no hay ningún valor de la respuesta Sexo El nombre de la variable también es sexo Código de respuesta 1 o 2 1 corresponde a alumno Y 2 corresponde a alumna Año NAC Año de nacimiento Esto es arbitrario Pero una vez que uno lo ha establecido Ya no lo puede cambiar Lógicamente Todos los códigos son arbitrarios Pero una vez establecidos Uno no lo puede cambiar Ahora en vez de que el 1 sea alumno El 2 sea alumna Pues si se puede Informáticamente se pueden hacer todos los cambios Año de nacimiento Hay 1, 2, 3, 4, 5, 6, 7 El 1 corresponde a antes de 1986 El 2 a 1986 El 3 Y así sucesivamente Esto depende de la información que nosotros tengamos Y de lo que nos interese Si nos interesa año a año O no nos interesa año Lugar NAC Lugar de nacimiento del alumno 1, 2 y 3 El 1 corresponde a Navarra El 2 a una comunidad autónoma distinta de Navarra Y el 3 fuera de España Sigue, esto sigue El libro de códigos Nivel est padre Nivel de estudios del padre Hay del 1 al 7 Uno sin estudios Dos primarios o básicos incompletos Tres primarios o básicos completos Y así sucesivamente Situación laboral del padre 1, 2, 3, 4 Trabaja en paro, jubilado Trabaja solo realizando las tareas de la casa Ordenador Número de ordenadores en casa 1, 2, 3, 4 Ninguno Un ordenador, dos ordenadores, tres ordenadores Eh Satisfacción Con los profesores de la alumna Entonces Satisfacción por las relaciones con el profesor del centro 1, no le satisface 2, le satisface poco 3, le satisface algo Eso es la información Lógicamente si nosotros tuviéramos esto Si que se puede trabajar con ello Pero es mucho más complicado Bien Entonces Esto es una tabla En la que se puede trabajar con el profesor del centro En la cual aparece esa información y esos códigos La pregunta 9 de la parte 1 Y el ítem 1 El código de centro La zona geográfica El código del 1 Y como veis ahí van apareciendo los códigos Esto es lo que hemos hecho La tabulación O sea Es que es la tabulación La tabulación es establecer en una tabla Los valores que nosotros encontramos En el trabajo de campo Y esos valores aquí Aquí están codificados. También lo podríamos haber hecho de esta otra manera, donde en lugar de los códigos, lo que nos apareciese fuese el texto de cada uno. Comunidad autónoma distinta de Navarra. Le satisface bastante la relación con el profesorado. Como veis es una tabla bastante más complicada a la hora de interpretar. Bien, una vez hecho esto, una vez que tenemos los datos, ¿qué tenemos que hacer? Ver el nivel de calidad de los datos que nosotros tenemos. Lógicamente cuando nosotros introducimos información podemos cometer errores sin darnos cuenta. Entonces lo primero que tenemos que hacer es comprobar si realmente esa tabla tiene errores y no podemos hacer mirando uno a uno. Si tenemos 10.000 registros con 50 variables, pues tenemos 500.000 datos. Es imposible estar mirando uno a uno. Entonces lo que tenemos que hacer es establecer en primer lugar, buscar los valores máximos y mínimos. Entonces dices, bueno, pregunta 9. El mínimo es 0, el máximo 1. Ahí no ha habido ningún fallo. El código de centro. No aparece nada porque no teníamos... No tenían valores. A la zona geográfica. El mínimo es 1 y el máximo 3. Código de alumno. Tampoco puede aparecer nada porque cada alumno tiene un código. El sexo, 1 y 2. El año de nacimiento, 1 a 7. O sea, lo que hacemos es comprobar si realmente nosotros hemos introducido bien la información. Eso no quiere decir que todo lo hayamos introducido bien porque los valores intermedios aquí no aparecen. ¿No? No lo sabemos. Pero por lo menos eliminamos aquellos datos. Imaginaos que en nivel de estudios del padre se hubiera introducido un 17 sin darme cuenta. En el teclómetro, 17. Ese 17 va a influir de alguna manera en el tratamiento de datos que yo pueda realizar. Por eso tenemos que realizar ese análisis de calidad. Y otro análisis que sería... ¿Qué sería? Las tablas de frecuencias. Nosotros, lógicamente, a la hora de seleccionar una muestra, nosotros sabemos cuántos sujetos tenemos de cada zona. En este caso, cuántos sujetos de género masculino, cuántos de género femenino. Y lo que tenemos que hacer es comprobar si realmente esa información es correcta en la tabla que nosotros hemos introducido. Bien. Otro análisis que podría ser el de porcentaje. Aunque aquí está este título. Este título no lo sé. O sea, es el mismo que el anterior y entonces tendríamos la frecuencia, el número de personas que aparecen sin estudios, el porcentaje que corresponde sobre el total, el porcentaje válido, que veis que es distinto. ¿A qué le llamo porcentaje válido? Esto está hecho con el programa SPS de estadística. ¿A qué le llamo porcentaje válido? Eso, claro, tengáis en cuenta cuando... No quiere decir que el anterior no sea válido. El porcentaje, cuando no tiene el apellido válido, lo que nos está indicando es el porcentaje sobre el total de sujetos que nosotros tenemos. Y el porcentaje válido sobre el total de datos que tenemos en esa variable. Eso quiere decir que aquí falta alguna variable. O sea, alguno lo ha dejado en blanco. Algunos no sabemos cuáles son sus estudios. Entonces, lógicamente, eso le llama porcentaje válido. Ese no se tiene en cuenta a la hora de hallar el porcentaje. Esa diferencia... Hay entre el porcentaje válido y el porcentaje. Luego, el porcentaje acumulado, eso sabéis lo que es, ¿no? ¿O no? No. El porcentaje acumulado está hecho, en este caso, lo hace el programa sobre el porcentaje válido. Quiere decir el porcentaje de sujetos que tienen el valor de una variable o cualquiera de los inferiores. Entonces, aquí sin estudios... Hay un 3,2% de sujetos con primarios o básicos incompletos. O sin estudios, cualquiera de las dos. Cualquiera de las dos. Entonces, en cualquiera de estas dos son 11,7%. 11,7% de sujetos tienen primarios o básicos o no tienen estudios. Bien. Sin estudios con primarios... Sin estudios básicos incompletos o primarios básicos completos, hay un 40,9%. Un 40,9% abarca a estas tres categorías. Claro. Lógicamente, este es 3,2 más 8,5 da 11,7. 11,7 más 29,2 nos da 40,9. Con formación profesional o cualquiera de los inferiores da 57,9. Añadimos el 17. El 17, que tenía formación profesional a todos los que tenemos ya, y el 57,9. Con bachillerato o cualquiera de los inferiores, 71%. Titulado universitario, 95%. Y otros, no sé lo que son, es el 100% lógicamente. Ese es el porcentaje acumulado. ¿Alguna duda? ¿Alguna pregunta? Bien. Yo me voy a saltar en este momento esa parte que pone introducción a los gráficos. Porque luego viene una información más amplia sobre los gráficos. Entonces es una repetición y no voy a repetirlo. Aquí aparece eso porque no es tan fiero el león como lo pintan. Este año pasado lo habría visto muchas veces y este año sigue apareciendo. Digo por el miedo que muchos tenéis a esta asignatura. Bien. Entonces vamos... A meternos con las medidas descriptivas. Bien. Primero aparece aquí una tabla. Una tabla con una serie de datos. Y una serie de conceptos que posiblemente no hayáis visto. Eso no lo busquéis en el libro que no está. Entonces, aparecen datos agrupados en intervalos. Entonces tenemos un intervalo. El primer intervalo va de 3 a 5. Eso que quiere decir que aquí estarán los sujetos que tienen una puntuación entre 3 y 7. De 8 a 12 los que tienen entre 8 y 12. 13 a 17 los que tienen entre 13 y 17. 18 y 22 los que tienen entre 18 y 22. Bien. ¿Qué es la marca de clase? La marca de clase es el punto medio del intervalo. A eso se llama marca de clase. O sea, yo alinearía. El promedio entre los dos extremos de cada intervalo. 7 más 3, 10 dividido entre 2 me daría 5. 12 más 8, 20 dividido entre 2 me daría 10. 17 más 13, 30 entre 2 me daría 15. Y así sucesivamente. Eso es la marca de clase. ¿Por qué utilizamos la marca de clase? O se utiliza, aunque en este momento no tiene mucho sentido, el utilizar tablas de datos con agrupación de intervalos. Porque no tiene sentido. Porque antes lo que hacíamos, no teníamos ordenadores, y lo que hacíamos era hacer la mano. Entonces si tienes 10.000 datos, pues como tengas que elevar al cuadrado cada uno de ellos, sumarles no sé qué, hacer no sé cuánto, pues lo tenías que repetir 10.000 veces. Entonces lo que se hacía es una agrupación de intervalos para reducir la cantidad de información, la cantidad de datos que uno tenía que manejar. Ahora con un ordenador eso no sucede, sino que el ordenador nos hace los cálculos. Pero bueno, para que sepáis, veis cuando os aparecen tablas de este estilo. Entonces en lugar, lógicamente para los cálculos, nosotros tendríamos que utilizar algún tipo de dato. ¿Cuál es? Pues la marca de clase. Podría haber sido otro, pero bueno, utilizamos la marca de clase. F, ¿qué es? F es la frecuencia. ¿Y qué es la frecuencia? Pregunto. No me estoy preguntando a mí mismo, sino pregunto, ¿qué es la frecuencia? El número de veces que se repite un dato. En este caso el número de veces que se repite un dato. El número de veces que se repite el intervalo. El número de veces que se repite la marca de clase. O sea, aquí hay 5 sujetos que tienen entre 3 y 7. Entre una puntuación 3 y una puntuación 7. 10 que tienen entre una puntuación 8 y una puntuación 12. 15 que tienen entre una puntuación 3 y una puntuación 17. 15 no, 10, perdón, que me he ido a la marca de clase. Luego estaría la frecuencia acumulada. Entonces hemos visto, hace un momento, hemos visto que la frecuencia acumulada, o el porcentaje acumulado, el porcentaje acumulado era el porcentaje de sujetos que tenían un determinado valor de la variable o cualquiera de los inferiores. En este caso la frecuencia es lo mismo. Nos indica el número de sujetos o el número de observaciones que tienen un determinado valor o cualquiera de los inferiores. Entonces, en la frecuencia acumulada tendremos que tenemos 5 observaciones 5 observaciones del intervalo 3 o 7. 11 observaciones que tienen menos de 12. Una puntuación menor de 12. O sea, 11 observaciones que están en 3 o 7 y 8 o 12. O dicho de otra manera, menor de 12. 21 es lo mismo que antes. 5 más 6 nos da 11. 11 más 10 nos da 21. Hay 21 observaciones que son iguales a este intervalo o inferiores o cualquiera de los anteriores. 49, pues serán 49 observaciones que están en cualquiera de estos intervalos. 106, pues serán 49 observaciones que están en cualquiera de estos intervalos. Bien, eso nos servirá luego para calcular algún tipo de puntuación individual como pueden ser los centiles, etc. Bien, porcentaje. El porcentaje corresponde a la frecuencia. O sea, es el porcentaje de sujetos que tienen una puntuación que está situada en este intervalo. Unos 64 tienen la puntuación situada entre 3 y 7. Unos 97 entre 8 y 12 y así sucesivamente. Porcentaje acumulado. Estamos en lo mismo de antes. En vez de frecuencia es el porcentaje. Si yo cojo 91 con 12 será el 91 con 12 por 100 tienen las puntuaciones entre 38 y 42 entre 36 y 37 o entre 32 y 36 sucesivamente. O de esta otra manera tienen puntuaciones iguales a 3 y 7. O sea, 42 o inferiores. Cuartilas de este. Eso es el porcentaje acumulado. Luego, límite aparente. Aquí pone limita pero es límite. Límite aparente y límite real. Cuando nosotros tenemos un intervalo 37 nosotros vemos que las puntuaciones van de 3 a 7. En este caso van de 8 a 12. En el tercer intervalo van de 13 a 17. En el cuarto intervalo van de 18 a 22. Y así sucesivamente. Pero entonces ahí tenemos unos límites. El límite superior es 3 perdón, el límite inferior es 3 y el límite superior es 7. En este otro intervalo el límite inferior es 8 y el límite superior es 12. Pero estos son los límites aparentes. Aparentes son los que aparecen. Los que tenemos ahí. Entonces cuando estamos con variables continuas, como puede ser este caso, decimos si uno tiene un 7, 25 ¿dónde está? No está. Porque aquí tenemos entre 3 y 7 y aquí entre 8 y 12. Los que hay entre medio, ¿dónde están? Por eso hablamos de límites reales. O sea el límite real sería añadirle medio punto al límite superior y restarle medio punto al límite inferior. Entonces aquí este intervalo estaría entre 2 y medio y 7 y medio. El segundo intervalo estaría entre 7 y medio y 12 y medio. No, no no tengo que hacer nada sino que es el límite real. Ah bueno. Sí. Entonces vamos a ver ¿para qué se utiliza esto? Esto se utiliza, bueno esto es algo teórico. Entonces se utiliza para que nosotros podamos utilizar todos los datos posibles porque si es una variable continua no podemos desechar el hecho de que existan valores o puedan existir aunque en la distribución que nosotros tenemos no existen que puedan existir valores que sean diferentes. Si yo tuviera en esta en estos valores que aquí tengo, en lugar de valores enteros tenía 7 y 25 entonces pondría entre 3 y 7 y 25 vamos a suponer. El siguiente me saltaría a 8 y entre 12 y 25 pero estaríamos en lo mismo, o sea de operar siempre me iban a quedar valores que no aparecen en el intervalo. Una manera de evitarlo sería poner 2 y medio a 7 y medio y ponerlos en una línea porque claro, si pongo 7 y medio también en el siguiente ¿dónde está el 7 y medio? ¿arriba o abajo? Ese no sería un problema excesivo porque no coincidiría mucho pero si coinciden muchos entonces el intervalo en lugar de ser 7 y medio tendría que poner 7 y 25 o 7 y 75 pero vamos, no os preocupe demasiado porque no vais a trabajar con intervalos sino que cuando os aparezcan tablas que sepáis los conceptos que se pueden manejar en esas tablas. Repito que ahora no se trabaja ya con intervalos sino que se trabaja con todos los datos reales. Bien, entonces vamos a meternos con las medidas de tendencia central. Una medida de tendencia central. Entonces, entre las medidas de tendencia central está la media aritmética. ¿Qué es la media aritmética? La media aritmética es el promedio de todas las puntuaciones que nosotros hemos obtenido. Entonces, ¿cómo se obtiene? Se obtiene sumando todas las puntuaciones y dividiéndolas por el número de observaciones que tenemos, lógicamente. Si nosotros tenemos esta distribución tenemos x nos indica los valores de la variable normalmente y aquí al transformarlo me he eliminado, esto sería x sub i os tenéis que acostumbrar a los subíndices x sub i que indica la i que hay debajo. La i que hay debajo nos indica a qué valor corresponde esa x. Si yo ordeno estos valores del 1 al 20, no sé cuántos hay exactamente entonces si pongo x sub 1 se corresponderá a la puntuación 5 x sub 6 corresponderá a la puntuación 18 y así sucesivamente. La i nos indica un orden, lo mismo pasaría en f sub i. Entonces tenemos esta tabla donde tenemos los valores, sus frecuencias entonces tenemos que sumar todos los valores pero no estos valores, porque lógicamente con el valor 5 hay cinco observaciones. Si yo sumase sólo esta columna, no sumaría todas las puntuaciones que yo tengo, porque yo tengo 304 puntuaciones y lo que sumaría serían nada más estas. Por lo tanto tendré que multiplicar cada puntuación por su frecuencia y sumar esta columna. De esa manera sumaré todas las puntuaciones que sean en este caso 9478 n es 304 y la media es 31,18 que sería esto. Entonces ya nos empiezan a aparecer aquí símbolos que todo el mundo está mirando y dice bueno, ya empezamos. Esto es el símbolo de la media una x con una raya horizontal arriba Podría ser una i con una raya horizontal, una z con una raya horizontal, es lo mismo. Este es el sumatorio ¿Qué me está diciendo? Que sume este producto el producto de una puntuación por su frecuencia desde la primera hasta la última. Eso es lo que me dice. O sea, me dice suma, multiplica 5 en la primera puntuación por 5, 25 a eso, vuelve a multiplicar 8 por 2, 16 sumarlo. Entonces me dice haz estos productos y luego súmalos desde el primero hasta el último que sería esta columna y me daría 9478 Eso es el signo del sumatorio. Si hubiera puesto suma desde 1 hasta 3, entonces sumaría estos tres 25 más 16 más 48 si pongo n estoy diciendo que sume todo Normalmente os vais a encontrar siempre con esto, no os van a decir sumes del 1 al 3 o del 1 al 5 o del 1 al 27 Si en lugar de tener esa distribución nosotros tuviéramos una distribución en intervalos lo que haríamos sería multiplicar la marca de clase por su frecuencia en cada uno de ellos y sumarlo. Entonces me daría una suma algo distinta, 9420 en vez de 9478 y una media también que sería algo distinto ¿Por qué es distinta cuando tenemos si tenemos los mismos datos tenemos la información tenemos los datos agrupados en intervalos ¿Por qué es distinta? ¿A quién se le ocurre? También la pregunta también va para el que está viéndonos o participando desde donde esté, no sé dónde está ¿Por qué los intervalos tienen más margen de error? Porque los intervalos tienen más margen de error Si por ahí va... Porque en los intervalos nosotros perdemos información En el primer intervalo lo que hacemos es utilizar como si todos los que están en ese intervalo fueran 5 y puede que sean todos 3 o que pueden ser que sean todos 8 Entonces lo que cometemos es un error es un error mínimo, pero cometemos un error Entonces lo que interesa es realmente lo que ya se hace ahora es decir utilizar todas las puntuaciones Bien, y como ya esto se está terminando detrás vienen otros ¿Alguna pregunta? ¿Alguna sugerencia? ¿Alguna duda? Ya cerramos esto