Buenas noches a todas y a todos los alumnos de los grados de Sociología, en concreto la asignatura de Estadística Aplicada a las Ciencias Sociales I, tanto del Centro Asociado de Segovia como del Centro Asociado de Guadalajara. A continuación, hoy vamos a ver el tema 3. El tema 3 es un tema sencillo que se refiere a la recogida y tratamiento de los datos. Quiero comenzar hoy por la práctica y luego vamos a ver los aspectos teóricos, que en realidad también son prácticos, puesto que ya vamos a empezar a calcular. Estos cálculos son básicos, esenciales y poco a poco vamos a ir construyendo el conocimiento en estadística y practicarlo. Prácticamente vamos a ver lo que es la frecuencia relativa, la frecuencia acumulada y cómo se procedería a resolver algunos de los problemas que suelen poner en el examen de la prueba presencial. De cara a que prácticamente hoy todo el mundo salga con la idea general para sacar los dos puntos y medio primeros del examen de junio. Vamos a continuación, como decimos. A ver la práctica. En primer lugar vamos a aprender a descargar el PSPP, el programa que nos va a permitir realizar los cálculos estadísticos. Para descargar el PSPP vamos a ver cómo se puede descargar. A continuación vamos a acceder a internet y una vez que accedamos a internet lo que hacemos es poner en el Google PSPP. Entonces una vez que pongamos PSPP vamos a ver qué es lo que va sucediendo. Vamos a ver un momentito que estamos descargando. Vamos a ir descargando la visualización. Vamos a ver, un momentito, a ver, actualizar complemento, ejecutar, bueno, se dice que, vamos a ver qué nos pasa, por qué no podemos acceder al escritorio, vamos a ver, un momentito, a ver, vamos a ver, a ver, un momentito, a ver, vamos a ver si nos lo permite acceder directamente, si no lo que haríamos sería verlo a través de las transparencias que hemos diseñado. Vamos a intentar a ver si se puede ver el escritorio y se ve en directo cómo se procede, cómo se pasa a descargar en concreto el programa que estamos diciendo. Bueno, pues veis que no se permite, pues nada, vamos a ver. Entonces, a ver a través de las transparencias. Bien, bueno, pues nada, vamos a decir que, vale, que no nos muestre el escritorio, pues nos vamos, vamos a ver si nos lo permite, bien, vale, pues no queremos el escritorio. Entonces vamos a ir a los archivos que tenemos aquí. En concreto a la práctica, primero, siento que no hayáis podido ver cómo se procede a ver el escritorio y cómo se descarga el programa. Ponemos en el Google PSPP, PSPP, no SPSS, que es otro programa estadístico quizá más común, que se suele utilizar en sociología o en medicina o en otras ciencias, sino PSPP, que es software libre. Y vamos en concreto a aquel que pone Michelangelo Downloads, que es este que pone aquí, Blog de PSPP. Veis aquí que pone uno Downloads. Download PSPP. Si pulsamos ahí, lo que nos saldría es la pantalla, esta de aquí, la pantalla esta de aquí, es el Blog de PSPP y le damos aquí a este enlace, a este primer enlace, vale, a este primer enlace que está en azul. Le pulsamos ahí y nos va a llevar a esta página. Y en esta página lo que hacemos es darle a la última versión que es la que tenemos aquí. Son 15 megas, entonces nos lo va a descargar. Una vez que nos lo descargue, bueno, pues se descarga bien, o sea, no hay ningún problema, es simple. Y una vez que nos lo haya descargado, pues lo que hacemos es, podemos empezar a trabajar con él. Si os dais cuenta, una vez que le damos a él, le damos a Intro en el escritorio, es decir, primero lo descargamos, luego nos vamos al escritorio y le damos al icono que nos haya creado en el escritorio. Le damos a PSPP y en este caso, veis... Aquí pone dos vistas, vista de datos y vista de variables. Lo primero que hacemos es definir las variables. Imaginaos que como sociólogos nos contratan para evaluar un programa de actividades juveniles en un ayuntamiento. Entonces, lo que hacemos es diseñar un cuestionario y lo administramos a la población. Ya sabéis que los cuestionarios tienen que tener diferentes preguntas, ¿no? Tienen que tener preguntas de... en concreto, cuanto más sencillas sean, mejor. Mientras, la mayor parte es cerrada, ¿no? Con categorías de respuesta. Las categorías de respuesta nos van a permitir, sobre todo, análisis de frecuencia, ¿no? Si, por ejemplo, queremos saber si los sujetos conocen las actividades juveniles que elabora el ayuntamiento de Guadalajara, pues lo primero que le preguntaría es, ¿conoce usted el ayuntamiento de Guadalajara? Ahí podemos tener una respuesta dicotómica. Si no, tenemos que tener respuestas dicotómicas, alguna que otra. O podemos poner mucho, poco... Bastante nada, ¿no? Ahí tendríamos una escala de 1, 2, 3, 4. Entonces, tenemos que tener escalas de este tipo y luego también tenemos que tener escalas numéricas que luego nos permitan determinar medias. Por ejemplo, tenemos que preguntarle a la gente, ¿cómo valora usted la calidad de los programas dirigidos a jóvenes? ¿Valora usted de 1 a 10? 1, muy poco. 10, mucho, ¿no? Entonces, siempre tenemos que tener, de alguna manera, preguntas de este tipo. Dicotómicas, escalas cerradas para analizar frecuencias y también es muy importante tener alguna pregunta, 2, 3 preguntas, en las cuales valoremos de 0 a 10 o de 1 a 10, ¿vale? Bien. También conviene tener una pregunta abierta, es decir, dígame usted cuáles son los problemas con los que se enfrenta la juventud y que nos lo diga, ¿no? Bueno, podemos hacer así, podemos decirle, priorice de 1 a 10 los siguientes problemas que yo le voy a leer. Pero bueno, estas dos preguntas... Estas dos cuestiones son también válidas. Bueno, pues una vez que tengamos definida la variable, nos vamos a la lista de variables y las vamos a definir. Aquí, fijaos, lo primero es poner siempre el número de sujeto. Bueno, pues vale, ponemos el número de sujeto. El género, el género, le podemos poner, fijaos, tipo numérico. Aquí, el ancho de la columna, siempre nos conviene definirlo. Como realmente sabemos que el género va a ser hombre-mujer, pues aquí con que pongamos ancho 1 es suficiente, ¿vale? Decimales conviene poner todo a 0 para que no haya problemas. En la etiqueta va a poner género cuando se haga algún tipo de análisis y aquí los valores vamos a definirlos. Si le damos aquí, nos va a aparecer una cajita aquí debajo y vamos a decir que nos ponga 1 cuando es hombre, por ejemplo, ¿vale? Y 2, ¿eh? Vamos a ver, vale. Y 2 cuando es mujer, por ejemplo, ¿vale? Aquí vamos a tener el grupo, pues por ejemplo, si yo... Bueno, pues imaginaos que... Curso, curso. Pues imaginaos que yo vaya a hacer esta encuesta en mi instituto, ¿vale? Por curso. Y entonces aquí puedo poner valores, por ejemplo, pues puedo poner primero, segundo, tercero, cuarto de secundaria, ¿vale? Y grupo, pues igual, ¿no? A, B, C, D, ¿no? El 1A, el 2B, el 3C y el 4D, por ejemplo, ¿no? Y bueno, aquí definimos simplemente una variable como ejemplo, ¿no? Conocimiento, en este caso, si conoce o no conoce las actividades. Y aquí creo que le he puesto mucho, bastante, poco, nada, ¿vale? Pues igual, ¿no? Vamos a ver un poquito más, a ver qué otra transparencia tenía yo por ahí para enseñároslo. Vale, aquí veis. En el concreto, en el grupo, pues aquí he definido, como os decía, que el 1 va a ser A, el 2B, el 3C, el 4D, van a hacer los análisis. Esto nos lo va a simplificar porque no lo va a poner en los análisis, ¿vale? Y luego, como decía, conocimiento, pues mucho, bastante, poco, nada. Vale, pues conozco mucho las actividades, bastante, poco o nada, ¿eh? Bueno, pues aquí veis que son la definición de las variables. Una vez que tenga definida la variable, lo que hago es irme a la vista de datos. Dejo la vista de variables y vista de datos. Bueno, pues en la vista de datos yo voy poniendo el número sujeto, 1, 2, 3, 4, 5. Género, 1 hombre, 2 mujer, 2 mujer, 1 hombre, 1 hombre, ¿vale? Curso, pues en este caso, tercero, tercero, tercero, segundo. Grupo, A, B, B, A, A. ¿Vale? Conocimiento, pues acordaos que esto me parece mucho, bastante, mucho, bastante, poco. Esto me parece que aquí se ve un 3, ¿no? Bueno, pues imaginaos que yo empiezo a rellenar toda la lista, ¿no? Puedo tener 50, 100 encuestas, las que sean oportunas, ¿vale? Y luego lo que hago ahí es coger y me voy a donde pone aquí, analizar, ¿no? Analizar estadísticas descriptivas, frecuencias, ¿no? Estas categorías de mucho, bastante poco. Nada, solamente podemos hacer análisis de frecuencia, no podemos hacer otra cosa. Si pusiéramos preguntas, y hay que ponerlas en cualquier encuesta, que se valoren de 1 a 10, pues entonces ahí podríamos hacer descriptivos, que serían la media, la mediana, la moda. Y eso, bueno, pues conviene, ¿verdad? Bueno, pues estadísticas descriptivas, frecuencias, que es lo único que podemos hacer aquí. Entonces, son muy poquitos datos, prácticamente ya veis que no tenemos casi datos, pero simplemente es a efectos de visualización para que veáis lo que sale, ¿vale? Le damos ahí. Y nos va a decir que, nos va a salir esta pantalla, entonces nos va a decir que ¿qué variable queremos que nos saque las frecuencias? Bueno, pues yo quiero que me saque las frecuencias de conocimiento. La pulso aquí y le doy aquí. Entonces, me lo trae a este lado. Aquí le puedo dar a la tabla de frecuencias para que me las saque de una determinada manera, como las ordene de mayor a menor o de menor a mayor. Y aquí los gráficos, es decir, vamos a decirle también que nos haga un gráfico, en concreto le podemos decir que nos haga un histograma, ¿vale? Yo le puedo pedir que me haga diferentes gráficos. Y al final el resultado que tendría es este. Fijaos que me va a salir aquí, si esta es la tabla activa del PSPP, aquí al lado me va a salir un archivo de resultados. Bueno, aquí si veis, pues las frecuencias, me dice que, ya veis que es muy poquita, ¿vale? Me dice que de poco, que lo conocen poco, el valor 3, ¿vale? Hay uno solo, que corresponde con un 20% de la muestra, ya que tenemos solamente 5 sujetos. Mucho, hay 2 sujetos, que es un 40%, y bastante otro. 2 sujetos que son el 40%, ¿vale? Tenemos aquí el porcentaje, el porcentaje válido en este caso, todo el mundo ha contestado a las preguntas, pues todos son porcentajes válidos. Y el porcentaje acumulado, 20, 40, 60 y 100, ¿vale? Aquí lo tenéis. Tenemos 5, la muestra es 5, ¿vale? El máximo es 3 y el mínimo es 2, ¿de acuerdo? Y este es el histograma que saldría. Evidentemente cuanto más datos mejor, ¿de acuerdo? Pues aquí tenéis el PSPP y cómo funciona, ¿eh? Bien. Entonces, os lo descargáis para ir trabajando con él. Y ahora a continuación vamos a ver ya lo que es el tema que nos toca hoy día. El tema que nos toca hoy día, pues como sabéis es, lleva por título, vamos a ver si me voy al principio, vamos a ver, vamos al principio y lleva por título recogida y tratamiento de datos. Bueno, pues vamos a ir viendo poco a poco los contenidos. El primer contenido que tenemos ya en este tema, es definir una serie de conceptos básicos. Población, le llamamos población, pues al conjunto de elementos que constituyen el objeto de investigación. Si yo quiero investigar sobre lo que piensan los jóvenes de Guadalajara, de la política de la juventud del ayuntamiento, la población N son los jóvenes de Guadalajara. Todos los jóvenes, ¿de acuerdo? Entonces habría que definir lo que es joven. Por lo tanto ya teníamos otro paso más. Por ejemplo decimos, jóvenes son... Personas que tienen de 16 a 30 años. Pues me voy a las estadísticas del INE, veo el número de jóvenes que hay y digo, mi población son tantos jóvenes. Los que sean, ¿de acuerdo? Bien, variable. Perdón, frente a población ya sabéis que tenemos muestra. La muestra es el número de sujetos que cogemos para investigar. Evidentemente son mucho menos que la población. Ya veremos en los temas posteriores, pues, cómo se selecciona una muestra. ¿Cómo se selecciona una muestra? Y que hay fórmulas preestablecidas para seleccionarla en función del grado de confianza que queramos asumir o el nivel de error que nos planteemos. La muestra tiene que tener las mismas características que la población. Seguimos, la variable. La variable se refiere a que varía, a que pueda adoptar diferentes valores. En concreto esos valores son características observables. Entonces, por ejemplo, el estado civil tiene cinco valores. Una persona puede estar casada, soltera, viuda, separada o divorciada. La edad, por ejemplo, si definiera de cero a cien años, pues sería una variable continua, ¿vale? De cero a cien años. Una variable numérica. En otro caso sería una variable de tipo cualitativa, ¿no? Y luego, pues, nos sirve lo que intentamos con la estadística es transformar una serie de observaciones que podemos apreciar, que podemos ver, observaciones empíricas, observaciones que están en la naturaleza en relaciones lógicas y numéricas, ¿vale? ¿Vale? Lo que intentamos hacer con la recogida y tratamiento de datos, ¿vale? Bien, seguimos. Las variables, ¿por qué son útiles y por qué son relevantes en estadística, en sociología? Pues, sobre todo, hacen referencia a tres operaciones principales. En primer lugar es el concepto o característica que yo vaya a observar, ¿de acuerdo? En función de, por ejemplo, si estábamos viendo la valoración que hace nosotras, jóvenes sobre la política de juventud de un ayuntamiento, pues, en este caso, bueno, pues, lo que yo quiero analizar precisamente es esa valoración de la política de juventud, ¿no? Por lo tanto, ese sería un concepto que yo tengo primero que definir y precisar. ¿Qué es la política de juventud? ¿A qué me estoy refiriendo, no? Entonces, ahí ya vemos que, bueno, pues, vamos a empezar a hablar de una cuestión que luego va a ser valorada. Luego también ya vemos que tiene su importancia apreciable, ¿no? Lo siguiente sería establecer una serie de categorías, ¿no? Las categorías, en este caso, de cada una de las variables. En el primer caso, dentro de esa política de la juventud, a mí lo que me interesa es ver si los sujetos en este caso, perdón, no sé por qué se ha ido a esta de aquí, ¿vale? Lo que me interesa saber es si los sujetos conocen. La política de juventud del Ayuntamiento de Guadalajara, el concepto de la primera variable, que sería el conocimiento, ¿vale? ¿Cómo defino yo conocimiento de política de la juventud? Esa sea la primera cuestión, para que todo el mundo lo tenga muy claro. Es decir, el conocimiento en este caso sería si los jóvenes a los que va dirigida el cuestionario saben o no saben qué actividades desarrolla el Ayuntamiento dirigida a la juventud. ¿Vale? Fijaos que en este caso, fijaos cómo lo he definido. Si los jóvenes saben o no saben las actividades que diseña el Ayuntamiento para la juventud. En este caso ya me está invitando a que luego las categorías que yo tenga que establecer son simplemente sí y no. En cambio, si lo que yo quiero saber es qué grado de conocimiento tienen los jóvenes de la política que el Ayuntamiento desarrolla hacia la juventud. En este caso, veis que el grado me va a remitir a... Diferentes graduaciones, diferentes categorías. Que en este caso puede ser poco, bastante, mucho o nada. ¿Vale? Incluso, fijaos que si a mí, en cambio, lo que yo quiero evaluar es el grado de satisfacción de los jóvenes relacionado con la política que el Ayuntamiento de Guadalajara realiza dirigida a los jóvenes, el grado de satisfacción me remite a una escala numérica. Lo tendría que valorar de 1 a 100. Luego, fijaos que el concepto es muy importante. El concepto nos va a determinar el resto de cuestiones que aquí tenemos planteadas. Como hemos dicho, lo siguiente serán las categorías que nos vienen por el concepto y luego la escala de medida. La escala de medida también es una cuestión arbitraria. Es decir, si yo lo que quiero saber es si los jóvenes conocen o no conocen la política de juventud, me vale con el sí, no las categorías. Y luego, ¿qué escala de medida voy a tomar? Pues me da igual tomar 1 o 2. 2, 0, 1. Aquí ya es una cosa que de alguna manera es un poco arbitraria. También dentro de la escala de medida me tengo que plantear si, por ejemplo, hay determinadas cuestiones que se pueden plantear en una escala de Likert y si voy a tener un punto central o no. Es decir, si yo en este caso lo que pretendo es valorar el grado de conocimiento que tienen los jóvenes. De la política de la juventud. Y bueno, pues puedo empezar a establecer una serie de categorías que pueden ser mucho, bastante, regular, poco y nada. Sabemos que hay un efecto estadístico que es la tendencia a la media. Por lo tanto, aquí en este caso puede estar ocurriendo un ser o un error. Entonces, lo primero que tenemos que definir es si vamos a tener punto medio o no, ¿vale? Bien. O si, entonces, bueno, pues esto me va a llevar a una serie de cuestiones y una serie de decisiones que voy a tener que ir tomando. O simplemente, pues prefiero que esté el punto medio porque no deja de ser algo natural que la gente se plantee en no definirse, ¿no? O tener dudas. Entonces, eso no está natural. ¿Lo dejo o no lo dejo? Ya, eso depende del criterio del investigador. Y luego es importante también el concepto que nos permite, que nos permite definir los diferentes objetos que existen en la población. De tal manera que vamos a tener, pues, una serie de niveles, de categorías, de variables clasificatorias, ¿no? Las variables clasificatorias se van a referir, pues, precisamente a aquellas variables que nos permiten clasificar sujetos. Entonces, nos van a permitir asignar un sujeto a una categoría. Por ejemplo, ¿ha estudiado o no ha estudiado? ¿Ha sido alfabetizado o no ha sido alfabetizado? Aquellas variables comparativas nos van a permitir ordenar en qué nivel se desarrolla la variable. Y las cuestiones métricas, la variable métrica, nos va a permitir cuantificar diferencias, por ejemplo, número de años o grado de satisfacción. Cuantificar diferencias entre los individuos a los que yo, bueno, pues, de alguna manera les pregunte, las cuestiones que tengo definidas en mi cuestionario. La siguiente cuestión es muy importante, son niveles de medición de variables. En general, en ciencias sociales se consideran cuatro niveles. Acordaos que esto ya vimos algo en el primer cuatrimestre. Ha habido mucho debate en ciencias sobre si la sociología, la psicología, las ciencias sociales se pueden medir o no. De tal manera que en el siglo XIX, pues, a principios del siglo XIX, hay un clima en el cual solamente se considera en ciencia aquello que se puede medir. Frente a eso, Stevens, a mediados del siglo XX, pues, nos propone una escala de medida para las ciencias sociales. Esta escala de medida para las ciencias sociales establece cuatro niveles de medida. Nominal, ordinal, de intervalo o razón. El nivel nominal se refiere precisamente cuando tenemos un... cuando solamente nos permite ese nivel de medida clasificar los elementos en categoría, los elementos de la población en categorías. De tal manera... De tal manera que lo único que nos sirve es para ver si los elementos que tengo son iguales o no son iguales. Si son iguales, los meto en una categoría determinada. Si no son iguales, los meto en otra categoría. ¿Vale? Todos los elementos iguales van a ir a una categoría determinada. Aquí tendríamos todas las variables de tipo cualitativas. Y estas variables nos permiten clasificar, por ejemplo, lugar de nacimiento. El lugar de nacimiento implica solamente que si uno ha nacido en Madrid, pues, todos los nacidos... Los nacidos en Madrid pertenecen a una categoría, punto. Pero eso no significa que sean más que los que han nacido en Valladolid, ¿no? Aunque dicen que de Madrid al cielo, pero bueno, eso dicen algunos, ¿vale? El género igual, hombre-mujer, punto. Estado civil, lo veíamos antes, casado, soltero, viudo, divorciado... No significa nada. Es decir, un soltero no es más que un casado, ni un casado más que un viudo, ¿no? Ordinal. Las variables de nivel ordinal... Nos van a permitir, pues bueno, no solamente ya realizar relaciones de equivalencia, es decir, no solamente ya meterlas en una cajita que determina que todos esos elementos pertenecen a una categoría, sino también ordenar, es decir, una jerarquía. Entonces ya vemos que hay distancia entre las categorías, ¿de acuerdo? Por ejemplo, el nivel de estudios que alcanza una persona. Puede haber estudiado primaria, secundaria, bachillerato o la universidad. O formación profesional. Entonces, ¿eso qué significa? Que aquel que haya estudiado formación profesional se supone que tiene la primaria y la secundaria. Aquel que haya estudiado universidad se supone que tiene la primaria y la secundaria y el bachillerato. Veis que ya estamos estableciendo un orden. Presuponemos una serie de cuestiones anteriores. Ahora, ¿qué distancia hay entre primaria y universidad? No es universal ni tiene sentido establecer distancias. Y aquí pues tenemos muchas de las variables que se utilizan en psicología y en sociología. Básicamente, casi todas las pruebas psicopedagógicas, si no han sido valemadas, es decir, si no han sido establecidas aquellos elementos que tienen que ver con la validez y la fiabilidad, que recordad que son las garantías científicas, estarían en el nivel ordinal. Luego tenemos el intervalo. El intervalo no solamente nos permite meter en cajitas, es decir, que metamos a todos los elementos de una misma categoría en una cajita. No solamente nos permite establecer una jerarquía, sino que además nos permite asignar valores. Nos permite asignar valores numéricos con cierta precisión. Nos permite establecer diferencias. ¿Y aquí qué tenemos? Pues, por ejemplo, las respuestas a las preguntas que hace el CIS. Las preguntas que hace el CIS o cualquier respuesta a cualquier cuestionario valemado, pues nos encontramos aquí. Establecemos, como os digo, distancia entre categorías de objetos. Pero en cambio, el cero es arbitrario. Es arbitrario. La medida de intervalo, pues sería, valora de 0 a 10 la satisfacción con la política actualmente. O valora, bueno, pues da una valoración, por ejemplo, desde muy negativa a 1 a 10 muy positiva sobre los políticos. Bueno, pues vemos que el darle un 4, ¿qué significa? Pues que una escala de 0 a 10 está más próxima al 1. ¿Qué hago? Al 10, ¿vale? Entonces veis que aquí hay no solamente una ordenación, sino además una distancia que nos permite luego establecer datos estadísticos como media, mediana. En este caso, el cero es arbitrario, es decir, no es algo absoluto. La razón serían las variables que se utilizan en ciencia física y en ciencias naturales. Aquí no tenemos ninguna en sociología. Sería y tendría el cero absoluto, sería la temperatura, el peso, y eso, todas estas variables, ¿vale? Seguimos. Y dentro de las variables cuantitativas, las variables numéricas, podemos tener valores discretos que son, pues, aquellos valores que adoptan un valor numérico entero y que no hay entre dos valores, no hay ninguno. Por ejemplo, el número de miembros del hogar. El número de miembros del hogar, pues, puede ser, desde 1, si está solo la persona, 2, si está el hombre y la mujer, 3, si está el hombre y la mujer y el hijo, 4, si está el hombre y la mujer y dos hijos, o la mujer, un hijo y el abuelo. Pero claro, veis que no puede haber 3 miembros y medio, ¿vale? Esto sería imposible, luego estos serían valores discretos. Entre cada dos valores no hay ningún intermedio. Continúa, pues, en aquellos que hay un número infinito de valores, en un intervalo, ¿de acuerdo? Sería, por ejemplo, la renta, ¿no? La renta, pues, fijaros, desde 0, de no tener renta, a ganar, pues, 80.000 euros al mes, ¿no? Bueno, pues, hay una barbaridad, ¿no? Entonces, aquí sí que hay, pues, como decimos ahí, una continuidad, ¿de acuerdo? En la asignación de estos valores. Quiero, vamos a entrar un poquito más en materia. Hoy, los conceptos que quiero, que queden muy claros son, bueno, las categorías, ya sabéis que son cada una de, bueno, pues, de alguna manera, de los cajones en los que yo divido la variable, ¿vale? Para encuadrar sujetos. Aquí, por ejemplo, veis, pues, esto es la población española, me imagino que esta es la población española en el 2011, y, bueno, pues, aquí tenéis una serie de categorías, ¿no? Las categorías serían menos de 16 años, de 16 a 64, mayor de 65. Pues, nos dice que de los 47.000 euros, millones 190.000 habitantes que había en España, pues, casi 8.000.000, 7.800.000 tienen menos de 16 años. 31.213.000 de 16 a 64. Y mayor de 65, 8.093.000. Fijaos, hay muchas más personas mayores de 65 que menores de 16 años, ¿vale? Bueno, pues, el primer concepto que quiero que veáis, bueno, la frecuencia sería, en concreto, el contar los datos. Aquí están contados, ya tenemos establecida la frecuencia. La frecuencia relativa sería el cociente entre la frecuencia, el número de sujetos, que tiene una categoría, que tiene un cajoncito, entre el número total de elementos que corresponde a la población, ¿vale? O que corresponde al conjunto de valores, a la suma de valores de todas las cajitas que hemos dicho antes, ¿no? Esto sería la frecuencia relativa. Veis que aquí la frecuencia relativa, pues, sería dividir ese 7.883.619 entre 47.190.000, ¿vale? Veis que aquí nos da un 0.1671, aquí un 0.66, un 0.17 y 1. Y ya sabéis que la frecuencia relativa siempre va a estar entre 0 y 1, ¿vale? Entonces, bueno, pues aquí tenéis los diferentes valores. La frecuencia relativa se puede convertir en porcentaje y es mucho más útil. Veis que por porcentaje todos vemos que estaríamos acostumbrados a trabajar con estas cifras. El 16.71 tiene menos de 16, el 17.15 más de 65 y la gran mayoría, el 66.14, mucho más de la mitad, son personal en edad de trabajar. 16.64 años. Seguimos. Vais a ver, estos son los tipos de datos que tenemos. Estos son los tipos de problemas que os van a plantear en el examen. Vamos a ver un problema que pusieron, pues, de los primeros que pusieron. En la siguiente tabla se presentan las frecuencias absolutas. Las frecuencias absolutas, ¿sabéis qué son? Estas de aquí, estas son las frecuencias absolutas. Las frecuencias absolutas son n sub i pequeña. Bueno, continuamos. Volvemos a leerlo. Y nos dice, en la siguiente tabla se presenta la frecuencia absoluta de la población adulta por nivel de formación alcanzado y edad. Expresados en miles de personas. Muy importante, ¿vale? A la hora de lograr resultados. Elabore con estos datos la tabla de frecuencias relativas en porcentajes para cada grupo de edad. Es decir, cuántos elementos de cada grupo de edad podemos establecer. Entonces, la tabla, la que os dan en el examen en concreto, tendría, no tendría esta columna de aquí, y muy posiblemente, yo no sé si tendría esta, ¿vale? El resto sí. Bueno, pues ya veis que hay de 16 a 29 años, 864, bueno, esto estaría en miles luego, o sea, había 864.000 personas que tendrían educación primaria o secundaria, ¿vale? Hay 2 millones de personas de 16 a 29 años que tienen educación primaria o secundaria. Esto es la primera etapa de educación secundaria. Lo veis, ¿no? Entonces, lo que haríamos primero sería sumar. Sumaríamos el total abajo y el total aquí en lo que se llaman los marginales, ¿vale? Y nada, pues vamos a ver, vamos a continuar. Aquí veis que me he traído, he cambiado la tabla, y aquí, bueno, me he traído los grupos de edad que los tengo aquí y aquí tengo en concreto, pues, el, bueno, pues el número de sujetos que componen la muestra en este caso, ¿no? De aquí, como digo, puedo hallar la frecuencia relativa, ¿eh? Para hallar, eh, que lo que me piden, ¿no? Los porcentajes, bueno, pues nada, pues yo cojo la frecuencia relativa y lo que hago es dividir el número este de aquí, 8.084, entre 38.058.000 personas, ¿vale? Bueno, pues nada, pues me sale 0,2124. Aquí, 11.648 entre 38.058. ¿Vale? Eh, bueno, pues me daría 0.3061, ¿de acuerdo? Luego así vamos haciendo todo esto, es una frecuencia relativa. La frecuencia acumulada simplemente sumo este con este y me da este. Esto, 0.5185, lo puedo sumar junto con esto, ¿vale? Y me va a dar 0.8061. 0.8061. 0.8061 se lo puedo sumar a este de aquí y nos va a dar este el valor total. Porcentajes, los porcentajes que lo que nos piden, es decir, la frecuencia acumulada no nos la piden, pero bueno, se puede hallar porque ya digo que, bueno, pues no pasa nada, es relativamente sencilla, ¿eh? Bueno, pues los porcentajes, ¿de acuerdo? Lo que decíamos que los porcentajes simplemente multiplican por 100 la frecuencia relativa individual, de tal manera que diríamos que El 30,61% pertenecen a la edad entre 30 y 44 años, ¿no? Muy seguido de eso estarían los que tienen entre 45 y 64. Por último estarían, o en tercer lugar, los de 16 a 29 años, ¿eh? Y, pues por otro lugar, estaríamos los de 65 o más, ¿vale? Veis que ya tendríamos hecho el primer problema. Esto es lo que nos pide, ¿de acuerdo? Ya lo tendríamos hecho y aprobado. Os lo voy a poner otra vez para que veáis lo que nos pide el problema. Nos pide elaborar la tabla de frecuencias relativas, ¿vale? Ni siquiera nos piden porcentajes, frecuencias relativas van a ser porcentajes, ¿vale? Para cada grupo de edad, ¿vale? Bueno, pues eso es lo que hemos hecho. Para cada grupo de edad, ¿eh? Hemos hallado en concreto, pues bueno, pues esta serie de cuestiones que tenemos aquí planteadas. Este es otro problema de otro examen. Aquí tenéis una edad, una serie. Los sujetos, lo que nos dan es esta de aquí, ¿vale? Yo creo que ni esta de aquí ni esta de aquí, no me hagáis caso. Lo primero que hacemos, ponemos los marginales. Y una vez que estén puestos los marginales, pues ya evidentemente ya puedo empezar a trabajar, ¿vale? Ya puedo empezar a trabajar y ya puedo empezar a, bueno, pues jugar con los datos que yo necesite, ¿de acuerdo? Entonces, por ejemplo, aquí yo creo que nos planteaban cuál, aquí nos planteaban el porcentaje de jóvenes entre 20 y 24 años. Bueno, pues el porcentaje de jóvenes entre 20 y 24 años, pues lo tenemos aquí, ¿eh? Estos son jóvenes que tienen entre 20 y 24 años, ¿eh? Entonces, para eso, lo que hacemos es sumar, ¿eh? Sumamos aquí el número de sujetos, ¿vale? Sumamos el número de sujetos, ¿vale? Y establecemos el porcentaje, pues en función del total, en función del total que lo tenemos aquí, ¿de acuerdo? Si lo hicieramos así, veríamos que los jóvenes de 20 a 24 años, pues serían 930, ¿eh? Y corresponderían al 32,27%, ¿vale? 930 y tendrían el 32,27%. ¿De acuerdo? Vale, hasta aquí bien. Bueno, vamos a seguir. Perdón, vamos a seguir. ¿Vale? Bueno, pues eso, aquí ya tenemos aquí este valor. Y ahora, vamos a ver los jóvenes que habría, me parece que es entre 15 y 19 años. Pues entre 15 y 19 años, pues haría lo mismo, ¿verdad? Entre 15 y 19 años. Estarían estos de aquí, ¿de acuerdo? Pues nada, ahí pues habría, bueno, pues 37, ¿de acuerdo? Y serían el 1,28%, ¿de acuerdo? Pues vemos lo que iría ahí, ¿vale? Espérate, a ver. A ver qué nos piden aquí. ¿De 15 a...? 19 años, a ver, los que tienen pareja. A ver, de 15 a 19 años, 37. A ver qué es lo que nos piden aquí. En concreto, a ver, lo que nos piden aquí. 37. Vale, yo creo que nos piden los que tienen pareja, ¿no? Porque, bueno, hemos visto que hay 37, serían 2 y 3, 5 y 4, 9, sí. Los que tienen pareja, ¿vale? Los de 15 a 29 años que tienen pareja. Pues sería un 3,28%. ¿Vale? ¿De acuerdo? Bien. Vamos a ver qué es lo último que piden aquí. Y lo último que piden aquí, en este caso... Pues bueno, volvemos otra vez. Y lo único que piden aquí este problema es aquellos que tienen... Me parece que son, a ver... Sí, los que tienen pareja. Bueno, por lo que tienen pareja son 859, que corresponden al 29,80%. ¿Vale? 859, que corresponden al... Bueno, los que tienen pareja son 859. Bueno, el 82, ahí nos daría la frecuencia relativa y luego posteriormente el porcentaje. ¿Vale? Pues esto sería cómo se resuelven este tipo de ejercicios, ¿no? Y como digo, esto es un punto y medio en el examen. Yo os propongo como tarea que hagáis esta. Aquí dice en la siguiente tabla, se presenta el número de personas según la edad y valoración del estado de salud. Con estos datos se elabora la tabla de frecuencia. La frecuencia relativa en porcentajes para los estados de salud percibidas según consideran su salud mala o muy mala. Es decir, lo que nos están pidiendo es... Aquí igual, aquí no está... Esta columna de aquí no la ponen. Bueno, pues aquí nos han dicho que es malo o muy malo. Nos decían que querían ver eso. A ver, malo o muy malo. Vale, malo o muy malo. Pues nada, lo único que quieren es... Aquí, en concreto, pues el porcentaje. La frecuencia relativa, la que quieren aquí. ¿Vale? Tenemos esos datos en miles de personas y quieren la frecuencia relativa. ¿De acuerdo? Entonces, bueno, pues simplemente sería ir dividiendo cada uno de estos indicadores, ¿vale? Entre el total, ¿vale? O sea, con eso, pues aquí tendríamos, como decimos, la frecuencia relativa, ¿vale? Entre n. ¿De acuerdo? Bueno, pues ahí tenéis un poquito cómo se procedería. Esto, pues hacerlo en casa y lo vemos el próximo día, ¿vale? De tal manera que podamos ir viendo cómo lo vais desarrollando. ¿De acuerdo? Bueno. Pues vamos a seguir viendo... En concreto, vamos a ver, os propone también el tema en internet, en la página web, en el foro, que... Que metáis una serie de datos en el ordenador para hacer la media, la mediana, para calcular estadísticos. Bueno, pues ahí veis que metemos el área del sujeto, ¿vale? Bueno, pues aquí también diría casi todas. A continuación vamos a hacer, pues, medias, ¿vale? Vale, a hacer medias, pues fijaos cómo saldría, ¿vale? Aquí saldrían los valores que tenemos, desde 20 hasta 66, ¿de acuerdo? La frecuencia, el porcentaje de cada uno de ellos. Según la frecuencia estimada, el porcentaje válido, el porcentaje acumulado hasta 100, ¿vale? ¿De acuerdo? Bueno, pues aquí tenéis un poquito cómo se procedería. Tenemos aquí 70 valores. Pon aquí... Dice perdido el 10, pues algo no se habrá pasado, ¿no? O sea, los 10 últimos, veis que aquí pone 10 últimos, ¿vale? La media dice que sería 43,53. La desviación típica es de 97, el mínimo son 20. El máximo 66 años, ¿vale? Bueno, pues aquí tenéis un ejemplo de cómo se procedería a trabajar con el PSPP. Bueno, pues nada, pues lo dejamos aquí. Cualquier duda, como siempre, pues al foro, ¿vale? Muchas gracias.