bueno pues ya parece que se ha iniciado la grabación bueno pues bueno también para los que estéis aquí presentes los que estén en streaming y los que veáis están diferidos hoy vamos a tratar tema número 6 el muestreo para la encuesta tenemos programado la pizarra podéis encender el ordenador y entrar en vuestro en vuestro perfil os podéis descargar el pdf vale con la problemática de la con la problemática de la pizarra mira que lo tenemos avisado pero bueno hoy vamos a tratar el tema número 6 si han ido subiendo y las grabaciones de los puedes descargar de powerpoint y pdf es lo mismo la cuestión está en que ellos subió ante powerpoint la plataforma me lo permitía y ahora no me lo permite desde las grabaciones están te lo puedes descargar que mira que te falta alguna lo que se ha metido un correo de los vasos y te lo pasa en el formato que quiera si lo quieren powerpoint powerpoint por cuerpo y la ventaja que tiene es que lo puedes modificar porque vuelvo a repetir son ilustraciones etcétera etcétera y yo me puedo equivocar y hay cosas que yo recalcó como más importante pero usted es luego puedes ver y otras cosas otras dimensiones y al final acabamos que entre todo construyendo otro libro sobre el libro pero bueno bueno venga pues la cuestión están que hoy vamos a intentar intentar terminar el tema 6 el muestro para la encuesta la próxima sesión que tenemos bien ya después de las vacaciones que serán sobre el tema número 7 preguntas el cuestionario un tema muy cortito y además que tiene relativamente fácil como hacer un buen cuestionario que lo veremos después de las vacaciones ya en la última sesión, que será el día 20 algo no, antes del 20, el 10 algo 10 9 de enero, antes del examen pues haremos algunos exámenes, ¿de acuerdo? intentaremos que la sesión sea lo más dinámica posible, en el sentido de que veremos las preguntas que hay de exámenes e intentaremos darle una respuesta así un poco desde nuestro punto de vista, ¿vale? o sea que tenemos la clase de hoy y la clase del próximo día para terminar lo que es finalizar el temario teórico. Bueno, ya nos vamos a meter en harina, ya lo decíamos que al principio de la asignatura era un poco así esotérica podemos llamarla de alguna forma, pero ahora ya nos estamos centrando en cuestiones que realmente son realmente son prácticas y realmente se trabaja de forma profesional así, ¿no? El muestreo para la encuesta tenéis que partir de una base que ya hemos visto en una en el tema anterior mismo la encuesta, fijaros, la encuesta ya más o menos todos sabemos lo que es, ¿no? De hecho alguna compañera le han realizado una encuesta por primera vez en su vida, ¿verdad? Y ya has visto que se hace, ¿verdad? En el ámbito profesional con las encuestas parece algo así como de inteligencia, pero que se hacen, ¿verdad? Bueno, pues, ¿qué es el muestreo? ¿Qué entendéis alguien, me podéis decir? No, por el chat, los que estáis aquí presentes me podéis decir qué entendéis por muestreo. ¿Qué creéis que puede significar el muestreo? Venga, decís cualquier cosa, es lo mismo. Elegid una muestra, ¿vale? ¿Y qué es una muestra? 9, 8, 7 6, 5, las elegidas. Vale. Una recopilación de muestras, ¿vale? Más cosas. 5, 4, 3, 2, 1, 0. Venga, para el muestreo, esto para la mente solo tenéis que tener claro, una muestra es un conjunto de personas que son las elegidas para una encuesta, pero que son representativas del conjunto de la población, ¿ok? Así. Una selección de personas o cosas, pero esta selección es representativa del conjunto de la población o sea si la población es una población sea cual sea la población una muestra es un conjunto pequeño de esa población pero que reúne las mismas características de la población en general si tenemos los alumnos de grado en sevilla en el centro asociado de sevilla y tenemos seis mil y pico de alumnos que cursan aquí los estudios queremos hacer una encuesta para medir la satisfacción de los alumnos con las instalaciones pero etcétera cogeremos una muestra del conjunto de los seis mil y pico de alumnos que tiene el centro asociado de la unes en sevilla de acuerdo pero claro imaginaos que como una muestra y seleccionamos todos hombres o cogemos una muestra y seleccionamos todos del grado en criminología porque yo soy el que hago la encuesta como a todos los hombres del grado en criminología es esa encuesta es representativa del conjunto de la población no está cerrada tiene que ser una muestra representativa del conjunto de la población en el grado de la un buen perdón en el centro asociado de la unes sevilla hay varios grados casi todos los grados autorizados más másteres más microgrado más grado más más cursos acceso a la universidad pues tendré para ver la satisfacción de las personas con las instalaciones que tendremos que que segmentar de cada una de las poblaciones la el grado de participantes en nuestra encuesta vale de forma que por criterios de fijación pues fijaremos cuánto cogeremos del grado en criminología cuántos hombres cuántas mujeres cuánto cogeremos de los primeros cursos cuánto cogeremos de los últimos cursos etcétera etcétera etcétera para que el conjunto de la de la muestra que escojamos a la cual le vamos a aplicar la encuesta sea representativa del conjunto de la población bueno pues esto es lo que tenéis que tener claro nítido en la mente y empiezo a leer las muestras se utilizan al objeto estudiar una parte de la población y a partir de esa subpoblación hacer estimaciones sobre la totalidad de la población vale la repito las muestras se utilizan al objeto de estudiar una parte de la población y a partir de esta subpoblación a partir de esta muestra de su población hacer estimaciones del conjunto de la población imaginaos que la aquí presente y aquí presente soy la muestra nuestra muestra escogida aparte y os pregunto cuál es vuestro grado de satisfacción con las grabaciones que se realizan vale pues a partir de esta muestra de ustedes hacemos estimaciones del conjunto de todas las personas que están matriculadas en esta asignatura en el centro asociado de los medios sevilla eso es lo que significa hacer estimaciones y os pregunto que si la utilidad de las grabaciones y ustedes me contestáis de 1 a 10 cuál es vuestro grado de utilidad bueno vamos a poner que sale de media un 0,5 pues a partir de ese 0,5 estimamos que en el conjunto de la población en el conjunto de todos los matriculados en esta asignatura pues la media de valoración del 1 al 10 0,5 vale sigo la atracción de muestra ha sido concebida como la ciencia que permite controlar y medir la fiabilidad de la información estadística útil mediante la aplicación de la teoría de probabilidades y a esto lo veis así con en sí más y tal y ahora cuando termina aquí vamos a dar esto mismo en este mismo grado en el año que viene en la técnica de estadística esto no viene de la nada esto se funda bajo los criterios de la probabilidad matemática o sea no podemos hacer una muestra y yo digo venga vamos a hacer una muestra del conjunto de los egresados en la del conjunto de los estudiantes generaron criminología en la unes a distancia y vamos a hacer una muestra de los de sevilla eso se tiene que hacer mediante criterios estadísticos que se basan en teoría de la probabilidad que el año que viene lo veréis vale de acuerdo de forma que todas las unidades que entren en el llamado bombo entre comillas tengan las mismas posibilidades de ser escogida y de que una unidad no puede ser escogida vale matemática lo que viene pero no preocuparse muy fácil bueno las razones para el uso de la muestra primera razón de tiempo y coste económico evidente tiempo y coste económico sólo entendéis no si yo tengo que hacerle una encuesta a todos los alumnos y alumnas del grado en criminología pues imagina todo el tiempo que me puedo llevar y el coste económico que tiene tendremos una población de 50 60 70 o 100 2 la muestra probabilidad pro ofrecen más datos que los derivados de los censos bueno vale en fin de comillas pero si ofrecen más datos porque él y digo entre comillas porque hoy en día se empieza a trabajar con registros etcétera etcétera pero bueno la muestra ofrece más datos porque simplemente el censo podemos establecer a más los censos son cada 11 años y bien así que eso si acaso no le eche mucha cuenta o saltar las muestras permiten mayor rapidez en la recogida de datos y celeridad de hecho en su publicación eso sí es rápido y más cola con las particularidades que hoy tenemos con la encuesta que se podemos hacer por intento si escogemos una pequeña muestra 400 500 mil personas más rápidamente recogemos los datos más radicales los podemos publicar le sigo en encuestas traversas las preguntas están de repetidas en distintas encuestas se consigue un efecto diacrónico y dinámico permitiendo analizar la información de opiniones actitudes o comportamientos a lo largo del tiempo diacrónico en el sentido de que la puedes puedes recabar las opiniones a través del tiempo hacia atrás y dinámico en el sentido de que puedes bueno tiene una serie de dinámicas es dinámico Seguro, seguro, seguro sea así. Pero, oye, tiene una gran probabilidad de que así sea. Por tanto, las encuestas pueden permitir o pueden diferenciarse debido a la actuación de las muestras laboratorias en poblaciones heterogéneas. Bueno, esto es algo así como un poco así, ¿no? Es la medida, el año que viene sí, pero este año no. Pero vos lo tenéis que conocer. El error es la medida de la distancia entre valores estadísticos obtenidos en la muestra y el valor de parámetros en la población. ¿Qué es el error? El error es si yo he obtenido un 0,5 en la utilidad de las teorías en la muestra de los aquí presentes, más los que están en Internet, el error será la diferencia que hay entre esa medida que he establecido en la población y el conjunto de la población. Se mide en tantos porcientos. Un error del 2%, del 3%. Un error del 2% o hasta el máximo que se permite es un error hasta del 5%. Pero ya entramos en errores estadísticos, ¿vale? Estoy hablando con una cosa muy simple, que es una pregunta de valorar la utilidad de las grabaciones. Pero, oye, estamos hablando de, yo qué sé, de la encuesta de la población activa o algo por el estilo, que tienen unos márgenes de error que tienen que ceñirse al mínimo. Y luego el nivel de confianza, que es la probabilidad de que esa distancia o error no sea mayor de la actualización. O sea, y los niveles de confianza más usuales en 95,5, en 97, en 99 y en 99,5. En el 99,5% de las veces que repita la encuesta tendré un margen de error del 2%. ¿De acuerdo? Esto os suena a matemática pura y aquí intentad comprenderlo. Lo tenéis en el libro, tenedlo localizado por si os viene el examen, pero que no, vamos, yo no creo que os van a preguntar, vamos, de hecho no viene y tal, ¿no? Este año no viene, sí. Este año, pues bueno, tenéis que tener conocimiento de que el muestreo no lo elegimos al azar. El muestreo lo establecemos mediante reglas matemáticas, mediante sus fórmulas y establecemos dos parámetros básicos. Uno que es el nivel de confianza y otro que es el margen de error. El fundamento estadístico del muestreo, sigo, propone generalizar los resultados obtenidos en la explotación de encuestas al conjunto de la población total. Observando, ¿no? Los márgenes de error y de probabilidad. Por tanto, la teoría de la probabilidad es el fundamento básico del muestreo. Esto sí, tal y como viene aquí, lo que más o menos tenéis que tener... Si ahí tenéis que memorizar algo de lo que hemos visto, memorizad esto, ¿vale? Bueno, pues vamos a la terminología básica del muestreo. Cuando empecemos a trabajar de forma profesional, como criminólogos y criminales, y tendréis que construir una muestra para hacer cualquier tipo de estimación estadística sobre vuestras poblaciones, tenéis que utilizar una terminología científica básica. Y es así y no es de otra forma. La terminología es primero la población. ¿Qué es la población? La población es el agregado de elementos del que se extraerá la muestra. Repito, agregados de elementos del que se extraerá la muestra con la que se va a trabajar en una investigación. ¿Ok? ¿Vale? La población es... A partir de tal, el conjunto de los graduados en Sociología, el conjunto de los usuarios de las instalaciones del Centro de la Unión en Sevilla, el conjunto de la población reclusa, etcétera, cualquiera de ellas. Muestra comprende a la población, pero no a su totalidad. La amplitud de la muestra debe ser proporcional a la magnitud de la población, en el sentido de que si tenemos una población reclusa, no sé cuántos pueden ser, 30.000 personas, 40.000, 50.000, no lo sé, pues tendremos que coger una muestra acorde a el tamaño de la población. ¿De acuerdo? Debe de garantizarse la variabilidad que existe en la población con respecto a las variables de estudio. O sea, que si tenemos el conjunto de los usuarios de las instalaciones del Centro Sociado de la Unión en Sevilla, dentro de la muestra tiene que haber la variabilidad que hablábamos antes. Los diferentes grados, los diferentes sexos, los diferentes niveles de edad, ¿de acuerdo? El otro día sacábamos, yo creo que es a la memoria, y os estoy hablando del Centro Sociado de la Unión en Sevilla y del uso de instalaciones porque el otro día estaba haciendo la memoria, pues estaba haciendo la parte de la memoria y estaba calculando la edad media de los grados. ¿Sabéis cuáles son los grados con menor edad media aquí en Sevilla? Pues son física y química por una parte, y luego casi igual educación social y criminología. Son con la edad media más baja. Extraigamos las conclusiones que estimemos. ¿De acuerdo? Bueno, por eso dentro del conjunto de la población de los usuarios del Centro Sociado de la Unión en Sevilla, pues tiene que existir esa variabilidad. Imaginaos que cojo, pues estoy hablando de edad media. Y nada, ahora cogemos a todos los alumnos de criminología de edades superiores. ¿Es representativa? No. Y la edad media más alta de todos los grados es sociología y ciencias políticas. Sociología, ciencias políticas e historia. Es la que tiene mayor edad. Y ahora me voy a los más jóvenes. Y todos los más jóvenes en sociología. Y ahora en educación social y en tal, cojo a los hombres en vez de a las mujeres, que tienen más mujeres. En fin. Tiene que dentro de la muestra que escojamos medir esa variabilidad. Tiene que tener, para que sea representativa, esa variabilidad que pueda existir en el conjunto de la población. A eso se refiere. Luego, otro de los criterios en la muestra es que haya ausencia de distorsión en la elección de la muestra, evitando que partes de la población sometidas a observación no estén incluidas en el marco muestral. ¿Vale? Que no distorsionemos nosotros a elegir la muestra. Imaginaos que estoy intentando trabajar con los alumnos del grado en criminología y yo distorsiono la muestra porque os cojo a ustedes y a los presentes. Y sin embargo, no cojo a los que lo ven en diferido. Estoy distorsionando la muestra. A lo mejor sin querer. A lo mejor porque hay mayor probabilidad de elección. Pero bueno. El otro día estábamos trabajando con una revisión sistemática de la literatura. Sobre un tal, ¿no? Y hacíamos una muestra de los estudios en los últimos cinco años de innovación docente, etcétera, etcétera, etcétera. Y distorsionábamos la muestra. ¿Por qué distorsionábamos la muestra? Vale, ¿otra vez? ¿Sigue grabando? Sí, está arriba el puntito grabando. Venga, vamos, continuamos. Qué bien. Bueno, que sea representativa de la población, que garantice la reproducción de las características básicas de la población, tanto cuantitativa como cualitativamente. ¿De acuerdo? Cuantitativa en el sentido de, oye, edad, secuencia, etcétera. Sexo, como cualitativamente, como otros tipos de variables. Lugar de procedencia, etcétera, etcétera. Sigo. Si voy demasiado rápido, lo siento, pero es que tenemos que ir así, ¿no? Bueno, el marco de la muestra son las unidades de población acotadas de las cuales se va a extraer la muestra. A mayor definición del marco muestral, mayores probabilidades de reducir los sesgos. La situación ideal, que no siempre existe, pues hay universos no registrados o difícilmente catalogables, requiere un registro exhaustivo individualizado de los elementos de la población. El marco de la muestra son los elementos que pueden ser elegidos dentro de la muestra. Lo repito, imaginaos que es un bombo. Tengo una población, ¿eh? Y ahora cuando yo me pongo a hacer la muestra, digo, bueno, pues de esta población voy a escoger mi marco muestral. Y son los que tienen, los que seguro que tienen la probabilidad de salir. ¿Vale? Acotando los que pueden salir. ¿Vale? El marco muestral. Se ha de verificar que la población que deseamos entrevistar o encuestar, el universo teórico coincide con aquel que se trabaja en el universo de trabajo. Producto de la elección de la muestra. ¿Vale? El marco muestral, en definitiva, es las unidades con las cuales vamos a trabajar. En la población, pero ya acotada, ¿no? Porque hay a lo mejor personas a las cuales no podemos hacer, porque viven en las montañas, o porque tal, o porque el conjunto de la población recursa. Pero hay a lo mejor los que están en tercer grado, que tienen más posibilidad para poder acceder, otros que tal, y los que están incomunicados a eso no podemos acceder. Son población, sí, pero no podemos acceder. Están en el marco muestral, ¿no? ¿Vale? ¿Así? Venga. Las unidades muestrales, ¿qué son? Hola. Las unidades muestrales. Pues son las unidades muestrales. Es cada uno de los elementos que son unidades muestrales. O sea, cada uno de los elementos que van a participar en la encuesta o tal. La talla de la muestra, el número de personas que van a participar o elementos que participan en nuestra muestra. ¿Bien? Bueno, pues tenemos marco de la muestra, población, unidades muestrales, y talla de la muestra. ¿Vale? Eso, bueno, voy a explicar un poco esto. ¿Vale? Entonces, las unidades muestrales simples en una sola etapa. Las unidades muestrales solo corresponden con los individuos. En diseños polietápicos se selecciona unidad muestra conforme a un proceso de etapas normalmente jerarquizado. Desde unidades muestrales primarias hasta unidades muestrales finales. ¿No? Pero bueno, esto es cuando lo vamos haciendo por etapas. En el sentido de que empezamos con, yo os digo yo, el conjunto de la población reclusa y empezamos con los... Los... El conjunto de la población reclusa a nivel nacional. Luego, a nivel autonómico. Luego, los dividimos por hombres y mujeres. Vamos así, trabajando con etapas. ¿No? Hasta que al final escogemos, yo sé, la cárcel de Soto del Real, la cárcel de Morón y la cárcel de Huelva. Y ahí hacemos la encuesta. ¿Vale? Bueno, aproximación a la lógica del muestre probabilístico. Esto es lo mismo. La homogeneidad y heterogeneidad de la población. La muestra debe contener la misma variabilidad, heterogeneidad que se da en la población. Eso lo hemos visto. Sesgo. ¿Los sesgos qué son? Cuando dicen, oye, la muestra está sesgada porque hay algún tipo de infrarrepresentación o sobrerepresentación en las unidades muestrales. De tipos o características de una sobre otra. Es lo que hemos estado viendo. Hay infras... Imaginaos que hacemos una encuesta y hay una infrarrepresentación de mujeres y una sobrerepresentación de mujeres. Porque no está bien diseñada la muestra. Continúo. Representatividad y probabilidad en la elección. Cada elemento de la población debe tener la misma posibilidad de ser elegido. Regla 1. Conocer esta probabilidad de elección implica la existencia de una seguridad estadística probable. En muestras no probabilísticas, la seguridad estadística no existe y por tanto no se podrán evaluar márgenes de error imposibilitando a la generación. Diferencia estadística. ¿Vale? Es lo que hablábamos al principio. Es lo que yo os decía al principio. Cuando realizamos muestras no las hacemos por nuestro antojo. Lo hacemos en base a la teoría de probabilidad. ¿Vale? La teoría de la probabilidad es la que nos da las reglas matemáticas para hacer las muestras. ¿Vale? Definidas por un nivel de confianza y un margen de error. Y la regla número uno es que en un muestreo probabilístico cada uno de los elementos tiene la misma probabilidad de ser escogidos que el resto de los elementos. Y todos los elementos tienen la probabilidad de poder ser escogidos. No vale una muestra sobre la población reclusa de la cual eliminamos los incomunicados, pero resulta que por algún tipo de tal a la de Santander no podemos acceder. O, por ejemplo, cuando se estudia la población reclusa en Cataluña, creo, y creo que en Cataluña, aunque yo no estoy muy puesto en temas de... En temas de... De penitenciario, pero bueno, se verá en el próximo cuatrimestre. Cataluña tiene otra administración, con lo cual es imposible. No podemos acceder a esa muestra. Está la muestra cerjada. Los presos que están cumpliendo condenas en las casas catalanas pues no tienen la probabilidad de hacer escogidos nuestros muestras. Pues nada, si no, bueno, no estoy por poner algún tipo de ejemplo. ¿Vale? Continúo. Bueno, ahora los tipos de muestreo. ¿Vale? Esto... Esto casi que por de memoria también. Sí, es que... A ver. Hasta ahora era todo interpretativo. ¿Vale? Los focos cruz, los grupos de discusión, las entrevistas, etcétera, etcétera. ¿Vale? Era toda una cosa sin interpretativa. Yo cuando empezamos la encuesta os lo dije. Digo, aquí ya... Esto ya estamos empezando en serio. Y ahora estamos con la muestra y esto es que así y no es de otra forma. O sea, los muestreos probabilísticos son... Los tipos de muestras. Los muestreos son probabilísticos y no probabilísticos. ¿Probabilísticos por qué? Porque se basan en la teoría de probabilidad. Y no probabilísticos porque no hay probabilidad. ¿Vale? Los probabilísticos son aleatorios simples. Aleatorios simples que significa, imaginad que tenéis todas las bolas en un bombo. Y movéis el bombo del bingo y sacáis las bolas. Al azar. Luego tenemos al azar sistemático. ¿Vale? Y imaginaos que tenemos un conjunto. Un millón de personas. ¿Vale? Por ejemplo. Y decimos que vamos a coger el conjunto... Vamos a tirar una bola y cogemos el 13. Y sale... Tiramos una bola y sale 64. Y tiramos otra y sale 32. Y ahora cada... Vamos a escoger el 64 más 32. Más 64 más 32. O sea, establecemos un azar sistemático. Establecemos siempre el azar sistemático. Y ya tenemos el mismo sistema para la elección. ¿Os vale el ejemplo o pongo otro? Si no, lo repito. Saco... Tengo del 1 al 1 millón. Y saco un primer número. Y me sale el número 64. Y saco un segundo número. Y me sale el 32. El primero es el 32. El segundo es el 64. Y ahora le voy sumando 64 más 32. 64 más 32. Me lo he inventado. Es una regla. Pero es al azar. Pero hay un sistema. A ver, escógelo. ¿Vale? O un algoritmo que lo podamos establecer. Estratificado. Resumido en pocas palabras. Cogemos la muestra. Tiene que ser proporcionada al conjunto de los estratos. ¿Qué son los estratos? Pues imaginaos que cogemos una muestra. Hombres y mujeres. Pues tiene que ser proporcionada al número de hombres y al número de mujeres. ¿Vale? Si escogemos los estudiantes de educación social en el grado de la UNED en Sevilla, que tiene un 65% de mujeres con respecto a un 35%, y escogemos una muestra, pues la muestra tiene que ser proporcionada al 65% de mujeres y al 35% de hombres. ¿Verdad? Yo no puedo tener una muestra que tenga un 70% de hombres y un 30% de mujeres. ¿Que no? Pues por eso mismo. Porque tiene que ser estratificado. ¿Vale? Por conglomerados. Muy bien. Por conglomerados es cuando ya las elecciones muestrales no las hacemos sobre... individuos, sino sobre conglomerados. Ahora imaginaos que en realidad vamos a hacer un conjunto de una muestra y en lugar de individuos, pues cogemos conglomerados. Bloques de piso... Similares. ¿Vale? Tenemos las encuestas a un bloque de piso en la barriada de Pino Montano, a otra en la barriada del Polígono de San Pablo, a otro en la barriada de la Macarena Tres Huertas, y a otro en el Tal. Y hemos hecho del 41-15 de Sevilla. Hemos cogido 10 bloques. Luego nos pasamos al 41-13 de Sevilla y cogemos tantos y así sucesivamente. No cogemos unidades muestrales, cogemos los bloques de piso, por ejemplo. ¿Vale? Y son conglomerados porque ya no es una persona, sino un conglomerado, varias. Polietápico, que luego lo veremos, y luego los no probabilísticos. Hemos visto en la primera parte izquierda probabilísticos que se basan en la teoría de la probabilidad, parte derecha no probabilístico. ¿Qué significa no probabilístico? Que ya... Ya ahí no hay teoría de la probabilidad, entra la subjetividad del investigador, que pueden ser por cuotas, intencionados o de conveniencia. ¿Vale? Lo veremos. Venga, primero, muestreo aleatorio o alafar sistemático. Sencillo y leo. Y prototípico. Se necesita un registro de la población a partir del cual se seleccionan las muestras. Imaginaos tener en vuestra mente la bola, el bombo del bingo. ¿Vale? Condiciones que cada elemento tenga idéntica probabilidad de ser incluido en la muestra. Que cada posible combinación de n elementos ha de tener la misma probabilidad de construir la muestra. Una muestra aleatoria simple de tamaño n está compuesta por n elementos elegidos entre la población, de modo que todas las muestras de ese mismo tamaño tienen la misma posibilidad de ser elegidas. Diversas estrategias para elección de muestras. Bombo de la lotería, calculadoras, ordenadores, tablas de números aleatorios, etcétera. Los... El listado de teléfonos, etcétera, etcétera. ¿Vale? Y esto que viene aquí es así y no es de otra forma. Y cuando vayáis a poner y hacéis la irreferencia a la muestra es n minúscula. No es o, ni mue, ni m, ni nada. Es n. Y a la población n mayúscula. ¿Vale? Bien. Bien, ¿no? ¿Tenía algún problema con esto? Venga, pues continúo. El tamaño de una muestra aleatoria simple. Los factores que influyen en su fijación. Los recursos disponibles. El tamaño, o sea, el presupuesto real y el tiempo. Evidentemente, tendremos que... Si vamos a una muestra, tendremos que presupuestarla y el tiempo que tenemos. El diseño de la muestra. Los diferentes diseños requieren tamaños muestrales diferentes. La varianza de la población, o sea, la mayor heterogeneidad de la población. Mayor varianza. En consecuencia, mayor tamaño de muestra. Si no existe conocimiento sobre el tamaño de la población, pues normalmente se acude a que la varianza es 50%. Si no conocemos el tamaño de la población o no conocemos, por ejemplo, si cuántos hombres y cuántas mujeres lo componen, pues asumimos que 50% de hombres y 50% de mujeres. Conforme mayor variabilidad asumamos, pues mayor nivel de error. Pero bueno, esto ya es algo más matemático. Lo que quiero que tengáis en cuenta es que mayor tamaño de la muestra... Perdón, a mayor población. A mayor tamaño de la muestra. A mayor heterogeneidad de la muestra, o sea, cuanto mayor varianza haya en la muestra, haya en la población, mayor tamaño de la muestra. A menor margen de error, mayor tamaño de la muestra. Y a mayor nivel de confianza, mayor tamaño de la muestra. ¿De acuerdo? El error ya lo hemos explicado antes, pero bueno, yo si acaso lo vuelvo a repetir. Es la distancia entre valor esterístico obtenido en la muestra y el parámetro en la población. A medida que aumenta el error... A medida que aumenta el error muestral, disminuye el error. A medida que aumenta la muestra, disminuye el error. O sea, cuanto más muestra tengo, menos error tengo, evidentemente. Si yo estoy haciendo una muestra sobre la utilidad de las tutorías jalabadas y hago una muestra de 25 personas, pues tendré un margen de error. Si en vez de hacerla de 25, la hago de 50, me disminuirá el error. Si la hago de 75, me seguirá disminuyendo el error. Y si la hago del 100% de la población, pues ya no hay error posible. Como en los temátodos, ¿verdad? Y el nivel de confianza, que normalmente se prefija en el 95, en el 97,5, en el 99, en el 99,5. Si lo fijo en el 95,5%, solo de cada 100 muestras que escoja, 5 superarán los niveles de error prefijados anteriormente. Bueno, esto lo he traído de Julio Borda, que es también profesor de gran criminología. Y bien, ahí viene un poco más detenidamente explicado y demás. Yo os lo he puesto ahí, o bueno, si tenéis interés de más, lo leéis y a lo mejor os saca de duda. Pero bueno, eso es lo que ya lleváis hoy y yo creo que vais bien. Continúo. Muestro aleatorio sistemático. Y se parte de un listado de la población por sorteo de la primera unidad. La primera unidad, el 64. Se calcula un coeficiente de elevación o intervalo de muestreo. Bueno, K igual a N, etcétera, etcétera. Unidad debe ser inferior acá. El resto de los elementos muestrados se obtiene sumando el número inicial, el coeficiente de elevación y así sucesivamente. Es lo que yo he dicho antes. Al azar sistemático, yo cojo una primera unidad en un listado del 1 hasta 1 millón, por ejemplo. En el listado de los números de teléfono o en el listado de los alumnos del grado en criminología o de los usuarios del centro de la UNEJ en Sevilla y cojo la primera unidad. Acevedo Blanco. Que soy yo, ¿vale? Y ahora estimo un algoritmo, este u otro cualquiera. Y el primero y luego el 33 y luego 33 más, luego el 33 más, 33 así. Hasta que cojo hasta el último, ¿vale? Es al azar, pero con un algoritmo que me indica qué unidades debo sacar. El muestreo estratificado. Permite obtener mayor representatividad disminuyendo el error muestra. Se basa en el supuesto de que las poblaciones homogéneas producen muestras con errores muestrares más reducidos. Se seleccionan elementos a partir de sus poblaciones homogéneas desde el conjunto de la población total. Cuando el universo es muy heterogéneo, se desean aplicar diferentes tipos de muestreo probabilístico y los diferentes tratos de la población se trata a las subpoblaciones como una población única a partir de la cual se construye el proceso de la teoría y sorteo. Bueno, y luego cómo sostienen el tamaño de los estratos, ¿proporcionales o no proporcionales? Bueno, o sea, imaginaos que el muestreo estratificado de los alumnos en el centro asociado de la UNED en Sevilla para medir sus instalaciones y tenemos una población que está dividida en másteres, grados, microgrados y acceso a la universidad. ¿Verdad? Vale. Cada una de esas poblaciones, ¿verdad?, tendrá dentro de esas cinco poblaciones que he nombrado la que mayor peso tiene en los grados, ¿no? Eso tendríamos el primer estrato. Ahora, dentro de los grados tenemos 10 o 15 grados que se dan en la UNED. Grado en Criminología, Grado en Sociología y Ciencias Políticas, Física, Química, Matemática, etc., etc. Cada uno con una población, ¿no? Sería el siguiente estrato, ¿de acuerdo? Y luego dentro de ese estrato, imaginaos que hay otro estrato por abajo. Mujeres. Y otro estrato por abajo, nivel de acceso, de cómo han accedido. Bien, por el acceso a la universidad, por el BUC, por el COU, etc., etc. Cada uno de esos estratos tiene un peso poblacional dentro del conjunto de la población. La muestra que vamos a construir tiene que trabajarse con respecto a todos esos estratos y ser proporcional a cada uno de los estratos o no proporcional, dependiendo del peso que le demos a cada uno de esos estratos. ¿Cómo empezamos? Pues las tendremos que diseñar, ¿de acuerdo? Imaginaos si hay 6.500 alumnos, el 80% están en un grado, pues tendremos que coger el 80%, 86% de nuestra muestra de grado. Y el resto de las otras titulaciones. Ahora dentro de grado tendremos que coger si Derecho y Psicología son los que más tienen. Y Derecho y Psicología tienen como mil y pico de alumnos. Y Psicología... No, Derecho mil y pico y Psicología hay Derecho 700 o por tal. Pues tendremos que ser, nuestra muestra tiene que ser de Psicología y Derecho más, ¿no? Luego tendremos que coger dentro ya de aquí, pues tendremos que hacerlo proporcional dependiendo del tipo de acceso y hombres y mujeres. Pues todos esos estratos que hemos nombrado, conforme y proporcional a esos estratos, construiremos nuestra muestra, ¿vale? Criterios, estadísticos, fórmulas, etc. Bueno, hay tres formas de afijación, o sea, a darle el peso a la muestra de cada uno de ellas. Primero, la afijación simple, se asigna el mismo tamaño muestral a cada estatus, o sea, cogemos el mismo número de elementos de cada uno de los grados. Desde el primero, desde Psicología, hasta el último. ¿De acuerdo? ¿Qué ocurre? Las encuestas electorales dependen... Depende de la encuesta y depende de la elección, ¿vale? Te vas a la página web y lo ves, el diseño de la muestra. En el CIS, por ejemplo, viene. Pero normalmente, claro, tienen que tener en cuenta que una encuesta electoral, pues una encuesta electoral primero, si es a nivel nacional, pues tiene que coger... Normalmente son 3.600 elementos las que hace el CIS. Pues tendrá que coger Andalucía, que tiene un peso de la población tanto. Tiene que coger Andalucía, de Madrid, etcétera, etcétera. Pues esté estratificado y luego, por último, va a las unidades muestrales, ámbito rural, ámbito urbano, etcétera, etcétera. Cada uno de los estratos, ¿vale? Pero vamos, estamos en el caso de los grados, en el centro asociado de la UNED Sevilla, que parece que no... Estamos trabajando y ya estamos metidos en ese mundo y si nos vamos a otro tipo de estrato, pues nos perdemos. Bueno, afijación simple, sí he dicho que cogemos de todos los grados, de la UNED Sevilla, de todos los grados. Pero el mismo tamaño, pues ¿qué ocurrirá? Que las carreras con menos personas, pues tendrán un mayor peso dentro de la población. Proporcional, cogeremos proporcional a cada uno de los grados, ¿cierto? ¿Qué de psicología son los que más gente hay? Pues cogeremos más gente de psicología, más de derecho, más de educación social, más de trabajo social, más de criminología, así sucesivamente. Y menos de las carreras que tienen menos. Y luego por último, la afijación óptima. Que esto se hace, y esta es una que me preguntan constantemente, pero normalmente no la van a preguntar en el examen. Si lo preguntan, quedaros con esto. Porque esto hay que saber un poco de estadística, hay que hacer una... O sea, hay que tener mayor conocimiento matemático y tal. Pero bueno, con que os quedéis, con que la afijación óptima se hace teniendo en cuenta... La varianza poblacional, con eso ya es suficiente, ¿vale? La afijación normal que existe es la proporcional. O sea, todo el mundo cuando hace una encuesta, hace afijación proporcional. Y hace otro tipo de afijación de Neymar o una afijación óptima por la varianza, etcétera, etcétera. ¿Vale? Bueno, por conglomerado. Lo decía antes. Ahora, las unidades no son los individuos, sino un conjunto de individuos. ¿Qué? Bajo determinados supuestos pueden ser considerados una unidad. En el diseño de investigación se parte de una selección inicial de clústeres o conglomerados. Para poder proceder a continuación con la elección de los elementos dentro de cada uno de los conglomerados. Cuando la población que se pretende estudiar se agrupa por áreas. Por ejemplo, la población de un barrio que se agrupa por manzanas. Se pueden seleccionar determinadas áreas o manzanas. De forma que cada uno por sí sola represente lo más posible a la población de este barrio. Este tipo de muestreo se denomina por áreas o por conglomerados. Simple. Lo más rápido. Para que, como siempre os digo, para la mente. Muestreos por conglomerados es cuando las unidades de muestreo no son individuos, sino conjuntos de individuos. Clústeres o conglomerados. ¿Vale? Pensad que ya no cojo individuos, sino cojo bloques de piso. Lo que hablábamos antes. Para los que sois de Sevilla capital o los que sois de cualquier otra población. Que Sevilla, por ejemplo, está dividida en distritos. El 41 tal o el 41015. Que es donde vivo yo. Bueno, estoy dando ya demasiados datos. A lo que voy. Imaginaos que ahora, en vez de... Vamos a hacer una encuesta política, como dice Obrero4. Vamos a hacer una encuesta política, ¿no? Para pedir, oye, para las cargas de Sevilla. Próximo alcalde para las elecciones que ha partido a votar usted, etcétera, etcétera. Y vamos a hacer la elección. En lugar de unidades por conglomerados, ¿no? Normalmente las encuestas políticas, primero se hace por conglomerados. Y luego, a partir de los conglomerados, se cogen las unidades muestrales. Las mínimas. Y ahora lo que cogemos, en lugar de unidades, cogemos bloques de piso. Nuestra unidad va a ser un bloque de piso. Y vamos a entrevistar a todos los géneros en bloqueo. A unos bloques de 41015. Oye, ¿cuántos barrios están compuestos? Pues uno de aquí, otro de aquí, otro de aquí, otro de aquí. ¿Vale? Amate, no sé qué. Pues cogemos un bloque de amate, otro de aquí, otro de aquí, otro de ahí. ¿Vale? Nuestras unidades son bloques. Conglomerados, clústeres. O sea, conjuntos de individuos. Bueno, esto es un poco así, tal, ¿no? Nos va a hablar de la... Claro, tenéis que tener en cuenta que está en una ola. Un poco complicado. En primer lugar, porque esto se hace con fórmula y se ve mejor. El año que viene lo veréis. Pero claro, como se muestre ahora, se escriben tesis. Todos los años se escriben varias tesis, ¿no? Y todo esto que viene aquí, pues un poco así, bien, que lo entendáis y demás. Si alguien tiene alguna duda, pues si no, ahora vuelvo, ¿vale? A ver si me da tiempo de intentar acabarlo todo. Quedan unos pocos minutos. El tipo de muestreo no probabilístico. Utilizando cuantos... No se dispone de un marco muestra para la población en el estudio cuando simplemente no se considera adecuado el uso del método probabilístico. Y son... Muestros por cuota, aplicado principalmente al marketing y estudios de opinión sobre la base de que se desarrolla en el conocimiento de la población y sus proporciones. Sobre esta base se asigna un tamaño muestra proporcional según los estratos. En la práctica se asigna peso a las cerdillas en una población y se va construyendo una matriz de celdas y va construyendo... O sea, marca a hombres y mujeres con niveles de estudios superiores. Por ejemplo, imaginaos que estáis haciendo un estudio de élite o algo similar, ¿no? A élites de grandes empresarios, de gente de mucho dinero y demás. Y os jodáis por cuotas, ¿no? Hombres, mujeres, etcétera, etcétera. Y asignáis a estas personas en concreto, ¿vale? La muestra intencionada. Bueno, esto ya es cuando simplemente vamos a... Y realmente ya de aquí no hay ningún tipo de probabilidad, sino que simplemente las escogemos porque sí, porque nuestro objeto de estudio pues así lo requiere. Y pueden ser muestreos de casos extremos, muestreos de casos poco usuales, muestreos de casos con máxima variación a los límites, muestreos de subgrupos homogéneos, muestreos estructurales, muestreos con informantes estratégicos y mezcla de las anteriores. Ya esto, el muestreo no probabilístico es de muestras intencionales y esto hay diferentes tipos de muestreos, pero esto ya es porque como no hay posibilidad de hacerlo proporcionalmente o bien el objeto de estudio no lo requiere, pues hacemos muestras intencionales. ¿Qué pasa? Que no podemos extraer conclusiones generalizarlas en conjunto de la población, pero oye, al fin y al cabo sigue siendo un estudio, ¿de acuerdo? Por un tipo de muestra. Y las muestras de conveniencia. Por tu hito o accidental. Caso en que salen al encuentro el entrevistado los más disponibles, no sé. Esto ya pues totalmente experimental. Salgo a la calle y os hago aquí, me pongo ahí en los pasillos y voy entrevistando al que vaya pasando por los pasillos sobre el uso de las instalaciones. Muestra de conveniencia directamente. No hay ningún tipo de probabilidad. Y esta es la última. Yo lo que quiero es que nos centremos en la diapositiva que ya puedo dejar de ir tan rápido. En la diapositiva esta, aquí, ¿vale? Nos centramos aquí, ¿bien? Tipo de muestreo. Primero, muestreo probabilístico y no probabilístico. ¿Qué significa eso? Venga, explícame. ¿Cuál es la teoría de probabilidad? ¿Cuál? El probabilístico. ¿Y el no probabilístico? No hay teoría de probabilidad, ¿vale? ¿Queda claro? No hay duda, ¿no? Primero. Primero, aleatorio simple. Dime, al azar. ¿Vale? ¿Hay problemas con eso? Segundo, al azar sistemático. ¿Alguien por ahí? ¿Un algoritmo o una regla sistemática? ¿De acuerdo? Bien, ¿no? ¿Extratificado? ¿Nada? ¿Proporcionada? Vale, pero dilo más concretamente. Cada uno de los estratos. ¿Vale? Muy bien. O sea, la muestra es proporcional a cada uno de los estratos de la población. ¿De acuerdo? Para la confección de la muestra tenemos en cuenta cada uno de los estratos de la población para su confección de la muestra. ¿Bien? ¿Tú tienes una población y la población está dividida por una serie de características? ¿Vale? ¿Sí? Cada una de esas características es un estrato, ¿no? Sí. No sé qué ejemplo te viene bien. El de las clases, el de los grados. No hace falta. Pero te viene bien cualquiera de esos ejemplos, ¿verdad? Los grados. Cada uno de ellos son un estrato. ¿Bien? ¿Por conglomerado? Exactamente. Ahora, las unidades muestrales no son unidades muestrales sino conglomerados. ¿Vale? Conjuntos de individuos. Luego viene el polietápico. Y yo no sé. Yo aquí no lo tengo. ¿Viene por aquí en el libro? Yo creo que no. Viene a decir y el polietápico debe... Bueno, yo lo explico por encima. Normalmente el que se suele hacer en investigación social grande, que se divide en diferentes etapas. En un principio se escogen unidades de conglomerados y luego posteriormente se escogen unidades muestrales. ¿Qué os digo? Hacer la... Acoger los conglomerados. Por ejemplo, bloques de piso o manzanas. Bloques de piso en la zona urbana. Manzanas en las zonas rurales. Escoge esos bloques de piso y luego baja ahí. Y dentro de esos bloques de piso escoge las unidades muestrales. ¿Vale? Está en dos etapas. Viceversa. ¿Vale? En diferentes etapas. Etapa número uno y luego etapa número dos o tres o las que sean necesarias. Bueno, a la izquierda tenemos los probabilísticos y no probabilísticos. Vuelvo a repetir. Los probabilísticos son los que se basan en la teoría de la probabilidad. A partir de la teoría de la probabilidad se construyen una serie de... De una serie de... De fórmulas y demás que son las que nos determinan cómo hacer una muestra. Y luego a la derecha tengo las no probabilísticas. Las no probabilísticas que son... Como no son probabilísticos, o sea, no me tengo que ceñir a los criterios matemáticos de la probabilidad. Pues ya puede ser por cuotas. Se lee con una serie de cuotas. Oye, voy a hacer un... Una muestra a los abogados. En activo. Y voy a coger a los penalistas, a los abogados laboralistas y a los de turno de oficio. Me quedan otra serie de abogados por ahí. Pero oye, yo escogí esta cuota. No hay probabilidad del conjunto de los abogados en activo. No. Pero oye, las razones que sean las que sean las que nos convengan a nuestro estudio. Pues así determinan que tenemos que trabajar de esta manera. Que no puedo generalizar los resultados. Que no puedo extraer... Conclusiones matemáticas. Evidentemente. Pero no quita que la... Que sea un estudio. Muchas veces, la gran mayoría de las veces, no podemos hacer muestras probabilísticas. No podemos acceder. Luego las muestras intencionadas. Y luego las muestras de conveniencia. Las muestras de conveniencia que es así más experimental. Que salimos y escogemos a los caballos viniendo. Como una especie de bola de nieve. Y las intencionadas, pues... Que simplemente elegimos. Hay diferentes. Cuando se hacen muestreos de élite. Cuando se hacen diferentes tipos de muestreos. A personas más informadas, etcétera. Hay una serie que vienen ahí en el libro. Que ustedes lo leéis con más tranquilidad. Pero si tenéis alguna duda. ¿Y esto qué significa? Me lo decís y demás. Pero lo interesante es que sepáis esto. ¿Vale? Que sepáis que las muestras son probabilísticas. No probabilísticas. Y que están divididas en aleatorios simples, asociados, sistemáticos, stratificados por conglomerado y por conglomerado. Por el politápico no creo que sea. Bueno, pues ya hemos acabado con este tema. ¿De acuerdo? La semana que viene, cuando volvamos de las vacaciones. Vemos el tema de las... El tema de las... De las preguntas. Tema 7. Lo vemos. ¿Vale? Cómo se hacen las preguntas en los gestionarios. Y el día antes del examen. Pues tendremos que hacer algo más dinámico. Nos traemos las preguntas. Y las responderemos aquí de una forma un poco así más amena y demás. ¿No? Podemos decir todas las cosas que se nos vengan a la mente. Y demás. Y tomar notas de... Oye, estas frases, ¿no? Que tú pones en un examen. Que el muestreo es probabilístico. Se basa en la teoría de la probabilidad. Y eso no te lo puede echar para atrás nadie. Y esas cuatro o cinco cosas básicas que hay que poner cuando se llegue a una prueba. Bueno, pues nada. Muchas gracias a los que estáis viendo esto. ¿Vale? Y en diferido. Y a los que estáis en directo por asistir. Y nada. Que feliz navidad. ¿Vale? Muchas gracias. Una cosa. Dime. ¿Saben que se prueba el libro? Sí. Pero el libro lo voy a ir comprando. O sea. No pueden ver. No pueden. Sí. ¿Vale?