¡Hola! Buenas tardes. Hoy vamos a empezar con tema 4, vamos a intentar ver tema 4 y tema 5. ¿Me oís bien? No se me escucha. ¿No está puesto el micro? Hola, ¿se me oye? bueno no se me oye nada, ¿no? bueno bueno, el tema cuatro como siempre os comento tenéis que tener en cuenta usar siempre el formulario entonces, si os fijáis lo que vemos aquí en la tutoría repasamos la secuencia de las fórmulas que tenéis aquí en el formulario fundamentalmente y se explica un poco el tema cuatro aquí ya empezamos a hablar de dos variables hasta ahora si os fijáis, básicamente se hablaba de una variable primero se aprendía a contar variables, después a obtener frecuencia, proporciones, porcentajes, después medidas de tendencia central de las variables, después variabilidad, cómo dispersa eran las variables y ahora empiezan a relacionarse las variables. Es decir, ver como dice su nombre, las variables tienen valores. Entonces, ver la relación entre variables quiere decir si los valores de una variable se relacionan con los valores de la otra variable o lo que es lo mismo. Si la variación de esos valores en una variable va en el mismo sentido, sentido distinto, no tiene nada que ver con... las variaciones de los valores de la otra variable. Entonces, básicamente lo que tenéis en el tema 4 y 5 es un resumen de los principales índices estadísticos que se usan dependiendo del tipo de medida de la variable que estéis utilizando. Entonces, veis que aquí en el tema 4 fundamentalmente lo que vais a ver son variables cualitativas y variables ordinales. Entonces, ya sabéis que las variables cualitativas son aquellas que se miden con escala de medida nominal. Es decir, que podéis tener cada uno de sus valores era una cualidad. Puede tener dos valores, que era dicotómico, o puede tener varios valores, que era politómico. Más de dos valores, politómico. También es verdad que una variable que sea ordinal o cuantitativa la puedes transformar en una variable cualitativa. Puedes tener una nota de 0 a 10 y decir apto o suspenso. Por lo tanto, eso sería dicotomizar una variable cuantitativa o politomizarla. La podéis convertir en una variable cualitativa u ordinal. Bueno, la básica forma de ver cómo se relacionan variables cualitativas es… Bueno, en principio, un poco aquí lo que os acabo de decir, ¿no? Si ciertos valores de una variable se asocian con ciertos valores de otra variable. Por ejemplo, si te sientas al principio o al final de la clase y eres hombre o mujer, pues si hay tantos hombres como mujeres al principio de la clase y hombres y mujeres al final de la clase, no hay ninguna relación entre género y la posición. Pero si al principio de la clase solo hay hombres y al final de la clase solo hay mujeres, pues parece que hay una relación. Pues ese tipo, esa es un poco la idea, ¿no? Entonces, lo que os acabo de decir, las variables pueden ser dicotómicas o politómicas o también pueden politonizarse o dicotomizarse, ¿vale? Bueno, esta es la forma simple que ya conocéis, que seguro que habéis visto en otros sitios antes, que serían las tablas de contingencia, la manera de presentar los datos de dos variables cualitativas. Por ejemplo, aquí tenéis sexo, hombre-mujer, sería la variable X, y el grupo que sea control y experimental, que ya un poco sabéis por diseño de investigación. Grupo control y grupo experimental es cuando conformas dos grupos para hacer un trabajo, un estudio, una investigación. El grupo control no recibe ningún tipo de tratamiento distinto o no recibe ningún tipo de tratamiento de ningún tipo. Y el experimental es en el que introducir la innovación, ¿vale? Y aquí tendríais, por lo tanto, tenéis dos valores y dos valores en sexo, hombre y mujer. Pues simplemente en esta tabla de doble entrada, que se denomina tabla de contingencia, lo único que quiere decir es, pues tenéis en total, si os fijáis, tenéis por un lado, ¿no? La variable X, que es sexo, por otra variable, por otro lado la variable Y, que es grupo. Si hablamos solamente de sexo, tendríamos, si os fijáis aquí al final, lo que se llama el marginal, los marginales por fila, pues tendríamos 23 hombres y 17 mujeres. Que serían los marginales de cada fila. A esto se le denomina frecuencias marginales. Claro, de X porque la variable de aquí se llama X. Igual si miramos en las columnas, pues tendríamos 20 personas en el grupo control, 20 personas en el grupo experimental. Pues esto serían las frecuencias marginales de la variable Y. Lo que tenéis dentro de la celda, dentro de las casillas, serían las frecuencias conjuntas. Es decir, ¿cuántos hombres hay en el grupo control? 14. ¿Cuántos hombres hay en el grupo experimental? 9. ¿Cuántas mujeres hay en el grupo control? 6. ¿Cuántas mujeres hay en el grupo experimental 11? Esto es importante que lo entendáis bien porque después cuando vayáis al tema 6, tema 7, entender bien esto, esta tabla de contingencia porque después vais a hablar de funciones de probabilidad. Es decir, ¿cuál es la probabilidad de que un hombre pertenezca a grupo control? Entonces tenéis que tener claro bien cómo se distribuyen y qué idea se hace en cada una de las casillas. y no sé si la cámara está conecta así no sé no sé no sé qué más puedo hacer en online se me oye pues no sé qué es lo que no puede haber con lo que no sé qué es lo que no hay conectado a ver si con esto voy a intentar usar este a ver esto es que no sé cómo se pone A ver, esto cómo es ¿Por arriba o por abajo? ¿Por abajo? ¿Sí? No, por arriba ¿Así? Como así, por detrás Ah, por detrás A ver Así, así Y por abajo ¿Así? Por debajo de la arena A ver A ver, se me oye así más Igual de nada, ¿no? Hola Pues nada Lo siento, no sé O que vaya alguien a decirle a esta mujer A ver si nos puede ayudar ¿Vale? Bueno, lo siento Bueno, voy a seguir explicando Mientras, aunque sea, ¿vale? Bueno, el cuadrito este que teníais Ahí Intento hablar más alto, también la mascarilla no ayuda El cuadrito este que teníais Ahí Pues en realidad es igual ¿Veis? Aquí tenéis la frecuencia Pero la podéis tener en porcentaje Es decir, ¿no? Si yo tengo 23 hombres ¿Sí? eran 14 y 9, control y experimental claro la frecuencia conjunta es 14 cuando dice el porcentaje dice por sexo obviamente por sexo 14 el 14 de 23 pues sería el 60 a ver que dicen que no me oyen ¿eh? ¿tenéis micrófono? esto está puesto, ¿no? ¿sería? y eso también, ¿no? eso ya he dado ¿Me seguís sin oír? Hola. O sea, me oí igual como si no hubiera micro. No puede ir a clase sin micro. ¿Este? Ese me lo he intentado poner y lo único que he conseguido es manchármelo los pelos. Si te traigo uno del aula Venga, muchas gracias Soy el que te da más lata Gracias Bueno, lo único que estaba diciendo era que la tabla esta que os presenté aquí de tabla de contingencia que aquí simplemente tenéis la frecuencia las conjuntas y las marginales pues obviamente eso también se puede representar en porcentaje Le pongo un poco de preciada atención a esto por si alguien tiene alguna duda a la hora de interpretar estos números porque es importante como os he dicho para después para los temas de probabilidad función de probabilidad eso después se va a hacer por probabilidades Y esto lo tenéis que tener claro. Pero bueno, en realidad, si os fijáis, simplemente se trata de hacer el porcentaje, si lo haces con respecto al total, si lo haces con respecto al género o si lo haces con respecto al grupo. Entonces, claro, 14 respecto al total, respecto al 40%, pues supone el 35%. 14 con respecto al sexo, sería 14 con respecto al 23, pues es mucho. El 60,87% y 14 con respecto a 20, que sería el grupo, sería el 70%. Bueno, pues lo que se llama, ¿no? Los porcentajes condicionados por fila o los porcentajes condicionados por columna, ¿vale? Bueno, cuando hay que, a la hora de interpretar las relaciones, bueno, aquí se habla de, te pueden preguntar si una relación es simétrica o asimétrica. Una relación simétrica o asimétrica quiere decir que le deis o no direccionalidad, ¿no? Yo puedo decir, me río porque estoy contento o estoy contento porque me río, ¿no? Pues no sé qué va antes que qué, pues entonces sería simétrico, ¿no? No hay uno que sea causa y otro que sea efecto. Si se plantea que una variable es la causa de la otra, sería una relación asimétrica. En las relaciones cualitativas, en las variables cualitativas es un poco más complicado de ver, porque claro, fijaros que la cualitativa es sí o no. Entonces, pues imagínate, género y posición. Es decir, hay más mujeres al principio de la clase y hay más hombres al final de la clase. Entonces lo que te están hablando es… Es de la relación que hay en esa frecuencia de aparición, ¿vale? Bueno, básicamente lo que tenéis que saber es simetría y asimetría, si hay o no direccionalidad, ¿vale? Bueno, y también la utilización de porcentaje después permite eliminar la influencia del tamaño y se estudia la influencia de los marginales, por eso decía lo importante, la importancia de esto para siguientes temas. Representación gráfica, esto seguro que también lo habéis visto ya antes, la representación gráfica de las barras, ¿no? Claro, como es cualitativo, si os fijáis es barra, ¿sí? ¿Por qué? Hay distancias, hay separación entre ellos, no son histogramas que tenían que estar juntas. Las barras en variables cualitativas hay distancias entre ellos. Porque solamente si es hombre-mujer, en el grupo de control experimental, aquí se ve la diferencia. Diagrama de barra, estas son las adosadas y estas serían las apiladas. Por ejemplo, aquí tenéis hombres y mujeres. Aquí tenéis los verdes representan a mujer y los rojos representan a hombre en el grupo de control. Estos son los hombres y estas son las mujeres. En el gráfico debería ser 100 en total. ¿Aquí? ¿Qué es lo que sucede aquí? Están hablando de porcentajes el 22,5 y el 25 Claro, pero esto si te das cuenta es buena pregunta el 22,5 y 27,5 si te bajas a la aquí no está esto a ver, 22,5 y 27,5 Ah, no hace referencia a esta es de otro ¿Hace referencia a esa? El 35% de hombres y el 15% de... ¿El porcentaje de hombres y de mujeres en el grupo experimentado? Sí ¿Es eso? Sí, 22 y 27 Ah, sí, sí, es correcto 22, sí Y 27, ¿vale? Porque está haciendo, ¿no? Como bien dices tú, ¿sí? ¿Ves? Este sería los porcentajes condicionados al grupo. ¿Vale? Entonces, bueno, en teoría, ¿no? Ya se lo veréis, pues debería, ¿no? Debería esto estar equiparado y parece que aquí puede haber una diferencia de género. Si el género o el sexo es una variable que afecta al estudio, eso puede estar generando problemas en este estudio, ¿vale? Bueno, ahora vendríamos con los índices estadísticos. Y, bueno, ¿qué es un índice estadístico? Pues simplemente es un numerito que te indica si hay... Si hay o no relación, dependiendo del número que te salga. Te cuantifica la existencia o no de asociación. El típico que se usa en psicología es este que tenéis aquí, la distribución chi cuadrado, además se usa mucho en inferencias estadísticas, el que se usa cuando habla de poner en relación dos variables cualitativas que son independientes entre sí. En definitiva, compara las frecuencias conjuntas. Una cosa es lo que tú observas y otra cosa es lo que tú esperas. Cuando dices lo que tú observas y lo que tú esperas, a lo que estás haciendo referencia, lo que tú observas sería... Lo que tienes dentro del cuadro. Tengo 14, 9, 6 y 11. Eso sería lo que yo observo, son los datos observados. Lo que tú esperas hace referencia a que si no hay relación entre género y grupo, pues debería haber una distribución homogénea entre los valores por casilla. Y eso es lo que hace, eso es el valor esperado. El valor esperado en el coeficiente, en la chi cuadrado, simplemente lo que se hace, el valor teórico, es simplemente multiplicar los marginales por el total de cada casilla. Entonces, si tenéis, por ejemplo, si queréis calcular aquí el h cuadrado, este sería el valor observado de la casilla 1. El valor esperado de la casilla 1 sería multiplicar sus marginales, sería 20 multiplicado por 23 dividido por 40. Sería este por este dividido por el total. El valor esperado de 11, pues ese sería el observado. El esperado es 20 por 17 dividido entre 40. Y después se hace el sumatorio. aquí el tema es que el achi cuadrado va a ser siempre positivo sus valores van desde 0 hasta más infinito entonces no tiene un máximo entonces claro, si dice tengo un achi de 12, entonces no sabe muy bien si hay mucha o si no hay relación el tamaño del achi suele ser grande y además está muy afectado por el tamaño de la muestra conforme la muestra es más grande el achi es más grande entonces por eso es por lo que en vez de utilizar el achi cuadrado se suele usar más el coeficiente de contingencia o la V de Cramer el coeficiente de contingencia si os fijáis Es igual que el H cuadrado, es decir, se basa en el H cuadrado pero con variante. Es decir, también mide la asociación que se da en tablas de contingencia, ¿sí? Pero en este caso el coeficiente de contingencia va de 0 a 1. Por lo tanto ya está más acotado, ¿sí? Obviamente si es 0, cuando el H cuadrado es 0, pues el coeficiente de contingencia es 0, ¿sí? Entonces, si yo diese un coeficiente de contingencia de 1, pues querría decir que hay una asociación perfecta. Asociación perfecta en cualitativo quiere decir, pues solo, si seguimos con el ejemplo de la situación en la clase, solo mujeres delante, solo hombres detrás. Eso sería una asociación perfecta. Aquí es posible conocer el valor máximo del coeficiente de contingencia si tenéis tablas de contingencia 2x2, o sea, el mismo número de filas y números de columnas, perdón, 2x2, 3x3, 4x4. Entonces, K sería el número de filas o número de columnas. Entonces, el máximo valor del coeficiente de contingencia sería el número de filas, menos 1 partido por K, o número de filas, raíz cuadrada de eso. ¿Y eso para qué quiero yo el valor máximo? Pues quiero el valor máximo... para saber si hay mucha o poca relación entre las variables ¿el valor máximo no debería ser 1? no necesariamente teóricamente puede ser 1 puede llegar hasta 1 teóricamente, pero hay veces que no, dependiendo del tipo de los datos que tú tengas ¿vale? entonces el valor máximo tiene que ser como máximo 1 nunca puede pasar de 1 es decir, que si hacéis un coeficiente de contingencia que os da el valor mayor de 1 eso no puede ser o si os da negativo, no puede ser ¿vale? más o menos me estáis enterando por allí Estoy intentando levantar la voz. A última hora no sé qué voz tendré, pero vale. Y después tenéis la V de Kramer, que es otra variante, que es otra modificación del H cuadrado. Y, de nuevo, está entre 0 y 1. Obviamente, 0 sería que hay independencia, 1 sería que es perfecto, ¿sí? Y la M hace referencia al número más pequeño de filas y columnas. Para la interpretación, fíjate aquí a la pregunta que tú has hecho, ¿no? En teoría puede llegar hasta 1, en teoría, en una distribución teórica de datos, pero se ve en la práctica que como máximo rara vez pasa el valor de 0.6. ¿Vale? Entonces tú tienes un valor de V de Cramer de 0,6, pues tú dices que tiene una relación perfecta. Y yo digo, bueno, pues el perfecto es 1. Pero en todos los estudios que hay, haciendo simulaciones con ordenador, se ve que es complicado que llegue a ese máximo nivel de 1. Entonces, si tenéis una V, si os dan una V de 0,6, diríais que hay una asociación prácticamente perfecta. Por lo tanto, si es 0,3, no diría ahí, claro, 0,3, ¿no? Si tú te fijas solamente en 0 y 1, dices, ah, 0,3 está cerca de 0, pues sería baja, ¿no? Pero claro, si tú piensas que el valor realmente alto es 0.6, no 1, 0.3 se considera una relación moderada o intermedia, ¿vale? Por eso raíz cuadrada de iK menos 1 entre iK sería 0.6. No, ese es el de contingencia. Ese es para otro. Este solo es el valor máximo para el valor de contingencia. Y el de la V de Cramer va de 0 a 1, pero normalmente no va a pasar de 0.6, ¿vale? Voy un poquito más rápido porque quiero avanzar en temas para ponernos a hacer ejercicio. Me gustaría daros toda la materia antes de Navidad, ¿sabes? Para después dedicarnos más a hacer solo exámenes, ¿sí? De todas maneras, si tenéis alguna duda o alguna cosa, la vemos. El coeficiente phi, hasta ahora más o menos estáis enterando de algo. Bueno, el coeficiente phi se aplica para variables dicotómicas. Es decir, variables que tienen dos valores, ¿no? Pues nada, esto simplemente tenéis tablas de contingencia. Obviamente la tabla de contingencia va a ser de 2x2, ¿sí? Porque tenéis dos valores, 0 y 1 normalmente, ¿no? Es como se suele clasificar. El coeficiente phi, si os fijáis, va desde menos uno hasta uno. Solo para las variables dicotómicas el valor absoluto del coeficiente phi es igual a la V de Cramer. Y bueno, simplemente puede aplicar estas dos posibles fórmulas que son las que tenéis aquí en el formulario. En el formulario la fórmula que tenéis es esta de aquí. Directamente solo la frecuencia. Tenéis N11, pues obviamente es la frecuencia así de la casilla que coincide la primera columna con la primera fila. N22. Pues hace referencia a esta de aquí. Entonces, si os fijáis, el coeficiente phi lo que hace es multiplicar, por un lado, las coincidencias, ¿veis? Los 0 con 0, 1 con 1, menos las discrepancias. 1 con 0, 0 con 1, ¿veis? ¿Veis? Obviamente, si te da 1, ¿qué quiere decir? Que no solo hay coincidencias. Si te da menos 1, quiere decir que solo hay discrepancias, ¿vale? Porque esto va a ser, ¿sí? 1, ¿sí? Y esto va a haber discrepancias, solo discrepancias. Si es 0, quiere decir que no hay ninguna asociación, ¿vale? ¿Alguna pregunta? ¿Os habéis mirado el tema? ¿Sí? Vale. Bueno, perdonadme que yo soy un montón de pesado. Yo soy muy artíble, muy artíble. Siempre os digo, tenéis que mirar el tema antes de venir. Pero bueno, es que si no... Bueno, la última que tenéis aquí es relación entre variables ordinales. Como ya sabéis, ordinal es que hay un orden. Escala ordinal es que va de mayor a menor. No, de menor a mayor. Es decir, una prelación. Vosotros, vosotras lo único que tenéis que saber aplicar aquí es el coeficiente de correlación de Spearman. ¿Sí? Es el que tenéis que aplicar. Todos los demás, los demás coeficientes que aquí se mencionan, la tau beta de Kendall, pues esto no lo tenéis que saber, ¿vale? Solamente si os ponen correlación entre dos variables ordinales, tenéis que utilizar la correlación de Spearman. Bueno, está aquí un poquito más explicado porque es un poco más labriosa. De nuevo, igual la correlación de Spearman, si es cero, es que no hay asociación. Si es menor que cero, pues es inversa. Una relación inversa es decir que cuando uno aumenta, el otro disminuye, ¿no? ¿Sí? Cuántos más kilómetros corro, menos peso, bueno, adelgazo, ¿sí? ¿Sí? Cuánto menos duermo, ¿sí? Cuánto menos duermo, más cansado estoy. Relación inversa, ¿no? Más-menos. O más-más, cuánto más como, más gordito, ¿sí? Pues eso sería relación directa, ¿sí? ¿Sí? Pues, o, ¿no? Por mucho que corra, no adelgazo, no hay relación, ¿sí? Cero, ¿sí? Eso sería un poco la idea de cero, ¿no? Positivo o negativo. El coeficiente de correlación de Spirman, ¿veis? Va desde menos uno hasta más uno. Lo que lo caracteriza, obviamente menos uno sería inverso, perfectamente inverso, uno sería perfectamente positivo y cero es que no hay relación. Difícilmente os vais a encontrar un coeficiente perfecto porque siempre hay fluctuaciones. Incluso aunque la medida sea súper precisa y esté súper claro delimitado los datos que sean extremos, es difícil encontrar un más uno o un menos uno. Ya veréis en segundo que todos estos índices después se asocian a significaciones, es decir, el valor del índice más la probabilidad de que realmente ese índice sea significativo, probabilísticamente hablando. Y eso sería más materia de siguiente curso, ¿vale? Cero, no hay relación, ¿vale? Hay un poco de más detalle aquí en la explicación porque el coeficiente de correlación de Spearman, si veis, es 1 menos 6 multiplicado por el sumatorio de, no, 6 multiplicado por d al cuadrado. Aquí lo que tenéis que calcular son los rangos, ¿sí? Los rangos es simplemente decir primero, segundo, tercero, cuarto, quinto, de menor a mayor. Es decir, si yo os clasifico por edad, pues, ¿no? Tiene el más joven, la más joven, la más vieja o por estatura o por la puntuación en un test, en un examen, ¿vale? Y n hace referencia al número de pares, por ejemplo. Aquí hay un ejemplo, ¿no? Tenéis 10 estudiantes que están medidos en test X y tienen una calificación Y. Estas son las calificaciones en el test, estas son las calificaciones en una calificación Y, ¿no? Una nota Y, ¿vale? Pues veis que tenéis solamente con respecto a la variable X, que sería el test, es decir, el estudiante 1, ¿sí? Tiene 35, el 2 tiene 47, el 3, 85 y así sucesivamente. Bueno, lo primero que hace es ordena las puntuaciones, ¿sí? De menor a mayor. Primero va la 27, la 33, 35, así, ¿no? Y obviamente la 27 corresponde al sujeto, al estudiante 9 y así, ¿vale? Entonces, después estas puntuaciones que van de menor a mayor, pues le asignan un rango, ¿sí? De 1 a 10, ¿sí? Porque había 10, ¿sí? Lo mismo se hace con la I. Tú tengo las puntuaciones de I, ¿sí? Las ordeno de la menor a la mayor y le asigno rango. ¿Cómo se calcula el índice? El índice se calcula simplemente, tiene los estudiantes, tiene las puntuaciones, ¿veis? Pero ya aquí tenemos los rangos. Ya sabemos que el estudiante 1, ¿sí? Con respecto al test 35, ¿sí? Que tenía una nota en el test de 35, ¿veis? Tenía el 35. Tiene un rango de... ¿de cuánto? ¿De 1 o de cuánto? Estudiante 1, test. En el test tuvo 35 con respecto a la nota que es 6,7. ¿Cuál es el rango que ocupa? El 3. ¿Y de dónde sale esto? De las enlacentas rangos de la B. ¿Eh? De las enlacentas rangos de la B. Exacto, porque era el sujeto 1 que tenéis aquí, ¿veis? Y aquí tenéis el 3, ¿no? Y así sucesivamente. Ponéis simplemente los estudiantes, los rangos de la X y los rangos de la Y. ¿Eso lo entendéis? ¿Sí? ¿Hay alguien que no entienda eso? Hay un tema que hay veces que si tienes el mismo rango, imagínate que hay dos puntuaciones iguales. Entonces sería primero, segundo, tercero, cuarto. Dice ahora el tercero y el cuarto tienen el mismo valor, ¿qué hago? Lo divide. Entonces pone tres más cuatro, siete entre dos, pues tres y medio. Y le pones tres y medio a cada uno de rango. Si tiene tres empates, pues tres más cuatro más cinco dividido entre tres. Los empates lo que hace es la media y le pone el mismo rango a todos. ¿Vale? Y ya está. Y ya con esto, pues en este caso sale un menos 0,8. Claro, con 0,8... En menos 0,8 lo único que está indicando es que la relación es inversa, ¿no? Que cuanto más puntuación tienes en el T, menos notas tienes en la I, ¿no? Y además es relativamente alta porque menos 0,8 está cerca de menos 1, ¿vale? Es una relación inversa fuerte, ¿vale? ¿Duda? ¿No se oye? Dicen, me están diciendo por aquí, ¿no se oye? ¿No me oí? ¿En online? Ah, sí, sí. Vale. Bueno, pues entonces... Aquí se pueden tener valores 1 y menos 1, ¿no? Claro, aquí sí pueden ser negativos, aquí el rango, el coeficiente de correlación de Spearman, que es por rango, va desde 0, puede ser mayor que 0, menor que 0, 0, va desde menos 1 hasta 1. Ok, vale, pues paso al tema...