Hola, proseguimos con el tema 1 de estimación de parámetros y contraste de hipótesis. Nos habíamos quedado en el ejemplo 1.6 que no lo había terminado el último día. Habíamos comenzado a leerlo, pero vamos a retomarlo completamente. Recordemos que estamos en los intervalos de confianza, en este caso, para la proporción. Ahora, pretendemos encontrar dos valores de P, la proporción, entre los que se encuentra con una cierta probabilidad la probabilidad de éxito poblacional, obviamente a partir de los datos de una muestra. Entonces, en el ejemplo 1.6, para sedimentar los conceptos, se decía para dejar constancia real de las preferencias de los padres sobre la lengua vehicular en la que prefieren que se eduquen sus hijos una determinada asociación de padres realiza un análisis. La encuesta sobre una muestra de 800 familias. Esa es la muestra. Y ya tenemos, por consiguiente, el número de N, el tamaño muestral. Residentes de una determinada comunidad autónoma bilingüe. De todo ese párrafo, lo único que ahora mismo nos interesa es que tenemos, a efectos del ejemplo, son 800 familias, tamaño muestral. De esas 800 familias hemos encontrado que 280 son partidarias de que todas las enseñaduras se enseñen en casería. Vamos a llamar, de forma arbitraria, a P la probabilidad de éxito que una familia sea partidaria de que las asignaturas se enseñen en castellano. Esto es completamente arbitrario. Lo único que es importante es que una vez que hemos determinado cuál es lo que vamos a considerar éxito, ya sabemos cuánto vale P en nuestra muestra. Con un nivel de confianza del 95%. Nos indican el nivel de confianza. 95%. O 0.95. ¿Entendemos? De probabilidad. ¿Entre qué valores se encontrará la proporción de padres? Que en esa comunidad son partidarios de que todas las asignaturas se impartan en castellano. Que es el evento que nosotros hemos determinado como éxito. Repito, de forma arbitraria. Colocamos todos los datos que nos han dado en nuestro esquema. Ahí hemos dicho que en la población la variable X es dicotómica, es eres o no eres partidario del castellano. En este caso, la unidad muestral. Y poblacional también. No es el individuo, no es el sujeto. Es la familia. Se han cogido 800 familias. Cada familia es una unidad muestral. Nos interesa, queremos conocer cuánto vale P. Que es la proporción de éxitos en la población, pero no lo conocemos. Por eso hemos colocado aquí un signo de interrogación. Ahora nos vamos a la muestra. En la muestra tenemos 800 familias. Y de ellas... 280 son partidarios del castellano. Vale. Y la distribución... Tenemos que la distribución muestral se corresponde a la proporción. Y que alfa vale 0.05. El nivel de confianza, 0.95. Esto es lo mismo que habíamos visto anteriormente. Al tratarse de una muestra grande, n igual a 800 es bastante grande. Es obvio que la distribución binomial se aproxima bastante a la normal. Por consiguiente vamos a utilizar los valores centrales, los valores de distribución normal. Vamos a la tabla de la zeta. Aquellos valores que dejan una probabilidad central del 95%, nuestro nivel de confianza. Estos valores son... Menos 1,96 y 1,96. Es decir, que entre esos dos valores está el 0,95% de toda el área de la distribución zeta. Y por encima de 1,96 y por debajo de menos 1,96 queda el otro 5%. 0,025 por debajo y 0,025 por encima. Hemos conseguido ese valor de 1,96 buscando la tabla. Observen en pantalla, en la tabla de la curva zeta, es decir, de la curva normal tipificada, lo que nos están pidiendo es un valor concreto de zeta que deja por debajo de sí el... 0,025. Entonces hemos buscado en la tabla, en el interior de la tabla, el 0,025 y luego nos hemos ido a la primera columna, primera fila. Menos 1,96 es el valor de zeta que deja por debajo de sí, observen el área señalada en la figura, que deja por debajo de sí el 0,025. De toda la distribución zeta. Ahora, si nos vamos a buscar, podríamos razonar por simetría. La curva zeta es simétrica, por tanto, si menos 1,96 es el valor que deja por debajo de sí el 0,025, es obvio que más 1,96 dejará por encima de sí el otro 0,025. Si lo buscamos en las tablas, no podemos buscar en el centro de la tabla 0,025 porque si nos damos cuenta arriba, lo que nos dan las tablas es la probabilidad acumulada y por lo tanto tenemos que buscar aquella puntuación, aquel valor de puntuación, aquel valor zeta, que deja por debajo de sí la suma del nivel de confianza 0,025 más el otro extremo que habíamos visto previamente. Ese 0,025. Entonces si aquí tenemos 0,025 y aquí 0,025. Su suma es 0,975. Buscamos en la tabla ese 0,975 que deja por encima de sí el 0,025, el área en blanco que vemos en esta gráfica, aunque la vemos un poco recortada, y es 1,96. Es obvio que es mucho más cómodo buscar estos valores partiendo de la propiedad simétrica de esta distribución. Aquí lo vemos en términos de la curva normal. Vemos que el área en amarillo por debajo del menús 1,96 y por encima de 1,96 abarca un área de 0,025, en conjunto el 0,05 y entre esos dos valores de 1,96 y menos 1,96 queda el nivel de confianza, 0,95 y buscamos el límite inferior y el límite superior, el intervalo de confianza. Aquí en este gráfico ya nos aparece, pero aún no lo hemos calculado. Hemos simplemente determinado que necesitamos la curva Z y que esa curva Z en función de alfa hemos calculado los valores apropiados para incluirlos ahora en la fórmula. Lo que hemos calculado que ha sido este valor y este otro valor. Vamos a ponerlo Z de alfa medios y Z de 1 menos alfa medios, Z de 0,025 y Z de 0,975 que son lo que hemos visto anteriormente en la gráfica. Menos 1,96 y más 1,96, esos serán estos dos valores. Ahora nos tenemos que coger para calcular el límite superior e inferior P. Observen que aquí tenemos P que es la proporción muestral. De éxito que hemos obtenido en nuestra muestra. N sabemos también cuánto vale, son las 800 familias. Entonces a P le vamos a restar este valor para calcular el intervalo, el límite inferior y se lo vamos a sumar para calcular el límite superior. Observen que aunque tenemos dos signos sumatorios, este se nos convertirá en negativo porque este Z es negativo. Entonces sería lo mismo que poner un único Z, Z de alfa medios en ambas fórmulas y entonces aquí añadir el menos y aquí el más. Hay varias formas de hacerlo. Aquí vemos los cálculos. Entonces la probabilidad de éxito eran 800 y pico familias en, no recuerdo los datos concretos. 800 familias en total y de ellas 280 partidarias del castellano. Si dividimos 280 entre 800 nos sale la probabilidad de éxito, perdón la proporción de éxito que es lo que vamos a poner en la fórmula, nos sale el 0,35. 0,35 es la proporción de éxito. 1,96 menos 1,96 y 1,96 es el valor Z, 0,35 de nuevo era T y 800 el tamaño muestral. Si hacemos este cálculo nos sale que el límite inferior vale 0,31 aproximadamente, si redondeamos 0,32 y el límite superior 0,38. Es decir. Que. Hemos obtenido en nuestra muestra un valor puntual del estadístico de proporción igual a 0,35. Ese es el valor puntual que vamos a estimar como mejor estimación de la proporción poblacional de éxito. Pero sabemos que nos estamos equivocando y hemos calculado un intervalo confianza, ese intervalo confianza va a cubrir, va a contener el verdadero valor de pi poblacional, de la proporción poblacional. En el 95% de toda la muestra. Y ese intervalo de confianza va a estar entre 0,32 y 0,38 aproximadamente, no, no, aproximadamente no. Teniendo como punto medio la estimación puntual 0,35, podemos afirmar que la proporción de éxito en la población se encuentra entre 0,32 y 0,38 a un nivel de confianza del 95%. Eso es el intervalo de confianza para la proporción. Es lo que indicábamos en esta, en esta presentación. La proporción poblacional será 0,32, 31.7% y 0,38, 38,3% con una probabilidad de un nivel de confianza del 95%. Ese es el cálculo de los intervalos de confianza en el caso de que estemos interesados en una variable dicotómica. Por consiguiente utilizamos la proporción. Bien. Hemos visto que en todos los casos anteriores. El. La amplitud del intervalo de confianza, si es más grande o más pequeñito, ¿de qué depende? En primer lugar, del nivel de confianza. Nc. Que es 1 menos alfa. Pero también depende del error típico de distribución muestral de ese estadístico. Es decir, en todos los casos, si nos cogemos esta fórmula como representativa del resto, vemos que para calcular el estadístico, en este caso era una zeta, siempre lo vamos a hacer en función de alfa. Y alfa está en función del nivel de confianza y de los datos muestrales. Es decir, el nivel de confianza y el error típico de distribución muestral. El segundo, en la fórmula que hemos visto anteriormente, la raíz cuadrada de p por 1 menos p partido por n, era el error típico de distribución muestral de la estadístico proporción. Es lo que tenemos que todos los intervalos de confianza dependen de estos dos factores. Nivel de confianza y error típico de la distribución muestral. Nivel de confianza y error típico de distribución muestral del estadístico concreto con el que estemos trabajando. Ahora bien, este segundo factor está en proporción inversa al tamaño de la muestra. Y esto significa que cuanto mayor es el tamaño de la muestra, menor es el error típico. La distribución muestral está cada vez más centrada alrededor de la estimación puntual. Su variabilidad es menor, lo cual es lógico porque conforme n, el tamaño de la muestra, se incrementa, significa que nos acerca aún más a lo que es la población. Si nos acerca aún más a lo que es la población, tenemos menos incertidumbre sobre cuál es el verdadero valor del parámetro poblacional. Obviamente, mantiendo constante el resto de factores. Creo que esto se conoce como, si no me equivoco, como ceteris paribus. A igualdad de factores, se cumple que cuanto mayor es el tamaño de la muestra, menor es el error típico. Y ahora nos ponen un ejemplo. Ci aquí no significa coeficiente de inteligencia, sino intervalo de confianza. En este caso, aplicado a la media. El error típico de la media, ya lo hemos visto, cuando se desconoce la varianza poblacional y la muestra es pequeña, es de el cociente entre la cuasi-desviación típica entre la raíz cuadrada del número de datos muestrales. Para obtener el intervalo de confianza, se multiplica este valor por el valor de la distribución t de student. Desconocemos la varianza poblacional. Para un determinado nivel de confianza, el que se haya decidido, aquí tenemos la fórmula. Es el producto entre un estadístico, en este caso el estadístico t, con n-1 grados de libertad. No confundamos este n-1 que en la t representa los grados de libertad, en la distribución t. Mientras que este subíndice n-1 representa la cuasi-desviación típica muestrada. El producto de estos dos factores, es decir, el producto de esto, por esto es lo que se conoce como el error máximo de estimación y se va a representar por él. Es obvio entonces que los intervalos de confianza son... Se... Se calculan como la estimación puntual del estadístico más o menos este error máximo de estimación. Y este error máximo está en función de alfa, el cual a su vez está en función del nivel de confianza y del tamaño muestral. Lo que hemos hecho en esta fórmula ha sido simplemente elevar al cuadrado todo este componente y despejar n. Hemos elevado al cuadrado para quitar la recuadrada. Por consiguiente, ahora... T nos aparecerá al cuadrado, s nos aparecerá al cuadrado, raíz cuadrada al cuadrado desaparece la raíz cuadrada y el cuadrado, y e al cuadrado. n que está dividiendo pasa multiplicando, pasa multiplicando y e pasa dividiendo. Y nos encontramos con esta fórmula. Vemos como ahora hemos despejado n y tenemos que... Eh... Podemos calcular el tamaño muestral en función del... Del resto de elementos. Esto puede ser muy útil en el caso de que queramos obtener una determinada estimación del intervalo de confianza, que el intervalo de confianza esté entre unos determinados valores de imprecisión. Si el tamaño de la muestra es grande entonces la distribución de referencia es la normal tipificada. Es... Si se dan cuenta esta fórmula es la misma que la anterior solamente que en vez de la t tenemos una zeta. ¿Por qué se le está diciendo confianza? Nos aparecería a continuación en el texto este cálculo de n del tamaño muestral necesario para obtener o conseguir un error máximo de determinada magnitud. Vemos que es muy parecido en todos los casos. Tenemos que el primer componente siempre es... Eh... La varianza de la distribución muestral de ese estadístico o su mejor estimador como vemos en este caso, en estos dos casos. Este es un poquito más complicado porque está multiplicado por 2 y es la cuasi-varianza al cuadrado. Esto es la varianza p por q, es la varianza en el caso de la proporción. Debo decir que estos primeros factores son o están en referencia a la... Eh... Varianza de la distribución muestral de ese estadístico. Mientras que el cociente en el otro elemento del producto siempre está en función del estadístico que estemos utilizando, zeta, t, chi cuadrado y del error máximo que estemos dispuestos a acometer. Y nos ponen un ejemplo. Ejemplo 1.7. Vamos a desgranarlo. Se desea calcular el tamaño muestral. Es decir, n. Necesario en una encuesta electoral. En una encuesta electoral en la que... Recuerden que una encuesta no es lo mismo que un censo. Un censo es cuando entrevistamos o medimos una determinada variable en todos los elementos de la población. Eso es cuando vamos a votar. Todo el mundo vota o si no vota se le asigna la categoría de que no ha votado pero todos han dado su respuesta. Una encuesta electoral... Es cuando nos cogemos a una muestra de esa población. Y queremos que la precisión de la proporción de voto estimada, es decir, el error máximo de estimación que vayamos a acometer sea de más o menos 0.02. No queremos que nuestro error máximo alrededor del pi de la proporción poblacional se aleje más de 0.02. Queremos ser muy precisos en nuestra estimación si nos damos cuenta. Para ello... Para ello lo que hacemos es lo siguiente. Aquí estamos asumiendo, por cierto, que la encuesta electoral hace referencia a una pregunta dicotónica porque el ejemplo lo han puesto en términos de proporción. Es decir, que se les ha preguntado a una serie de individuos, se les quiere preguntar a una serie de individuos si van a responder una opción o su complementaria. No hay más opciones de respuesta. Vamos a utilizar proporción de votos a favor y en contra. Por ejemplo, del gobierno o de lo que sea. Asumiendo que la proporción de votos a favor y en contra es del 50%, es decir, que tenemos la máxima incertidumbre, luego veremos por qué hacemos ese supuesto. Si no lo hiciéramos nos tendrían que dar en torno a dónde queremos establecer esa proporción de votos. Es decir, si estamos haciendo una encuesta sobre va usted a votar a favor o en contra de entrar en la OTAN, de entrar en la UE, aunque eso ya es bastante antiguo, etc., asumimos que como no tenemos información previa, la mitad de la población va a decir que sí y la mitad de la población va a decir que no. Recuerden que realmente aquí lo único que nos interesa es N. Nos interesa saber el tamaño que tenemos que escoger de sujetos para entrevistar. Y aplicaríamos entonces la fórmula de la proporción donde N es igual a P, la proporción muestral que nos indicaría que estarían a favor, P menos 1, 1 menos P. Esto es un error. Es P menos 1. La razón es muy sencilla. P siempre va a ser inferior a 1. Si lo ponemos como P menos 1 esto sería un valor negativo, lo cual no tiene sentido. Es decir, entonces P, 1 menos P será la proporción de sujetos en contra, que muchas veces se le llama, se le representa como Q. P por Q multiplicado por Z al cuadrado de alfa medios partido por el error máximo al cuadrado. Entonces tenemos, con este número de sujetos el investigador se asegura que la amplitud del intervalo de confianza será de cuatro puntos porcentuales. Es decir, dos puntos porcentuales por debajo de la estimación puntual y dos puntos por encima de esa estimación puntual. Cuatro puntos porcentuales alrededor del valor 0.5. Entonces tenemos, como vemos, el valor de máxima incestible será 0.105. Ese será, sería el valor... de éxitos, 0.5. Ahora, en ese caso el número de fracasos será también de 0.5. 1 menos P. Z al alfa medios, que es 1.96, se está trabajando a alfa de 0.05 al cuadrado partido por ese valor porcentual de 0.02. Hacemos estos cálculos. Nos da 2.401 sujetos. Si utilizáramos esta cantidad de sujetos nos estaríamos asegurando, independientemente de cuánto nos salga la proporción poblacional posterior porque estamos asumiendo que es 0.5 y luego nos puede salir 0.75, 0.30, lo que sea pero nos estaríamos asegurando que el intervalo de confianza será de cuatro puntos porcentuales alrededor... Tengo como punto medio la estimación puntual que nos salga en la muestra y por tanto el error máximo será de 0.02 porcentual será muy pequeño con esos 2.401 sujetos Observen que son muchos sujetos Por eso el error porcentual es muy pequeño Obviamente, cuanto más pequeño sea el error máximo que queramos introducir N va a ser mayor Lo cual tiene costos Para que nos demos cuenta de por qué se ha elegido 0.05 este valor como proporción poblacional con mayor incertidumbre He graficado la función p por 1 menos p Mira, aquí lo había puesto bien Multiplicado por el coeficiente entre 1.96 con el error máximo de 0.02 Para p entre 0 este valor y 1 Vemos que esto en teoría de la información se conoce como es una medida de incertidumbre y vemos que el valor de mayor incertidumbre se encuentra precisamente en el punto medio Por eso es el que se ha elegido Y como nos interesa simplemente calcular N no nos interesa... No lo sabemos tampoco Cuánto ha valido p Lo calculamos con esta p que representa el punto de máxima incertidumbre Por consiguiente, si la precisión de la estimación Bueno, eso lo hemos hecho con un error máximo de 0.02 Y qué pasaría si dijéramos Bueno, es que quiero una precisión todavía mayor de 0.01 Que el intervalo de confianza abarcara solamente dos puntos alrededor del de la estimación puntual Si aplicáramos la fórmula anterior necesitaríamos 9604 sujetos Esto en términos de psicología es una barbaridad En términos de sociología quizá no pero para nosotros lo sería Entonces, observamos claramente que cuanto más pequeño queramos que sea el error máximo Queremos obtener una muestra y un intervalo de confianza con una gran precisión Necesariamente mayor tendrá que ser el número de sujetos a utilizar Y para calcular ese número de sujetos aplicaríamos cualquiera de las fórmulas anteriores Bien, terminamos los intervalos de confianza Y vamos a entrar en otro capítulo muy relacionado con el anterior Que es muy, muy interesante El contraste de hipótesis Básicamente un contraste de hipótesis Lo vamos a ver durante el resto del video El resto de los temas se parece mucho a un juicio A un juicio con jueces, abogados, defensores, etc. ¿Qué sucede cuando... Imaginen que a mí me acusan de un delito Me acusan de haber robado un aparato Kirchner UNED Yo entro entonces en el sistema judicial Pero entro bajo un supuesto Actualmente en nuestro sistema judicial Entro bajo el supuesto De que soy inocente A no ser que se demuestre lo contrario Ese a no ser que se demuestre lo contrario Significa que tiene que haber una serie de datos Que fuera de toda duda Por encima de un nivel razonable de duda Me señalen como culpable Es decir, yo ese día Debería haber estado aquí en la UNED Debería haber entrado al despacho Que se supone en el que estaba El aparato que supuestamente he robado Mis güeyes deberían estar en ese despacho Etcétera, etcétera Esos son los datos Lo que en estadística es la muestra Si los datos son lo suficientemente potentes Para que dentro de ciertos márgenes de error Me señalen como culpable Yo voy a la cárcel Si los datos no son lo suficientemente fuertes Para señalarme como culpable El juez tendrá que enviarme a la calle Ahora bien, observen que en estos dos casos Se pueden producir errores Se puede producir el error De que yo haya robado efectivamente Y de que los datos sean anecdóticos Que no sean lo suficientemente fuertes Y el juez entonces Hay pruebas suficientes y me tiene que dejar en la calle Pero el juez no puede decir Que yo vaya a asustar la calle Porque usted es inocente El no puede decir que yo sea inocente El solamente puede decir que Váyase a la calle Porque con estas pruebas Hay dudas razonables De que usted sea culpable El no está afirmando que yo sea inocente Ni que sea culpable Simplemente con los datos No me puede culpabilizar Si me mete en la cárcel Es que hay pruebas suficientes Para meterme en la cárcel Pero cuidado Aún así puedo ser inocente Simplemente Simplemente le estoy diciendo Con las pruebas que hay El margen de duda Aunque existe Pero es muy pequeño Váyase a la cárcel Pero todos sabemos que aún así Algún otro podría haber robado ese aparato Y haber puesto mis huellas dactilares ahí Etcétera En contraste de hipótesis vamos a hacer lo mismo En contraste de hipótesis Vamos a Queremos saber algo sobre Alguna característica poblacional De una variable y de un grupo de sujetos Queremos saber Cómo se distribuye el CI Cuál es la media del CI por ejemplo En mujeres Queremos saber Los niños con hiperactividad Si son más o menos inteligentes Que los niños normales Queremos saber Si un determinado tratamiento Para la reubicación de toxicómanos Funciona y en qué proporción funciona En relación a los que viven aquí Ya existen Es decir, hay montones de preguntas Pero vamos a entrar en el contraste Vamos a entrar en la investigación Asumiendo que mi hipótesis Lo que a mí me gustaría demostrar No es correcto Es el supuesto que en el sistema judicial Yo entro como que soy Inocente Pues en la investigación vamos a entrar Con el supuesto de que El tratamiento por ejemplo que yo he puesto Para reubicación de toxicómanos No funciona No funciona mejor que otros Por ejemplo Vamos a entrar Si queremos hacer alguna estimación Sobre el CI De niños diglésicos O hiperactivos Vamos a asumir Que no difiere con respecto A los niños normales Siempre lo contrario De lo que al investigador Le ha llevado a realizar el estudio Porque nos queremos proteger Más adelante veremos que es eso Pero quédense con esto Vamos a entrar en una investigación Que se va a reflejar En un contraste de hipótesis En el que vamos a Disponer Todo en contra De mi hipótesis De lo que yo me ha llevado A realizar esa investigación De lo que a mí me gustaría que se hubiese confirmado Y por qué lo ponemos todo en contra Porque queremos estar muy seguros De que si lo que encontramos No haya la menos duda Y por consiguiente Tenemos que disponerlo todo en contra de ello Al principio resulta un poco extraño Si yo hago un experimento Me he tirado un año Pasando sujetos, analizando datos Programando el experimento Etcétera Resulta que Lo pongo todo en contra De la hipótesis Que a mí me gustaría que se confirmara En mi experimento Pero así es Los resultados de la investigación No pueden apoyarse En resultados negativos Tenemos que estar muy seguros De que lo que hemos dicho Que funciona Lo que hemos dicho La ley que hemos encontrado La relación funcional que hemos encontrado Que es real Y que no se debe al azar Y por ello lo disponemos todo En contra de mi hipótesis Entonces Eso es el contraste de hipótesis Vamos a plantear una hipótesis estadística Que es una afirmación Sobre una población Yo afirmo Que en la población Mi nuevo tratamiento Para la rehabilitación de toxicomanos Es mejor que los que ya existen Eso es lo que me gustaría afirmar Bien Entonces Una hipótesis estadística Es una afirmación sobre la población Que puede someterse a prueba A través de una muestra de la teoría de esa población Que puede ponerse a prueba La psicología es una ciencia experimental No solamente experimental Pero es básicamente experimental No nos podemos sentar en nuestro despacho A elucubrar Tenemos que meternos en el laboratorio Y someter A los sujetos A situaciones experimentales Que nos permitan Luego deducir algo Sobre lo sucedido Y aportar datos Entonces Se ha contrastado con los datos En esa muestra O no se ha contrastado Entonces tenemos que tomar alguna decisión Respecto a su resultado Si mi hipótesis De que Mi tratamiento con toxicomanos Funciona mejor que los que ya existen La acepto Mi resultado me indica Que la puedo aceptar Voy a tomar decisiones importantes Con respecto A un aspecto de la realidad Dar mejores resultados O no Si mi investigación da resultados nulos Ya veremos exactamente Qué significa eso posteriormente Tendré que decir La decisión será Sigamos con los métodos anteriores El mío no es mejor Es decir Que toda la investigación que hagamos Va a tener como resultado final Una decisión Normalmente Puede ser muy relevante Para la vida cotidiana De las personas implicadas A veces no A veces las decisiones son mucho más teóricas Que tienen relación con una teoría A mí esas son las que me gustan Pero bueno Eso son cuestiones personales El contraste de hipótesis Es por tanto una parte esencial del método científico En el método científico yo tengo Una teoría De esa teoría Raíz unas predicciones Una deducción analítica Y esas deducciones Me voy Al laboratorio Dispongo de una situación experimental o correlacional Y someto Los resultados de esa situación experimental O correlacional a una hipótesis estadística En la que Me va a confirmar O no La hipótesis Que me había llevado a realizar Ese estudio Entonces general siempre se parte Obviamente Que se plantea en el ámbito de una investigación Y a la luz de un determinado marco técnico Personalmente Considero que Esto es un aspecto ya Opinión personal Considero que los marcos técnicos Deberían estar completamente formalizados De forma analítica Lógica O matemáticamente De tal forma que podamos luego Realizar predicciones sin Que intervenga la subjetividad Sin que intervengan interpretaciones Diferentes de esa deducción Es lo que se hace en las ciencias físicas Por desgracia en psicología aunque existe No es muy común Realizar, tener marcos teóricos Completamente analíticos Completamente formalizados Completamente matemáticos De los que podamos deducir De forma completamente no ambigua Alguna Algún resultado que podamos Comprobarlo en el laboratorio Pero obviamente Siempre partimos de algún interrogante Queremos conocer Saber algo sobre las personas Sobre su memoria Sobre su motivación Sobre su conducta social Y tiene que estar completamente operativizado Con términos no Connotativos, etc. Bueno eso es más de metodología Y de teoría de la ciencia Seguimos Una vez planteada la cuestión Hay que buscar una respuesta Empíricamente verificable Es decir, tenemos que tratar de Es decir Dar una respuesta Pero que pueda someterse A comprobación empírica Que la podamos Meter en un laboratorio Que nadie pueda dudar Que los resultados son esos Que las conclusiones conscientes son esas Debemos ser capaces de operatividad Nuestras preguntas Para que tengan entidad de hipótesis científicas La operatividad Es operativización Mejor dicho Es algo que han visto ustedes en metodología Pero es fundamental No se admiten hipótesis vagas No se admiten hipótesis Como que Mi tratamiento va a ser bueno ¿Qué es eso de bueno? Eso es una hipótesis no verificable Porque admiten Estoy introduciendo términos Connotativos Lo que para unos es bueno para otros O es malo Lo que hay que decir es que Mi tratamiento va a producir Una mejora en el rendimiento De 2 puntos porcentuales O de 10 puntos porcentuales Eso es completamente verificable Operativizable La mejor manera de hacerlo Es plantearlo en términos estadísticos Obviamente en términos estadísticos Por una sencilla razón Porque tenemos mucho error aleatorio En nuestros experimentos Siempre vamos a utilizar la estadística Afortunadamente para ellos Su error, su intervalo de confianza Son muy pequeñitos Y tienen muy poca duda En sus resultados En nuestro caso Los intervalos de confianza son mucho mayores Pero utilizamos la estadística Básicamente por eso Porque tenemos un gran error En los experimentos Por mucho que intentemos Controlarlo casi todo Los sujetos difieren en muchas variables Entonces tenemos que utilizar la estadística Para obtener resultados Conclusiones Poder afirmar algo Siempre con un cierto margen de error Porque tenemos Ruido En nuestros experimentos Y ante el ruido La técnica más apropiada Que podemos aplicar es la estadística Nada más que eso Por cierto, el psicólogo debería conocer No solamente la estadística Debería conocer cualquier herramienta En su trabajo La lógica La clásica o la difusa El cálculo Se utiliza mucho en análisis de señales El álgebra Se utiliza mucho En sistemas formales De axiomas En psicología Pero en la carrera solamente se ve la estadística Porque básicamente lo que ustedes van a hacer Va a ser Van a ver datos y van a analizar datos Entonces necesitamos esta herramienta Esto significa que las afirmaciones Que realicemos Están relacionadas de una manera u otra Con alguna distribución de probabilidad Entonces Otro aspecto importante Una hipótesis científica Se puede traducir A diferentes estadísticas Esto no sería así Si los marcos teóricos En la psicología estuvieran completamente formalizados Pero bueno Como no lo están La hipótesis científica No siempre permite una única hipótesis estadística Sino varias Pero bueno, si tenemos varias Todas ellas se pueden contratar para dar respuesta A dicha hipótesis científica Todas esas hipótesis estadísticas Se pueden meter en laboratorio Que eso es si todas ellas Deben poder meterse en laboratorio Entonces las hipótesis estadísticas Las hipótesis estadísticas planteadas Para dar respuesta a las hipótesis científicas Se conocen como Hay dos, hipótesis nula y hipótesis alternativa Que se presenta por hipótesis nula Que se presenta por H0 Normalmente, como he dicho anteriormente La hipótesis nula Se plantea en términos de que No hay diferencia De que mi tratamiento no tiene efecto De que todo sigue igual De tal forma que si la rechazamos Al final del estudio Tenemos una gran confianza En que los resultados No se deben al azar Porque lo hemos dispuesto todo En contra de la hipótesis Que a mi me gustaría confirmarme Lo hemos puesto todo a favor de H0 Que es la hipótesis que a mi no me gustaría Que se confirmara si yo hago un experimento Por consiguiente Si al final resulta Que rechazo a H0 Lo estoy haciendo con una gran confianza Las hipótesis nulas pueden contener Afirmaciones como las siguientes Esta es una hipótesis nula Hipótesis nula La media de una variable En hombres es la misma que la media de las mujeres Observen Está indicando que algo es igual Hipótesis nula Que algo no cambia Yo no realizaría un experimento Si realmente considerara Que algo es igual A mi me gustan las cosas diferentes La ciencia aquí busca Los patrones Aquí no hay ningún patrón Si decimos que dos variables son idénticas Esto significa Que si yo mantuviese esta primera hipótesis nula De que algo en hombres y mujeres En términos de media Lo mismo Lo que estoy Lo que a mi me gustaría que se confirmara Que no fuese así Pero lo estoy exponiendo todo Para que el contraste de hipótesis Este en contra De la hipótesis que a mi me gustaría Y por consiguiente Voy a afirmar lo contrario de la misma Estoy afirmando Que dos cosas son iguales Otra hipótesis Que pi vale 0.6 Esta es una hipótesis mucho más específica Aquí vemos que la hipótesis nula Afirmamos que en la proporción De una variable dicotómica No nos dicen cual es Esa proporción en la colección vale 0.6 Me meto en el laboratorio y lo compruebo Otra hipótesis nula Que la proporción Es menor o igual que 100 Aquí sería porcentaje En términos de proporción Aquí sería 0.1 Las proporciones No los porcentajes van de 0 a 1 Si pi es una variable dicotómica Que va de 0 a 1 Obviamente No me gusta esta hipótesis Otra hipótesis Probablemente esto lo hayan puesto simplemente Pi menor o igual que 100 En términos de porcentajes Pero no me gusta porque Es difícil que un porcentaje Sea mayor que 100 ¿Entienden por qué lo estoy diciendo? Otra hipótesis nula La última La variable x tiene distribución normal Con media 50 y división típica 5 En todos los estudios Nos van a indicar o bien la hipótesis nula O la hipótesis que yo quiero Que me gustaría que se confirmara Si me dan la hipótesis nula Directamente La complementaria Y eso será la hipótesis alternativa Si me dan la hipótesis Que a mi me gustaría que se confirmara H1 La complementaria Será la hipótesis nula No es fácil diferenciar entre ambas Eso es algo que Que es importante Dependiendo de cómo esté formulada la hipótesis nula Se habla de la dirección del contraste En el primer ejemplo La H0 está planteada como igualdad De las medias de hombres y mujeres Mientras que la alternativa es simplemente Subnegación Es decir, que la media de mujeres Es distinta a la media de los hombres Las medias no son iguales Esto significa que es un contraste bilateral Porque admitimos que Si no son iguales Lo pueden ser O bien porque la media de las mujeres Sea mayor que los hombres O bien que la media de las mujeres Sea menor que los hombres Amitimos que esa desigualdad De la hipótesis alternativa Este en una dirección o en otra Lo contemplamos como posibilidad Por lo tanto hay dos Dos lados En la hipótesis Alternativa En la que contemplamos Que pueda estar La respuesta Por eso se dice que es bilateral A veces En vez de ser bilateral Conocemos la dirección en que H0 puede ser falsa Por ejemplo Si yo tengo Yo he cogido varios Métodos de Mejora de la memoria en ancianos Y he introducido Una variable Que creo que mejora Los resultados De los otros métodos Es obvio que parece ser que Si mi tratamiento tiene efecto Lo tendrá Siendo más positivo Que el resto No voy a contemplar la posibilidad Que sea más negativo Porque me he basado en los anteriores Que ya han demostrado su eficacia El mientro de mí Tendría que ser un poquito mejor Si yo he fabricado una nueva droga O fármaco Para el dolor de cabeza Espero que mi fármaco Sea mejor que la aspirina No peor En ese caso en el que Conocemos o intuimos O preveemos En qué dirección la hipótesis nueva puede ser falsa Entonces Pondremos a prueba Un contraste unilateral A la derecha o a la izquierda Se dice a la derecha o a la izquierda En función de dónde está la hipótesis alternativa H1 H0 Es la que planteamos inicialmente Su complementario Es la hipótesis alternativa O bien cuando en la investigación Se plantea algún método de aprendizaje Un fármaco Tiene un efecto positivo o negativo Sobre lo que estamos estudiando Creo que este proceso industrial Para mejorar La calidad del cemento Va a ser mejor que los que existen actualmente Pues va a ser mejor Sabemos hacia qué dirección H0 puede ser falsa En qué dirección está H1 Eso es un contraste unilateral Simplemente si indicamos La dirección de ese efecto En los ejercicios que se pueden poner En el examen O para resolver Es muy importante Buscar en el enunciado del ejercicio Indicios Que nos digan Si se está utilizando un contraste unilateral O bilateral Una vez que se ha planteado la hipótesis Unilateral Es preciso definir lo que se conoce Como la medida de discrepancia Una medida estandarizada Dentro de alguna distribución de probabilidad Esa medida de discrepancia es Hemos puesto Toda la fuerza del contraste A favor de H0 La hipótesis que a mi no me gustaría que se confirmara En qué medida Ahora hago el experimento Y obtengo un estadístico de contraste En qué medida Esa T Esa Z Tiene que ser más o menos grande Para rechazar H0 Y aceptar por consiguiente H1 Esa es la Medida de discrepancia Normalmente las medidas de discrepancia Siempre tienen esta forma El estadístico de contraste De discrepancia Es un valor numérico De los muchos que hemos visto anteriormente Suele ser igual al cociente Entre estos valores Tenemos en primer lugar En el numerador Tenemos la diferencia entre El estadístico en nuestra muestra Puede ser la media Puede ser la varianza Puede ser la proporción Muestral Menos el valor del parámetro que hemos planteado En la hipótesis nula Observen Estamos rechazando lo que hemos obtenido en la muestra Del parámetro En contra de la hipótesis que nos gustaría Esa diferencia La dividimos por la Deviación típica de la distribución muestral Del estadístico Por eso se dice que El estadístico en contraste está Estandarizado Porque no escogemos simplemente La diferencia entre el estadístico muestral Y el parámetro planteado en la hipótesis nula Sino que lo dividimos Para estandarizarlo Lo dividimos por la derivación típica De la distribución muestral del estadístico Si tenemos la media Pues nos cogemos la distribución muestral De la distribución muestral de la media Si tenemos la varianza Nos cogemos en el denominador La división típica de la distribución muestral de la varianza Además de definir la discrepancia Es preciso considerar Que cantidad de esta consideramos admisible Es decir, a priori Antes de hacer el experimento Cual será la diferencia máxima Entre el estimador y el parámetro Que estamos dispuestos a considerar Es compatible con H0 Y por consiguiente Una vez que hayamos hecho esto A priori ya sabremos También Que si esa diferencia máxima Cuando realicemos el experimento Y la obtenemos realmente Supera A esta diferencia Sabemos que H0 es falsa O es poco probable Esta decisión dependerá Obviamente tanto de la distribución de probabilidad De la medida de discrepancia Como si el contraste Es bilateral o unilateral Como del riesgo Que estamos dispuestos a asumir Alfa Estos tres factores Van a determinar Los valores de z, t y chi cuadrado Admisibles Aceptables según H0 O inaceptables Vamos a dejar El resto Para una segunda clase Simplemente voy a ir Estoy en la transparencia 35 Y me quedan hasta la 88 Me voy a ir A las ultimas transparencias Porque Les he hablado que Nuestro sistema judicial Y a semejanza del contraste De hipótesis Trabaja bajo la hipótesis De un determinado supuesto Este supuesto es En el caso del sistema judicial Que yo entro en un juicio Siendo inocente En la estadística En el contraste Entramos en un contraste Asumiendo que H0 es cierta Ponemos toda La baraja en contra De la hipótesis H1 Que es la que realmente me gustaría Verificar Otro día entonces Estaba aquí un estudiante De doctorado Y le comenté Que el sistema judicial No siempre ha sucedido así Siempre entra un Acusado Asumiendo que es inocente Este es el sistema judicial Actual que nos parece El más lógico En la antigüedad Era todo lo contrario El acusado Entraba a un juicio Asumiendo que era culpable Y tiene que demostrar Que era inocente Y le comenté las ordalías Y no sabía que era esto de una ordalía Era un juicio divino En el que La persona se sometía A una prueba Y salía misteriosa de esa prueba Es que Dios Consideraba que era inocente En caso contrario era culpable Las pruebas podían ser Poner la mano sobre una rejilla Al rojo vivo Durante 10 minutos Quitaba la mano Se la vendaba Y si al cabo de 3 días Era culpable Y si ya no tenía Ampollas Era inocente Eso era una ordalía Era muy frecuente No solamente en el catolicismo Viene de la época pre islámica Aquí en España Pero bueno Y muy anterior Los judíos ya la utilizaban Los griegos la utilizaban Y bueno les estuve comentando esto Les resultó curioso Las transparencias Que eso se refleja Incluso en nuestro lenguaje Porque oyendo A Diana Navarro Una cantante que me gusta En la canción Una y no más Decía yo que ponía la mano Dentro del fuego por ti Mira como me he quemado De tanta fe que te di Esto refleja La conciencia Que tiene el pueblo Poner la mano dentro del fuego Pero la pobre Diana Navarro Se quemó Tengo por aquí La música no sé si se oirá Pero la voy a poner Y ya con eso me despido Espero que se haya oído