Hola, retomamos el tema 8, la segunda parte de regresión lineal simple y múltiple. Nos habíamos comentado cómo calcular la correlación entre un conjunto de valores a partir de las puntuaciones directas, de las puntuaciones diferenciales o de las puntuaciones tipificadas y nos hemos quedado en el cálculo de esa correlación para este conjunto de datos. Teníamos, recordemos, 16 sujetos para cada uno de los sujetos hemos calculado o hemos medido dos puntuaciones que le hemos denominado X e Y. Normalmente X va a representar en este caso la variable que vamos a utilizar para predecir independientemente de que sea la puntuación en vocabulario y cuando queremos simbolizarlo de forma simple para no poner vocabulario o para no alargar demasiado el nombre de la variable ponemos simplemente X indicando que es la variable predictora o independiente mientras que Y va a ser la variable predicha, aquella que deseamos conocer a partir de X. Una vez que tenemos este conjunto de puntuaciones son dos puntuaciones para cada individuo, vemos que para cada sujeto tenemos dos puntuaciones. De esas 16 puntuaciones, paren de puntuaciones calculamos un índice de asociación que es el coeficiente de correlación entre X e Y Si utilizamos las puntuaciones directas, lo más sencillo es en primer lugar calcular los estadísticos descriptivos de X e Y. De esta forma primero calculamos la suma por ejemplo de X, 102, dividimos por 16 y nos debe salir 6.375 que es la media de la variable X con una división típica de 2.7538 Hacemos lo mismo para Y, calculamos el sumatorio de todas las puntuaciones de la variable predicha, 218, dividimos por 16 y nos tiene que dar 13.625 y calculamos también su división típica que es 4.64 aproximadamente y calculamos la media de la división típica de las dos variables vemos que estamos utilizando simplemente estadística descriptiva Para aplicar la fórmula del coeficiente de correlación, vemos que es muy conveniente además de calcular los estadísticos descriptivos básicos de X e Y calcular también en primer lugar el producto de X por Y porque lo tenemos en la fórmula aquí Aquí vemos que vamos a tener que calcular el sumatorio del producto de X por Y Es muy cómodo cogernos una nueva columna y vamos calculando ese producto 3 por 9 es 27, 7 por 1 es 7, 7 por 12 es 84 y así calculamos el producto de X por Y y por último calculamos su sumatorio, 1561 que va a ser el valor que tendremos que colocar aquí 16 es el número sujeto y ya tenemos el sumatorio de X por Y Vemos que en la fórmula luego tenemos que restar el producto de dos componentes Este y este Estos componentes son el sumatorio de X y el sumatorio de Y Pero eso ya lo tenemos Sumatorio de X hemos visto que era 102 Sumatorio de Y 218 Su producto va a ser el componente que tenemos que restar al anterior Y por último vemos que en el denominador Voy a quitar todo lo que he enseñado anteriormente porque está complicando bastante la transparencia Vamos a irnos ahora al denominador En el denominador, ¿qué tenemos? Tenemos N, ya seamos cuantos es, 16 por el sumatorio de X al cuadrado No tenemos todavía la columna del sumatorio de X al cuadrado Tenemos X, tenemos Y y tenemos X por Y Calculamos X al cuadrado Entonces creamos una nueva columna Que sea donde vamos a colocar los valores de X al cuadrado Observen que esto no es X2 sino X al cuadrado Entonces 3 al cuadrado 9 1 al cuadrado 1, 7 por 7 es 49, 9 por 9 es 81 Vamos colocando el cuadrado de la columna X Y luego su sumatorio que nos da 764 Este 764 es lo que tendremos que colocar aquí Menos el sumatorio de X al cuadrado Observen la diferencia entre estas dos expresiones En la primera es el sumatorio de una serie de cantidades elevadas al cuadrado Es decir que primero se elevan esas cantidades al cuadrado y luego se realiza la suma Sin embargo en la segunda es al contrario Primero se hace la suma de esas cantidades y luego se eleva al cuadrado En este caso tenemos el sumatorio de X que es 102 Y es ese 102 el que se eleva al cuadrado Por tanto para calcular este valor no necesitamos establecer ninguna nueva columna Sin embargo necesitamos establecerlo para calcular esta segunda parte del denominador Que está multiplicándola a la primera Observen que es similar a la primera excepto que en vez de X se está calculando con respecto a Y Es decir, de nuevo tenemos 16 sujetos N por el sumatorio de Y al cuadrado Y como no tenemos Y al cuadrado necesitamos crear una columna Que nos dé los valores de Y al cuadrado 9 al cuadrado es 81 7 al cuadrado es 49 12 al cuadrado es 144 Y así seguimos y obtenemos la última columna Y al cuadrado Observen que de nuevo no es Y por 2 Es Y al cuadrado Y su sumatorio lo vamos a necesitar Ya que es lo que nos viene dado en esa parte de la expresión para calcular el coeficiente de correlación Multiplicamos 16 por ese sumatorio de valores al cuadrado De Y al cuadrado Y ese sumatorio es 3.294 Y a ello le restamos el sumatorio de Y Que lo tenemos aquí, 218 al cuadrado Establecemos una vez que hemos hecho todos estos cálculos Son pesados pero son sencillos Todo depende también de la cantidad de datos que tengamos Este cociente nos da un índice de asociación entre las variables X e Y Un índice de asociación que en este caso vale 0.89 aproximadamente Es un valor muy alto en términos de coeficiente de correlación Porque si tenemos en cuenta que el máximo es 1 o menos 1 Indicando ese máximo que las dos variables están completamente asociadas Un valor de 0.89 indica que están muy asociadas Una variación en una de ellas lleva una variación similar en la otra No idéntica, pero muy similar Este es un índice descritivo de asociación entre variables Y hemos visto que haciendo esta tabla Calculando los índices estadísticos de X e Y Y calculando los sumatorios de X por Y De X al cuadrado y de Y al cuadrado Podemos pasar casi directamente Los resultados estadísticos descritivos que tengamos en esta tabla A la fórmula del coeficiente de correlación Lo mismo lo podríamos haber hecho Utilizando las puntuaciones diferenciales En este caso la fórmula, la pueden ver aquí abajo en pantalla Sería el sumatorio de X por Y Pero observen que estas X y estas Y están en minúscula Mientras que las anteriores estaban en mayúscula Cuando están en mayúscula normalmente Estamos indicando que son las puntuaciones directas Sin ningún tipo de transformación Sin embargo cuando están en minúscula X e Y estamos indicando que son puntuaciones diferenciales Recuerden que una puntuación diferencial es Esa puntuación, por ejemplo Si la simbolizamos por X Menos La media de ese conjunto de puntuaciones Es diferencial porque estamos haciendo una resta Una diferencia entre cada una de las puntuaciones Menos la media de ese grupo Entonces en esta primera columna Se establecen Se han puesto los cálculos para las puntuaciones diferenciales De X, observen, minúscula Y en la segunda columna se han colocado Las puntuaciones diferenciales de Y Es decir, de Y Para cada sujeto Menos la media De Y Una vez que tenemos esas puntuaciones diferenciales Para X y para Y Establecemos una nueva columna En donde multiplicamos ambas puntuaciones diferenciales X por Y De tal forma que Menos 3.375 Por menos 4.625 Debe dar 15.6093 Depende de la precisión que queramos poner Menos 5.375 Por menos 6.625 35.60 Es decir, en esta Tercera columna ponemos El producto de Las puntuaciones diferenciales X por Y Porque lo necesitamos para calcular El sumatorio De esos productos Observemos que el sumatorio de esos productos Es 171 por 25 El sumatorio de la tercera columna Es el numerador Del cálculo de la correlación Mediante puntuaciones diferenciales Partido por la raíz cuadrada Del producto Entre dos sumatorios Observamos que los sumatorios son El sumatorio de X diferenciales Porque está en minúscula Al cuadrado Por el sumatorio de las X diferenciales Al cuadrado Entonces necesitamos, por consiguiente Elevar al cuadrado Las puntuaciones diferenciales Las dos primeras columnas X E Y Menos 3.375 Debe dar 11.39 Menos 4.625 Debe dar 21.39 Excepto que se haya cometido algún error El cálculo está muy claro Una vez que tenemos Las puntuaciones diferenciales Al cuadrado Cada una con una respectiva Las sumamos Y obtenemos Estos dos valores 113.75 Para el sumatorio De las X diferenciales Y 323.75 Para el sumatorio De las X al cuadrado Estos valores Los introducimos En la fórmula Simbólica Para calcular El coeficiente de correlación Será 171.25 Dividido Por la red cuadrada Del producto Entre 113.75 Por 323.75 Y nos tiene que dar El mismo valor Que nos dio En el cálculo anterior Porque son fórmulas Diferentes Pero para obtener exactamente lo mismo Desde mi punto de vista Esta, aunque parece más complicada Las puntuaciones directas Es más sencilla Porque cuanto más cálculos realicemos Más fácil es equivocarnos Y aquí no estamos metiendo Por ejemplo en puntuaciones Una vez que hemos visto El cálculo de la correlación Entre X e Y Esto todavía no nos indica La relación lineal Porque la relación lineal Nos indica una función lineal Y el coeficiente de correlación Es simplemente un índice estadístico Un valor numérico Que nos indica si la asociación Entre X e Y Es alta, baja, nula Inversa Pero no dice cuánto Ni en qué sentido Pero es un solo valor numérico Necesitamos algo más Necesitamos La ecuación de regresión Hemos calculado el coeficiente de correlación Porque es muy importante Lo vamos a necesitar posteriormente Para el cálculo De la función lineal Que mejor ajuste los datos Pero necesitamos algo más Necesitamos calcular La función de regresión Una función lineal En el caso de que los datos Obviamente parezca O En el caso de que los datos Realmente se ajusten a esa función lineal Ya hemos visto antes casos, ejemplos En donde Un conjunto de datos No se ajustaba a una función lineal A veces a una función cuadrática A una función exponencial Depende En este caso si verificamos los datos De forma muy clara Los datos son lineales A la vista de los datos es fácil intuir Que la relación entre ambas variables La podemos modelar De tal forma que la variable dependiente Se represente como una función De la variable independiente Es decir, que la puntuación En errores ortográficos Y sea una función De las puntuaciones en vocabulario X Y obviamente si la función parece lineal Tendremos que encontrar Aquellos valores de la función lineal Que mejor ajusten estos datos En ese sentido es lo que se dice Que vamos a modelar Estos datos mediante una función Lineal De la variable independiente Para predecir la variable dependiente Visto el diagrama Está claro que Ese modelo Ese modelo estadístico Va a ser Una función Una línea recta Básicamente viene dada Por dos parámetros Que son Aquí lo hemos denominado B y B0 Entonces Dados estos valores numéricos B Al que le vamos a llamar pendiente Y vamos a ver posteriormente Por qué se llama pendiente La pendiente es el valor Que está multiplicando a la X Independiente que estoy utilizando En mi estudio En este caso era Vocabulario La puntuación de vocabulario Multiplicada por una constante B A la que vamos a llamar pendiente Más otra constante Llamada B0 A la que le vamos a llamar Punto de corte con la ordenada Y vamos a ver posteriormente por qué Este cálculo Para cada valor de X Una vez que hayamos calculado Un valor de Y De la puntuación Pronosticada de la variable dependiente Es decir, en este caso De los errores ortográficos Pero como es una ecuación pronosticada A partir del modelo lineal Le hemos puesto una prima Una coma En la parte superior derecha Esto lo denominamos prima Indicando simplemente que La I No es la I Que estamos viendo en pantalla No es la I que hemos medido Que tenemos en otros datos No son las I que hemos visto En la tabla anterior Es la I Pronosticada, predicha Por la recta de regresión Que vamos a construir a continuación Y estas puntuaciones Y' Deben ser muy similares A las puntuaciones Y Realmente observadas Pero no van a ser idénticas Porque obviamente Si vemos el gráfico Hemos hecho En este caso Vamos a colocar una línea recta Aunque ya está hecha Observen Si esta fuese La recta de regresión Que vayamos a calcular Observen que Los valores Y predichos Van a quedar todos Sobre La recta de regresión Los valores Y predichos Mientras que los valores observados No Los valores observados Están unos más cerquita Otros más lejos Uno por encima, otro por debajo De esa recta de regresión Entonces los valores Y predichos Que están sobre la recta Son ligeramente diferentes A los valores Y Observados Por eso hay que diferenciarlos Entonces Si esta es la función Para cualquier Ecuación lineal Lo único que tenemos que encontrar Es aquellos parámetros pendientes Y punto de corte con la ordenada Es decir, B y B0 Que cuando se le aplique Este cálculo Nos dé unas puntuaciones Y predichas Posibles a la Y empírica A la Y realmente observada Vamos a poner unos cuantos ejemplos De funciones lineales Para entender que son los parámetros Hemos visto anteriormente Que esta era La fórmula general De cualquier función lineal Es el parámetro pendiente B El parámetro punto de corte con la ordenada Y lo único que hacemos es Que para cada valor de X Del eje de ordenadas Se multiplica por la pendiente Se le suma B0 Y este nos da un valor Y En este caso Y' Que sucede Que se encuentra justo En esta línea recta Si graficamos Si damos valores En este caso arbitrarios A, B y B0 Estos valores vivo que son arbitrarios De la función lineal Aunque muchos de ustedes ya lo sabrán Pero nunca viene de más Un recuerdo Observen que he graficado La función lineal Que vemos a mano izquierda La he graficado dando Valores concretos A, B y B0 En concreto A, B la pendiente me he dado 5 Valor numérico Cualquiera Y a B0 el valor 8 Eso quiere decir Que el valor de la ordenada vale 8 ¿Qué significa Ese 5 y ese 8? La pendiente representa El grado de inclinación de esta recta Cuanto más inclinación tenga La recta en este diálamo De coordenadas La pendiente es mayor Creo que había hecho un gráfico Sobre... Lo vemos más adelante Aunque lo vamos a repetir posteriormente Lo voy a indicar ya Lo que me indica Este gráfico es que Lo que me indica la pendiente 5 Es que cuando yo me muevo Una unidad En el eje de las fisas En el eje de las X Voy por ejemplo de 0 A 1 Me he movido una unidad En este gráfico ¿Cuanto subo En el eje Y? 5 unidades Eso es lo que indica la pendiente Por cada cambio de una unidad En el eje X ¿Cuanto cambio en el eje de las Y? Vemos que para 0 El valor de la función Estaría aquí Creo que serían Sería 8, efectivamente Pues cuando X valga la unidad Y valdrá 5 unidades más 13 Es decir que un cambio de una unidad En el eje X Me ha producido un cambio de 5 unidades En el eje Y Eso es lo que representa B La pendiente Mientras que B sub 0 El punto corto con la ordenada Está recta Al eje Y A la ordenada Aquí En 8 Cuando X vale 0 5 por 0 es 0 Más 8, 8 Entonces vemos que Dados esos dos parámetros La pendiente y el punto corto con la ordenada Tenemos definida cualquier función lineal Aquí tenemos otro ejemplo de función lineal Muy importante En el contexto de la reversión Observen que aquí El punto corto con la ordenada es 3 Cuando X vale 0 Y vale 3 Pero, ¿qué sucede con la pendiente? La pendiente vale 0 Vemos que la función Es una función Horizontal Cuando yo Me muevo una unidad En el eje de las X Paso, por ejemplo De 0 a 1 ¿Cuánto me muevo en el eje de las Y? Nada La pendiente 0 Si nos encontráramos Con una recta de reversión De este tipo O no significativamente diferente De una pendiente de 0 Significaría que La variable X No me sirve para predecir Porque da igual El valor que tenga Y hace siempre lo mismo Por consiguiente Veremos que cuando Queremos evaluar Si una recta de reversión Es buena o mala Básicamente lo que queremos es Ver si su pendiente Es distinta de 0 Porque si fuese estadísticamente No pudiésemos rechazar la hipótesis De que vale 0 Significaría que nuestra variable No sirve para predecir Por consiguiente La podemos eliminar La recta de reversión No nos sirve para nada Por eso es tan importante Esta función lineal Una función lineal también Se puede expresar En puntuaciones diferenciales Observen de nuevo que X e Y Están en minúsculas Lo cual quiere decir Que son puntuaciones diferenciales Esta X Es la media De sus datos Mientras que esta Y Será Y' menos Su media Son puntuaciones diferenciales Vemos que Esta B es la misma Que en el caso de la De la función En puntuaciones directas No hemos dado ningún símbolo distinto Es B mayúscula y punto Esto significa que la pendiente En puntuaciones diferenciales Es la misma Que en puntuaciones Directas Es exactamente lo mismo Voy a intentar Puntuaciones directas Y' igual a B Por X directos Más B Sub cero La única diferencia que existe Entre estas dos funciones Es que en puntuaciones diferenciales B Vale cero Por tanto no se pone Y eso significa que En puntuaciones diferenciales La recta de reacción Siempre pasa Por el punto 0,0 Por el punto donde se cortan Los dos ejes de coordenadas Esto en puntuaciones diferenciales Y en puntuaciones tipificadas Vemos una relación Un poquito diferente Mientras que En los dos casos anteriores Al menos coincidía la pendiente En puntuaciones tipificadas La pendiente es distinta Y justamente vale La correlación entre X e Y En puntuaciones tipificadas La pendiente de la recta de regresión Entre las puntuaciones tipificadas de X Y las puntuaciones tipificadas de Y Esa pendiente que antes era B Ya no es B Es un valor distinto Y ese valor es Coeficiente de correlación El que hemos calculado previamente Son tres funciones listas Funciones lineales Expresadas cada una de ellas En función de cómo hayamos Puesto las puntuaciones En directas, diferenciales o típicas Lo importante es que Aunque tengan distinta expresión Las tres son funciones lineales Son rectas Y las tres expresan La misma relación entre X e Y Lo que pasa es que cada una de ellas Es una escala distinta Pero expresan la misma relación Entonces, muy importante Al ser una estimación Lo que hacemos con la recta de regresión Es Calcular Veremos próximamente cómo Los parámetros pendiente Y punto de corte con la ordenada Que mejor ajustan los datos Y esto nos va a dar para cada X Una predicción Una Y' Y esa Y' es una estimación No es el valor observado Esta estimación Y' Se acercará más o menos Al verdadero valor de la variable dependiente Al verdadero valor Es decir, al valor que hemos medido Este ajuste El ajuste entre la Y' Y la Y observada Será mayor cuanto mayor sea la relación Entre las variables Cuanto más estrecha sea esa relación Es decir, cuanto mayor sea La correlación, más estrecha Será la relación entre Y' Y Y' E Y Aún sabiendo que esa mejor relación Puede ser representada por una función lineal Queda aún por determinar cuál De las muchas funciones lineales Es decir, para cada parámetro B y B0 Vamos a tener una función lineal Como B y B0 Son valores que pertenecen Al conjunto de números reales Posibilidades para escoger B y B0 Tenemos infinitas rectas Para ajustar nuestros datos Y la pregunta es ¿Cuál es el par de valores B y B0 Que mejor ajustan los datos Que mejor ajustan Los datos del diagrama Para ello vamos a tener que calcular Esos valores Pero antes Indicar que si deseamos predecir El comportamiento de la variable dependiente Utilizando su relación Con la variable independiente Una vez hecha la predicción Una vez que hayamos calculado Que todavía no lo hemos hecho Una vez que hayamos obtenido La predicción, la Y' Vamos a ver que en muchos casos En la mayor parte de los casos Difiere de la Y observada Esa diferencia entre Y Y predicha Y observada Se le llama error Es el grado en que Mi función lineal ¿En qué grado mi función lineal Ajusta los datos? Pues en el grado en que Estén cercanos los valores predichos Con los valores observados Y la diferencia entre esos valores El predicho y el observado Lo vamos a llamar error Entonces Para recapitular Hemos dicho que la función lineal Que queremos ajustar a nuestros datos Es esta V0 más V por X Siendo V la pendiente V0 el punto de corte con la ordenada Son parámetros que tenemos que estimar A partir de los datos YX es la variable predictora La aplicación de estos valores Nos va a dar Una puntuación predicha Ahora bien Para predecir Para que el modelo Se ajuste a los datos Como hay un error Tenemos también que Introducir en la ecuación Un componente aditivo Es decir, una suma De un error Que obviamente no lo conocemos Si lo conociéramos Así Observadas Pero tenemos que introducirlo en la ecuación Para hacer constancia De que hay algunos componentes Que hacen que la relación No sea absolutamente lineal Entonces Ese error Para cada puntuación observada Y Valdrá Tendrá un determinado Valor numérico También los errores tienen Hay que indexarlos Con el subíndice Y Porque hay un error distinto para cada sujeto Lo más importante es que El error es la diferencia Entre la puntuación observada Menos la puntuación predicha Por la ecuación de regresión Esa diferencia entre Lo observado y lo predicho La vamos a llamar error Y tendremos un error Por cada uno de los datos observados Si La Desarrollamos según la función lineal Pues tendremos La expresión del error Completa Es decir Esta predicha es lo mismo que esto Por lo consiguiente Tenemos la misma función Del error que antes A este error también se le llama Muchas veces residuo Residuo porque Es la parte De La predicción Que la línea Deja de predecir Por decirlo así Hay una parte que predice Y una parte que no predice Y ahora lo más importante Si queremos que nuestra predicción Que los valores Que vayamos a calcular De B sub cero Y de B sean buenos ¿Qué tendremos que hacer? ¿Qué tenemos que conseguir Una vez que sabemos Que no queremos? Pues Lo que tendremos que hacer es que La suma de esos residuos Porque habrá un residuo Para cada uno de los datos Hacerlo lo más pequeño posible Es decir, el objetivo es minimizar Esta suma de residuos Al cuadrado Al cuadrado porque queremos castigar Más fuertemente errores grandes Que errores pequeños Entonces al elevarlo al cuadrado Un valor, un residuo Un valor numérico Elevado Se incrementa muchísimo más Que si el residuo fuese pequeñito Es una de las razones por la que No simplemente minimizamos La suma de los residuos Sino la suma de los residuos Al cuadrado Estos son otros datos distintos A los anteriores Pero vamos a explicar Lo que hemos visto anteriormente Era un gráfico Que tenía preparado De otras transparencias Y lo he utilizado aquí Aquí tenemos, por ejemplo Un caso en el que La variable independiente La variable predictora Es el tamaño de una araña En centímetros Se les presentó a una serie de sujetos Con ansiedad Hacia las arañas Y se medió la ansiedad Que tenían Y Esto sería x La ansiedad que tenían A partir de la constancia De la piel Vemos claramente Que la función Parece lineal y positiva La pendiente parece positiva Pero, ¿qué función lineal sería mejor? Esta No lo sabemos Pero ahora ya tenemos Un criterio Con el que podemos establecer Cual de esas funciones es mejor La minimización De los residuos Al cuadrado ¿Y qué es un residuo? Bueno, pues sea cual sea La función lineal Que vayamos a escoger Aquí me he puesto uno en negro Lo más importante es que Para cada valor observado La recta de regresión Hará una predicción y prima Y el valor observado será otro Aquí, por ejemplo Tenemos que para este dato Esta es la i Para un determinado sujeto La recta de regresión No predice A este sujeto Se le presentó una araña Que será aproximadamente De unos 11 centímetros Lo que la recta de regresión Predice para este sujeto Es que La ansiedad medida en GSR Será aproximadamente de unos 22 Este es el valor Predicho por la recta de regresión Mientras que el verdadero valor Observado Para ese sujeto Es de 30 Vemos por consiguiente Que hay una diferencia Entre i E y predicha Esa diferencia viene dada aquí Por esta línea Discontinua Ese es el error Para ese sujeto Si el objetivo ahora Es minimizar Vemos los errores Para cada puntuación Los estoy señalando Esos serían los errores La diferencia entre el valor observado Y el valor predicho para cada sujeto Este por ejemplo Vemos que casi no tiene error Estos son los errores Ahora Lo que queremos es minimizar Estos errores al cuadrado Si lo vamos al cuadrado ¿Dónde está? Aquí está Si lo vamos al cuadrado Y poniendo como ejemplo otra vez Lo que estamos calculando No es ya Esta longitud Si no es esta longitud Al cuadrado significa calcular El área de ese cuadrado Para cada una De las puntuaciones Observemos como Errores pequeñitos Al elevarse al cuadrado El área Que obtenemos es mucho menor Que con un error grande Lo elevamos al cuadrado Esa es la razón de elevar al cuadrado Y lo que hacemos entonces Es minimizar Es coger la recta Que me haga mínima Esta suma de cuadrados Con lo cual A ver Es decir Elevamos al cuadrado La distancia entre I Menos I predicha Y sumamos todos esos cuadrados Esa suma Es el error Cuadrático Porque I menos I prima Es el error Al elevarlo al cuadrado Es el error cuadrático Y lo que estamos haciendo es Un sumatorio Ese error cuadrático Vamos a minimizarlo Y solamente hay una recta Que haga mínimo Ese error Por esta razón, este método de ajuste De una recta de regresión Se conoce como Ajuste por mínimos cuadrados Cuando dijimos el último día Que era Queríamos encontrar la recta La mejor recta que ajustara los datos Y eso de mejor Queda un poco en el aire Que es lo mejor Aquí hemos encontrado un criterio Para establecer que es lo mejor Y este criterio Hay otros Pero este criterio Es minimizar Al mínimo Esta suma de errores cuadráticos Minimizar Escoge aquella recta Que cuando calcules estos errores al cuadrado Con respecto a estos datos Haga mínimo Y eso se consigue No vamos a demostrarlo Porque haría falta cálculo diferencial Se consigue De la siguiente forma En primer lugar Para calcular La pendiente de esa recta Que hace mínima La suma de cuadrados Esa B La pendiente Todo lo que tenemos que hacer es Multiplicar el coeficiente de correlación Que hemos calculado con los datos Directos Por el coeficiente entre La deviación típica de Y Partido por la deviación típica de X Este cálculo Nos va a proporcionar La pendiente de la recta Que mejor ajusta esos datos Según el criterio De mínimos cuadrados Mediante las puntuaciones directas Aquí se ven que hemos utilizado Una fórmula relativamente sencilla Y que exige Disponer de la tabla anterior Necesitamos las deviaciones Típicas de X y de Y Y su coeficiente de correlación Lo podríamos calcular Y obtenemos el mismo valor Mediante esta otra fórmula Que parece más complicada Pero se ve que es Podemos calcular la anterior Y aplicar estos cálculos Tenemos un coeficiente entre El numerador tenemos N, el número de datos Por el sumatorio de X por Y Menos El producto del sumatorio de X Por el sumatorio de Y Observen que son puntuaciones directas Porque X e Y están en mayúscula Partido por N Por el sumatorio de X al cuadrado Menos El sumatorio de X al cuadrado Este cálculo me da La pendiente Si queremos utilizar Las puntuaciones directas También podemos utilizar Esta ecuación Vemos que Por ocasiones que nos falte Podemos O debemos utilizar aquella ecuación Que Que nos sea más cómoda en cada caso Si por ejemplo En un enunciado nos han dado La correlación Y la varianza de las puntuaciones originales Pues parece lógico Que esta ecuación es directa No tenemos que hacer más cálculos Pero si nos han dado, sin más Los datos directos Y no nos han dado estadísticos descritivos Esta podría ser la opción Más directa En este caso Aplicado a A nuestros datos Aquí Me ha faltado el No se ve el resultado Vale He hecho el cálculo Con las puntuaciones directas Es decir He puesto Dieciséis Que es el número de datos N Por el sumatorio de X por Y En la tabla anterior vimos Que el sumatorio de X por Y Varia 1561 Entonces El producto de estos dos factores Menos El sumatorio de X Este factor Sumatorio de X Que es 102 Por el sumatorio de Y Que es 218 Este segundo factor La diferencia entre esto y esto Nos dará el numerador Partido por N, 16 16 sujetos Por el sumatorio de X al cuadrado Que vale 764 Menos El sumatorio de X Que es 102 Al cuadrado Y este cálculo nos tiene que dar B La pendiente de la recta de regresión Que mejor ajusta Esos datos Si hemos calculado B Calcular Recuerden, B la pendiente E integra el grado de inclinación De esa pendiente Cuanto mayor sea B Significa que más inclinada Está la pendiente Nos falta Encontrar B sub cero El punto en el que esa Recta con esa inclinación Cruza El eje de las IS Voy a intentar Hacer Supongamos que este es El eje de coordenadas El sistema de ejes de coordenadas Con X e Y Si hubiéramos calculado Esta recta de regresión Con una determinada pendiente Observen que corta Al eje De Bueno, esa sería Una posibilidad Voy a intentar dibujar ahora Otra recta de regresión Con la misma pendiente que esta Observen que sin Salvo errores de De precisión Estas dos rectas tienen La misma pendiente Y esta Tiene la misma pendiente Salvo errores de Pero cortan Las rectas de regresión En puntos distintos Esta la corta aquí Esta aquí Y esta aquí Por consiguiente, observen que Estas rectas tendrían todas El mismo valor de B De la pendiente Pero aún así existirán infinitas Rectas con esa pendiente Para identificar la recta Que necesitamos Necesitamos conocer B sub cero Simplemente tenemos que Hacer uso De esta fórmula La media de I en puntuaciones directas Menos la pendiente que hemos calculado En el paso anterior Multiplicado por la media de X Este cálculo nos va a dar Un valor concreto para B sub cero Y ya tendremos definida La recta que mejor ajusta los datos En este caso De nuevo tengo aquí Los Los cálculos 13.625 es la media De X Perdón, de I No, un momento De I 13.625 Menos el producto De la pendiente que hemos calculado En el paso anterior Que era 1 punto Era 1.50 Por La media de X Que vale 6.375 Y esto nos va a dar un valor Para B sub cero Por consiguiente ya tenemos B Que vale 1.50 aproximadamente Y B sub cero Que vale 4.275 Por consiguiente ya tenemos B sub cero Y tenemos B Ya tenemos la recta de reversión 1.50 más 4.27 Por X Ahora, para cada valor De X Yo tendré un valor de I Predicho Por una función lineal En concreto esta función lineal Que es la que mejor me ajusta Los datos según el criterio De mínimos cuadrados Y tenemos entonces Ya hemos hecho el ajuste Un ajuste según El criterio de mínimos cuadrados La recta Cruzará El eje I En el punto 1.5 aproximadamente aquí Voy a intentar dibujarlo a mano Aquí 1.5 Y tendrá una pendiente Aproximadamente de 4 Es decir, que por cada unidad Que yo me desplace en el eje X Subirá en el eje I 4 unidades Y esta recta me asegura Que los errores al cuadrado Entre la puntuación que predice La recta Y la puntuación observada Esos errores Son mínimos Al cuadrado Pero sabemos que estamos todavía No hemos hecho nada De estadística inferencial Todo esto es descriptivo Luego veremos que Para cada uno de los componentes Que estamos trabajando aquí Para B sub 0 Para B Necesitamos establecer Sus contrates estadísticos En términos inferenciales Porque esto lo hemos calculado Con esta muestra De 16 sujetos Pero la estadística inferencial Quiere ir más allá Estos datos Muestrales a la población En la que estemos interesados Y por consiguiente Necesitaremos contrates estadísticos para B Para B sub 0 Para B Sus intervalos de confianza Y luego Un contrate estadístico global Para Ver en qué medida Esa recta de regresión Es buena o mala En conjunto Entonces vemos que aquí Los contrates estadísticos Se disparan porque tenemos más parámetros Tenemos B sub 0 Y necesitamos un contrate estadístico Para ver si ese B sub 0 Es igual o no a 0 Para ver si la pendiente Es igual o no a 0 Sus intervalos de confianza Para cada uno de los parámetros Y luego Ver si la recta de regreso En qué grado Porque de momento estamos Hablando solamente en términos Decretivos Haber calculado Los valores B Y B sub 0 Los dos valores que me definen La recta de regresión Que mejor ajustan los datos Según el criterio de mínimos cuadrados Me permite lo siguiente En primer lugar Que el sumatorio Sumatorio para todos los sujetos Es decir, la puntuación observada Menos la puntuación predicha Por la recta de regresión Que hemos calculado Es decir, estos son los errores El sumatorio de esos errores Será 0 Es una característica De este tipo de ajuste De regresión por mínimos cuadrados El sumatorio de los errores Sin grabar el cuadrado Es 0 Porque si vemos Este ejemplo Vemos que hay errores Que son positivos Y otros que son negativos Hay casos en los que la puntuación observada Está por encima de la recta Y otros en los que está Por debajo de la recta Y por consiguiente Cuando la puntuación observada I Esté por encima de la recta de regresión Y su I será mayor Que la I predicha El error será positivo Y a la inversa Cuando la puntuación predicha Este error será negativo Pero lo importante es que Según este criterio de los mismos cuadrados Ese sumatorio De los errores Nos da 0 Mientras que Ese sumatorio de los errores Al cuadrado Obtiene un valor mínimo No hay ninguna otra Otra recta de regresión Que me permita obtener Un sumatorio De errores al cuadrado Más pequeño que el que voy a obtener Con esta recta de regresión Ninguna otra Por eso dice que es mínimo Cualquier otra recta de regresión Que utiliza con valores distintos De B y B sub 0 Me va a conseguir un sumatorio Superior a este sumatorio De errores al cuadrado Estas son dos características Distintas De la recta de regresión Que se consigue mediante este procedimiento Y Si tenemos Puntuaciones de error Estos son los errores La puntuación I Observada menos la predicha Por la recta de regresión que hemos calculado De estos errores podemos conseguir también Una varianza Como un estadístico descritivo Porque ya hemos visto que la media Bueno, la media no La media va a ser 0 La media de los errores va a ser 0 Porque E La media será El sumatorio De los errores Partido por N Pero el numerador es 0 Por consiguiente La media de los errores también vale 0 Pero no así su varianza Su varianza Si la Calculamos mediante El mejor estimador de la varianza poblacional De estos residuos Es el valor que ven en pantalla Sumatorio de los errores al cuadrado Lo mismo que una varianza Pero aplicado a los errores No, perdón, perdón Me estoy equivocando No Esta varianza no es No estamos utilizando aquí La media de los errores La puntuación pronosticada Esto es la varianza de los residuos La puntuación de error En eso no hay ningún error Elevado al cuadrado Y partido por N-2 Y eso nos indica claramente que Al número total de datos Le hemos quitado Dos unidades Significa que estamos utilizando Una estimación poblacional Insesgada De La varianza de error Poblacional Por eso Vemos ahí el sombrero, el hat Varianza de los errores Insesgada Poblacional por consciente De los errores viene dada Por esta fórmula Que es simplemente El sumatorio de los errores Al cuadrado Partido por N-2 Y este es el mejor estimador De la varianza de los residuos Cuando comience a Cometer algún tipo de errores Que ya estoy cansado Así que no sé si seguir Bueno, un poquito más y lo dejamos Una vez calculados los parámetros B y B0 Podemos construir la reacción Que es lo que hemos hecho anteriormente En donde vamos a tener La puntuación pronosticada Como el sumatorio de El punto de acuerdo T con la ordenada Que hemos calculado Más el producto De la pendiente Por los valores de X correspondientes Más un error Que es el error de predicción Y este error de predicción Está compuesto por las distancias Entre cada valor de Y Y el valor predicho Para un valor determinado de X Para ese valor determinado Si lo aplicamos a casos concretos X tendría que tener un subíndice Y correspondientemente otro Así como el error Entonces, en el análisis Por recapitular En el análisis de revisión simple Estamos utilizando una única Variable independiente El coeficiente B se conoce Como pendiente de la recta Ya hemos explicado por qué Y nos cuantifica el incremento Que se produce En la estimación de la variable dependiente Y prima y predicha Cuando la variable independiente aumenta En una unidad Es una forma de estandarizar En este caso El significado de B La estimación de Y para un valor De X igual a 4 Aplicamos los valores que hemos obtenido Para B y B sub 0 Con X igual a 4 Nos daría una hiperdicha de 10.03 Y para una X de 5 Observamos que entre esta X Y esta otra X Hay una unidad de diferencia Daría igual que hubiéramos cogido X igual a 4 Y X1 igual a 4 Y X3 igual a 5 Que haber cogido X igual a 0 Y X2 igual a 1 Siempre que haya una unidad De diferencia Entre estos dos valores Vamos a poder ver El significado de B Aquí hemos cogido simplemente El primer valor de X igual a 4 Por consiguiente el segundo 5 Hemos calculado entonces Para X igual a 4 Cuanto vale la hiperdicha 10.03 Y para X igual a 5 El valor de hiperdicha es 11.58 La diferencia Entre los dos valores La diferencia entre 10.03 Y 11.58 Es lo que representa el valor de B Al aumentar X en una unidad Cuando aumenta y prima Ese es el valor de la pendiente En el caso del ejemplo La pendiente nos dice que Los escolares Con cada punto más Que obtengan en la prueba de vocabulario Van a detectar en promedio 1,5 errores más En la prueba de lectura Aquí lo vemos gráficamente Para X igual a 2 Es un valor distinto Que hemos obtenido anteriormente Aplicamos la recta de regresión anterior Y obtenemos Que Y Para X igual a 2 6.92 Aquí está mal El gráfico está mal Para X igual a 3 Ah, no, no, no está mal Este es el gráfico anterior Para X igual a 2 Hemos visto antes que era 6 y pico Era 6.9 Y para X igual a 3 Que es el gráfico que tenemos en pantalla El valor que predice Es 8.47 En el eje De las X Vemos que hay Una unidad de diferencia Por consiguiente ahora buscamos Cuanto hay en el eje Y 8.4 Menos 6.9 1.5 Este valor es Lo que nos indica La pendiente De la recta de regresión Que hemos calculado Cuanto sube Cuando se incrementa Y Cuando la X Se incrementa Una unidad Da igual en que lugar del eje X Calculemos la variación De Y Al ser una línea recta Ese cambio es siempre el mismo Siempre que el cambio en X Sea igual a la unidad Obviamente Ahora, si B Valores cercanos a 0 Lo que nos está indicando Es que no existe Capacidad predictiva Bueno, si existe regresión lineal Esto es falso Claro que existe regresión lineal Pero X no nos sirve para predecir Y Da igual en que punto del eje X Nos encontremos Y va a ser siempre el mismo Entonces cuando B Este cercano a 0 Indica que mi variable predictora No es buena variable predictora Bueno, esto es lo mismo Que hemos visto anteriormente Lo que pasa es que el gráfico Ya está completo Se ha agrandado La recta Esta pequeña parte De la recta Este gráfico Se ha agrandado aquí Vemos aquí la recta de regresión completa Calculada para X igual a 5 Nos daría 11.5 Y para X igual a 4 Nos daría 10.049 Es decir Un cambio de una unidad De 4 a 5 Nos produce un cambio de N Es decir Este Cambio vertical Es de 1.5.05 Es lo El significado de De B Y el significado de B sub 0 Es Este En donde corta la recta que hemos calculado Donde corta el eje de AFISAS Lo más importante De esta recta de regresión Es B No siempre, hay que juzgarlo Con mucho detenimiento En función de lo que estemos Investigando, pero normalmente Lo que nos interesa es B ¿Por qué? Pues por lo que hemos dicho anteriormente Si B está cercano a 0 Significa que Mi Variable predictora no es buena Sin embargo, el punto en el que La recta corte El eje De la AFIS Pocas veces es Interpretable o O interesante Todo depende del contexto En el que nos encontremos Esto es lo general Por lo que B sub 0 es importante Pero de forma general B sub 0 no es un concepto interpretable En el mismo sentido en que lo es la pendiente De hecho, casi nunca es objeto de interpretación Casi nunca Salvo cuando el valor 0 se encuentre Dentro del rango de valores De la variable independiente Por ejemplo En el caso Que han puesto Como ejemplo No había ningún caso En el que 0 En X Todos tenían una puntuación Superior a 0 Incluso muchas veces Bastante superior En este caso tiene poco sentido Decir que un sujeto tiene En vocabulario 0 Significa que no sabe nada Sobre su idioma Entonces ¿Qué interpretación se le puede dar a eso? En ese sentido es poco interpretable Si encontramos Valores de X Suficientes para 0 Pues en el caso Sustantivo En algún caso sustantivo Podríamos tratar de interpretarlo Pero no es muy general Entonces La constante de la recta de reacción B sub 0 Nos señala el punto en el que esta Corta el eje de ordenadas Es decir El valor estimado de Y Cuando X vale 0 Nada más Si Si no es el caso De que Los valores de X El rango de valores de X Incluyan 0 Entonces la recta de reacción Solamente se puede interpretar Dentro del rango de valores De la variable independiente Pues es con esos valores Con los que se ha construido La recta de estimación Fuera de ese rango No se sabe que sucede con la recta Incluso si es una recta Y por tanto podría ser Que por debajo del menor valor De la variable independiente O por encima del mayor valor De esa variable independiente La función de estimación Cambiara su forma Dejara de ser una recta Creo que fue un ejemplo Este es el ejemplo típico Vemos que Si solamente tuviéramos valores Vamos a ponerlo en verde Si solamente tuviéramos valores Entre 1960 y 2011 Para el incremento De la temperatura global De nuestro planeta Si solamente tuviéramos Este conjunto de valores Estoy desarrollando en rojo Una función lineal Sería una buena estimación De estos datos ¿Estás de acuerdo conmigo? Ahora bien Irnos Hacer inferencias Por encima De los valores que tenemos Por encima de 2011 O por debajo de 2011 Cuando no dispusieramos esos datos Sería arriesgado No es incorrecto hacerlo Pero hay que tomar medidas Y ser conscientes Que fuera de esa gama de valores La función puede no ser lineal De hecho en estos casos Vemos que por debajo de 1960 La función no es lineal Sino que yo diría claramente Que tiene una forma Tiene componentes sinusoidales Pero a partir de 1960 El componente lineal está clarísimo Es a eso a lo que se refiere Lo que se indicó En la preparación anterior La recta de regresión Solamente se puede interpretar De forma absolutamente rigurosa Y correspondiente Porque hemos construido La recta de regresión Con esos valores Fuera de esos valores Estamos en territorio peligroso Ya a partir de este momento Pasamos a las inferencias Todo lo que hemos visto hasta el momento Son cálculos De la recta que mejor ajustan los datos Mediante el criterio de mismos cuadrados Es estadística descriptiva A partir de este momento Pasamos a la estadística inferencial Y por consciente siempre tenemos El mismo sistema Supuestos Hipotesis 1 de hipotesis alternativa Estadístico de contraste Valor crítico Rechazo de h sub 0 Y como esto es ya Pasar de nivel Lo dejamos para el próximo día Nos quedamos en la Transparencia 69 Por último comentarles El último día creo que les hablé también De que los científicos Suelen tener En los medios de comunicación A las películas por ejemplo Proporcionar cierta imagen De los científicos El científico loco El científico que está en su mundo Y no se entera de lo que sucede a su alrededor Vamos a ver Le voy a comentar Una anécdota Que le sucedió a Einstein Explican ustedes Si cuadra O qué característica Le darían ustedes al científico En este caso a Einstein Con esta anécdota A principios del siglo XIX Einstein fue invitado Por el inglés Haldane A una fiesta Una velada con diferentes personalidades Entre estas había Un aristócrata muy interesado En los trabajos de Einstein Tras haber estado Conversando con Einstein Un largo rato El aristócrata le explicó Que había perdido recientemente Su mayordom Y que aún no había encontrado Un sustituto Le dice, mire la raya de mi pantalón La he tenido que hacer yo mismo Esta mañana Y el panchero me ha llevado Casi dos horas A lo que Einstein comentó Me lo va a decir usted a mí Ve usted estas rugas de mi pantalón Pues se tardaron casi cinco años En conseguirlas ¡Adiós!