Bueno, como ya veo que tenemos a bastante gente conectada por streaming, vamos a ir empezando. Lo primero que voy a hacer es saludaros, por supuesto, a los que estáis por streaming y si me podéis confirmar en el chat que el audio es bueno y el vídeo es bueno. Y así ya nos quedamos tranquilos. Y también, por supuesto, saludaros a los que estáis aquí en Ponzarrada, en presencial. En Ponzarrada tenemos a Patricia, tenemos a Javier y tenemos a Ana. Sé que va a estar alguien más en presencial. Se irán incorporando. Es una hora un poquito temprana, es verdad, a las 4 de la tarde es una hora un poquito muy cerca de la hora de comer, pero como queremos aprovechar bien la tarde y que sea un seminario muy práctico y no terminar tampoco demasiado, tarde y que sea compatible con horarios de otras asignaturas que también seguramente que tenéis, pues hemos elegido este intervalo largo. Bueno, pues veo, y disculparme que me refiera a vosotros por la denominación que aparece en el correo, veo que está conectado el alumno 3, que bueno, si podéis poner el nombre en el chat, pues así ya nos vamos conociendo. También está Eblázquez. N.R. Sanjuan, J. Lafuente, P. Quevedo, F. Sebastián y J. Jiménez. Ya digo, disculpad que me refiera así a vosotros, pero es lo que aparece en la identificación que aparece en pantalla. Me decís que se oye bien y ya algún estudiante dice que han mandado un correo con dos documentos, y es verdad. O sea, hemos enviado a todos los que están inscritos, bueno, pues al mediodía más o menos, ¿no, Cipri? Al mediodía enviamos un correo. Un correo con los dos archivos que vamos a manejar a partir de hoy. Y esta va a ser la práctica habitual, enviaremos con carácter previo a tocar los diferentes temas, enviaremos por correo electrónico los materiales que en principio van a ser PDFs o similar, ¿no? Bueno, voy a presentarme cuando lo he hecho, aunque yo creo que ya me conocéis casi todos, soy Jorge Vega, soy el profesor que va a estar un poquito al cargo del seminario, junto con Cipriano Gullmiel, que está aquí en mi lado y está ya listo, sentado en el ordenador, listo para empezar. Yo voy a llevar la parte más, vamos a decir, de desarrollo de contenidos, por así decir, y Cipriano se va a encargar de la parte más práctica. La parte práctica, y esto es importante, es importante que lo... que lo comentemos cuando ya vemos que alumno 3 es Moisés, que San Juan es Enrique y que Quevedo es Pedro. Bueno, pues, buenas tardes de nuevo a todos. Decía que la parte práctica la vamos a hacer con ordenador, tanto aquí, presencialmente en el aula en Conferraja, que tenemos ya ordenadores listos para esto, como los que estáis siguiéndolo a través de streaming, pues desde cualquier lugar, que seguro que tenéis un ordenador porque si no no estaríais conectados, y tendréis internet, etcétera. Entonces Cipri os va a dar instrucciones precisas para que se pueda bajar un software que vamos a utilizar desde internet, es un software gratuito, y por lo tanto se puede bajar sin ningún problema desde internet, y Cipri también va a explicar con detalle cómo se instala ese software y cómo se usa el software, con lo cual yo creo que vamos a poder, en fin, sin mayor dificultad, y dado que además vais a estar viendo como ahora en pantalla lo que nosotros queremos contar, pues no deberíamos tener dificultad para seguir el seminario. Yo ahora voy a minimizar, estamos viendo aquí el chat, lo voy a minimizar, después Cipri tienes que acordarte, si quieres ver las preguntas en el chat tienes que maximizarlas otra vez, y voy a empezar ya con la parte de desarrollo de contenidos. Bueno, el seminario se llama de Econometría Aplicada porque precisamente pretende ser, pues muy práctico, el objetivo es doble, el objetivo es que los alumnos que estén cursando o vayan a cursar, porque me consta que hay estudiantes que todavía no están matriculados y que sí que se van a matricular más adelante, y esta es una materia, en fin, que tiene bastante enjundia, pues que esos estudiantes que estén matriculados en estas asignaturas de Econometría de diferentes carreras, porque hay Econometría en AVE, hay Econometría... Hay Econometría en Economía, hay Econometría en Turismo, etcétera. Y después hay Estadística, muchísimas carreras de todo tipo, ¿no? Entonces que sobre todo para los que están matriculados de Econometría, pues adquieran unos conocimientos que yo creo que les van a ayudar mucho a la hora de aprobar ese examen. Pero nosotros, más que centrarnos en el examen, vamos a hacer un seminario práctico, para aprender Econometría de verdad y que sea útil para cualquier cometido en la vida del profesional o del futuro profesional. Ese es el doble objetivo. Por eso, veréis que el temario es amplio, es bastante amplio, pretendemos ver prácticamente todos los temas que se suelen ver, en las diferentes asignaturas de Econometría, sea cual sea la titulación que estemos cursando. Y, en realidad, pues hay tres grandes partes. Tres grandes partes en cualquier programa de este tipo. Hay una primera parte que podemos considerar una introducción, una introducción que se refiere a modelos econométricos uniecuacionales. ¿Qué tal me va a ir? Pasa... tenemos por ahí una pregunta de asistencia. Bueno, a los que están en presenciales hacemos firmar la oferta de asistencia, y a los que están en remoto ya están fichados, ya están ahí en el sistema virtual, con lo cual ellos no tienen que firmar nada. Bueno, no lo he dicho, pero ya lo sabéis, el seminario es totalmente gratuito y no conlleva créditos porque no está definido como tal como una actividad de extensión con créditos. Más adelante en el futuro ya veremos, ya veremos si lo hacemos así. Pero de momento preferimos que sea un apoyo, un complemento totalmente gratuito. Yo creo que es muy importante que sea gratuito. Un complemento para que esté accesible a cuanta más gente interesada mejor y por eso de momento estamos emitiendo el tema de créditos. No obstante, sí podemos, por supuesto, certificar la asistencia. Eso sí, el certificado de asistencia. Y un cierto certificado. Un certificado de aprovechamiento también porque vamos a plantear una tarea voluntaria. Voluntaria. Algún trabajo voluntario que tenga tiempo y ganas, pues como forma de aprender un poquito mejor la materia, plantearemos como novelazos que hagan el trabajo voluntario y también certificaríamos el que haga el trabajo, pues haremos un certificado de qué ha hecho. Eso lo certificaría yo. Pero bueno, que como tal no lleva créditos. O sea, certificado de asistencia o certificado de haber hecho el trabajo el que lo quiera hacer. Bueno, pues las tres grandes partes del secenario es el primer bloque, es una introducción, modelos econométricos uniecuacionales donde vamos a hablar en todo un modelo econométrico qué significado tiene, cómo se estima, cómo se hace el contraste de hipótesis. En todo esto de la estimación y el contraste de hipótesis hay conocimientos estadísticos y matemáticos con carácter general que hay que poseer, hay que conocer. En principio nosotros vamos a dar por supuesto que se conocen esos conocimientos básicos matemáticos, por ejemplo de álgebra lineal o estadísticos, tanto una estadística de introducción como sobre todo una estadística ya más avanzada, una estadística ya probabilística, etcétera. Pero, pero, en el caso de que esos conocimientos estén olvidados o nunca se hayan adquirido de manera sólida, pues no os preocupéis porque también explicaremos lo suficiente para que seáis capaces de resolver todas las cuestiones. Bueno, y en este bloque 1 pues hay como varias cuestiones a tratar. Primero hay que hablar de modelos, tipos de modelos y de datos. Después hay que hablar de la estimación, de lo que sería una regresión lineal, después se pueden hablar de aspectos más avanzados, de esos análisis de regresión y sobre todo muy importante, ya que es una cuestión estadística fundamental, los aspectos de inferencia, inferencia estadística. Y por último se pueden plantear ciertos problemas en este tipo de estimaciones de modelos econométricos y ecuacionales y los problemas más destacados, en los que más vamos a insistir, son los de autocorrelación y heteroscedasticidad. Hay otros problemas diferentes que se verán en el apartado de aspectos avanzados de análisis de regresión, pero fundamentalmente los dos problemas en los que vamos a poner énfasis son la autocorrelación y la heteroscedasticidad. No os preocupéis ahora que estoy contando cosas que obviamente alguno no conocerá, a alguno le sonará a chino en este momento qué significa la heteroscedasticidad y qué significa la autocorrelación, pero por supuesto lo vamos a explicar. Esto es nada más una visión de conjunto, es un mapa, una hoja de ruta para que sepáis qué cuestiones vamos a tratar en el seminario. El seminario empieza hoy y ahora no recuerdo cuándo acaba, acaba en el mes de mayo, tenemos unas cuantas sesiones, todas ellas de tres horas, con lo cual nos tienen que dar un tiempo suficiente para aprender de forma significativa unas cuantas cosas. Esto que estoy diciendo es muy amplio, lo que veis ahí en pantalla es amplio y sobre todo tiene un trasfondo de conocimientos previos, no sólo de matemáticas y estadísticas sino sobre todo también de teoría económica que podemos dominar más o dominar menos y entonces se requiere tiempo francamente para poder manejar estas cuestiones requerimos de un tiempo, puede parecer mucho las tres horas semanales pero realmente se requiere tiempo y de hecho vamos a poner tareas para que en casa hagáis más cosas porque realmente esto da mucho juego para dedicarle bastante tiempo. El segundo bloque ya son los modelos multiecuacionales, ya pasamos de una sola ecuación a más de una ecuación, dos, tres, etcétera. Pero no sólo veremos modelos multiecuacionales sino que veremos también escenarios especiales, casos específicos que se pueden plantear cuando se estudia el análisis de regresión. Ahí vamos a empezar hablando de lo que se llama el análisis de la especificación y ciertos problemas que nos pueden dar los datos y después hablaremos de algunos casos especiales como pueden ser los paneles, los modelos de regresión con paneles, las variables binarias, variables explicativas dicotómicas, los modelos de regresión de variante cualitativa y también sobre todo los modelos de regresión con variables instrumentales. Pero lo más importante en esta parte, donde vamos a destacar lo más es el tema de modelos econométricos multiecuacionales. Y como tercer bloque ya entraríamos en lo que son las series de tiempo, el análisis de regresión con series de tiempo, y ahí hay que hablar de cuestiones en general de autoregresión, de estacionariedad y de tendencias. Y de manera más específica hablaremos del análisis de series temporales explicando lo que son los procesos estacionarios y no estacionarios y cuestiones de modelización dinámica, cuestiones de VAR y de cointegración. Esto es un poco el menú. Es un menú amplio, es un menú que incluso en los modernos planes de estudio se ve en varias asignaturas distintas. En los antiguos planes de estudio de las viejas licenciaturas solía haber una gran asignatura anual en la que se veía todo, muy grandes asignaturas anuales, pero en los modernos planes de estudio son dos o tres asignaturas, dos o tres asignaturas cuatrimestrales. Incluso pueden ser tres. Depende del plan de estudios, lo que quiera extenderse. Podría ser el equipo docente en ese análisis, pero podría ser tranquilamente el bloque 1 una asignatura de introducción a la geometría y los otros dos bloques o una asignatura cuatrimestral potente de modelos multiconstitucionales y de serie de tiempo o incluso dos. Dos asignaturas cuatrimestrales. Esto es una cosa que es pequeña, una cosa grande. Después ya cada uno, nosotros lo vamos a ver todo en el seminario, de ahí las tres horas anuales, ya cada uno en función de la asignatura a la que se enfrente en el examen, pues ya sabe cuál es su menú y ya sabe dónde tiene que insistir más. Pero francamente, voy a ser muy claro desde el principio, el que no lo entienda todo de manera relacionada es que no sabe de geometría. No nos engañemos. El que no sea capaz de relacionarlo todo es que en realidad tiene déficits muy graves y por tanto yo soy partidario francamente del error todo en su conjunto. Además a los estudiantes siempre les digo que si te vas a enfrentar con varias asignaturas de varios niveles atácalas todas a la vez y asiste a un seminario de estos en el que nos tomemos en serio la geometría porque esto de manera estanca y parcial es poco menos que imposible. Y es un tema que requiere tiempo, también es verdad que es una asignatura que requiere tiempo. No hay que agobiarse porque en una primera aproximación, un primer año contactemos con ella y ese año no seamos capaces. Esto es muy habitual. Entonces no hay que agobiarse ni mucho menos. Es una asignatura que es posible que tengamos que abordarla en varios intentos. Bueno pues dicho esto además no pretendemos sólo que aprendáis para aprobar un examen que eso es importante. Queremos que aprendáis para futuros profesionales que tengan que aplicar esto en la profesión porque eso es esencial. Iba a decir economista pero yo me atrevo a decir que casi cualquier científico social de una forma u otra acaba aplicando estas técnicas que son estadísticas en base a modelos teóricos para resolver todo tipo de problemas en su profesión. Hombre, no es por darme mucha importancia pero es verdad que los economistas son los que más trabajamos estos temas. Los más especialistas en análisis en ciencias sociales son los economistas. Mucho más en vuestra titulación de profundizar mucho más que otras disciplinas en estos temas. Por tanto el que FIPRIO seamos economistas nos va a dar la tranquilidad de que tenemos trabajo. Nosotros hemos tenido que estudiar muchas titulaciones. Bueno, pues dicho esto a los que estamos en Bonfarrada estamos en la sala de informática los demás estaréis conectados a un ordenador todos necesitamos tener un ordenador conectado al internet porque todo lo que vamos a hacer en tiempo real vamos a intentar hacer las prácticas entre las 5 y las 7 vamos a tener dos horas hacer sosegadamente la práctica que es como se debe hacer y de 4 a 5 aproximadamente vamos a hacer el desarrollo de los contenidos vamos a avanzar contenidos a los que estáis en casa tenéis que seguir las instrucciones y nosotros vamos a intentar estar atentos al chat para poder atenderlos sin problemas. Pues ya entramos sin más con un ejemplo práctico porque es como mejor se entiende esto ¿de qué va este seminario? Este seminario va de los problemas que nos planteamos un problema que nos planteamos en cualquier ciencia social no sólo de la economía en cualquier ciencia social que es el análisis de la causalidad de eso va la asignatura y eso es esencial para cualquier científico social un científico social que no sea capaz de analizar la causalidad no es un científico social francamente aquí no hay no hay otra opción esto es sí o no si eres científico social es que eres capaz de analizar la causalidad y si no es que no lo eres por eso es un tema que nos tenemos que coger con mucha ilusión con muchas ganas porque un profesional que se dedica a cualquier disciplina social la causalidad realmente tiene un problema mayúsculo ¿qué es eso de la causalidad? la causalidad es si tenemos varias variables matemáticas, estadísticas a partir de ahí voy a referirme al término estadístico varias variables estadísticas por ejemplo la variable X y la variable Y en el tema de variables matemáticas o estadísticas el que ha estudiado matemáticas o estadísticas sabe que hay distintos tipos de variables sabe que hay variables cuantitativas y variables cualitativas y dentro de esos dos escenarios todavía se puede tipificar con más finura podemos hablar de variables de tipo dicotómico binomial, de tipo ordinal las podemos ordenar estas son cuestiones muy básicas de matemáticas y estadística que se supone que manejamos no obstante le pegaremos un repasito ahí tenéis dos variables de tipo cuantitativo ya veis que son números son series temporales porque ya veis que hay una variable esos son años desde el año 1998 hasta el 2009 con la cual estamos hablando de series temporales estamos hablando de dos variables variable X y variable Y que toman distintos valores en distintos momentos del tiempo por ejemplo en el año 98 la variable X tomó el valor 23 y la variable Y tomó el valor 60 y en el 2009 la variable X tomó el valor 31 y la variable Y tomó el valor 53 bueno también si sabemos algo de matemáticas y sobre todo de estadística sabríamos que esto es una muestra de unos pocos valores porque desde el año 98 hasta el 2009 cuantos valores hay es una muestra pequeña una muestra corta de unos pocos valores y esos son esos datos a los que me he referido son datos muestrales es decir al tomar la muestra en el año 98 de la variable X el valor que resultó el valor muestral que resultó fue 23 y al tomar en el año 98 de la variable Y el valor muestral que resultó fue 60 ¿qué quiere decir esto? ya desde el principio que cada uno de esos años en cada uno de esos momentos del tiempo podría haber otros valores muestrales distintos nosotros tenemos uno el que cogimos con esa muestra concreta bueno y la gran pregunta la pregunta clave para nosotros es oye podemos entender que una de estas variables es causa de la otra explica a la otra esa es la gran pregunta del científico social una pregunta que va mucho más allá de la mera correlación estadística se supone que sabemos algo de estadística pero vamos a repasarlo y en estadística incluso la estadística de introducción una estadística muy sencilla de tipo que decimos los economistas descriptiva en el mundo de la estadística pues ya se analizan temas de correlación estadística por ejemplo hay un sencillito coeficiente de correlación lineal también llamado correlación de Pearson por ejemplo que recordaréis que era algo así como Rxy coeficiente de correlación de Pearson entre las variables xy y era un cociente en el numerador se ponía la covarianza entre esas dos variables y en el denominador se ponía las desviaciones típicas qué quiere decir esto que nosotros deberíamos recordar y a los que no lo recuerden intentaremos explicárselo qué es una covarianza y cómo se calcula y qué es una desviación típica y cómo se calcula esas son cuestiones de introducción a la estadística lo que es una covarianza y lo que es una desviación típica son cuestiones muy básicas de lo que es una introducción a la estadística en un segundo de carrera no más tarde habitualmente una introducción a la estadística la correlación entre esas dos variables seguro que os suena es un coeficiente que varía entre el coeficiente de correlación de Pearson se puede aplicar a variables de tipo cualitativo como esta que tenemos en la pantalla si estuviésemos hablando de otro tipo de variables tendríamos que discutir cuáles son otras medidas diferentes no el coeficiente de correlación de Pearson pero para variables de tipo cualitativo el coeficiente de correlación de Pearson varía entre menos uno y más uno pasando por el cero si nos diese cero diríamos no hay correlación estadística entre estas variables y en la medida en que se acerque a uno o a menos uno pues sí, habrá una correlación estadística o positiva si se acerca a más uno si tiene a más uno cuanto más se acerque a más uno mayor correlación positiva cuanto más se acerque a menos uno mayor correlación negativa y si es el uno exacto 1,000 o menos 1,000 pues diríamos correlación perfecta positiva o correlación perfecta negativa esto os suena bueno eso está bien eso es estadística pero realmente a un científico social no se le puede conformar ni mucho menos con eso es una primera aproximación a nuestro problema nuestro problema es mucho más ambicioso nuestro problema es el de analizar la causalidad es decir podemos aceptar que x por ejemplo es causa de y o sea, podemos aceptar que la variable x explica la variable y bueno pues para decir esto la primera afirmación rotunda es que no basta con la estadística es la primera afirmación rotunda necesitamos un modelo teórico un modelo teórico que explique esa causalidad ese modelo teórico pues será un modelo teórico que aportará alguna disciplina de las llamadas ciencias sociales un modelo teórico que viene de la sociología o que viene de la economía o que viene de donde sea un modelo teórico que explica esa causalidad que explica que x sea causa de y sobre ese modelo teórico que se va a concretar en una normalmente una ecuación una ecuación que tendrá apariencia de ecuación matemática una ecuación que trataremos que sea si es posible lo más sencilla posible siempre cuanto más sencilla mejor son los modelos siempre que sean explicativos pues con esa ecuación que proviene de un modelo teórico un modelo teórico pues trataremos de analizar si hay o no hay causalidad vale de momento vamos a ver las gráficas esto es muy fácil de momento vamos a quedarnos solo en el ámbito de la estadística y vamos a ver estas gráficas si nosotros hubiésemos representado gráficamente ayudándonos del software que vais a practicar a partir de las 5 con Cipri que el software tiene la gran virtud es una maravilla porque te lo dibuja todo vas a poderlo visualizar todo con lo cual te ayuda muchísimo te ayuda muchísimo a trabajar en ecotometría de forma manual en fin es muy limitado necesitaríamos muchas horas manualmente para llegar a algún tipo de interpretación que tuviese un mínimo de fiabilidad sin embargo si tú sabes ecotometría y dispones de una ayuda que es un buen software pues es muy potente por ejemplo muy pronto te enseña las gráficas hombre y si sabes algo de ecotometría ya la gráfica te da mucha información de ecotometría o de estadística estamos con los niveles de estadística matemática y estadística ya solo la gráfica nos indica muchas cosas hay una variable que es la variable X de color azul y hay otra variable que es la variable Y de color rojo es muy fácil ver que la variable tiene una cierta tendencia creciente crece suavemente y que la variable Y aunque la variable Y es más fluctuante sube y baja más por así decir pero tiene una cierta tendencia decreciente eso se ve son dos tendencias suaves ya sabéis que las tendencias de una gráfica muy sencilla o estadística muy sencilla de una estadística descriptiva las tendencias se pueden calcular mediante una aproximación por ejemplo de una línea recta una línea recta que se ajuste a ese modelo que veis ahí si ajustásemos líneas rectas esas líneas rectas tendrían ligeras pendientes positivas y negativas ¿verdad que sí? ¿qué querrá decir esto? desde un punto de vista estadístico muy fácil ahora que entre esas dos variables de existir correlación estadística será una correlación estadística negativa porque una crece y otra decrece y si parece a simple vista que una crece y otra decrece podría haber una correlación estadística negativa vale ya solamente compréis esa gráfica que queréis que te la da en un segundo en cuanto has acabado de meter los datos que es lo que más tiempo lleva le das a un botoncito y ya te hacía la gráfica pues ya te da una información muy útil posible correlación estadística en este caso negativa ¿no? vamos a ver si voy a le doy más caja a Cipri y me voy aquí abajo al AYAS que es donde está la gente atendiendo dice S Palacios es Saúl J La Fuente es Javier E Blanque C es Enrique etcétera bueno, hasta ahora ¿qué tal lo lleváis? los que seguís por streaming seguro que no os habéis perdido porque tampoco he descubierto nada lo que he dicho es muy sencillo o al menos el audio sigue siendo bueno audio y vídeo tarda un poquito en contestar espero que sigan teniendo conexión puede haber un retardo posible en estos sistemas ah sí, perfecto se siguen muy bien las explicaciones bueno, pues seguimos entonces minimizo vamos bien y no hemos avanzado casi nada os he situado ya estáis situados en el tema ¿qué metodología vamos a utilizar nosotros fundamentalmente? fundamentalmente no es la única que se puede utilizar pero de manera fundamental una metodología sencillísima la gran ventaja que tiene esta metodología es que es muy sencilla es la metodología de mínimos cuadrados que seguro que os suena porque esto se puede ver en una pequeña introducción incluso esta metodología en un pequeño curso de introducción a la estadística ya se habla un poquito de mínimos cuadrados cuando hablamos de mínimos cuadrados nos sirve la metodología para estimar los parámetros y utiliza un sistema un sistema matemático que al final es álgebra lineal ahí tenéis la inversa de una matriz la inversa de la matriz x'x x'x a la menos uno significa inversa de la matriz x'x que multiplica por otra matriz la matriz x'y y al hacer esto el resultado que obtenemos son unos parámetros que vienen representados por la letra b b es un vector columna de parámetros estimados álgebra sabemos todos sabemos lo que es la matriz álgebra lineal sabemos lo que son vectores sabemos que se pueden expresar como filas o como columnas sabemos lo que son las matrices sabemos hacer inversas de matrices y sabemos multiplicar matrices hay que seguir un breve recordatorio para hallar una inversa de una matriz qué pasos hay que dar primero el diseminante para comprobar que es distinto de 0 porque si no fuese distinto de 0 la matriz no tendría inversa se halla la punta de la transpuesta y por último se divide la punta de la transpuesta por el determinante y ya está segundo recordatorio para multiplicar matrices qué tiene que ocurrir hay una matriz que premultiplica en este caso x'x a la menos uno y una matriz que posmultiplica en este caso la matriz x'e la multiplicación de matrices no es conmutativa entonces la matriz que premultiplica tendrá un número de filas y un número de columnas y la matriz que posmultiplica también tendrá un número de filas y un número de columnas para que se pueda multiplicar las dos matrices el número de columnas de la matriz que premultiplica tiene que coincidir con el número de filas de la matriz que posmultiplica y si eso es así se multiplican las matrices multiplicando como filas por columnas esto hay que recordarlo, repasarlo y practicarlo si lo tenéis olvidado hay que ponerse ya a repasar todo esto y hay que hacer unas cuantas inversas y unas cuantas multiplicaciones esta semana hasta que estemos aburridos ya del tema el algebra lineal es una matemática para niños es una matemática muy sencillita el tema de matrices es muy sencillizo eso es una gran ventaja que sea tan sencillo bueno pues la matriz resultante acaba teniendo el número de filas de la matriz que premultiplica y el número de columnas de la matriz que posmultiplica vamos ya al grano imaginaros imaginaros que tenemos un modelo un modelo que puede ser económico o sociológico me da igual la disciplina de la que parta este modelo hay un modelo teórico un modelo teórico que verife el modelo teórico la variable x explica la variable y el siguiente modelo teórico y su t y su t quiere decir que es una serie temporal es una variable del tiempo es igual a un parametro alfa que habrá que estimar más otro parametro beta que habrá que estimar que multiplica por la variable x su t que también es una variable de serie temporal más una discrepancia o error de su t discrepancia o error claro todo modelo teórico incorporar una discrepancia o error es muy difícil que una variable x sea cual sea o un conjunto de variables x expliquen al 100% al 100% la variabilidad o lo que le ocurre digamos en términos generales a otra variable y la variable x explicará parte de lo que le ocurre a la variable y y habrá otra parte explicada por la variable x eso es lo más lo más razonable esa parte que no explica la variable x es lo que denominamos la perturbación aleatoria o error o discrepancias ese concepto de perturbación aleatoria error o discrepancia es esencial el concepto de error es un concepto esencial en cualquier ciencia sea social o no social y es un concepto que se maneja en matemáticas, en estadística y en todos los sitios es un concepto esencial, troncado y para nosotros va a ser un concepto muy importante la perturbación aleatoria o error después haremos una serie de hipótesis referidas a esa perturbación aleatoria o error y yendo al grano en un modelo como este es muy fácil demostrar que lo que hemos denominado matriz x'x que tenemos que invertir es una matriz de dos filas por dos columnas es facilísimo de demostrar esto desde el punto de vista matemático pero no solamente es una matriz de dos filas por dos columnas sino que es la matriz que está ahí en pantalla n sumatorio de x1 sumatorio de x1 sumatorio de x1 al cuadrado lo veis verdad es facilísimo de demostrar desde el álgebra lineal y también es facilísimo de demostrar desde el álgebra lineal que la matriz x'y va a ser la matriz columna, columna por decir una sola columna dos filas por una columna sumatorio de y sumatorio de x1 por y pero no sólo esto sino que además es facilísimo de demostrar porque es solamente álgebra lineal hacer inversas y multiplicar todos sabemos hacerlo que cuando se aplica la metodología de mínimos cuadrados ordinarios es decir, se halla la inversa de x'x y se multiplica por x'y el resultado va a ser que b b que es el vector columna de estimadores está formado por dos estimadores el estimador alfa y el estimador beta el estimador beta que es el más importante porque se llama coeficiente de expresión lineal es muy fácil de calcular también desde el punto de vista estadístico hay conceptos estadísticos que conocemos que nos permiten en este caso calcular en poco tiempo ese estimador beta lo veis ahí en pantalla se puede demostrar que es la covarianza de y con respecto a x dividido por la varianza de x que a todos os suena, ¿verdad? porque son las covarianzas y la varianza y una vez que tenemos a g de beta el estimador de beta es muy fácil estimar alfa el estimador de alfa sería la esperanza matemática de y o si queréis la media de y menos el estimador de beta que multiplica esto es sólo al general lineal es facilísimo de desarrollar y hombre ¿cuál es la gran ventaja? que estimas de manera muy sencilla alfa y beta sólo con al general lineal siempre y cuando se den una serie de condiciones que después explicaré esto no se puede aplicar a ciegas, a tontas y a locas la parte de al general lineal es lo menos importante realmente eso para nosotros lo suponemos conocido y es muy fácil lo importante es cuando se puede hacer esto de tal manera que obtengamos unos estimadores voy a decirlo así, de buena calidad pues cuando se den ciertas condiciones que después explicaré oye y si el modelo es un poquito más grande pues claro los modelos no tienen por qué ser tan pequeños el modelo de antes era un modelo de una sola ecuación la única ecuación cual era alfa más beta que multiplica por x más un error, una sola ecuación y este modelo también tiene una sola ecuación pero es un poquito más grande igual a alfa más beta1 por x1 más beta2 por x2 más una perturbación aleatoria o error aquí hay dos variables explicativas x1 y x2 habrá un modelo teórico que vendrá de la economía o de la sociología o de la ciencia social que sea que establece esta posible causalidad que x1 y x2 explican o pretenden explicar a la variable y obviamente no van a explicar el 100% de la variabilidad de y habrá una parte que no explique por eso hay una perturbación aleatoria o error ¿cuál sería en este caso? la matriz x'x y la matriz x'y eso, algebra límite se puede demostrar muy fácilmente porque sólo es algebra lineal que la matriz x'x en este caso es una matriz de 3x3 y además la veis en pantalla primera fila sumatorio de x1, sumatorio de x2 segunda fila sumatorio de x1, sumatorio de x1 al cuadrado sumatorio de x1 por x2 tercera fila sumatorio de x2, sumatorio de x1 x2 sumatorio de x2 al cuadrado todos sabrían hallar estos sumatorios a mano si nos dan los datos el hacer los sumatorios de manera manual matriz x'y es una matriz columna tiene una sola columna y tres filas es una matriz de 3x1 una columna y tres filas sumatorio de y sumatorio de x1 por y y sumatorio de x2 por y los sumatorios también se calculan muy fácilmente si los tuviésemos que hacer de forma manual pues bien, de nuevo si aplicamos la metodología de mínimos cuadrados ordinarios hacemos la inversa de x'x y multiplicamos la inversa resultante por x'y ahora ya está nos sale muy fácil el estimador de alfa el estimador de beta1 y el estimador de beta2 con alfabra lineal que es sencillo estimar parámetros ¿verdad? yo entiendo que todos el alfabra lineal lo tenéis más o menos y el tema de matrices lo tenemos bueno para todo esto si estuviésemos en un examen de econometría ¿de qué sirve saber hacer matrices? la respuesta es de nada ¿cuánto se puntúa el saber hacer matrices? la respuesta es nada todo el mundo lo sabe esto es trivial no hemos dado ni un paso siquiera en la asignatura esto no puntúa nada yo insisto mucho en esta idea porque a veces la gente pierde mucho tiempo con un cálculo matricial que se supone que sabes hacerlo perfectamente y no te va a aportar nada porque en la puntuación tienes que saber mucho más para incluso si no te da tiempo en el examen porque los exámenes de SOYO si son de dos horas y que hay un problema un poquito largo no te va a dar tiempo hacer en el examen seguramente todos los cálculos de manera sosegada y es más es posible que cuando hagas de manera manual un examen inversas de matrices y multipliques matrices y habrá una serie de decimales o las prisas y los nervios pues haya un montón de errores eso es así ¿de qué sirve que hayas hecho las inversas y las multiplicaciones? de nada lo que sí tienes que tener los conceptos claros tienes que saber yo lo que quiero tienes que saber estadística tienes que saber matemáticas y entonces tienes que sabiendo interpretar los signos que tienen que tener los diferentes parámetros estimados para que aunque te hayas equivocado en el proceso de cálculo matemático no pasa nada porque como tú sabes de esto pues ya anticipas al profesor o profesora cuáles deben ser sus signos y si no te han salido es que te has despistado y te ha salido mal me he tenido que despistar porque no me daban los datos que me tenían que dar esto no va a leal general lineal el ángel general lineal es un instrumento pero no va a leal general lineal el siguiente paso es muy interesante porque este mismo modelo con dos variables explicativas x1 y x2 se puede se puede plantear desde el punto de vista estadístico de otra forma otra forma muy habitual en estadística que es a través de las varianzas y covarianzas el tema de los sumatorios está muy bien es muy sencillo todos sabemos sumar con éste no hace falta tener un software específico para sumar tiene la gran ventaja el sumatorio de x1 sensible pero estadísticamente es un concepto muy pobre estadísticamente es mucho más rico el concepto de varianzas y covarianzas ya aporta una información estadística entonces resulta que el modelo anterior que ponemos de las varianzas y de las covarianzas es decir de la varianza de x1 de la varianza de x2 de la covarianza de x1 respecto de x2 de la covarianza de y respecto a x1 y de la covarianza de y respecto a x2 varianzas y covarianzas que nosotros desde el punto de vista estadístico tendríamos que saber interpretar vamos allá en la estadística introducción en la estadística descriptiva cómo se puede describir un fenómeno estadístico cuáles son las medidas descriptivas de un fenómeno estadístico son de cuatro tipos las medias o esperanzas matemáticas las varianzas la simetría y la acutosis cualquier variable cualquier fenómeno estadístico descrito por esa variable si lo queremos describir echaremos mano de cuatro conceptos sencillísimos que son medias, varianzas, simetría y acutosis la varianza ya sabemos lo que es y la media ya sabemos lo que es más adelante volveremos sobre el tema yo supongo que sabéis lo que es la media y la varianza la covarianza implica que no hay una sola variable no hay un solo fenómeno hay dos variantes o fenómenos y la covarianza ya se aproxima se aproxima a la idea de la posible relación que hay entre esas dos variables idea a la que también se aproxima la correlación estadística la aproximación que hace la covarianza y la correlación estadística a esa posible relación entre dos fenómenos entre dos variables pues tiene una virtud que es sencillísima pero tiene un defecto que es muy pobre lo que es muy sencillo está muy bien porque es muy sencillo pero tiene respuesta poco entonces la covarianza y la correlación son aproximaciones como sabéis estadísticas al concepto de relación entre varias variables de hecho la covarianza es el numerador de la correlación el signo que tenga la covarianza es el signo que va a tener la correlación son aproximaciones muy sencillas pero muy pobres nosotros no estamos buscando eso nosotros buscamos la causalidad que es lo verdaderamente importante ¿de acuerdo? un buen profesor de ciencias sociales de análisis científico estadística aplicada a las ciencias sociales o iconometría o psicometría o como le llamen a tu distintina aplicada a las ciencias sociales sería un obseso del concepto de causalidad y os preguntaría todo el tiempo en el examen por el concepto de causalidad a nivel teórico si tú eres capaz de contestar a ese concepto bien es que algo has aprendido ¿de acuerdo? vale pues vamos a ver oye, si tenemos las covarianzas y las medias pues otra manera de expresar desde el punto de vista del álgebra lineal los cálculos que nos conducen al alfa, al beta1 y al beta2 pues es esta esta es una forma muy habitual de trabajar porque si estuviésemos en un examen los datos no nos lo van a dar en sumatorios habitualmente los datos nos lo van a dar en varianzas, covarianzas y esperanzas matemáticas si nos dan varianzas, covarianzas y esperanzas matemáticas la forma de plantear el examen es este modelo que tengo aquí en ese caso la matriz x'x es una matriz de 2x2 que es la que veis ahí n por varianza de x1 n por covarianza de x1 a x2 voy leyendo por filas n por covarianza de x1 a x2 n varianza de x2 la matriz x'y ¿cuál sería? n covarianza de x1 n covarianza de x2 ¿cómo se calcularían beta1 y beta2? pues hallando la inversa de esa matriz x'x de 2x2 y multiplicando esa inversa por la matriz de x'y y una vez que tengamos beta1 y beta2 ya podemos calcular alfa ¿cómo? como esperanza matemática de y menos beta1 que multiplica por esperanza matemática de x1 menos beta2 que multiplica por esperanza matemática de x2 ¿si? como veis en las matrices x'x y x'y aparecen n ¿verdad? cuando halléis la inversa y multipliquéis la inversa por x'y esas n desaparecerán desaparecerán cuidado porque en cualquier manual que os explique esto ya desaparecen las n es que tienen que desaparecer el alumno cuando lo ve en el manual o en los apuntes o aquí en la transparencia que tengo yo claro, ya veis que en la parte de abajo de la transparencia no aparecen las n, han desaparecido ¿verdad? porque al operar, al hacer la inversa y multiplicar desaparecen pero si no multiplicas a través de la inversa las n están ahí ¿de acuerdo? más cosas todo esto es un concepto muy básico ya veis que hemos explicado hasta ahora casi nada hemos explicado que nos interesa la causalidad hemos explicado un poquito que en estadística ya sabemos que la relación entre variables se aproxima a través de covarianzas y correlaciones y poco más y he hablado un poquito de algebra lineal ¿no? un poquito de algebra lineal y de un método que se llama mínimos cuadrados ordinarios que tiene la virtud de que se basa en algebra lineal por lo cual es sencillísimo lo sabe hacer por hielo tiene esa virtud pero tiene desventajas tremendamente importantes o sea, tiene limitaciones muy serias después las explicaré más adelante las explicaré más conceptos que hay que empezar a poner encima de la mesa pero que casi casi son todos recordatorios de estadística todo esto pues son cuestiones de estadística hay un concepto en estadística que se llama suma de cuadrado residual suma de cuadrado residual hay otro concepto que se llama suma de cuadrados explicada y hay otro concepto que se llama suma de cuadrados total este último la SFT suma de cuadrados total es la suma de la suma de cuadrados explicada más la suma de cuadrados residual y los otros dos se calculan fácilmente con un cálculo matricial o sea, usando de nuevo algebra lineal como la suma de cuadrados residual se puede ver ahí ven la fórmula es el resultado de restar dos expresiones matriciales dos matrices podríamos decir en realidad son dos números son dos matrices de dimensión uno por uno o sea, dos números, dos escalares la primera matriz de dimensión uno por uno es I'I y la segunda matriz de dimensión uno por uno es B' B' significa traspuesta de B siendo B el vector columna de los estimadores de los parámetros alfa, beta1, beta2, etc beta' es la traspuesta de B que multiplica por X'I bueno pues eso es la suma de cuadrados residual que es un número que tiene una interpretación lo que nos importa es la interpretación más que el cálculo matricial que es muy fácil y la suma de cuadrados explicada también va a ser otro número porque si B'X'I en una matriz de uno por uno que ya hemos calculado antes hay que restarle N que es el tamaño de la muestra que es un número que multiplica por el cuadrado de la media o esperanza matemática de I obviamente la esperanza matemática de la variable I o media de I es un número que al multiplicar ese número al cuadrado nos da un número de escalar y al multiplicar ese número por N que es el tamaño de la muestra pues sigue siendo un número también deberíamos ser capaces de interpretar qué significa la suma de cuadrados explicada al sumar la suma de cuadrados explicada más la suma de cuadrados residual obtenemos la suma de cuadrados total a partir de estos conceptos y esto es de estadística introducción aparece un concepto que es el de coeficiente de determinación que tiene algo que ver con el coeficiente de correlación lineal de Pearson al que antes aludíamos y que os recuerdo que era el coeficiente entre la covarianza y el producto de las derivaciones típicas pues bien, el coeficiente de determinación que algo tiene que ver con el coeficiente de correlación lineal como veis ahí en la parte de abajo de la diapositiva es un coeficiente es un coeficiente entre la suma de cuadrados explicada dividido por la suma de cuadrados total y ese coeficiente va a variar siempre entre 0 y 1 en la medida en la que se aproxime a 1 esto mide la bondad de ajuste a nivel muestral decimos bondad de ajuste a nivel muestral tened en cuenta que nosotros en las expresiones matemáticas que hemos visto antes la primera que vimos era una, si prescindimos de la perturbación aleatoria o error vamos a prescindir de momento de la perturbación aleatoria o error la primera ecuación que vimos era y igual a alfa más beta por x eso es una línea recta la segunda ecuación que vimos sin el error es igual a alfa más beta 1 por x1 más beta 2 por x2 eso es un plano es un plano la recta tenemos sólo dos dimensiones, la x y la y y en el plano ya es tridimensional tenemos x1, x2 e y restas de regresión y planos de regresión claro, con lo cual aquí habrá nubes de puntos habrá nubes de puntos que es lo que vimos en la gráfica, en la primera grafica aquella línea azul y aquella línea roja de la x y la y en realidad son nubes de puntos y nosotros estamos pretendiendo ajustar o bien una recta o bien un plano a esa nube de puntos cuando pretendes hacer ese ajuste ese ajuste puede salir mejor o peor si sale bien el r cuadrado tenderá a ser 1 si sale mal, el r cuadrado tendrá a ser 0 y desde luego el concepto más importante que hemos explicado hasta ahora es el que voy a explicar ahora y ya estoy casi terminando sigma cuadrado sigma cuadrado lo veis aquí en la penúltima fila, ¿verdad? sigma cuadrado es el estimador de la varianza de las perturbaciones aleatorias o errores este es un concepto serio este sí hasta ahora no es fácil, hasta hablar de matemáticas de algebra lineal y una introducción a la estadística pero cuando ya hablas del estimador de la varianza, de la perturbación aleatoria o error ya hay que hacer una reflexión de mayor calado eso ya es estadística de verdad eso ya es estadística teórica, estadística probabilística estadística con mayúsculas y por tanto ya empezamos a hablar de econometría de verdad el cálculo de este estimador es muy sencillo, es un cociente es un cociente, en el numerador aparece la d, que es la suma de cuadrado residual y en el denominador aparece n menos k n es el tamaño de la muestra y k es el número de regresores incluyendo el término independiente en la ecuación i igual a alfa más beta por x ¿cuántos regresores había? 2, alfa y beta y en la ecuación i igual a alfa más beta1x1 más beta2x2 ¿cuántos regresores había? 3, alfa, beta1 y beta2 pues eso es k y después aparece aquí en medio en medio, aparece una multiplicación muy sugerente este es un concepto ya muy, muy sugerente muy importante que es ese sigma cuadrado que es el estimador estimador y sesgado ya el próximo día hablaremos de esto de estimadores y sesgados el estimador y sesgado de la varianza de la perturbación aleatoria del error multiplicado por por supuesto ese estimador es un número multiplicado por una matriz un número multiplicado por una matriz que es la inversa de x' a x cuando tú multiplicas un número por una matriz, el resultado es una matriz que resulta en multiplicar todos los elementos de la matriz por el número en cuestión pues dentro de esa matriz resultante que es una matriz apasionante esto ya es esto ya es de verdad estadística esto ya es de verdad geometría ahí dentro van a estar las varianzas de los estimadores de los parámetros de nuestro modelo de relación y ya hemos llegado a un punto que empieza a ser interesante ya no es sólo álgebra lineal ya no sólo es la estadística, ya es algo más ya es al menos estadística teórica estadística probabilística que se supone que lo habríamos estudiado antes de llegar a geometría pero bueno, yo lo voy a explicar despacio las cosas importantes las explicaré despacio y hombre, las más facilongas las explicaré más deprisa pero si alguien tiene problemas que levante la mano o que mande un mensaje al chat y le atenderemos termino con esta idea es un breve recordatorio es un breve formulario todos sabéis calcular según este formulario que hay aquí medias, varianzas y covarianzas ¿a que sí? este formulario lo sabemos todos medias, varianzas y covarianzas y hasta aquí esto ya es estadística de verdad hasta ahí hasta ahí sabemos todos llegar vamos a ver si los que están en el chat todos sabéis calcular medias, varianzas y covarianzas y todos tenéis un cierto nivel de álgebra lineal y de estadística introducción o descriptiva al menos porque hoy lo he hecho más que álgebra lineal y estadística introducción hasta aquí podemos llegar bueno, ahora os voy a dejar con Cipri para que empecéis con la parte práctica hemos avanzado poco en el transporte de contenidos aunque bueno hemos avanzado de tal manera que ya podéis empezar a meter números en su software porque como yo ya puse unos números ¿verdad? unos números de una variable X y una variable Y pues ya podemos bajar su software y podemos empezar a meter números en ese software para empezar entonces, Cipri hoy con tiempo os va a explicar muy despacio muy paso a paso cómo bajaros este software todos ahora los que estén en casa tienen que bajarse y los que estéis aquí hay que bajaros también al ordenador del aula y cuando lleguéis a casa por favor porque todavía vamos a trabajar hay que bajarnos del equipo de casa para seguir trabajando suerte bueno, vamos a ver lo primero que tenemos que hacer para poder utilizar el software es bajarlo entonces aquí en el aula ya tenéis el software en los ordenadores ¿quieres entonces la clave para entrar en los ordenadores es programación y el número arriba aquí desarrollo 1, 2 3, 4, 5 vosotros ya habéis entrado y tú tienes que poner aquí desarrollo el usuario es desarrollo y ahora explicamos a los de casa también para que lo vayan bajando primero vamos a explicar aquí al aula para que lo puedan bajar en el ordenador pues tienes que poner aquí desarrollo 1, 2, 3, 4, 5 6 y aquí la clave programación la primera con mayúscula guión bajo y el número que tiene el desarrollo pues sería el 6 es un 6 ¿qué? sí, la primera es mayúscula si no pasa nada no te preocupes y ahora explicamos también a los de casa para que ellos lo vayan bajando primero vamos aquí para que puedan entrar en los ordenadores ya está vamos a ver si lo tienes la mayoría no tendrá ¿tú sí lo tienes? aquí sí que está y aquí tenéis una carpeta, los que estamos aquí y los dos archivos que os hemos enviado podéis bajarlos e ir guardando ahí esa carpeta podéis guardar y hacer la opinión bueno, pues ahora ya que todos los que estamos aquí ya tenemos el ordenador tendríamos que bajarnos el programa vosotros ya lo tenéis bajado esto que tú lo tienes bajado me parece que el ordenador no está compruébalo y si no, hay que bajarlo pues lo primero que tendríamos que hacer es un software gratis por lo tanto lo primero que tenemos que hacer y lo que vamos a ver hoy va a ser esto introducción, gestión de datos vamos a ver un cuadro de gráficos y vamos a ver una estimación para actos por mínimos cuadrados ordinarios pero ahora lo vamos a ver desde el punto de vista de un ejemplo porque lo único que vamos a hacer va a ser meter datos en el ordenador y vamos a ver si hay relación entre dos variables pero no consiste en que haya causalidad entre dos variables tiene que haber detrás un estudio económico que explique qué relación hay entre dos variables porque tú puedes meter este programa informático la renta de Australia y el empleo en España y posiblemente el software te va a decir que puede haber una correlación con las variables económicas que van a crecer en el tiempo y puede decir que hay una relación entre ellas pero no hay ningún estudio económico que diga que hay una relación entre ellas y que se pueda explicar estadísticamente sí puede haber una relación entre ellas pero en econometría no solamente sirve con eso tiene que haber un estudio económico que haya realizado un estudio económico y tú explicar ese estudio económico mediante esas variables y ver si hay una causalidad entre ellas así que lo que vamos a hacer hoy es simplemente meter datos lo primero que tenemos que hacer es entrar puedes poner en tu buscador o en esta dirección pinchas en esta dirección y vamos a buscar en el que yo os pasé esta dispositiva está distinta bueno, buscamos aquí pinchamos pincha a ver si te deja para bajártelo y una vez que ya hemos pinchado no sé si desde casa tenéis algún problema al bajarlo pero vamos primero pinchar en la página si queréis lo hago yo aquí pero lo voy a hacer yo también porque en este ordenador el ordenador que estoy aquí ahora trabajando no lo tiene entonces lo voy a hacer después pincho aquí Gretel para Windows el que tenga un App que pinche para Mac lo que quiera según el ordenador que tenga después todo el bajártelo para 32 es de 4 eso da igual yo lo voy a bajar aquí para 32 y bajo la última versión que tenemos aquí que es de 22 de diciembre de 2019 la más reciente me está aquí ya bajando yo no sé si va a ser tú espera, tengo una pregunta ¿cuál descargo es este? ¿lo pongo en ciego? ¿por dónde voy a bajar? ¿cuándo subo? aquí lo tienes pinches aquí una vez que ya lo tenéis bueno, tarda un poquillo está todavía bajando vosotros como bueno ya lo tenéis pero bueno, esto lo sabéis hacer con el ordenador que no son de verdad no es minimizado es que hay veces que se atasca eso pues este este va bien ese esto va bien ¿puedo entrar con esto? vuelve a entrar, ahí está programación mira, lo voy a poner aquí ¿qué hay en mayúsculas? animación guión bajo y el ordenador que tengas el 3 bueno, sigue bajando va un poco lento porque como estos están todos en línea y no tienen mucha capacidad estos ordenadores tampoco y no están actualizados pero bueno espero que lo vaya bajando los que estéis en casa si tenéis algún problema aquí todavía igual en casa ya os va más rápido y lo bajáis más rápido pero bueno, este ordenador es un poco lento y por eso va muy despacio bueno, ahí está casi ya lo tenemos ejecutamos elegimos el idioma el modo es siempre poco a poco le vais diciendo que sí siguiente si queréis añadir para que os aparezca en vuestro escritorio y os vamos a instalar es un software gratuito y lo bueno que tiene que para los trabajos así de economía como los que vamos a hacer nosotros pues es muy útil cerramos aquí y ya vemos en nuestro escritorio la aplicación después ya entramos en ella bueno todo esto ya lo hemos hecho no sé si en casa los que estáis habéis tenido algún problema pero es muy sencillo simplemente ah, para Mac simplemente donde yo he pinchado en la página anterior tenéis que poner para Mac que te lo he indicado espera un momento sí aquí y aquí tienes Gretel Mac pues aquí que tenga un Apple le da ahí en los pasos va a ser lo mismo nada más que es para Mac no hay ningún problema es exactamente lo mismo que hemos hecho para Windows es igual para Mac así que no tenéis ningún problema bueno ya tenemos el icono y ahora si pinchamos esto sería nuestro menú de inicio si queréis pinchar y aquí lo primero que nos sale nos sale aquí archivo, herramientas datos, ver, añadir, muestra, variable modelo y ayuda ahora vamos a ir explicando cada uno de los iconos hay algunos que estarán activados lo de datos, ver, añadir, muestra y variable eso no está activado porque no hemos metido ningún dato una vez que metamos datos pues ya se activa y ya podemos empezar a jugar con ello lo primero en ayuda hay una guía guía de usuario con la podéis bajar y ahí tienes todos los conocimientos que quieres lo puedes bajar también hay iconos aquí directos que lo mismo que yo voy a buscar por aquí también hay iconos directos por ejemplo para calcular los mínimos cuadrados ordinarios aquí lo tienes el de ayuda aquí para la guía de usuario bueno pues en esa guía de usuario te pone todo sobre esta aplicación lo podéis bajar ir leyéndolo empezamos aquí con archivo aquí en archivo lo vamos a utilizar aquí tú puedes bien en este programa meter tú los datos a mano normalmente vas a meter muestras imagínate datos 6 temporales claro, si son muchísimos datos a veces que tú puedes ir puedes ir al Banco de España o al Instituto Nacional de Estadística y te puede dar 6 temporales muy grandes entonces lo que puedes hacer es bajártelo a una extra y el ordenador te chupa de distintos formatos como de Word o de Excel eso lo vamos a ver otro día en una Excel para que él entienda los datos que está en una Excel tienes que utilizar la primera fila la primera columna no se lo puedes poner en mitad de la Excel en la fila 3 o en la mitad en la 34 si no, no lo va a entender eso lo vamos a ver otro día y aquí vamos a empezar con un nuevo conjunto de datos y vamos a empezar a introducir valores a mano antes vamos a aplicar algunos iconos y después ya vamos introducimos los primeros valores del caso 1 que dejó Jorge hoy y lo metemos nosotros a mano después aquí en herramientas en los libros de estadística el de Econometría por ejemplo aquí de la UNED pues tiene estadísticas valores esto también lo tienes aquí en el programa por ejemplo si quieres calcular quieres hacer una análisis de cada una de las variables lo que había dicho antes Jorge también lo tienes aquí y puedes hacerlo después una vez que ya metamos datos ya se nos va a facilitar en el menú en datos una vez que hemos metido datos sobre una variable por ejemplo la primera que vamos a meter pues ya puedes sobre esa variable te va a mostrar valores editar valores te faltaban algunas observaciones si quieres añadir alguna observación si quieres ver cómo es esa variable quieres que te muestre de esa variable imagínate que quieres que te muestre de esa variable su gráfica todo eso claro, a la hora de tú hacer un examen no tienes un software y no vas a ver estas representaciones gráficas eso está claro y claro esto, el mínimo escuadro se dio en esto te lo calcula una vez que tengamos los datos si tú habías metido los datos esto te lo hace en 3 segundos en cambio si tú esto tienes que calcular no tienes que calcular las matrices aunque si te da valores, te dé una muestra o bien te dé covarianzas o varianzas si tienes que calcularlo lleva bastante rato y encima que no te equivoques porque ya si encima te equivocas y estás interpretando y no has interpretado bien el modelo económico y lo vas a interpretar a partir también de los datos que te van dando te puede enseñar algunas concurrencias y ya puedes realmente todo lo que tú encuentras en el examen no es calcular las matrices sino la interpretación claro, si tú ya lo has calculado mal y no te has dado cuenta que lo has calculado mal ya vas a hacer una mala interpretación únicamente que conozcas bien el modelo en profundidad y sepas que lo que te está dando el modelo lo que tú estás calculando sabiendo que no es correcto con lo que dice el modelo entonces si lo explicas seguramente te va a poner bien no te lo van a poner perfecto pero lo que más valoran es la interpretación y si tú la interpretación la haces bien aunque te hayan salido mal los cálculos posiblemente el examen lo tengas aprobado para que veas la importancia de lo que tiene lo que es importante es la interpretación bueno, después aquí para ver vamos a utilizar por ejemplo el gráfico para ver si en una serie temporal se te da distintos gráficos gráficos múltiples después te da también cuando hablamos de la correlación pues aquí puedes calcular la matriz de correlación simplemente que te va a valer de ejemplo para ver qué relación hay entre dos variables de momento estamos viendo a nivel estadístico y muestra bueno, después aquí también en lo de añadir hay veces que normalmente lo has explicado un sistema, un ecuacional simple y múltiple pero es lineal lo que hemos visto es lineal hay veces que no va a ser lineal entonces tenemos que pasarlo a logaritmos cuando tú te das un modelo por ejemplo con Douglas y que ya es exponencial para poder trabajar tú con él y tengas una muestra y tengas los valores de esa muestra lo que tienes que pasar es a logaritmos para poder trabajar con él que también tendrías que hacerlo en SAR bueno, pues aquí claro lo pasamos a logaritmos y ya tendríamos esas variables en logaritmos ya tendríamos que interpretarlo teniendo en cuenta que ahora tenemos logaritmos bueno, pues aquí te va a dar una muestra después también aquí sobre la muestra esto lo vamos a utilizar menos aquí te va a decir la muestra que estamos si quieres establecer rangos, algún criterio en vez de trabajar con toda la muestra imagínate y dices pues voy a trabajar con una muestra una muestra más pequeña normalmente cuando las muestras sean más grandes mejor va a ser el estudio así que normalmente lo que es importante es que la muestra sea lo más grande posible y si tiene más variables aunque de por si fuéramos a buscar modelos lo más simples posible y después aquí lo de variable es lo que vamos a utilizar sobre todo aquí te va a decir qué valores tenemos si quieres calcular algún gráfico de la variable que tengas coeficientes y si quieres hacer algún contraste a normalidad pues ya te lo hace también me demoré muchísimo tiempo a hacer eso y en el software te lo haría al instante y después ya por último el modelo el modelo nosotros vamos a utilizar mínimos cuadrados ordinarios entonces aquí utilizaríamos mínimos cuadrados ordinarios se pueden utilizar otro tipo de estimación por ejemplo la máxima de absurditud puedes utilizarla mínimos cuadrados no lineales pero normalmente lo que tú vas a utilizar va a ser mínimos cuadrados ordinarios ¿vale? pero te da facilidades para hacer más estudio vamos a utilizar mínimos cuadrados ordinarios porque sea más sencillo más simple por eso vamos a utilizar ese vale lo primero que tenemos que hacer para la gestión de datos antes de poder empezar a trabajar con estos datos tenemos que saber que Grether va a utilizar su propio formato para almacenar datos el formato que tiene en vídeo su extensión es GDT entonces tú puedes guardarlo en esta extensión y después abrir los datos o también si quieres como guardar el programa y ya lo guardas en GDT y lo puedes guardar guardar como o guardar en el propio programa y ahí te lo va a guardar en la carpeta que hemos creado hoy donde se guarda el programa ahí te lo va a guardar se puede guardar de dos maneras y si no los quieres guardar los vuelves a subir porque tampoco tardas nada una cosa es si lo tienes que meter a mano claro, si lo metes a mano es mejor que lo guardes si no, pues tardas bastante y te lo sale directamente Grether también puede importar archivos de distintos formatos como ya dijimos estos tipos de formatos pero sobre todo la gente ¿qué vas a utilizar? sobre todo Excel es lo más común es utilizar Excel pero bueno, guarda más tipo de datos normalmente si tú vas al Banco de España o vas al Instituto Nacional de Estadística donde tienes muchísimas variables pues te las va a permitir bajar siempre a una Excel que es más útil y te va a permitir subir los datos rapidísimo bueno, entonces lo primero que vamos a hacer nosotros es lo del caso 1 y vamos a meter los datos del caso 1 tanto los que estéis aquí como los que estéis en casa los datos del caso 1 lo tenéis ahí yo os voy a explicar un momento cómo se hace y vuelvo otra vez a esta página sobre todo para los que estéis aquí o los que estéis en casa y podéis seguir mirando esta página mientras vais subiendo los datos que es más útil ahora lo vamos a hacer dos o tres a mano es un rollo pero bueno, de momento tampoco los conocimientos que tenemos de momento es para hacer estadística vamos a hacer una muestra nosotros lo que vamos a hacer es la causalidad lo que queremos hacer es esa ecuación que nosotros estamos calculando vamos a ver si esa ecuación es válida a nivel poblacional y una vez que hagamos tanto los parámetros los alfa y los beta y también si la perturbación aleatoria o error, porque no todo el modelo lo explican las variables que tengas hay una parte que no está explicada y que si bien la perturbación aleatoria o error vale, después una vez que todo esto tanto calculamos los alfa y los beta y que veamos que a nivel muestral es correcto y que la perturbación aleatoria cumple unas propiedades que tampoco las he explicado aquí cuando ya las veamos pues una vez que veamos esto ya tendremos una ecuación que veremos si es válida o no válida a nivel poblacional y si es válida a nivel poblacional pues esa ecuación nos va a servir para, normalmente vas a utilizar por ejemplo predicciones como va a crecer la población o como va a crecer la demanda pues en función de eso tú vas tocando unas variables y normalmente van a ser también a corto plazo me refiero a dos o tres años no puedes a veces hacer unas predicciones a más largo plazo con esto después ya hay programas pero necesitaríamos un software muchísimo mayor no hay problemas en el gobierno no, mira si te sigues dando trabajo parece que le he tratado bien también le he dado pero me he vuelto ya está ve, está buenísimo la tienen cargada de arriba ahora les explico yo entra aquí, crece el software pincha donde tienes que ir bueno, ahora ya que estamos todos otra vez hubo un problema técnico y ya no lo han arreglado desde INTEC tiene que ser desde arriba desde aquí no puedo arreglarlo y ya que lo han arreglado bueno, les estaba aquí explicando que lo primero que tenemos que hacer vamos a mirar que está todo el mundo indicadme si ya lo veis bien desde aquí parece que ya está todo arreglado ya lo he resuelto ya se ha resuelto el problema técnico si todos lo veis bien seguimos vale, perfecto ya está ahora mismo no es posible ver la imagen te ponía ahí bueno pues ya estamos aquí ahora vamos a meter vosotros ir metiéndose vamos a meter el nuevo conjunto ya está bien hola quedo aquí mirando la cámara no me había fijado bueno es un poco más rollo vale, perfecto si se vuelven a cortar esperas a que conectemos nosotros y le das al 1 vale, lo doy al 1 cuando veáis que ya está lo doy al 1 y ya está bueno, ya está bueno perdonadme por esto Son cosas que pasan del 10. Bueno, pues lo que íbamos a hacer ahora mismo era meter los datos. Y vamos a empezar metiendo los datos a mano. Como ya expliqué, bueno, se había cortado, este programa permite introducir los datos a partir de, por ejemplo, de una Excel o de formato SAT, AST2, bueno, normalmente lo que más se utiliza va a ser una Excel. Pero nosotros para empezar hoy vamos a introducir los datos. Entonces lo que tenemos que ir a nuevo conjunto de datos, pinchar en nuevo conjunto de datos y vamos a introducir los datos que tengo yo aquí que le llamamos caso 1. Para introducir estos datos pinchamos en nuevo conjunto de datos porque lo vamos a hacer a mano y lo primero que nos va a pedir va a ser el número de observaciones. Aquí vemos que son de 1998 a 2009 que son exactamente 12 observaciones. Tenemos que ponerlo. Aceptamos. Después vamos a estructura de conjunto de datos y tenemos que indicarlo cómo son los datos que vamos a introducir. Si es una sección cruzada, una serie temporal o un panel. En este caso es una serie temporal. Es una serie temporal. Explicamos aquí la diferencia que hay entre una serie temporal y datos sección cruzada o datos panel. Es una serie temporal porque nos da una variable, en este caso dos variables, cómo van variando en un periodo de tiempo, distintos años. En este caso nos da anual, que también puede ser semestral, nos puede dar por distintos datos. Esto nos lo va a pedir también el programa. Sección cruzada sería en un año por distintas variables pero en un año distintos conceptos. Y datos panel sería una muestra, un conjunto de los dos. Sería una mezcla de los dos. En este caso son series temporales. Tenemos que poner la frecuencia en este caso, como hemos visto en el caso 1. Es por años. Podría ser semestral, mensual, semanal, diarios, incluso otro. Podrían darte lo otro y tú tendrías que poner el que tú veas. Por ejemplo, cada tres días. Imagínate. Le damos a siguiente. Seleccionamos anual. Después te piden que pongas el primer año. En este caso el primer año era 1998. Seleccionamos 1998 y le damos a seguir para empezar a introducir los valores. Le damos a aplicar. Y lo primero que tenemos que hacer es introducir el nombre de la primera variable. En este caso, como estamos ya para meter datos, no hemos identificado las variables. Simplemente son datos. Le ponemos a la primera y le llamamos i. Una vez que le hemos llamado i, se nos activa. Y se nos activa en función de los años que le hayamos dicho. Como dijimos que era anual y era desde 1998, se nos activa hasta 2009. Entonces empezamos a introducir uno a uno. Y una vez que, cuando vamos introduciendo los datos, le podemos ir dando al cursor para ir bajando. Si fuese, imagínate que fueran datos que parecieran 20,50. Bueno, pues tenéis que meterle la... En este caso hay veces que no coges la coma, tenéis que hacerlo con el punto, si no coges la coma. Y lo voy a ir dando. Y una vez que ya habéis metido toda la columna, en este caso, los valores de la i, tenemos que hacer lo mismo con la x. Para eso, una vez que hayamos terminado de meter todos los valores de la i, comprobamos que son todos correctos, le daríamos al más y ya nos habilitaría para una siguiente variable. La siguiente variable llamaríamos x y volveríamos a hacer lo mismo. Y con la vez que he terminado le daríamos al ticket y ya está. ¿Es que nos hubiera faltado algún valor? O que se nos hubiéramos equivocado. Pues se puede modificar. ¿Vale? Iremos a editar valores y podemos modificarlos, incluso añadir alguna observación más, todo eso. ¿Vale? Bueno, pues entonces ahora, los que estéis estando en casa, los de aquí ya lo han empezado porque se había cortado. Los que estéis en casa, os dejo aquí la pantalla para que vayáis metiendo estos datos y si tenéis alguna dificultad, pues nos decís. Vamos a dejar más o menos unos 5 minutos para que lo hagamos. Y mientras tanto, me voy a confesar para ver si funciona el ordenador. Aquí, ¿de dónde habéis dado? Aquí, aquí. A esta. ¿Qué vale esta? No da igual. Yo puedo con los dos también. Ya está. Mire, esto está bien. Bien. 4, 3, 2, 1. Lo que pasa es que este ordenador pide x. ¿Sabes? Ay, malo. No vuelves a elegir más de esos ordenadores. No vuelvo a elegir más. Te lo tenía yo puesto. Muy bien. Fue muy guay leerlo. No hay problema. ¿Sabes lo que pasa? Que como es práctica... Es un joy. Vale, ejecutamos y ya lo tenéis. Aquí está. Eso. Y ahora ya pueden meter los datos. Español. Siguiente. Siguiente. Ya lo tienes. Tengo que terminar. Bueno, menos hora tengo. ¿Qué dos horas paga esto? No sé. Bueno, lo que pasa ahora aquí es que el ejercicio es que sí, que lo doy. Ahora ya es que puedo. Es justo que no se puede leer esa versión. Ya está. Archivo. Nuevo conjunto de datos. Dijimos que eran 12. Ponemos 12. Aceptamos. Sería temporal. Anual. 1998. Un poco perdido, pero bueno. 1998. Adelante. Ahí está. Le llamamos un sí. Con un e. Y ahora ya empieza a meter el número 2. Lo hace el número. 60. 65. 62. 61. 55. 53. 60. 63. 53. Fíjate que piché fuera, en el último. Le das a más. Añadir variable. Y le damos a ajustar. Y hacemos lo mismo. Y cuando termines tú, pasamos al siguiente. Claro. Normalmente en un examen lo normal es que ya ni te den una serie temporal ni nada. Te den covarianzas y varianzas. El problema que te den covarianzas y varianzas es que tú no vas a hacer una representación gráfica. Entonces tú, al no ver una representación gráfica, ahora lo vamos a ver ya te sirve para ver cómo se mueven las dos variables. O si son tres, cómo se mueven las dos variables. En este caso, el primer ejercicio que es una ecuacional, que es una sola ecuación y con una variable explicativa y es una exógena que vamos a mirar sería una recta. Pero claro, si todavía en un examen te dieran esto, una serie temporal y te dieran las variables aunque no pudieras dibujarla ya podrías seguir viendo cómo esta va creciendo y esta va decreciendo. Y ya puedes imaginarte que hay una relación indirecta entre las variables. Pero claro, no tienes un software para hacer las cosas. Pero bueno, eso te puede ayudar. Una vez que hayamos terminado de meter los datos no sé si desde casa habéis tenido algún problema para meter los datos si ya todos tenéis metido los datos. Aquí ya los hemos hecho. Ya tenemos todos los datos y hemos estado al programa también. Tenemos ya todo hecho. Y así que ahora vamos a empezar. Hoy va a ser muy sencillo porque simplemente hemos metido datos y vamos a hacer mínimos cuadrados algún gráfico, mirar la correlación poca cosa más. Vale. Pues vamos a empezar ... Vamos a seguir. Una vez que ya hemos metido los datos pues ya en nuestra pantalla nos van a aparecer los dos datos, veréis los datos que tenéis ahí, x y y pondrá datos no guardados. Lo primero que tenemos que hacer es vamos a guardar los datos. Pues vamos al archivo guardar datos. Guardáis los datos y le ponéis por ejemplo como nombre caso y ya lo vamos a guardar en la carpeta que hemos creado secreto. Y lo vamos a guardar en formato GDT. Si ahora lo veis, volvéis a enviar ahí os aparecerá, si están bien guardados os tiene que aparecer arriba caso 1 GDT Entonces está guardado en formato ... Un momento ¿Ya lo tienes? ¿Vale? También antes de guardar los datos podríamos haber seleccionado las dos variables, ir a datos y ver que hemos metido bien los datos porque si tú haces un cuando metes a mano el problema imagínate que tú pones estos datos erróneos y distintos a los que tenemos aquí va a salir totalmente distinto. Entonces por eso es importante siempre meter bien los datos. Vale, pues una vez que ya hemos guardado los datos ya podríamos mirar en guardar nos aparecerá caso 1 formato GDT que es el formato que tiene GDT ¿Vale? Hay que guardar los GDT pero imagínate que lo hubiéramos tenido ya en una Excel y no queremos guardar los casos Bueno, pues no pasa nada. Si le damos ahora a mostrar datos esto es simplemente para mostrar bien los datos para ver que todos los datos que has metido están correctos Si ves que falla algún dato o tal tendríamos que ir a editar datos y tendríamos que volver a meter los datos Es importante que los datos sean bien para que todos nos hagan un buen resultado no nos va a salir igual Una vez ya que tenemos metidos los datos lo primero que vamos a hacer ya que tenemos las variables vamos a ir a ver ya dijimos que era importante ver un gráfico para ver una situación de cómo son las variables eso nos va a decir qué relación hay entre las variables Tenemos que pensar que en el momento estamos siempre esto es, en Estadística estamos trabajando con muestras no con toda la población Bueno, pues te sale una pantalla que pone Gretel definir gráficos gráfico y en el lado izquierdo te pone las variables y si quieres un gráfico para las dos variables tienes que seleccionar las dos variables y pasarlas al lado derecho y una vez que seleccionas las dos variables y las pasas al lado derecho le das a Start y ahí te sale el gráfico A simple vista ya veíamos que tenía una relación inversa entre las dos variables Más o menos se puede ver que una va creciendo y que la Y va decreciendo Esto te sirve de ayuda simplemente para saber que cuando tú hagas la ecuación y lo peor es que te salga vas a tener que salir un valor negativo porque va a haber una relación inversa entre las dos variables Pero bueno eso simplemente es para eso Tú en el examen obviamente no tienes la ayuda de Gretel y no vas a ver esto y más, si encima no tienes las variables te van covarianzas y varianzas esta posibilidad Bueno, lo primero que vamos a hacer una vez que ya tenemos las variables metidas y tenemos ya la variable metida lo que vamos a regular es estimar los parámetros Entonces para estimar los parámetros esto se puede hacer a mano Es conveniente hacer los primeros ejercicios para probar hacer a mano alguno Esto es muy simple porque esto es una ecuación lineal y con una sola variable una represión lineal simple lo más simple que hay siempre hay una variable explicada y una variable explicativa Lo que queremos es la causalidad entre la variable X como puede explicar en este caso la variable Y Sería conveniente hacerlo a mano y para hacerlo a mano lo que nosotros queremos mediante esta expresión lo que queremos calcular son, vamos a estimar esos parámetros muestrados ¿Vale? Eso es lo primero que vamos a hacer ¿Cómo lo podemos hacer en casa? Bueno, si tenemos ya la variable mediante el sumatorio que tenemos aquí y esto nos daría lugar para poder calcular ya el alfa y el beta Nosotros ahora cuando lo vamos a hacer al programa se tarda un segundo y esto lo haces en casa pues va a tardar por lo menos una hora Vale, entonces nosotros una vez que ya tenemos las variables vamos a hacer lo mismo que se puede hacer en casa lo vamos a hacer nosotros ahora mismo Vamos a modelo y en modelo ya dijimos que vamos a utilizar mínimos cuadrados ordinarios ¿Vale? Vamos a mirar si desde casa tenéis algún problema nos lo indicáis Una vez que hayamos introducido los datos y tenemos todo seguimos, pues vamos a mínimos cuadrados ordinarios pinchamos en mínimos cuadrados ordinarios y nos van a salir estas pantallas La primera pantalla, que es esta la que está hacia la izquierda siempre va a ser igual te va a poner siempre mínimos cuadrados ordinarios MCO te va a poner siempre y en la ventana de la izquierda te va a poner siempre las variables la LX y la constante siempre tiene una constante Y del otro lado te va a decir en un cuadrito cuál debe ser la variable dependiente que es la que tú quieres que te lo explique la otra variable la llamamos variable dependiente o endógena ¿Vale? Pues tú seleccionas la variable en este caso seleccionamos la I De momento, como no tenemos ningún modelo estamos jugando Cuando ya hay un modelo pues ya tenemos la renta o imagínate que estamos en un modelo de consumo de Keynes o que estamos en una función de oferta pues ya tenemos una variable independiente ¿Vale? Pues pondremos la variable dependiente seleccionamos la I y después seleccionamos los regresores En este caso ya tienes la constante pues ya tienes que meter la otra variable Y una vez que ya tienes el modelo que tiene la variable dependiente y los regresores que sería la variable dependiente la constante ya te la pone pues ya le das a aceptar Y una vez que tenemos que aceptar ya nos va a salir el modelo 1 También después se pueden guardar los modelos A ver, ¿por qué es esto? Porque imagínate que tuviésemos queremos explicar una variable en el modelo anterior en vez de tener una sola variable que tuviéramos 10 variables Entonces podemos diseñar distintos modelos con la combinación de esas variables o esas variables que vamos a poner en los regresores y entonces podríamos crear muchísimos modelos Y al final Imagínate que si tuviéramos 10 variables y teníamos una cantidad de modelos porque se pueden combinar entre ellas las variables Pues podemos al tener un software pues podemos en una hora hacer muchos modelos y podemos ir guardando los modelos Y después seleccionar el modelo que es más representativo ¿Cuál es mejor modelo? ¿Qué modelo explica mejor? Siempre se buscan modelos lo más simple posible Si puede ser Entonces esto realmente el software está pensado para eso No para meter una sola variable y hacerlo No, está pensado porque aquí tuviéramos imagínate 10 variables más ir jugando con todas esas variables y con la ventanita que nos va a salir ahora de ese modelo nos van a salir todos los modelos que nosotros queramos ir guardando cada modelo Se pueden ir guardando también los modelos Y nosotros podemos seleccionar al final cuál es el mejor modelo Claro, tenemos que tener una teoría económica para esa teoría económica que queremos estudiar Cuál sería el mejor modelo y cuáles serían esas variables Entonces, cuando ya realmente, hoy no vamos a utilizar redactores en un solo tiempo Cuando ya Jorge nos va a dar unos ejercicios, imagínate sobre un estudio de la pizarra en la provincia de León Entonces te va a poner distintas variables y tú vas a poder jugar con el modelo y seleccionar cuál es el mejor modelo que mejor representa Y una vez ese modelo a nivel muestra ya haces inferencia estética lo pasas a nivel poblacional y la explicación de ese modelo económico en función de lo que tú consideras que es el mejor modelo después de haber utilizado todas las variables que tú crees que eran las que tenías Eso sería a nivel práctico Por eso se utiliza el software Que realmente un examen si nos dejara un ordenador pues daría muchísimas variables y vosotros seleccionáis cuál era el mejor modelo y le explicaréis por qué será el mejor modelo por qué ese modelo y no otro Lo que pasa es que hoy por hoy en los exámenes no tienes el software entonces no puedes hacer eso Vale, pues una vez que tenemos eso ya nos sale esta pantallita Y sería el primer modelo Aquí no podemos hacer otro modelo Tenemos el modelo 1 Tuviéramos 50 variables Imagínate la cantidad de modelos que podíamos hacer y estudiar Aquí te da primero los coeficientes El primero que sería el alfa y este sería el beta Eso es lo que te está diciendo Si puedes ver la variable x que sería en el beta tiene signo negativo Esto sí nos parece loco También podríamos haber calculado si veis en el programa en la ventanita Bueno, después lo vemos en correlación Bueno, después lo miro Y podríamos mirar la correlación O también cuando vimos el gráfico vimos que el signo era negativo Ya no nos sorprende que salga aquí negativo Porque vemos que hay una relación inversa entre las variables De esta manera hemos calculado ya el alfa y el beta Entonces en nuestra ecuación lo que tenemos que hacer es sustituir el alfa y el beta por estos valores Y ya tenemos esa ecuación a nivel muestral Después tenemos que saber si este alfa y beta son representativos o no Si son buenos o no ¿Cómo podemos saber eso? Bueno, aquí te calcula Eso se hace mediante unos estadísticos que tampoco le hemos explicado Hoy me voy a adelantar un poco Pero bueno, realmente el tema es que tienes que calcular los estadísticos Estos estadísticos te van a salir un valor Y ese valor va a decir si es bueno o malo en función del valor que te salga Aquí, por ejemplo, el software En función de que te salgan tres estrellas Cuanto más las estrellas que te dicen que es representativo o no Eso es lo que te está diciendo el software Lo que pasa es que hay que entenderlo cuando tú lo calcules Me refiero a que tú cuando calculas en un estadístico tienes que dejar a un lado a la derecha o a la izquierda y tienes que coger un porcentaje Siempre que calculemos normalmente se coge el 0.5 Bueno, pero eso como no lo hemos explicado de momento lo vamos a dejar De momento lo que hemos aprendido hoy es que al meter los datos te va a dar la dirección típica te va a decir los estadísticos a nivel muestrado del alfa y beta y el valor P te va a decir El P sería ir a las tablas y mirar si entra Si lo rechazas o lo aceptas Eso es lo que te va a decir la tabla Lo que tú tienes que hacer Lo que pasa es que no lo hemos visto Entonces, cuando salen tres estrellitas quiere decir que lo aceptas Siempre lo va a aceptar en función del porcentaje Normalmente se toma 0.5 o 1 Depende de lo que tú hayas establecido Normalmente eso es 0.5 Entonces te va a decir si estas variables son buenas Pero después también aquí te va a dar los valores que tampoco y de estimaciones que nosotros no hemos calculado y todavía no nos ha explicado que te va a indicar si el modelo en su conjunto no solo las variables que hemos visto que las variables de este modelo eran buenas Pero además te da R cuadrado para mirar Si también tampoco lo hemos visto también te va a dar la media de la variable te va a dar la suma de los cuadros residuales te va a dar en distintos criterios te va a dar R cuadrado corregido y en función de estos valores te va a decir si es representativo o no También te va a dar otros contrastes como es Durville-Watson el criterio de Necke, el valor P Claro, pero esos valores de momento no los hemos podido interpretar porque todavía no los he dado en teoría Todo esto lo vamos a ver El próximo día cuando se explique la teoría volveremos otra vez a este ejercicio para poder interpretarlo De momento lo único que hemos visto es calcular el alfa y el beta y hemos visto que el alfa y el beta si son representativos, si son buenos por el valor que nos ha salido porque dentro de la voluntad del ajuste se sale a la derecha e izquierda pero eso todavía no lo he explicado Teníamos que saberlo hacerlo a mano para poder interpretarlo aquí Me refiero a que aquí es muy sencillo pero tú tienes que hacerlo a mano hacer un gráfico a mano y ver dónde cae el valor que has calculado para saber si es representativo o no Pero eso como no lo hemos visto, pues nada Y después a nivel global un estadístico a nivel global tendríamos también que interpretarlo Aquí ahora nos sale 11,98 No lo vamos a interpretar todavía También nos va a decir si es bueno o malo Y también R al cuadrado es decir, la voluntad de este ajuste si es bueno o malo aquí nos sale 0,54 muy bajo el estadístico para que más o menos sea representativo Normalmente a partir de 0,75 Tampoco lo hemos visto Bueno, todos esos valores que vemos aquí de momento no los hemos interpretado Tú tendrías que saberlos calcular Por ejemplo la F tendrías que saber calcular los estadísticos estos para ver si son representativos o no Y como que la voluntad del ajuste tenés que calcular la identidad y tú tendrías que calcularlos si son buenos o malos Esto de aquí tendrías que calcular el valor P de la constante y de la X y el F Todo eso tendrías que calcularlo Pero claro, de momento nosotros no sabemos si esto es bueno o es malo porque de momento estamos haciendo unos cálculos Después ya lo vamos a ver Y ahora tenemos aquí también un caso 2 Si queréis ya podemos meter aquí los datos No sé si tenéis algún problema alguna duda desde casa Ah, vale Estamos ahora aquí hablando de lo que salía al pantallazo Mira ¿Todo bien? Bueno, se cortó una vez, pero bueno El chat va siguiendo la explicación Sí, lo único es que hay un poco de lío por eso Pero bueno Desde casa estaba diciendo que ahora lo señalo aquí Estamos hablando que nos da los valores de alfa y el que sería ahí, que lo estoy señalando el beta, que sería este Hemos dicho que el beta es negativo ¿Por qué negativo? Porque es una relación inversa Y ya lo vimos dentro de la gráfica Por ahora no tiene sentido También hemos visto que este alfa y este beta lo que hay que comprobar mediante un estadístico que se llama cel estadístico tenemos que calcular este estadístico Y una vez que calculemos este estadístico esto no lo hemos visto todavía La próxima sesión en teoría vamos a ver cómo se calculan estos estadísticos a mano, porque el programa ya no los da Una vez que ya tenemos estos estadísticos también el próximo día vamos a mirar que estos dos estadísticos que nos ha dado este valor vamos a ver si la voluntad de ajuste a nivel individual o sea para este alfa y para este beta es bueno o es malo Quiere decir que si este estadístico es representativo o no Tampoco lo hemos visto Entonces el próximo día se va a ver cómo se calcula esto y después también vamos a ver cómo se calcula en función del valor que nos da este estadístico y cómo es la voluntad del ajuste si es bueno o es malo Lo único que se adelanta hoy es que, por ejemplo, en estos estadísticos si son buenos el programa para decir si es bueno o malo es en función de las estrellas que sale aquí Cuando sale tres estrellas quiere decir que es muy bueno Dos también sería aceptable Y ya cuando no sale una estrella es que ya es malo, ya no sería bueno No puedes explicarlo así Tienes que explicarlo en función de una gráfica que tienes que hacer normalmente En esa gráfica tienes que explicar si la voluntad del ajuste cae dentro de la zona representativa o no Si la rechazas o aceptas Pero bueno, eso todavía no lo hemos visto y puede sonar de chino Pero bueno, el próximo día cuando lo explique Jorge en la siguiente clase va a ser muy sencillo Y una vez que ya entendamos cómo se calcula la mano, ya será muy sencillo cuando lo veamos aquí Vamos a calcular otro estadístico pero ya eso es a nivel no solo a nivel individual de las otras variables sino a nivel global Si en su conjunto esa ecuación es buena o mala Para eso vamos a utilizar este estadístico FNEDECOR Aquí lo vamos a ver Vamos a aplicarlo a 11 Numerador Y en función de este valor vamos a ver si es bueno o es malo y vamos a ver si es representativo o no representativo El R al cuadrado y el R al cuadrado corregido Que mira la voluntad de este ajuste Si este ajuste es representativo o es malo Normalmente por criterio se toma que tiene que ser superior a 0.75 Aquí está en 0.54 Se diría que a nivel global no sería muy bueno Pero bueno, eso lo vamos a ver el próximo día en teoría De momento también hay otros estadísticos como el de Woodwardson que nos va a servir para mirar las variables y si hay falsa correlación Bueno, pero eso cuando lo veamos Y claro el sistema pues claro El programa te permite calcularlo todo de forma muy sencilla y entonces no tardas nada pero en calcular simplemente los estadísticos tanto a nivel individual que sería este de cada uno del alfa la constante sería el alfa y la X sería el beta y el coeficiente Solo calcularlos a mano pues tardaría muchísimo En función de las variables si después hacerlo también a nivel global tenéis que hacer otro estadístico a nivel global también se tardaría muchísimo ¿Vale? Cuando veamos ya el próximo día cuando veamos ya en forma teórica cómo se calculan los estadísticos volveremos aquí y ya veremos si son buenos o malos Bueno, yo os adelanté ahí que eran buenos pero bueno, lo vais a ver muchísimo mejor cuando hagamos el gráfico Y lo mismo a nivel global con la X ¿Vale? Eso lo vamos a ver Y una vez que hayamos visto esto el problema es que como hemos avanzado tampoco podemos en la práctica avanzar muchísimo más Lo que podemos ahora hacer si queréis podéis meter ya el caso 2 y ya lo dejamos metido para el próximo día y el próximo día ya seguimos aquí Hoy nos sobra tiempo porque no podemos tampoco expandirnos más ¿En editar los valores? ¿Eh? Añadir valores Al principio, archivo, añadir valores No sé si desde casa tenéis alguna duda Vale, pues con la teoría que tenemos hoy llegamos aquí El próximo día, como este modelo lo tenemos guardado pues ya podemos entrar otra vez en el caso 1 cuando yo explique cómo se calculan los estadísticos Lo que sería bueno que calcularon los alfa y los beta Por ejemplo, cogierais el caso 1 y hicierais a mano para un ejemplo os sirve de ejemplo Es lo más sencillo porque es una regresión lineal simple con una sola variable y es lo más fácil Mira, aquí también en lo que hemos visto y en ver podéis ir a matriz de correlación y os saca el coeficiente de correlación Si queréis pincharlo dentro de ver seguimos en el caso 1 y en la correlación aquí exactamente lo habéis dado Aceptar y con 0 en la variable pues aquí te lo pone En la correlación cogéis las variables y pasáis a aceptar y te sale menos 0,73 Sabemos que si tenéis una relación inversa entre dos variables pues entonces sale negativa y sabemos que su valor está entre menos 1 y 1 El programa te permite después para cada variable estudiar todo lo que quede de cada variable te permite también realizarlo Mirar toda su variable te permite calcular todos los valores sobre una sola variable y todo tipo de gráficos Lo que pasa es que todavía no hemos avanzado en eso cuando lo veamos ya vamos a ir haciendo más cosas con software Hoy de momento con saber bajar el software saberme añadir las variables el próximo día haremos otro ejercicio también para el caso 2 meteremos los resultados de valores a mano y después ya en vez de meterlos a mano yo os doy los valores en un Excel y os enseño yo a coger el archivo directamente cargarlo y de esa manera no perdemos el tiempo en meter los valores a mano y de esa manera ya podremos empezar más rápido de trabajar y después también otra vez en otro ejercicio se puede indicar que vayáis por ejemplo al Instituto Nacional de Estadística y que os bajéis tal variable en tal periodo entonces hay que bajarse esa variable en un Excel depurar un poco los datos también tenéis que saber cuando son variables económicas hay veces, normalmente cuando son variables económicas hay que tener en cuenta el IPC entonces que hay que defractar las series y si es una variable económica pues meter todos en una base en una base en un baño concreto para poder compararlo bueno, pues todo eso se tiene que ir bajando por ejemplo puedes ir a una página como normalmente al Instituto Nacional de Estadística para los valores económicos los vas bajando tienes que depurar esos datos ya los subes aquí al programa y si por ejemplo cuando hagamos un ejercicio que es por ejemplo una función call tubulas que tenemos y pasarlas a logaritmos y claro, si lo pasas a logaritmos tienes que también tener que entender la interpretación que nos lo va a dar en teórico cuando Jorge te explique el modelo call tubulas pues tenéis que pasar a logaritmos y una vez que pases a logaritmos ya tenéis que hacer toda esta interpretación con logaritmos vale pues si tenéis alguna duda o alguna pregunta o alguna cosa que queráis saber porque hoy realmente hemos llegado donde hemos podido me refiero que el próximo día hoy lo básico que es tener todo ese programa y si queréis cacharrear con él o tenéis alguna duda pues podéis mandar un correo yo os mandé estas dos presentaciones el próximo día os mandamos el caso 2 entero caso 3 y ya cuando vayamos ampliando y llevamos consciente pues ya se mandará algunos ejercicios prácticos me refiero de de lo que se ve en la vida real por ejemplo hacer un estudio sobre imagínate que te van a hacer un estudio pues sobre el vino o qué variables influyen en el consumo del vino o del valor del vino o de la pizarra las exportaciones de pizarra pues imagínate a Alemania o a Francia o un estudio sobre las empresas de pizarra que había aquí en el Verde por ejemplo consigues primero los variables con cuales se usa toda su producción y quieres saber, predecir para un futuro si va a haber más demanda de pizarra o no va a haber más demanda de pizarra y si vas a hacerlo en Alemania pues igual tienes que tener en cuenta la renta que hay en Alemania las construcciones que tienen previstas en Alemania, en función de eso pues de esas variables una vez que tengas tu modelo si es un buen modelo te puede ayudar a predecir imagínate que tú quieres saber si tienes que extraer más pizarra o menos pizarra para exportar a Alemania pues en función del modelo que tú hagas y sabes la demanda que va a haber en Alemania puedes predecir qué demanda vas a tener en Alemania en los siguientes años entonces puedes adelantarte y un empresario imagínate de la pizarra, que se dedica a exportar a Alemania, pues tiene que saber más o menos qué demanda va a tener en función de la demanda que va a tener ya puede utilizar esa empresa si contratar más gente si sacar más pizarra y lo que necesite para poder atender a esa demanda bueno pues lo dejaremos aquí y el próximo día ya seguimos aquí en el caso 2 y a partir del caso 2 si tenéis alguna pregunta pero vamos a mirar aquí sí, mira para el caso 2 que me dices aquí, introducimos valores como sección cruzada en vez de serie temporal no, siempre que vas a introducir los valores tienes que tener en cuenta cómo te los estamos dando en este caso te darás cuenta que es una serie temporal ¿por qué? aunque pone aquí el número de observaciones el número de observaciones puede ser años aunque no te parezca aquí puede ser año 1, año 2, año 3 pero bueno por eso es una serie temporal porque queda una variable en distintos periodos de tiempo este periodo de tiempo normalmente vamos a interpretar es año año 1, año 2 que puede ser 2001, 2002 2003, 2004, 2005 también si quieres interpretarlo puedes hacer trimestralmente semestralmente, lo que quieras lo que pasa es que es una serie temporal en este caso sería regresión lineal múltiple porque tendremos dos variables x sub t2 x sub 3t y una y sub t explicativas que serían en este caso dos variables y vamos a hacer una función aquí la tenemos beta2 x sub 2t más beta sub 3 x sub t3 más una perturbación aleatoria o error en este caso sería un modelo de regresión lineal múltiple tendríamos dos variables x sub 2 y x sub 3 que queremos explicar y sub t en este caso podríamos cuando planteemos nuestro modelo al utilizar un programa econométrico normalmente podríamos coger y utilizar el modelo con estas dos variables incluso podríamos hacer un modelo a mayores y utilizar, calcular y sub t simplemente utilizando una de las variables x sub t2 o utilizar solo x sub t3 medíamos y podríamos hacer tres o cuatro modelos y una vez que ya se lo podemos interpretar cuál es el mejor modelo qué modelo es mejor pues ya nosotros seleccionaríamos cuál sería el mejor modelo en un ejercicio de examen te pueden poner un ejercicio como este y te pueden poner cuál es el mejor modelo igual el mejor modelo existe simplemente con la variable x sub t2 vale entonces el próximo día si queréis ya meter estos datos y el próximo día ya seguimos ya con este ejercicio desde aquí y vamos mirando en función de lo que ya vamos avanzando en teoría pues ya vamos calculando los estadísticos tanto a nivel individual como a nivel global los estadísticos individuales después si ya esta ecuación a nivel global es buena o mala y una vez calculamos los betas que tenemos aquí vamos a mostrar el de apoyo de teoría a nivel poblacional que es en referencia estadística si es representativa o no pero de momento vamos paso a paso lo primero es saber si estos beta1, beta2, beta3 calcularlos una vez que los hemos calculado saber si son buenos o son malos o sea si son representativos o no y después saber si la ecuación que hemos calculado la igualdad de ajuste de esta ecuación es buena o es mala eso es el siguiente paso de una vez que ya sabemos después vamos a ir avanzando vamos a ver en otros teóricos que no lo he explicado aquí la perturbación o error normalmente un modelo prueba a explicar estas dos variables pero hay una parte que no va a estar explicada por estas variables que es la perturbación aleatoria de error tenemos que saber si esta perturbación aleatoria de error como se comporta entonces hay unas propiedades que vamos a ver en los próximos días que tenemos que saber calcular eso no te lo vamos a poner en la parte práctica te lo vamos a poner en la parte teórica seguro que te van a poner alguna pregunta sobre la perturbación aleatoria de error y las propiedades que cumplen y cómo se demuestran esas propiedades eso te lo vamos a poner fijo en teoría eso ya lo vamos a ver también el próximo día en la teoría nosotros ahora estamos siempre jugando con las variables aunque es muy importante cuando tú planteas el programa siempre que haces un problema primero demostrar que la perturbación aleatoria de error cumple con sus propiedades porque si ya no cumple con sus propiedades todo lo que estás calculando no sirve para nada entonces eso siempre que hagas un ejercicio práctico lo primero que tienes que hacer sería eso nosotros de momento eso lo veíamos bueno, pues no sé si hay alguna pregunta más si tenéis alguna duda más y si no lo podemos dejar aquí y el próximo día entonces si no fuera serie temporal en este caso nosotros vamos a interpretarlo como que son años claro o sea uno quiere poner 2001, 2002 ya como tú quieras al final eso nos va pero bueno eso ya no hay ningún problema pues nada el próximo día que sería el próximo miércoles a las 4 y después vamos ya viendo aquí pues más casos bueno no, no nos faltan simplemente con que le des aquí la pantalla nada, un trate y el próximo día lo seguimos a ver al principio es un poco rollo porque el año pasado teníamos una hora bueno, lo de dos horas está bien cuando son dos horas de interacciones una hora una hora cada era el año pero me refiero que al principio como no nos llega lo que pasa es que cuando ya vamos programas cuando ya vamos ya en el programa luego ya no acabábamos en una hora pero ya no solo con mínimos cuadrados cuando hacemos mínimos cuadrados por dos etapas entonces si se necesita más tiempo porque los programas son mucho más amplios