Bien, pues se trata del tema 7, distribuciones de probabilidad, que consiste en ver unos ejemplos o modelos notables de variables, de variables, lo que ahora vamos a definir como variable aleatoria, que son modelos que se usan, modelos más notables que se usan en la práctica de probabilidades. Entonces, bueno, en primer lugar vamos a ver el concepto de función de probabilidad y de variable aleatoria. Es un concepto bastante importante. Partimos del espacio muestral de un experimento aleatorio, y aquí continuamos con la probabilidad, y en ese espacio muestral tenemos una función de probabilidad, definida una probabilidad. Entonces vamos a llamar X a una aplicación que a cada suceso le haga corresponder un número. Y que nosotros ahora los distintos sucesos los vamos a reducir a números, vamos a definir un número para cada suceso. De forma, ahora pondremos así el plomo, de forma que las probabilidades de los distintos sucesos se puedan expresar con ayuda de esta aplicación numérica. Por ejemplo, podríamos pedir que X valga 3, pedir que X sea igual que 5, pedir que X sea mayor que 1, etc. Entonces diríamos que esa aplicación que convierte en números los sucesos, pues es una variable aleatoria. Bueno, ahora vamos a ver, pero por ejemplo un ejemplo muy simple, si yo lanzo una moneda, los sucesos que hasta ahora hemos llamado salir cara o salir cruz. Cada uno tendrá su probabilidad. Pues a partir de ahora nosotros en vez de llamarle salir cara, vamos a asignarle a cada resultado, por ejemplo, el número de caras. Entonces claro, al lanzar la moneda, o le sale una cara o ninguna cara. Eso sería la variable aleatoria, ¿no? O sea que la variable aleatoria es la que hace corresponder a cada suceso un número, en este caso el número de caras. O bien aquí tenemos otro ejemplo, ¿no? En una urna hay tres bolas blancas y dos negras. Entonces extraemos una bola. Vale, pues entonces nosotros hasta ahora en el tema anterior, por ejemplo, preguntábamos cuál es la probabilidad de que esa bola sea blanca o cuál es la probabilidad de que esa bola sea negra, etc. Aquí vamos a cambiar, antes de hablar de probabilidad, pues vamos a llamarle a la variable x, vamos a llamarle número de bolas blancas. De manera que sacar bola blanca sería que x valga 1 y sacar bola negra sería que x valga 0. O sea, x es el número de bolas blancas. Por lo tanto, ya digo, al hacer el experimento me puede salir que x vale 1 o que x vale 0. Reducimos la probabilidad. Fórmula de la probabilidad a una fórmula con la x, ¿no? Bueno, pues entonces la función que a cada valor de la variable aleatoria asigna su probabilidad se llama función de probabilidad y que en el caso del ejemplo, este de las bolas, podemos expresar mediante la tabla en la que aparezcan las probabilidades de los sucesos elementales que muestra la distribución de probabilidad. Bueno, aquí tenemos la tabla, por ejemplo, ¿no? Es decir, aquí tengo X, ¿qué valores puede tomar 0 o 1? Es decir, que yo al sacar una bola puede ser blanca o no. O sea, hay una blanca o ninguna blanca al sacar la bola, ¿no? Por lo tanto, puede ser 0 o 1. Y ¿con qué probabilidades? Bueno, pues como teníamos, tenemos 5 bolas de las cuales hay 2 negras y 3 blancas. Luego, ¿cuál es la probabilidad de que haya 0 blancas al sacar una bola? Bueno, pues si he sacado, o sea, si la probabilidad de que haya 0 blancas... ¿Cuál es la probabilidad de que es negra, lógicamente? Luego, entonces, ¿cuál es la probabilidad? 2 quintos. ¿O cuál es la probabilidad de que X valga 1? Pues la probabilidad de que X valga 1 será 3 quintos. Bueno, eso aquí lo tenemos representado, ¿no? O sea, en el 0 una barrita de altura 2 quintos y en el 1 una barrita de altura 3 quintos. O sea, la función de probabilidad. Bueno, las variables aleatorias, claro, pueden ser discretas, como por ejemplo en estos ejemplos anteriores que hemos comentado, cuando sus valores son el número finito o también infinito numerable. O continuas, ¿eh? Pues las variables aleatorias pueden ser discretas o continuas, cuando sus valores pueden ser cualesquiera de un intervalo de números reales. Vamos a ver algunos ejemplos. Ejemplos de valores discretas, pues número de hijos por familia. Familia, ¿eh? Tenemos un colectivo, un espacio mostrado, ¿no? Tomado por los individuos, serían familias, ¿no? Entonces, cada familia pues tiene un determinado número de hijos. Eso obviamente es una variable aleatoria, ¿no? Número de trabajadores por empresa, etcétera, ¿no? Número de accidentes en un tramo de carretera y tal. Aquí, por ejemplo, número de hijos por familia, bueno, evidentemente no es infinito, no puede ser infinito, claro. Pero bueno, vale, 0, 1, 2, 3, 4, no sé, podemos alargarlo, bueno, no sé, 10, 12, no sé, 15. Evidentemente no es infinito, pero bueno, en algún momento se termina. Pero bueno, siempre puedes encontrar una familia que tenga un hijo más. O número de trabajadores por empresa, pues algo parecido. Número de accidentes en un tramo de carretera, pues también algo parecido. Es decir, tampoco, el número no se cierra, porque claro, ¿cuántos accidentes hay? Puede haber, ¿cuántos puede haber? ¿Cuál sería el valor de X? Pues X puede ser 0, 1, 2, 3, etc. Bueno, al principio está abierto, ¿no? O bien ejemplos de variables continuas, ¿no? Por ejemplo, salarios de los empleados de una empresa. Claro, el salario sí que es un número, los salarios no van de uno en uno, ¿no? Como por ejemplo el número de hijos por familia, o el número de trabajadores, o el número de accidentes, son números enteros, ¿no? El salario ya no. El salario pues puede ser cualquier valor, son números decimales, etc. O sea, entre dos salarios cualesquiera, siempre cabe uno, ¿no? Seríamos que es continua, ¿no? O el tiempo del... ...de determinado electrodoméstico, ¿eh? Hasta que se fungue, ¿no? Entre termos, ¿no? Con tiempo, pues es también una variable continua. Bueno, si una variable aleatoria es continua, entonces hay un concepto muy importante que es lo que se llama función de densidad, f de x, es una función no negativa tal que la probabilidad de que esa variable esté comprendida entre dos valores a y b, o sea, tomen los valores de la x que estén comprendidos entre a y b, pues eso lo mediremos o lo visualizaremos con la ayuda de esa función de densidad como el área comprendida entre esa función y el eje de abscisas y las rectas x igual a a y x igual a lo que está aquí dibujado, este dibujo de aquí. Es decir, que ese dibujo, la forma de ese color amarillo, sería la probabilidad de que la variable aleatoria esté... entre a y b, el área debajo de la función de densidad. O sea, esa función de densidad es una función que se define para cada variable aleatoria continua que nos permite calcular probabilidades. Bien, ¿a qué se llama el valor esperado en las muestras? De una población. La población en realidad es el valor esperado de la variable aleatoria. Bueno, pues si tenemos una variable aleatoria discreta que toma los valores x sub i igual a 1, 2, n, hasta n. Hemos visto que la variable aleatoria discreta toma valores con un número finito o infinito numerable. En este caso toma n valores con probabilidades respectivas p sub i. La probabilidad de que x sea x sub 1, sea p sub 1. La de que x sea x sub 2, sea p sub 2, etc. Entonces se denomina el valor esperado de x o también la media de la variable aleatoria x a esta expresión de aquí. O sea, esperanza, se llama esperanza, el valor esperado de esperanza de x es igual a la suma de cada valor de la variable por su probabilidad. La suma de cada valor de la variable por su probabilidad. En el caso de que la variable sea continua, con función de densidad f de x, la definición cambia un poco y entonces el valor esperado va a ser la integral. Aquí, bueno, no vamos a tener prácticamente que utilizar cálculo integral, pero bueno, se define de esa manera. El valor esperado, bueno, aquí ahora al verla observo que falta una cosa, que es la x, aquí falta una x. Eso. Es decir, el valor esperado de la variable aleatoria x sería x, aquí dentro de la integral está x minúscula, x por f de x diferencial de x. La integral desde menos infinito hasta más infinito de x por f de x diferencial de x. Es algo parecido al caso de discreta, el caso de discreta que era la suma de cada valor de la variable por su probabilidad, la suma. Bueno, pues en este caso, sustituimos la suma por la integral. La integral, en realidad, lo que representa es el área. Lo que teníamos antes, o sea, que esta zona de color amarillo, esto sería la integral de la función de densidad, la integral de f de x desde a hasta b. O sea, que una integral representa el área que hay debajo de la función de densidad en este caso. Bueno, por aquí es como si dijéramos, la integral de alguna manera es una generalización del sumatorio, para una suma infinita. Bueno, pues eso es lo que tenemos aquí. O sea, que la media, o sea, la esperanza, en el caso de variable continua, sería la integral del producto de la variable x por la función de densidad. Vale, eso. Ya digo eso, en realidad luego, pues no, afortunadamente no vamos a tener que utilizar cálculo integral. Bueno, aquí está la definición. Bueno, pues vamos entonces a ver unos ejemplos concretos de variables aleatorias, de distribuciones concretas. Entonces un primer ejemplo sería lo que se llama la distribución uniforme discreta. Entonces, tal variable aleatoria, la variable aleatoria x, se llama. La distribución uniforme discreta, si toma valores x sub i, desde igual a 1 hasta n. Pero todos con la misma probabilidad. La probabilidad de que la x sea igual a x sub i es 1 partido por n. Eso para cualquier x sub i. Puesto que hay n valores, x sub 1, x sub 2, etc. Esta x sub n, la probabilidad y la probabilidad de cada uno de ellos es 1 partido por n. ¿Cuánto sumarán? O sea, podríamos decir que estos son los sucesos elementales. ¿Cuánto sumarán las probabilidades de todos los sucesos elementales? Pues puesto que hay n y cada uno vale 1 partido por n, lógicamente suma 1. Como tiene que ser, claro. Bueno, esa variable aleatoria, ya digo, con esas características se llama variable aleatoria uniforme discreta. Por ejemplo, en un ejemplo concreto de una bolsa hay 5 bolas idénticas numeradas del 1 al 5. Si extraemos una, bueno, pues ahí tenemos un ejemplo de variable aleatoria discreta tipo uniforme. Si extraemos una, cada una tiene la misma. La misma probabilidad es 0,2. O sea, 1 partido por 5. 1 partido por 5. 0,2 debe ser extraída. Bueno, pues entonces la distribución de probabilidad y su representación gráfica sería la siguiente. Aquí tenemos la distribución de probabilidad. Los valores que toma la variable aleatoria, o sea, aquí yo puedo sacar la número 1, la número 2, están numeradas, la número 1, la número 2, esos serían los valores de la variable, y cada una tiene la misma probabilidad 0,2, por lo tanto, bueno, aquí estaría la representación gráfica. Bien, para cada número, 1, 2, 3, 4, 5, pues subimos una barrita de longitud 0,2. Esa sería la distribución de probabilidad. Bien, otro ejemplo, ahora sería la distribución, se llama uniforme continua. ¿Qué consiste? Bueno, pues aquí, como es una variable aleatoria continua, tenemos que proporcionar la función de densidad. Entonces, la función de densidad es esta que tenemos aquí, es f de x, vale, 1 partido. 1 partido por b menos a, es ese cociente, ese quebrado, 1 partido por b menos a, siempre que la x esté entre a y b, o 0 en el resto. Bueno, aquí tenemos un dibujo, aquí tenemos el intervalo ab, y tenemos la recta, ¿no?, este segmento, aquí arriba de color rojo, que eso sería la representación gráfica de esta función. O sea, que esta función f de x toma el valor constante 1 partido por b menos a, que está aquí representado, de color rojo, entre A y B y cero en el resto, en realidad, o sea que aquí también tendríamos que dibujar de color rojo la gráfica antes de A y después de B, que es cero. O sea que entonces la gráfica de la función de densidad sería viene valiendo cero hasta que llegamos a A, cuando llegamos a A salta a 1 partido por B menos A, que es una constante, el valor que sea y luego cuando llegamos a B vuelve a seguir valiendo cero. Cero, ¿no? Bien, entonces, vamos a ver, ¿cuál sería entonces la probabilidad de que la variable aleatoria X esté comprendida entre A y X? X es un valor cualquiera. Bueno, pues ahí lo tenemos dibujado. Es decir, que es la parte que hay debajo de la función de densidad. Es el área, esa área está aquí pintada de amarillo, claro, pues sería ese rectángulo de ahí y claro ¿esa área cuál es? Pues es base por altura. Entonces la base es X menos A hasta X, la longitud es X menos A y la altura que es 1 partido por B menos A. Entonces base por altura pues sería X menos A partido por B menos A. Esa sería la probabilidad. Entonces esta sería la función de probabilidad de la variable uniforme continua. Bien, en ocasiones una variable aleatoria puede ser uniforme a trozos. Eso ocurre por ejemplo cuando hay intervalos como vamos a ver aquí en este ejemplo. La población de Soria en el año 2001 se distribuía en grupos de edad como se indica en la siguiente tabla. Aquí tenemos intervalos de edad de 0 a 20 años, de 20 a 35, etc. Y el número de individuos en cada clase, este día total. Y las probabilidades estas, bueno, ya no están hechas aquí pero las podríamos haber obtenido nosotros simplemente dividiendo por ejemplo cuál es la probabilidad de elegir un individuo que esté entre 0 y 20 años. Pues es dividir 15.375 por 90.727 en casos favorables o cualquier cosa posible y vamos obteniendo estas probabilidades. Aquí ya están hechas. Entonces aquí tenemos la representación gráfica. Pues, bueno, pues tenemos cada intervalo con su probabilidad. Rectángulo, hemos hecho un rectángulo. que tiene la probabilidad que tenemos aquí en la tabla. Entonces, la función de densidad aquí, o sea, el área de cada uno de estos rectángulos es la probabilidad entonces la función de densidad será uniforme pero en cada subintervalo de 0 a 20, pues tenemos el área esta sería 0,1695 que es la probabilidad entre 0 y 20, etc. Entonces, así por ejemplo este sería el ejercicio 1 del texto dice la probabilidad de elegir un habitante soriano que tenga una edad entre 35 y 45 bueno, pues claro, puesto que nosotros aquí tenemos entre 35 y 50 pero entre 35 y 45 pues tenemos que partir tenemos que partir el intervalo este entonces cuál sería el área o sea, si el área es 0,2075 entre 35 y 50 pero entre 35 y 45 bueno, pues lo podemos hacer es un reparto Miramos ahora la parte entre 35 y 45, claro que sería como si hagamos el factor de proporción que tengo que multiplicar el 0,2079, o como si hiciéramos el porcentaje que tenemos que calcular al 0,2079, y claro, el porcentaje tanto por 1, tanto por 1 lo calculamos, pues eso, 45 menos 35 partido por 50 menos 35. 45 menos 35 sería este intervalo de aquí, y luego 50 menos 35 que sería todo. Entonces claro, la proporción que tenemos que utilizar del 0,2079 pues será ese cociente, 45 menos 35 partido por 50 menos 35, eso se multiplica por 0,2079, bueno, este resultado sería la probabilidad esa. Bueno, se llama uniforme, uniforme continuo a ese modelo. Bien, vamos a ver otro ejemplo. Es el ejercicio 2 del texto. La población española residente en viviendas familiares en 2011 se distribuye por edad según la siguiente tabla. Bueno, aquí tenemos también por intervalos menos de 20, de 20 a 34, de 35 a 39. Bueno, aquí recordemos que aquí tenemos intervalos que acaba de 20 a 34, en realidad llega hasta el 35, pero intervalo abierto. Bueno, aquí está puesto de otra manera, aquí abajo. Bueno, y aquí tenemos los totales, ¿no?, de cada uno de esos intervalos. Y entonces, bueno, y aquí, bueno, aquí en la tablita esta que hay aquí abajo, pues ya se han puesto las probabilidades también, ¿eh?, de cada uno de los intervalos. Pues ya dividir el total de cada intervalo por el total. Bueno, dice, ¿cuál es la distribución de probabilidad de las edades de la población española en 2011? Bueno, eso lo tenemos aquí en la tabla esta. Ahí está la distribución de probabilidad. Es la probabilidad por cada intervalo. Y después dice, ¿cuál sería la probabilidad de encontrar en España alguien que tenga entre 30 y 49 años? Bueno, entre 30 y 49 serían entre 30 y 50. Vamos a considerarlo con intervalos iguales, entre 30 y 50. Por lo tanto, tendremos que partir. O sea, el intervalo de 30 a 50 va entero, pero el de 20 a 35, ahí tenemos que partirlo de 30. O sea, que entonces, bueno, algo parecido a lo de antes, ¿no? Entonces, vamos a ver aquí, encontrar a alguien entre 30 y 49, ¿no? Equivale a que la persona esté en el intervalo 30-50. Pero, claro, 30-50 es el 30... 30 y 59. Unido con el 35-50, ¿eh? Lo separamos porque aquí en la tabla lo tienen separado. entonces sea X la edad de la persona elegida entonces tenemos que la probabilidad de que X que la edad esa pertenezca a 30, 35 es igual, lo hacemos por la proporción sería 35 menos 30 partido por 35 menos 20 y multiplicamos su probabilidad 0,1829 eso lo tenemos aquí, 0,1829 bueno, eso sería 0,0610 los cálculos lo hacemos por la calculadora y luego la probabilidad de que X esté entre 35 y 50 esa sí, esa ya la teníamos en la tabla que es 0,2373 por lo tanto, la probabilidad de que X esté entre 30 y 50 es la suma de estas dos probabilidades que hemos hallado 0,2183 bueno, estos ejercicios están en el texto estando ahí también la solución viene al final y aquí pues eso también, lo hacemos para comentarlos bien, otro modelo este pues podríamos decir uno de los más importantes cálculo de probabilidades que se llama la distribución binomial Entonces, una variable aleatoria, primeramente, decimos que es de Bernoulli, x es una variable de Bernoulli, si solo toma el valor 0 con una probabilidad q o el valor 1 con una probabilidad p. Podemos decir el caso de la moneda, el alzo de la moneda, entonces número de caras, pues es 1 o 0. Ese sería un caso particular de variable aleatoria de Bernoulli, se llama así. Entonces, si la probabilidad de éxito, podríamos decir, o sea, de que x valga 1 es p, pues decimos que la variable aleatoria de x es b de p, o sea, de Bernoulli, la vez de Bernoulli, de parámetro p. Bueno, y en el ejemplo anterior, el número de bolas blancas del ejemplo anterior, pues también era de Bernoulli. ¿Cuál era la probabilidad de sacar bola blanca? Tres quintos. ¿Y cuál es la probabilidad de sacar bola negra? Pues lo contrario, dos quintos. Entonces, era un ejemplo. Era un ejemplo de variable aleatoria de Bernoulli, b de tres quintos. Bien, si una variable x es la suma de n variables del Bernoulli de parámetro p, independientes, decimos que es binomial y de parámetros b, n, p. O sea, n es el número de veces que repetimos o que sumamos la variable del Bernoulli y p es la probabilidad de éxito, podríamos decir. Aquí, por ejemplo concreto, pues la moneda en vez de lanzarla una vez la lanzamos diez veces. Ahí tendríamos una binomial porque lanzar diez veces una moneda es lanzarla una vez y otra vez y otra vez. O sea, que son repetir la variable del Bernoulli y después sumar el resultado. Porque cada vez que me salga cara, por ejemplo, yo lanzo la moneda diez veces y miro a ver cuál es el número de caras. Esa sería la variable de la teoría, el número de caras. Claro, el número de caras voy sumando las caras cuando me vayan saliendo. Saliendo caras en las de Bernoulli, claro. O sea, que la variable binomial es la suma de las de Bernoulli. Bueno, por ejemplo, la probabilidad de que en cada nacimiento de los que se producen en España encontremos una minia es p igual 0,48. Por tanto, de que nazca un niño, pues es lo contrario, claro, si no es niña, pues es niño, entonces sería 1 menos p, 1 menos 0,48 igual a 0,52. Bueno, pues ¿cuál es la probabilidad de que nazcan tres niñas en cinco nacimientos? Pues ahí tenemos, o sea, se trata de repetir cinco veces, hay cinco nacimientos, repetir cinco veces un nacimiento. Un nacimiento distinto cada vez, claro. Por tanto, sería repetir cinco veces una variable aleatoria de Bernoulli de parámetro 0,48, que sería el éxito en nuestro problema, ¿no? Porque queremos ahí la probabilidad de que nazcan tres niñas y la probabilidad de que nazca una es 0,48. Por lo tanto, una posibilidad sería, pues, 1, 1, 1, 0, 0. De las tres primeras niñas, o sea, cada vez que sea un niño... 1, va a ser éxito, o sea, es una niña, y luego 0, que es que no es niña, por lo tanto, niño, ¿no? Entonces, una posibilidad es que en los cinco nacimientos, los tres primeros son niñas y los dos últimos son niños. ¿Eso qué probabilidad tiene? Pues, a ver, cada vez que nazca niña sería 0,48, pues se multiplicaría 0,48 por 0,48 por 0,48 y luego por 0,52 y por 0,52. Son cinco casos por el que lo tendríamos, o sea, 0,48 elevado al cubo por 0,52 elevado al cuadrado. Ahora, eso sería la probabilidad de este suceso, podríamos decirlo, ¿no? 3,1 y 2,0. 1,1,1,0,0 en ese orden. Pero podrían haber salido en otro orden, o sea, podría haber sido niña, niño, niña, niño y niña, ¿no? De manera que el orden cambia, es otro suceso diferente al anterior, pero tiene la misma probabilidad, ¿eh? Tiene la misma probabilidad. Bueno, etcétera. Entonces, siempre que el número de éxitos sea 3, la probabilidad será la misma. Pero, claro, ¿de cuántas maneras entonces podemos obtener tres éxitos? Bueno, pues eso ya lo hemos visto también con la combinatoria, ¿no? Y aquí si tengo cinco lugares para rellenar con 3,1 y 2,0, ¿de cuántas formas lo puedo hacer? Pues serían 5 sobre 3, combinaciones de 5 de orden 3, ¿no? Por tanto, el número de posibilidades de que nazcan 3 niñas y 2 niños sería 5 sobre 3, que son 10. Y cada uno de esos tiene la probabilidad que hemos escrito antes, ¿no? De 0,48 al cubo por 0,52 al cuadrado. Por lo tanto, la probabilidad de que nazcan 3 niñas en 5 nacimientos será 5 sobre 3 por 0,48 elevado a 3 por 0,52 elevado a 2. Eso, pues, es 0,21 de 90. En general, vamos a obtener la fórmula. En general, si X es una binomial NP, entonces se cumple que la probabilidad de que haya R éxito sería N sobre R por P elevado a R y por Q elevado a N menos R. Esta fórmula viene recordarla porque ya digo, es bastante importante este modelo. Bien, y eso, Q es igual a 1 menos P igual. Bien, ¿cuál es? Día el valor esperado de la distribución binomial, cual sea la media, ¿eh? ¿Cuál es el valor esperado? de esta distribución. Bueno, pues aquí tenemos bueno, en primer lugar vamos a ver la de Bernoulli aquí tenemos la tabla de una Bernoulli la Bernoulli solamente toma el valor 1 o 0 y el 1 con probabilidad p y el 0 con probabilidad q por tanto el valor esperado era cada uno de los valores de la variable por su probabilidad el valor esperado de la esperanza de x sería el 1 multiplicado por p más el 0 multiplicado por q y eso da p. Y la varianza que sería la media de los cuadrados menos el cuadrado de la media sería, a ver, ¿cuál es la media de los cuadrados? Pues sería 1 al cuadrado por p más 0 al cuadrado por q. La esperanza del cuadrado, 1 al cuadrado por p más 0 al cuadrado por q. Menos la esperanza de la x que hemos hallado antes que era p elevada al cuadrado. Es la varianza la varianza es la media de los cuadrados menos el cuadrado de la media. Por tanto sería p cuadrado menos p cuadrado. O sea, perdona, p de p o sea, p porque es 1 al cuadrado es 1 por p, es p menos p cuadrado. Ahora, p menos p cuadrado, podemos sacar la p factor común y nos queda p factor común de 1 menos p que es q. Luego lo podremos escribir de esa manera. O sea que la varianza de la variable de Bernoulli es p por q. Así es que si x es ahora una binomial, y como la binomial es suma de variables de Bernoulli independientes, pues la esperanza de la x será la suma de las esperanzas de Bernoulli, pues lo que sumamos n veces, y como era p, pues n por p. Y la varianza será la suma de las varianzas de las de Bernoulli, y como sumamos n veces, pues sería n por p y por q. Así que aquí tenemos ya el valor esperado y la varianza de la variable binomial en p. Vamos a ver un ejercicio que sería el ejemplo 3 del texto. Bien, un opositor es convocado. El mismo día para dos oposiciones distintas. En la oposición A, de nivel medio, hay 5 plazas a cubrir, y en la oposición B, de nivel superior, hay 9 plazas. El aspirante no sabe bien a cuál presentarse, entonces observa las estadísticas de convocatorias anteriores y aprecia que en la oposición A el porcentaje de éxito está en torno al 25%. O sea, podríamos decir que la probabilidad de aprobar sería 0,25. Mientras que la oposición B es más difícil y el éxito solo alcanza el 15%, o sea que la probabilidad de aprobar la oposición B sería 0,15. Entonces dice, con esta información, ¿cuál será la elección más ventajosa? Bueno, vamos a ver. Entonces el número de éxitos de la oposición A es una variable binomial 5, puesto que hay 5 plazas, pues entonces la oposición A sería una variable de la teoría binomial 5, 0,25. Tengo la probabilidad 0,25. De tener un éxito, pero tenemos 5 plazas. Y en la oposición B, puesto que hay nueve plazas, se trataría de una binomial nueve con probabilidad de éxito 0,15. Entonces, claro, los valores medios respectivos, o sea, el número medio de éxitos sería, hemos quedado que la media es NP, que lo tenemos aquí arriba, pues serían 5 por 0,25 en el caso de la oposición A, que es 1,25, y 9 por 0,15 en el caso de la oposición B, que es 1,35. Es decir, que a pesar de que la oposición B sea más difícil, ¿no?, porque es más improbable, o sea, la probabilidad de éxito es más pequeña, sin embargo, el valor esperado es más grande. En el caso de la A, el valor esperado es 1,25, mientras que en la B es 1,35. Luego, aquí se compensa, de alguna manera, el hecho de que la probabilidad, pero el número de plazas es mayor, ¿no? Entonces, bueno, aquí está hecho el cálculo preciso de cuál sería el valor esperado. Entonces, bueno, en este caso, pues sería más ventajoso presentarse a la oposición B. Bien, tenemos otro ejercicio. En el año 2012 las empresas españolas se distribuían según el número de asalariados de la siguiente en forma, ¿no? Bueno, por ejemplo, los intervalos, los inasalariados, de 1 a 9, de 10 a 49, etcétera, y aquí tenemos el número de personas por cada uno de los intervalos y el total. Entonces, si tomamos una muestra aleatoria de 20 empresas, ¿no? ¿En cuántas de ellas esperamos encontrar 100 asalariados? Bueno, bien, el total aquí se refiere a empresas, ¿eh? Se refiere a empresas. O sea, empresas sin asalariado hay un millón y trescientos mil y pico, etcétera, ¿no? Entonces, bien, tomamos una muestra aleatoria de 20 empresas. Bueno, ¿y qué? ¿En cuántas de ellas esperamos encontrar 100 asalariados? Bueno, pues, ¿cuál es la probabilidad? ¿Cuál es la probabilidad de encontrar una empresa sin asalariado? Por eso aquí tenemos casos favorables para ti, por casos posibles. O sea, que sería esto de aquí, ¿eh? Un millón setecientos sesenta y cuatro mil a setecientos sesenta y siete dividido por el total. Eso sale 0,5516. Por lo tanto, si tomamos una muestra de 20 empresas, la variable número de empresas sin asalariados en esas 20 es una variable binomial donde n vale 20 y la probabilidad p vale 0,5516. Por lo tanto, el resultado sería 20 multiplicado por 0, que sería el valor esperado, np. Sería np, el valor esperado. Por lo tanto, sería 20 por 0,5516, que es aproximadamente 11. Es decir, que ese es el número de empresas que esperamos, que se esperan encontrar sin asalariados. Solo te digo, es el valor esperado. La pregunta dice, esperamos encontrar. Bien, y una muestra. Una muestra de 1.000 empresas, pues lo mismo, multiplicamos 1.000 por la probabilidad, que sería 0,5516. Bien, y otra pregunta. ¿Se calcula la probabilidad de que en una muestra de 15 empresas aparezcan dos que tengan entre 10 y 49 asedariados? Bueno, aquí tenemos otra binomial, pero ahora es n vale 15 y la probabilidad ahora es entre 10 y 49. Por tanto, serían 122.163 partido por los 3 millones estos de total, ¿no? Por tanto, la probabilidad de encontrar una empresa entre esos asedariados sería 0,0382. Puesto que cogemos 15 empresas y queremos encontrar dos, pues se trataría de hallar la probabilidad de una binomial, ¿eh? 15, n igual a 15 y probabilidad 0,0382, la probabilidad de que la variable sea igual a 2. Y eso, bien, la fórmula sería 15 sobre 2 por 0,0382. 0,0382, que es el éxito, ¿no? La probabilidad de éxito elevado a 2 por Q, que sería 1 menos, ¿eh? 1 menos 0,0382, que sería 0,9618 elevado a 13. tenemos 2 y otros 13 en total hay 15, bueno pues eso se calcula y ya es el resultado bien, otro apartado del mismo problema hay varios apartados vamos viendo por separado dice el apartado D, calcule la probabilidad de que en una muestra de 10 empresas aparezcan por lo menos 7 que tengan entre 1 y 9 asociados bueno pues lo mismo aquí volvemos a tener una binomial a la hora de N vale 10 y entre 1 y 9 asociados en la tabla lo buscamos y esta sería la probabilidad 1.288.390 porque por el total queda 0,4027 por lo tanto lo que tenemos aquí es una binomial 10, 0,4027 de parámetros 10 0,4027 luego la probabilidad de tener al menos 7 es que haya 7, 8 9 o 10 sacamos 10 empresas, claro lo máximo serían 10 entonces bueno pues aquí no hay entre normas remedio que ir calculando y sumando, o sea en el caso de la probabilidad de obtener 7 sería 10 sobre 7 por la probabilidad de éxito elevado a 7 por la probabilidad de fracaso, 1 menos 1 menos ella, elevado a 3 Más 10 sobre 8, más 10 sobre 9, etc. O sea que vamos poniendo la fórmula en cada caso para 7 éxitos, 8 o 9 o 10. Bueno, eso calculo directamente lo que hemos calculado y el resultado está ahí. Otro apartado es que calcule la probabilidad de que en una muestra de 10 empresas aparezcan al menos 6 con menos de 10 asalariados. Bien, pues vamos a la tabla a ver la probabilidad de tener menos de 10 asalariados. Bueno, entonces en la tabla menos de 10 es sin asalariados o de 1 a 9. Entonces hay que sumar estas dos cantidades. Entonces, bueno, pues aquí lo tenemos, ¿no? Por lo tanto, esta sería la probabilidad de obtener una empresa de menos de 10 asalariados, de hacer una extracción. Pero puesto que hacemos la muestra de 10 empresas, pues volvemos a tener una binomial n igual a 10 Y probabilidad 0,9543. Por lo tanto, la probabilidad de tener... O sea, de que aparezcan al menos 6, por lo menos 6, pues es parecido a lo de antes, ¿no? Es que salgan 6 o 7 o 8 o 9 o 10, ¿no? Entonces, bueno, pues tenemos que haber separado cada uno de estos cálculos, ¿no? Y, bueno, pues eso para que sean 6 empresas, o sea, 10 sobre 6, pues 0,9543 elevado a 6, pues 0,0457 elevado a 4, bueno, etcétera, ¿no? Sobre 7, 10 sobre 8, 10 sobre 9, 10 sobre 10. Bueno, y aquí fíjate el resultado, que sale prácticamente 1, ¿eh? Prácticamente 1, 0,9999. Bien, otra pregunta, ¿no? Calcule la probabilidad de que en una muestra de 10, 10 empresas, aparezcan 3 que tengan entre 1 y 49 asalariados. Bueno, pues lo mismo, tenemos que contamos, a ver, las empresas con entre 1 y 49 asalariados, hallamos la probabilidad, ¿eh?, de que una empresa pertenezca a ese colectivo y entonces, puesto que también elegimos 10 empresas, estamos ante una binomial de tamaño, o sea, n igual a 10, y queremos 3 éxitos, pues sería, la probabilidad sería 10 sobre 3, 0,449 elevado a 3, y por 0,531 elevado a 7, bueno, eso es el resultado. Y, bueno, y finalmente calcula la probabilidad de que una muestra de 7 empresas, como mucho 2, tengan entre 1 y 49. Bueno, pues entonces, como tenemos ya la probabilidad de entre 1 y 49, la tenemos de antes, ¿no? A ver, entre 1 y 49, que era 0, a ver, aquí la teníamos 0,4409. Pues entonces, la probabilidad de que entre 7 empresas, como mucho 2, pues como mucho 2 serían o 0, o 1, o 2. Por tanto, tenemos que actuar la probabilidad de que haya 0 éxitos, o 1 éxito, o 2 éxitos, siempre usando la misma fórmula. Y, bueno, el resultado sería este. Bien, y de esto, pues ya digo, es cuestión de, aquí porque lo he repetido en este ejemplo varias veces, la formulita de la binomia. Porque, bueno, es importante. Y tenemos aquí otra distribución, que podríamos decir que todavía es cada vez más importante que la binomial, por su utilidad, que es la distribución normal. Es la distribución teórica más usada en estadística. Esta es una distribución de tipo continuo. Bueno, es muy importante porque cualquier distribución muestral de medias se aproxima a lo normal. Esto quiere decir lo siguiente, si tenemos un colectivo de alumnos, por ejemplo, que han hecho un examen, entonces tenemos, no sé, 200 alumnos y no sabemos cuál es la nota media. Bueno, podríamos preguntar a los 200, pero supongamos que es muy difícil. Bueno, no, es muy difícil. Bueno, si son 200, pues vamos muchos más, pongamos 100.000 alumnos. Bueno, pues entonces lo que hacemos es extraemos muestras. Entonces yo cojo, por ejemplo, 10 alumnos y de 10 alumnos sí que es más cómodo sacar la media. Luego saco otros 10, otros 10 diferentes, saco la media, otros 10 diferentes, saco la media. Entonces las distintas medias que vayamos obteniendo, obviamente no van a... van a ser la misma, claro, pero esas medias se van a distribuir, se van a distribuir... Bueno, si las elegimos de manera aleatoria, pues bueno, pueden ser parecidas, incluso si aumentamos el tamaño de la muestra, pues más parecidas todavía, incluso parecidas a la muestra, o sea, a la verdadera media del total de la población. Pero bueno, se van a distribuir esas medias alrededor precisamente de la verdadera media de la población, que no la conocemos, y se van a distribuir como indica esta curva, que es la campana de Gauss, que es la función de densidad de esta distribución normal. Es decir, que aquí tenemos la fórmula escrita, la forma analítica, es 1 partido por sigma raíz de 2 pi, depende de dos variables, de dos parámetros, ¿no? Es una fórmula. Es una función que es 1 partido por sigma raíz de 2 pi, sigma es una constante, que bueno, luego se ve que representa la desviación típica de la variable aleatoria, ¿no? Tanto es un número positivo. Esto es 1 partido por sigma raíz de 2 pi, 2 pi es el número pi. Y luego multiplicado por e elevado a menos x menos mu elevado al cuadrado, partido por dos sigma al cuadrado. Aquí tenemos la otra constante, el otro parámetro que es la mu, que luego se comprueba que es la media, bueno además aquí está dicho, son la media y la desviación típica de la variable aleatoria, aunque eso hay que probarlo, pero bueno, se prueba. Y la x es la variable, o sea, aquí tenemos f de x, es una función donde la x solamente está aquí en el exponente, x menos mu elevado al cuadrado. Bueno, esta función tiene una gráfica que está aquí dibujada, es lo que se llama la campana de Gauss, pongamos el punto máximo está a la altura del valor de mu, y luego pues a la derecha de mu, un intervalo. Un intervalo mu más sigma, y a la izquierda de mu, mu menos sigma, precisamente llega hasta los puntos de inflexión, donde la curva cambia de convexa a cóncava, ahí están los puntos de inflexión, ahí es donde está el mu más sigma y el mu menos sigma. por tanto esos parámetros mu y sigma pueden ser distintos el mu puede ser positivo o negativo el sigma siempre positivo pero puede ser mayor o menor entonces pongamos la campana de Gauss pues puede estar más cerrada o más abierta bien bueno, el número E no lo comentaba, el número E es una constante matemática también que su valor aproximado es de aquí el número I pues es más conocido es el 3, 14 bueno, esta sería la distribución normal recordemos como hemos dicho antes que la función de densidad lo que pongamos determina por debajo de ella son las áreas comprendidas entre ella y el eje de abscisa etc. Y bueno, y aquí pues eso, de alguna manera es como indica la distribución de las probabilidades, porque aquí observamos que donde más se acumulan los sucesos más probables, los sucesos más probables estarán alrededor de mu, porque es donde más arriba sube la función de densidad. O sea que aquí las áreas, pongamos de intervalos, pongamos alrededor de mu, pues son mayores, estas áreas de aquí, esta área de esta zona, es mucho mayor que las de zonas más alejadas, más alejadas del mu. Bien, bueno, pues si x es normal, con media muy descripción típica sigma, decimos abreviadamente que la x es, lo escribimos así, una n coma, o sea, entre paréntesis. Paréntesis mu sigma, normal mu sigma. Bien, ocurre que si nosotros a una variable x que sea normal mu sigma le restamos su media y la dividimos por su desviación típica, esa operación se llama tipificación de la variable. Entonces esto la convierte, o sea, que si le restamos mu a todos los valores de la variable, pues el valor cuando x valía mu ahora valdrá cero, es decir, que pongamos el centro o la media de la distribución se nos va a ir al cero. Y si dividimos por sigma, bueno, pues la desviación típica de la nueva variable va a valer uno. Entonces se dice que la nueva variable, que se suele representar por la letra z, se llama normal, o sea, es normal cero uno. O sea que, bueno, nosotros podemos convertir una variable normal mu sigma en una variable normal cero uno. Eso nos va a servir precisamente para capturar probabilidades. Aquí las probabilidades basadas en la distribución. Normal, que serían... Serían áreas debajo de lo normal, bueno, como he dicho antes, se calcularían mediante cálculo integral, pero claro, no vamos a tener que hacerlo porque existen tablas donde ya están calculadas las raíces. Áreas, ¿no? Claveres. Bueno, aquí tenemos, por ejemplo, cómo se calcularían las probabilidades en el caso de la distribución normal. Bien, tengamos un x, supongamos que es una variable normal mu sigma y supongamos que se desea calcular la probabilidad de que a esté comprendido, o sea, sea menor o igual que x, menor o igual que b. O sea, que la variable esté comprendida entre a y b en el intervalo a. Entonces, la probabilidad de que a sea menor o igual que x, menor o igual que b, la vamos a calcular restando, o sea, tipificando. Tipificamos aquí cada uno de los tres elementos de estas dos desigualdades. O sea, que le restamos a cada uno de los tres elementos, le restamos mu y dividimos por sigma, con lo cual las desigualdades se siguen manteniendo. O sea, es equivalente, lo mismo me da, es decir, a menor o igual que x, menor o igual que b, que a menos mu partido sigma, menor o igual que zeta, o sea, donde zeta es la variable x tipificada. Y menor o igual que d menos 1 partido por sigma. Por lo tanto, reducimos el cálculo de probabilidades de la variable x al cálculo de probabilidades de la variable z, que es la normal 0,1. Así es que disponiendo de una tabla de la distribución normal 0,1 podemos calcular probabilidades de cualquier otra variable. Bien, ahora veremos la tabla y practicaremos un poco. Bueno, teniendo en cuenta la simetría de la distribución normal, eso también es importante tenerlo, tener en cuenta la simetría. Y consultando las tablas se obtiene que entre mu menos sigma y mu más sigma, o sea que aquí tenemos este primer intervalo que va de mu menos sigma a mu más sigma. Bueno, pues ahí se encuentra el 68,26% de la población. La probabilidad de encontrar un individuo entre mu menos sigma. Mu menos sigma y mu más sigma es 68,26%. Entre mu menos 2 sigma y mu más 2 sigma, que es un intervalo ya más grande, de mu menos 2 sigma a mu más 2 sigma sería este. Ahí ya hay mucha más probabilidad. De hecho, ahí está el 95,44% de la población. Pero es que entre mu menos 3 sigma y mu más 3 sigma, pues está ya prácticamente el total de la población. Está al 99,74%. La probabilidad ya es muy grande. Bueno, por ejemplo, la edad de fallecimiento en España se distribuía aproximadamente normal 86. Eso quiere decir que la media es 80 años, ¿no? Y la desviación típica es de 6. Bueno, entonces la probabilidad de que una persona fallezca entre 80 y 85 años, bueno, pues vamos a calcularlo. Ponemos, escribimos lo que se trata, ¿no? Se trata de calcular la probabilidad de que la X esté entre 80 y 85. En 80 menos igual que X, menos igual que 85. Entonces tipificamos, puesto que la normal es 86, por tanto restamos 80 y dividimos por 6 a cada uno de los tres números. Entonces 80 menos 80 partido por 6, menos igual. Que Z, la X, tipificada de la variable, llamamos Z, menos igual que 85 menos 80 partido por 6. Bueno, 80 más 80 es 0, por tanto sería la probabilidad de 0. Menos igual que Z, menos igual que 0,83. Y eso lo buscamos en las tablas. Bueno, entonces esto vamos a verlo. Bueno, aquí tenemos la tabla de la normal 0, 1. Entonces, puesto que era entre 0, entre 0, a ver, vamos a a ver, vamos a ver, aquí teníamos, o sea, queda entre 0 y 0,83, la probabilidad entre 0 y 0,83. Bueno, pues entonces vamos a ver cómo utilizamos las tablas. Bueno, aquí eh... tenemos un dibujito arriba donde está la campana de Gauss y una zona sombreada que empieza en 0 y acaba en Z. Entonces, eso es lo que significa que es lo que nos proporciona la tabla. La tabla nos proporciona esas áreas que hay sombreadas que van de 0 a Z donde Z es el valor que está aquí en vertical aunque aquí en vertical lo que nos aparece son la unidad y la décima y en horizontal nos aparece la centésima. O sea que, por ejemplo el 0,83 el 0,83 lo puedo buscar aquí con el 0,8 y luego aquí el 0,03 entonces 0,83 es 0,8 más 0,03 es la centésima. Entonces ¿qué número aparece en el cruce del 0,8 con el 0,03? Aparece este número 0,2967. ¿Qué es 0,2967? La probabilidad de que la X esté entre 0 y 0,83 eso es lo que está aquí sombreado en el dibujito de arriba. Que es justamente la que queremos calcular, ¿eh? 0,2967. A todo, bueno, volvemos, volvemos, bueno, de esa manera lo hemos calculado. Es decir, que la probabilidad de que Z esté entre 0 y 0,83. Entonces en las tablas, por eso ya directo, 0,2967. Ahora, probabilidad de que fallezca entre 70 y 75 años, ¿eh? Otra pregunta. Pregunta, bueno, pues entonces la probabilidad sería de 70 menos o igual que X menos o igual que 75. Tipificamos, ¿eh? 70 menos 80 partido por 6 menos o igual que Z menos o igual que 75 menos 80 partido por 6. Aquí nos aparece el intervalo este, ¿no? Desde menos 1,67 a menos 0,83. Y precisamente por simetría, aquí los valores son negativos, pero si los convirtiésemos en positivos, el intervalo, o sea, nos daría la misma probabilidad, ¿eh? Por simetría. Lo mismo ocurre a la izquierda del 0 que a la derecha del 0, ¿eh? La campana de Gauss es simétrica. Entonces por simetría esta probabilidad sería la misma que la de que la Z esté entre 0,83 y 1,67. Bueno, claro, el menos 1,67 es más pequeño que el menos 0,83, pero cambiarlo de signo es al revés. El 0,83 es más pequeño que el 1,67. Entonces, bueno, aquí vamos a las tablas. Entonces, claro, aquí tenemos que buscar dos valores porque es la probabilidad entre el 0,83 y el 1,67. Luego vamos a buscar primero el 0,83, bueno, que lo teníamos ya de antes, que era el 0,2967. Y luego buscaremos el 1,67, que será más grande, claro, esa probabilidad. Y lo que tenemos que hacer ahora es tablas, ¿no? ¿No? Entonces buscamos el 1,67 en las tablas. Bueno, aquí tenemos el 1,6 en la columna 7. Entonces, 1,6 en la columna 7. A ver, aparecería este de aquí, ¿eh? 0,4525. Entonces, pues eso es, ¿eh? 0,4525 menos 0,2967 y eso es el resultado. Bien, bueno, hoy... Vamos a dejarlo aquí, ¿eh? Y entonces el próximo día continuaremos con ese tema, ¿eh? Que nos quedan algunos ejercicios. Lo dejamos aquí. Gracias. Saludos.