Bien, vamos a ver el tema 6, distribuciones de probabilidad discretas. Se trata en este tema de ver algunos modelos notables de distribuciones de probabilidad de variables aleatorias discretas, que son las que más utilizaremos en la práctica. Bien, en primer lugar tenemos la que se conoce como distribución degenerada en un punto C. Se trata de una variable aleatoria, xi, tal que la probabilidad de que xi sea igual a un valor constante C es igual a 1 y la probabilidad de que xi sea distinto de ese valor C es igual a 0. También se conoce como variable aleatoria constante, puesto que solo toma un valor constante C con probabilidad 1 y el resto tiene probabilidad 0. Bien, la función de distribución f de x, que sería la probabilidad de que xi sea menor o igual que x, pues vale 0. Si ese x es menor que c, y vale 1 si x es mayor o igual que c. Bueno, aquí la tenemos representada. Es decir, es la semirrecta desde el infinito hasta el punto C, y luego el punto C que ya vale 1, la semirrecta está en el infinito. Bien, los momentos serían los siguientes. En primer lugar, el valor esperado de esa variable, esperanza de c, es igual a c. ¿Por qué es igual? Es igual a cada uno de los valores que tome la variable discreta por su probabilidad, o sea, por la desviación c, o sea, igual a c, c por 1. La esperanza de xi al cuadrado, pues lo mismo, es el valor que toma la variable elevada al cuadrado por su probabilidad, lo que sería c al cuadrado. Así que la varianza, por lo tanto, sería c al cuadrado menos c al cuadrado, que es el valor esperado de xi al cuadrado, menos el valor esperado de xi elevado al cuadrado, tanto c al cuadrado menos c al cuadrado, que por lo tanto sería c. Y la función característica, pi de t, que es el valor esperado elevado a i, t, xi, pues sería elevado a i, t, xi por i elevado a i, t, c, por la probabilidad de que xi valga c, que es 1, por lo tanto, e elevado a i, t, c. Bien, vamos a ver otro segundo ejemplo. Tenemos una distribución uniforme discreta. Por aquí es una variable de la teoría que su probabilidad de que esa variable tome el valor x sub i es igual a 1 partido por n, donde i es igual, toma n, los n números naturales, desde 1 hasta n. Y los valores de x sub 1, x sub 2, x sub 3, x sub n, etc., pues están escritos en orden creciente. Bien, la función de distribución f de x. Entonces, desde luego, si x es menor que x sub 1, valdría 0. Si x está entre x sub 1, o sea, x sub 1 menor o igual que x, menor que x sub 2, la probabilidad sería 1 partido por n. Si x está comprendido entre x sub 2 y x sub 3, o sea, x sub 2 menor o igual que x, menor que x sub 3, la f de x sería 2 partido por n, etc. Y si x ya es mayor o igual que x sub n. Pues la función de distribución valdría 1, y aquí pues la tenemos representada. En los momentos, pues tenemos esperanza de x i, sería igual a cada uno de los valores de la variable por su probabilidad, tanto sería la suma de x sub j por 1 partido por n, x sub j partido por n, es decir, que j vale 1 hasta que vale n. Y bueno, si sacamos el 1 partido por n factor común, pues 1 partido por n por el sumatorio de los x. Análogamente, la esperanza de x i al cuadrado, pues sería el sumatorio de x sub j al cuadrado partido por n, desde que j vale 1 hasta que vale n, y análogamente, pues sacamos 1 partido por n factor común del sumatorio de j igual a 1 hasta n de x sub j al cuadrado. Y la función característica, el valor esperado de e elevado a it si, que sería el sumatorio de j igual a 1 hasta n de e elevado a it. x sub j y partido por n. Sacando el 1 partido por n, pues nos quedaría 1 partido por n por el sumatorio de j igual a 1 hasta n de e elevado a it x sub j. Bien, vamos a ver un ejemplo. Supongamos que x i toma los valores 1, 2, 3 puntos suspensivos hasta n, y cada uno de ellos con la misma probabilidad 1 partido por n. Bien, pues entonces se tendrá que la esperanza de x i sería 1 partido por n por... El sumatorio de cada uno de los valores que toma, que es la suma de j desde la cota igual a 1 hasta n. Aplicamos la fórmula de la suma de los términos de una progresión aritmética. Luego aquí tendríamos 1 partido por n multiplicado por dicha suma, que sería el primero más el último con el número de términos partido por 2. 1 más n por n partido por 2. Que simplificado nos quedaría n más 1 partido por 2. Y la esperanza de x i al cuadrado. Y la esperanza de x i al cuadrado, que sería 1 partido por n por la suma de los cuadrados desde el 1 hasta n. Bueno, esta suma se puede calcular y toma este valor. Es n por n más 1 por 2n más 1 partido por 6. Y eso multiplicado por 1 partido por n. Que lo simplificaríamos y nos quedaría n más 1 por 2n más 1 partido por 6. Y de aquí ya podemos obtener la varianza de x i, que sería la esperanza... La varianza del cuadrado menos el cuadrado del valor esperado. O sea, n más 1 por 2n más 1 partido por 6 menos n más 1 partido por 2 al cuadrado. Y bueno, haciendo operaciones, diciendo al denominador común, etcétera, simplificando y al final nos queda esta expresión. n más 1 por n más 1 partido por 12. O finalmente n cuadrado menos 1 partido por 12. Bien, y la función característica. Sería el sumatorio de e elevado a i t x sub j y partido por n. Bueno, x sub j no, j, j puesto que j toma los valores naturales. Por tanto sería 1 partido por n por el sumatorio desde j igual a 1 hasta n de e elevado a i t j. Y bien, aquí lo que tenemos es la suma... Este sumatorio es una serie geométrica, desde 1 hasta n. Sería 1 partido por n por i elevado a i t n, que sería el último término. Por el primero menos la razón, la razón es e elevado a i t y partido por la razón menos 1. Aquí lo tenemos. Y bueno, escrito de esta manera simplificada sacamos factor común elevado a i t, elevado a i t n. Menos 1 partido por n y por e elevado a i t menos. Bien, otro ejemplo de distribución discreta sería la distribución de Bernoulli. 1 b que representaremos por b, 1 p. Y que esta distribución es la de una variable x i que toma los valores 0 y o 1. Con las probabilidades p de que x i valga 1 llamaremos p. Y p de que x i valga 0, obviamente, pues sería el suceso contrario. Pues su probabilidad será 1 menos p que llamaremos q. La función de distribución. Si x, visto que x solamente toma esos valores 0 y 1, ¿no? Si x es menor que 0 la probabilidad sería 0, p de x sería 0. Si x está entre 0 y 1, o sea 0 menor o igual que x menor que 1, la probabilidad sería q. Y a partir de 1, si x es mayor o igual que 1, pues ya la función de distribución tomaría lo alguno, ¿no? Y los momentos. Pues esperanza de x i, que sería cada uno de los valores que toma la variable por su probabilidad, lo vería q por 0 más p por 1, es decir, igual a p. Y la esperanza de x i cuadrado, que sería cada uno de los valores elevado al cuadrado por la probabilidad. Lo vería q por 0 al cuadrado más p por 1 al cuadrado, que también es p. De aquí obtenemos la varianza, que sería p menos p cuadrado. Y se acaba fuerte con un p, nos quedaría p por 1 menos p, que es igual a p por q. Y la función característica, pues sería el valor esperado de elevado a i t xi, y por lo tanto sería e elevado a i t por 0, o sea que sería elevado a 0 por su probabilidad, que sería q más e elevado a i t por 1, o sea elevado a i t por su probabilidad, por p. Y bueno, por lo tanto eso sería q más p por elevado a i t. Bien. Otro ejemplo. Otro ejemplo notable, pues es la distribución binomial, b, n, p. Que se construye de la siguiente manera, ¿no? Dadas n variables aleatorias independientes que sean de ver un i, no p, que representaremos por xi sub 1, xi sub 2, etc., hasta xi sub n. Entonces la variable suma de ellas, o sea, xi igual a la suma de estas variables de ver un i, se dice que es una distribución binomial b, n, p. Bien. Bien, por lo tanto esta variable binomial xi puede tomar los valores desde 0 hasta n, que si las variables de ver un i, cada variable de ver un i puede ser, tomar los valores 0 o 1. Entonces si todas las variables de ver un i tomaran el valor 0, la variable xi tomaría el valor 0. Y si todas las variables de ver un i tomaran el valor 1, pues la variable xi tomaría el valor n, ¿no? Y entre 0 y n, pues la variable xi puede tomar cualquier número entero, ¿no? Entonces la función de probabilidad, ¿cuál sería? Bueno, desde luego cualquier, vamos, cualquier combinación, ¿no? Los valores que puedan tomar las variables xi sub i, ¿no? Formaría, digamos, una combinación de n números donde habría unos y ceros. Entonces, ¿cuál es la probabilidad de que xi sea igual a r? Es decir, de que haya r1. Bueno, pues si hay r1. Por tanto, hay n menos r ceros. La probabilidad de una de estas cualquiera, de una de estas combinaciones cualesquiera sería p elevado a r por q elevado a n menos r. Ahora bien, ¿de cuántas maneras puede haber r1 en una combinación de n números, no? Pues serían las combinaciones de n sobre r. Por tanto, la probabilidad de que xi sea igual a r sería n sobre r por p elevado a r por q elevado a n menos r. O sea, las combinaciones. Las combinaciones de n tomadas de orden r por p elevado a r y por q elevado a n menos r. Bien, la función de distribución, pues simplemente f de x sería el sumatorio para r menor o igual que x de n sobre r por p elevado a r por q elevado a n menos r. Y los momentos, tendremos en cuenta que la variable xi es la suma de las variables de r1 y xi sub i, pues el valor esperado de xi sería... La suma de la suma de estas variables xi sub i, que es la suma de los valores esperados, y puesto que cada valor esperado de r1 y xi era p, pues aquí sería n por p. Y, análogamente, la varianza, puesto que se trata de variables independientes, la varianza de xi sería la varianza de la suma de las xi sub i, y esto sería la suma de las varianzas de las xi sub i, y puesto que era pq, pues la varianza de xi sería npq. Bien, y la función característica, pues la haremos de la misma forma, la reduciremos a las funciones características de las variables de r1 y xi, o sea que f de t sería la esperanza de elevado a it xi, que es elevado a it por la suma de las xi sub i, y puesto que son independientes, podemos separar el producto de los valores esperados, por esperanza de elevado a it xi sub 1, por esperanza de elevado a it xi sub 2, etc., que son las funciones características de las variables de r1 y xi, que cada una de ellas era igual a q por p elevado a it, por tanto, tendríamos q por p elevado a it elevado a n. Bien, veamos la moda de esta variable aleatoria. Entonces se demuestra que la moda es siempre un valor 0 comprimido entre np menos q, y np más p. Bueno, np menos q y np más p se diferencian en una unidad, pues se diferencian en p más q, que es igual a 1. Entonces, si np menos q, o sea, entre np menos q y np más p, si ambos son enteros, pues son consecutivos. Y si no son enteros, entre ambos solamente existe un número entero, esa sería la moda. Y si ambos son enteros, estaríamos en el caso de que la distribución sería bimodal, digamos todos modas. Por ejemplo, una binomial que sea 10, 0,4, que es la que tenemos aquí en la figura, pues resulta que el np sería 4 menos q, que sería 0,6, sería 3,4, y por lo tanto, np más p sería 4,4, que es una unidad más. Así es que la moda está comprendida entre 3,4 y 4,4, luego la moda del 4. Bien. Bien, y una propiedad que cumple la variable aleatoria binomial es la propiedad reproductiva, que consiste en lo siguiente. Supongamos que tenemos dos variables binomiales si sub 1, que sea binomial n sub 1 p, y si sub 2, que sea binomial n sub 2 p, digo, el nuevo parámetro, y que ambas sean independientes. Entonces, las sumamos y ya vemos eta, a la variable aleatoria suma, y entonces tenemos que la función de característica de eta, bueno, pues será el producto de las funciones características, puesto que son independientes las dos variables si sub 1 y si sub 2, que son respectivamente q más p por elevado de t elevado a n sub 1 y multiplicado por q más p por elevado de t elevado a n sub 2. Por tanto, sería q más p por elevado de t elevado a n sub 1 más n sub 2, que es la función característica de una variable binomial. Ya sabemos que la función característica caracteriza las variables aleatorias. Es decir, que la suma sería también una variable binomial, pero ahora n sub 1 más n sub 2 y del mismo parámetro p. Es decir, esta es la propiedad reproductiva. Es decir, que si sumamos variables aleatorias binomiales independientes, que tengan el mismo parámetro p, su suma es otra variable binomial del mismo parámetro p. Bien, vamos a ver otra distribución, la distribución de Poisson. Es una variable aleatoria x, tómalos, cualquier valor entero natural, por lo tanto, 0, 0, 1, 2, 3, etc., hasta el infinito, y entonces la probabilidad de que x sea igual a x, es igual a e elevado a menos lambda por lambda elevado a x partido por x factorial. Y siendo lambda un parámetro que es siempre mayor que 0. Esta sería la función de probabilidad. Bueno, la función de distribución, pues es simplemente, o sea, f de x sería la suma desde k igual a 0 hasta x, de e elevado a menos lambda por lambda elevado a k partido por k factorial. Bien, podemos... Podemos apreciar una característica de la distribución de Poisson, y es que la mayor parte de la masa de probabilidad se concentra para valores no mayores que 2 lambda. Por ejemplo, si lambda vale 2, pues f de 4, o sea, el valor de la función de distribución, para x igual a 4, calculamos y aparece un valor que es 0,9473. Una probabilidad ya es más del 94%, ¿no? Si, por ejemplo, si lambda es igual a 3, pues f de 6, siempre el f de 2 lambda más f de 6, pues sería 0,9665. Y dentro de 2, si lambda es igual a 4, estamos aumentando, el f de 8 sería 0,9787, etcétera, ¿no? Por tanto, es una variable de teoría que se conoce como la distribución de los sucesos raros. Es decir, que es conforme aumenta el valor de la e, pues la probabilidad ya cada vez es más pequeña, ¿no? La mayor parte de la probabilidad se acumula para valores pequeños de x. Bien, veamos la función característica, pues f de t sería la esperanza de elevado a y de xi, y, bueno, pues escribimos, o sea, que sería el sumatorio desde x igual a 0 hasta infinito de elevado a y de x por e elevado a menos lambda por lambda elevado a x partido por x factorial, sacamos el e elevado a menos lambda factor común, esto no depende de x, y multiplicamos el e elevado a y de x por el lambda elevado a x, le ponemos un único exponente, o sea, sería lambda por elevado a y de e elevado a x y partido por x factorial. Bueno, y este desarrollo es el desarrollo en serio de la función e elevado a lambda por elevado a y de t. Por tanto, esto sería e elevado a menos lambda por e elevado a lambda por e elevado a y de t. Y escribimos una única exponencial sacando el lambda factor común, porque sería e elevado a lambda, por e elevado a y de t menos 1. Y en cuanto a los momentos, bueno, los vamos a obtener precisamente de la función característica, ya que la hemos obtenido. Entonces derivamos la función característica, prima de t, y, bueno, aquí tenemos la misma función por la derivada del exponente, que sería lambda por elevado, o sea, lambda por i por e elevado a t. Si hacemos que t valga 0, o sea, phi prima de 0, nos quedaría lambda por i, y, por tanto, el valor esperado de xi sería phi prima de 0 partido por i, que nos queda lambda. Bueno, análogamente, el momento del segundo orden lo vamos a obtener de la segunda derivada de la función característica, phi segunda de t, que sería lambda por i cuadrado por elevado a y de t por e elevado a lambda por e elevado a y de t menos 1. Más, bueno, y luego tendríamos, lo estamos llevando como producto, ¿no? Luego sería, el lambda por i por e elevado a y de t por la derivada de la exponencial, y, bueno, ahí nos quedaría esto, ¿no? Lambda cuadrado por i cuadrado por e elevado a 2i t por e elevado a lambda por e elevado a y de t menos 1. Sustituimos la t por el 0 y nos queda lambda por i cuadrado más lambda cuadrado por i cuadrado y el valor esperado de xi cuadrado sería esta phi segunda de 0 dividida por i cuadrado que nos queda lambda más lambda cuadrado. Por lo tanto, la varianza de... La variable aleatoria sería lambda más lambda cuadrado menos la esperanza de xi, que era lambda elevada al cuadrado, por lo tanto nos queda lambda también. Bien, la distribución... Bueno, una variable aleatoria binomial, si n es suficientemente grande y p es pequeño, puede aproximarse por una variable aleatoria de Poisson. Tiende a ser una variable aleatoria. Es decir, consideremos entonces que xi sea una binomial de np. Supongamos que n es grande y que p es pequeño y llamemos np pondremos igual a lambda de manera que tendríamos que el límite de la probabilidad de que xi sea igual a x vamos a poner la fórmula de la probabilidad binomial sería el límite cuando n tiene infinito de n sobre x por p elevado a x por 1. P elevado a n menos x que es la probabilidad binomial. Bueno, desarrollamos el número combinatorio el n sobre x que sería n factorial partido por x factorial y por la diferencia factorial. El p lo vamos a sustituir por lambda partido por n que es el cambio que hemos hecho. Entonces ponemos lambda partido por n elevado a x. El 1 menos p ponemos 1 partido por n elevado a... Bueno, pues lo que es n menos x separamos 1 menos lambda partido por n elevado a n y 1 menos lambda partido por n elevado a menos x. Bueno, de esta expresión tendríamos el lambda elevado a x aparece en el numerador y el x factorial aparece en el denominador y puesto que son expresiones que no contienen la n los podemos sacar factor común podemos sacarlos bueno, antes del límite y entonces nos queda el límite de n factorial bueno, partido por n menos x factorial que lo vamos a simplificar es decir, vamos a poner n por n menos 1 por n menos letra hasta n menos x más 1 y el resto ya sería n menos x factorial que lo simplificamos con el denominador y partido por n elevado a x que sería el que hay en el denominador aquí del lambda partido por n elevado a x y luego los otros términos 1 menos lambda partido por n elevado a x y 1 menos lambda partido por n elevado a o sea, a n, perdón y 1 menos lambda partido por n elevado a menos x y entonces cuando n tiene infinito bueno, este primer fracción sería un polinomio un polinomio de grado x en n partido por n elevado a x puesto que el polinomio del numerador el término de mayor grado es n elevado a x también el límite sería 1 el segundo factor que es el 1 menos lambda partido por n elevado a n cuando n tiende a infinito es e elevado a menos lambda y el tercer factor que es 1 menos lambda partido por n elevado a menos x cuando n tiende a infinito es igual a 1 tiende a 1 por tanto, lo que nos queda aquí es el coeficiente que teníamos antes el lambda elevado a x partido por x factorial por e elevado a menos lambda claro, esta es la función de probabilidad de la distribución de Poisson bien, se suele considerar una buena aproximación o sea, utilizar la distribución de Poisson para calcular probabilidades binomiales siempre que p sea menor o igual que 0,1 y n p sea menor que 5 por ejemplo vamos a ver un ejemplo en una rotonda se produce un accidente por cada 500 vehículos entonces, para el próximo fin de semana se esperan 2000 vehículos bueno, ¿cuál es la probabilidad de que haya 5 accidentes? bien, pues evidentemente se trata de una x y o sea, el número la variable x y el número de accidentes este fin de semana es una binomial y bueno este fin de semana pues lo que van a pasar 2000 vehículos bueno, pues una binomial e 2000 n vale 2000 y la probabilidad de accidente que sería 1 por 500 claro aquí puesto que bueno, pues esto que n es muy grande y p es bastante pequeño vamos a poder aproximar esta variable binomial por una variable de Poisson que sería aproximadamente una variable de Poisson de parámetro np es decir 2000 partido por 500 es 4 por tanto la probabilidad de que el número de accidentes este fin de semana sea igual a 5 pues sería utilizaremos la de Poisson y por tanto sería elevado a menos 4 elevado a menos lambda por lambda elevado a 5 partido por 5 factorial o sea elevado a menos 4 por 4 2 elevado a menos 5 por 5 por 5 factorial que o sea entre 0,15 y 60 bien y también hay una propiedad la propiedad reproductiva que también cumple la variable de Poisson o sea supongamos que tenemos n variables de Poisson independientes i sub j j igual a 1 hasta n con parámetros respectivos lambda sub j y llamemos eta a su suma entonces la función de característica de esta variable eta sería el producto de las funciones características de las variables sin sub j y por tanto tenemos el producto de e elevado a lambda sub j por e elevado a i t menos 1 desde j igual a 1 hasta n y por tanto sería e elevado a e elevado a i t menos 1 factor común de la suma desde j igual a 1 hasta n de lambda sub j que es la función característica de una variable de Poisson de parámetro lambda igual a la suma de j igual a 1 hasta n de lambda sub j bien también hay una propiedad que es la siguiente si tenemos dos variables sin sub 1 y sin sub 2 que son independientes y son de Poisson de parámetros lambda sub 1 y lambda sub 2 entonces la variable aleatoria condicionada sin sub 1 condicionado por la suma sin sub 1 más sin sub 2 es binomial vamos a comprobarlo bien pues aquí tenemos que la probabilidad de que sin sub 1 sea igual a x condicionada porque la suma más sin sub 2 es igual a y vamos a hallar la función de probabilidad de esta variable condicionada bueno pues sería por definición de probabilidad condicionada la probabilidad de ambos sucesos simultáneamente o sea la probabilidad de que sin sub 1 sea x y sin sub 2 sea y menos x pues claro sin sub 1 más sin sub 2 vale y pues lo que sin sub 1 es x tendríamos la probabilidad de más sin sub 2 igual a y bueno puesto que son variables aleatorias pues son independientes en el primer numerador pues tendríamos e elevado a lambda sub 1 por lambda sub 1 elevado a x partido por x factorial y multiplicado por e elevado a menos lambda sub 2 por lambda sub 1 partido por y menos x factorial y en el denominador puesto que la suma de variables de Poisson también lo será en la reproductiva pues tendríamos la función de probabilidad que sería e elevado a menos lambda sub 1 más lambda sub 2 por lambda sub 1 más lambda sub 2 elevado a y partido por y factorial bueno pues esta expresión la podemos simplificar nos quedaría esto de aquí es decir que los exponenciales las es desaparecen y nos queda esta expresión que bueno el y factorial partido por x factorial y por y menos x factorial es y sobre x es el número combinatorio y después tenemos las dos potencias estas de aquí y claro esta fórmula es la una probabilidad binomial es una probabilidad binomial de bueno y o sea es b de y y del parámetro lambda sub 1 partido por lambda sub 1 más lambda sub 2 bien otro modelo la variable de victoria discreta sería distribución geométrica que es es la siguiente llamemos a cierto a un determinado suceso de un experimento aleatorio cuya probabilidad sea p y a con barra pues sería el suceso contrario que llamaremos fallo para que se verificará lógicamente que la probabilidad del suceso contrario sería 1 menos p que llamar q supóngase que repetimos varias veces este experimento entonces si repetimos pues unas veces aparecerá a otras veces aparecerá a con barra bueno entonces se denomina distribución geométrica g de parámetro p la de la variable de victoria sí igual al número de fallos antes de que aparezca un acierto entonces bueno por ejemplo si nosotros realizamos sucesivamente el experimento pues supongamos que nos salen x fallos a con barra etc x veces y a continuación sale ya un acierto ese sería el suro ocurrir sí y x veces es decir x fallos antes del primer acierto bueno vamos a ver entonces cuál es su función de probabilidad la probabilidad de que sí sea igual a x es decir es cada una o sea la probabilidad de que haya un fallo puesto que experimentos los realizamos de forma independiente claro pues sería q elevado a x por p que es la probabilidad del éxito el último de la serie que tenemos aquí escrita y eso pues para x igual a cero uno dos tres etc hasta el infinito bien cuál sería la función de probabilidad igual que x bueno pues sustituyendo para x igual a cero uno dos etc bueno para sí igual a cero uno dos hasta x tanto sería q elevado a cero por p q elevado a uno por p etc sacamos p factor común nos cedería esto de aquí y simplemente sumamos q elevado a cero más q elevado a uno etc que es la suma de términos y esto pues el uno menos eh uno menos q que es igual a p lo simplificamos con el t y nos queda uno menos q por e elevado a x más u esta sería la función que distribuimos y la función característica en esperanza de elevado a it x y pues sería el sumatorio de desde x igual a cero hasta infinito de elevado a it x y por q elevado a x y por p aquí sacamos el t factor común y nos ponemos una única potencia exponente x ¿no? que sería el q por e elevado a it es elevado a x y eh bueno esta también es una serie geométrica ¿no? es una serie geométrica el primer término sería uno para x igual a cero y la razón que es q por e elevado a it por tanto la fórmula sería bueno la suma sería uno partido por uno menos q por e elevado a it y multiplicado por la p que tenemos el factor común entonces esta sería la función característica para hallar los momentos pues vamos a utilizar la función característica entonces derivamos eh pi prima de t bueno pues se obtiene esto de aquí luego el valor esperado es i que sería pi prima de cero partido por i nos quedaría p partido por q hacemos la segunda derivada bueno aquí la tenemos ¿no? haciendo con paciencia derivada de la fracción de la primera derivada eh bueno simplificamos y sustituimos la t por cero y nos queda esta expresión de aquí que es igual a segunda de cero partido por i cuadrado luego nos quedaría p q más dos q cuadrado partido por uno menos un cuadrado de aquí vamos a obtener la varianza que es la esperanza de si cuadrado menos la esperanza de si elevada al cuadrado eh simplificando nos queda q partido por p cuadrado bien esta variable aleatoria la variable aleatoria geométrica no presenta la propiedad reproductiva pero sí que tiene una propiedad que es la que se llama propiedad de falta de memoria y que consiste vamos en que la probabilidad de que la variable aleatoria si sea mayor o igual que a b a condición de que si sea mayor o igual que a es decir que cuál es la probabilidad de que el número de fallos sea mayor o igual que a b sabiendo que es mayor o igual que a pues es lo mismo que la probabilidad de que el número de fallos sea mayor o igual que b esto es lo que se llama falta de memoria no se puede demostrar esta propiedad bien otro modelo que tenemos es la distribución binomial negativa o de pascal bueno pues con la misma terminología que la distribución geométrica aquí es decir que hacemos un experimento con un resultado a cierto y o contrario el fallo entonces la variable binomial negativa es una variable sí es el número de fallos antes de que aparezcan r aciertos un poco generalizar la geométrica bueno aquí por ejemplo pues tendríamos una de supongamos que tenemos uno de los resultados donde aparecen aciertos y fallos supongamos que tenemos aquí x fallos y r menos 1 aciertos y el último es un acierto por tanto esta sería uno de los resultados donde han aparecido x fallos antes de que aparezcan r aciertos es decir que antes de que aparezcan r aciertos habrán aparecido r menos 1 aciertos y el siguiente la siguiente vez que hagamos el experimento será un acierto claro bien entonces vamos a calcular cuál sería la probabilidad de que el número de fallos sea x antes de que aparezcan r aciertos bueno pues simplemente la probabilidad de uno de los resultados uno de los resultados puesto que tengo x fallos pues sería q elevado a x y puesto que tengo r aciertos sería el p elevado a r ahora bien de cuántas formas cuántas combinaciones tenemos de encontrar x fallos y r menos 1 aciertos el último es acierto por tanto eso lo afijo por tanto nos tenemos que fijar en dos primeros resultados de la combinación que son x fallos y r menos 1 aciertos bueno pues ahí tenemos o sea los dos las combinaciones de colocar los x fallos en esta combinación que es menos 1 x más r menos 1 r más x menos 1 y sobre x o sea las combinaciones en las combinaciones de r más x menos 1 sobre x esas serían todas las posibles combinaciones de tener x fallos antes de r aciertos y eso multiplicado por la probabilidad de que la combinación de r más x menos 1 sobre x pues si desarrollamos sería r más x menos 1 por r más x menos 2 etc hasta llegar a r y partido por x factorial tenemos x factores no bajando desde r más x menos 1 hasta r bien y aquí si cambiamos el signo de todos estos x factores del numerador cambiamos el signo de todos los factores del numerador por tanto como hay x yo voy a poner aquí menos 1 elevado a x y como factor desde delante y después cambio el signo de todos los factores del numerador y los escribo en los del inverso o sea que el último que sea r lo pongo delante menos r sería menos r menos 1 etc hasta el último que es el primero que tengo que tenemos puesto aquí sería menos r menos x más 1 están todos cambiados de signo y partido por x factorial entonces bueno esto sería menos 1 elevado a x y aquí claro observemos que tenemos menos r sería el primer factor luego menos r menos 1 es decir que vamos disminuyendo vamos disminuyendo y tengo x factores y partido por x factorial es decir que cumple esta fracción es la es un número combinatorio puesto que aunque sea negativo el primer factor el menos r pero bueno tiene la fórmula la fórmula de los números combinatorios o sea que sería menos r sobre x y de aquí le viene el nombre bueno por lo tanto bueno por lo tanto lo que teníamos antes ¿no? la probabilidad en vez de poner r más x menos 1 sobre x pues vamos a poner menos 1 elevado a x por menos r sobre x y después pues ya la probabilidad q elevado a x por p elevado a r menos 1 elevado a x lo ponemos con la q que también está elevado a x luego sería menos q elevado a x y nos queda finalmente esa fórmula de la probabilidad de la distribución binomial binomial negativa y bueno precisamente el nombre le viene de que uno menos q en la expresión uno menos q elevado a menos r si lo desarrollamos con la fórmula de Maclaurin por ejemplo la desarrollamos en serie pues nos aparece precisamente el sumatorio desde x igual a 0 hasta infinito de menos r sobre x por menos q elevado a x bien bueno la función de distribución pues sería 0 si x es menor que 0 y a partir de ahí pues ya los sumatorios de estas probabilidades y la función característica sería el valor esperado de elevado a y pues sería el sumatorio de x igual a 0 hasta infinito de elevado a y tx por menos r sobre x por menos q elevado a x por p elevado a r y esto es igual nada esto es igual a p elevado a r pero vamos a sacar factor común puesto que no contiene la x el sumatorio desde x igual a 0 hasta infinito de menos r sobre x por menos q por e elevado a y t elevado a x ponemos una única potencia del exponente x y este sumatorio bueno pues se trata de la suma de las bueno es decir que sería el desarrollo precisamente esto sería el desarrollo de 1 partido por 1 menos q por e elevado a r por lo tanto esto sería p elevado a r partido por 1 menos q por e elevado a r entonces de aquí de esta expresión vamos a obtener los momentos del por derivación derivamos y de t entonces tenemos la primera derivada a c la derivada del cociente sustituimos la t por el 0 nos queda esta expresión de aquí q por r por q partido por p por lo tanto la esperanza de xi sería que el primer acero partido por i que sería r q partido por p bueno hacemos la segunda derivada con paciencia derivamos la primera derivamos simplificamos aquí y sustituimos la t por 0 y nos queda esta expresión y bueno un poco simplificada y después el valor por tanto la esperanza de xi cuadrado sería fi segundo de acero partido por i cuadrado pues nos quedaría esta expresión de aquí y entonces la varianza de x esperanza de xi cuadrado al menos la esperanza de xi al cuadrado colocamos lo simplificamos y nos queda r por q partido por p al cuadrado bueno aquí sí que se cumple la propiedad reproductiva de que para j igual a 1 o 2 hasta n etc supongamos que tenemos si sub j variables aleatorias independientes r sub j p y entonces sea eta la suma de estas variables aleatorias entonces fi sub eta de t que sería el producto de las funciones características de cada una de las si sub j y que era p elevado a r sub j partido por 1 menos q por e elevado al sumatorio de la r sub j que es la función característica de una binomial negativa suma o sea bn del sumatorio de la r sub j por coma p bien otro modelo la distribución hiper geométrica de la distribución de variables que es el resultado de la distribución de las variables aleatorias de la r sub j que es el resultado de la distribución de la y la distribución de r sub j por e elevado j por e elevado la distribución de r sub j por e elevado distribución de r sub j en la distribución de r sub j es el resultado de la r sub j y este resultado es el obtener de esas n sub 1 x, bolas blancas serían n sub 1 sobre x y el resto n menos n sub 1 que o sea, nos quedarían n menos n sub 1 que son las bolas negras que hay y de ahí hemos de tomar n menos x bolas negras, por lo tanto todas las combinaciones de bolas negras serían n mayúscula menos n mayúscula sub 1 partido por n sobre sobre n menos x así que pues este producto serían los casos favorables de obtener x bolas blancas así pues la probabilidad pues sería más que casos favorables partido por casos posibles entonces la función de distribución bueno, pues sería 0 si x es más pequeña que el máximo entre 0 y n menos n menos n sub 1 o bien sería el sumatorio desde k igual a 0 hasta x de bueno, n sub 1 sobre k por n menos n sub 1 partido, o sea, sobre n menos k partido por n sobre n y sería 1 si x es ya mayor que el mínimo de n o de n sub 1 bueno, pero aquí se puede demostrar, se puede calcular se demuestra que el valor esperado es np y que la varianza de xi sería npq por n mayúscula menos n partido por n menos bien, vamos a ver un ejemplo eh, en un libro de cien problemas diez tienen errores elegimos aleatoriamente diez problemas ¿cuál es la probabilidad de encontrar dos con errores? bueno, pues aquí tenemos un ejemplo o sea, si se trata de una distribución los parámetros serían, o sea, h sería cien diez y 0,1 que sería la probabilidad de error, o sea, diez son los que vamos a elegir eh, elegimos diez problemas o sea, esto sería la n minúscula cien que sería la n mayúscula y 0,1 que sería la probabilidad eh entonces simplemente se trata de aplicar la fórmula la probabilidad de que xi sea igual a dos pues sería diez sobre dos eh, que es la n sub 1 que es la n sub 1 que es la n mayúscula sub 1 que sería el número de problemas que tenemos aquí, ¿vale? los problemas que tienen errores, ¿no? sobre dos por noventa sobre ocho y partido por cien sobre diez, bueno pues lo calculamos y sería 0,2015 bien, vamos a ver un último ejemplo una última variable aleatoria que sería la distribución multinomial bueno, en una distribución binomial bnp hay dos clases de sucesos son el éxito con probabilidad p y el fracaso con probabilidad q ya sabemos, ¿no? entonces la probabilidad de r éxitos y n menos r fracasos pues bueno, ya conocemos la binomial, ¿no? entonces vamos a generalizar esta variable aleatoria a k clases de sucesos en vez de a dos que sería el éxito o el fracaso finalizamos a k clases de sucesos con probabilidades p sub 1, p sub 2, p sub k entonces diremos que una variable k dimensional sería si sub 1, si sub 2 si sub k, etcétera o sea es multidimensional multinomial, perdón es multinomial en n o sea los parámetros serían n minúscula en p sub 1, p sub 2, etcétera p sub k, si su función de probabilidad es la siguiente probabilidad de que si sub 1 sea igual a x sub 1, si sub 2 sea igual a x sub 2, etcétera si sub k sea igual a x sub k sería n factorial partido por x sub 1 factorial, x sub 2 factorial, etcétera x sub k factorial por p sub 1 elevado a sub 1 por p sub 2 x sub 1, perdón por p sub 2 elevado a x sub 2, etcétera por p sub k elevado a x sub k se trata de una generalización de la fórmula de la binomia por ejemplo los alumnos de una tutoria virtual se reparten del siguiente modo el 35% son de alicante el 25% son de castellón y el 40% son de valencia un día se conectan 12 alumnos ¿cuál es la probabilidad de que 4 sean de alicante, 2 sean de castellón y 6 sean de valencia? bueno, pues llamamos si sub 1, si sub 2 y sub 3 al número de alumnos conectados de alicante, castellón y valencia respectivamente entonces simplemente vamos a aplicar la fórmula en una multinomial la probabilidad de que si sub 1 sea igual a 4 si sub 2 sea igual a 2 y si sub 3 sea igual a 6 pues sería 12 factorial que son los alumnos que se conectan partido por 4 factorial, 2 factorial, 6 factorial por las probabilidades ahí a 0,35 elevado a 4 por 0,25 elevado a 2 y por 0,40 elevado a 6 eso es el resultado bueno, cada variable por separado se distribuirá como una binomial b, n, p sub j y también se demuestra la covarianza de la variable bidimensional si sub h si sub j es menos n, p sub h, p sub j por lo tanto el coeficiente de correlación lineal entre dos variables elegimos dos variables de esta multinomial si sub h, si sub j pues sería menos n, p sub h p sub j partido por la varianza o sea el producto de las desviaciones típicas que sería la igualdad de n, p sub h 1 menos p sub h por n, p sub j 1 menos p sub j podemos simplificar la n y nos quedaría esta expresión aquí lo dejamos a continuación haremos una serie de ejercicios relativos a este tema extraídos de los exámenes