Matemàtiques 2n Batxillerat
Distribució de les alçades d'una població:
1. Mida de la mostra (N): Augmenta els individus per a tenir dades més representatives.
2. Amplada de l'interval (w): Fes més estretes les classes per afinar el detall i evitar la pèrdua d'informació.
Densitat de probabilitat
La forma de la campana depèn de dos valors:
Paràmetres del lot
$X \sim N(\mu, \sigma)$
La probabilitat es defineix com l'àrea sota la corba de densitat.
Prem la fletxa DRETA (→) per descobrir les propietats.
Com utilitzar la Taula Estàndard
Hi ha infinites distribucions normals, però només tenim una taula de probabilitats: la de la Normal Estàndard $N(0,1)$.
Per poder utilitzar-la amb qualsevol distribució $N(\mu, \sigma)$, hem de tipificar la variable.
Prem la fletxa DRETA (→) per descobrir els passos.
La despesa d'un turista a Barcelona segueix una distribució Normal amb $\mu = 180€$ i $\sigma = 30€$.
Prem la fletxa DRETA (→) per començar.
Per poder fer servir la taula $N(0,1)$, transformem la variable:
Tipificació: $Z = (X - 180) / 30$
$$P(X < 200) = P\left(Z < \frac{200 - 180}{30}\right)$$
$$= P(Z < 0.67)$$
Busquem $z=0.67$ directament a la taula:
$$P(X > 220) = P\left(Z > \frac{220 - 180}{30}\right)$$
$$= P(Z > 1.33)$$
Apliquem el complementari:
$$1 - P(Z \le 1.33) = 1 - 0.9082$$
$$P(180 < X < 210) $$
$$= P\left(0 < Z < \frac{210-180}{30}\right)$$
$$P(0 < Z < 1) = P(Z < 1) - P(Z < 0)$$
$$P(X < 150) = P\left(Z < \frac{150 - 180}{30}\right) $$
$$ = P(Z < -1)$$
Per simetria, l'àrea a l'esquerra d'un negatiu és igual a l'àrea a la dreta del positiu:
$$P(Z < -1) = P(Z > 1) $$
$$=1 - P(Z \le 1)$$
1. La Població
És el conjunt total d'individus que volem estudiar (ex: tots els cotxes del país).
2. La Mostra
Com que no podem mesurar a tothom, agafem un subgrup representatiu i a l'atzar.
3. L'Estadística Inferencial
El nostre objectiu és fer servir les dades de la mostra ($\bar{x}, s$) per deduir els valors de la població ($\mu, \sigma$).
Prem el botó per veure com cada mostra dóna una $\bar{x}$ lleugerament diferent!
1. L'estimació de paràmetres
A la vida real no coneixem la mitjana ($\mu$) ni la desviació típica ($\sigma$) de la població. Cal estimar-les mitjançant mostres:
Mitjana mostral:
$\bar{x} = \frac{\sum x_i}{n}$
Desviació típica mostral:
$s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}}$
Aquests valors són la nostra única eina per conèixer la població.
2. El Dilema
La mitjana que hem calculat, és realment la mitjana real? Fins a quin punt hi podem confiar?
La mitjana mostral és una variable aleatòria: si canviem la mostra (agafant uns altres 10 individus), el valor de $\bar{x}$ serà diferent.
Necessitem saber com es distribueixen aquestes mitjanes.
3. Teorema Central del Límit
Encara que cada mostra doni una $\bar{x}$ diferent, el conjunt de totes les mitjanes segueix una llei sorprenent:
Això ens diu que la mitjana de les mostres estarà centrada en la real, però amb una dispersió molt menor ($\sigma/\sqrt{n}$).
La gran pregunta
Agafem una mostra i calculem:
$\bar{x} = 140$
La resposta
Gairebé cap seguretat.
Com vam veure, la probabilitat d'encertar un punt exacte en una variable contínua és sempre 0.
1. La Confiança i el Risc ($\alpha$)
Definim primer el Nivell de Confiança (ex. 95%), que és l'àrea central.
El risc d'equivocar-nos s'anomena Nivell de Significació ($\alpha$):
2. La simetria ($\alpha/2$)
Ens podem equivocar per excés (dreta) o per defecte (esquerra).
Repartim el risc ($\alpha$) a les dues cues de la campana:
$\frac{\alpha}{2} = \frac{0.05}{2}$
$= 0.025 \text{ (2.5%)}$
Això deixa un "marge d'error" idèntic a cada costat.
3. El valor crític ($z_{\alpha/2}$)
Per trobar la frontera a la taula, sumem l'àrea central i la cua esquerra:
A la taula, $0.9750 \implies z = 1.96$
Aquest "multiplicador" determinarà l'amplada exacta del nostre interval.
4. L'Interval de Confiança
Ajuntant la nostra mitjana mostral ($\bar{x}$) i el marge d'error, la "xarxa" final es construeix així:
Els valors clàssics del multiplicador de confiança són:
| Confiança | Risc ($\alpha$) | $z_{\alpha/2}$ |
|---|---|---|
| 90% | 0.10 | 1.645 |
| 95% | 0.05 | 1.96 |
| 99% | 0.01 | 2.575 |
Fins ara hem assumit que coneixíem la $\sigma$ de la població, però a la realitat gairebé mai és així.
Tenim 3 escenaris possibles.
1. Població Normal i $\sigma$ coneguda
Estem a l'escenari ideal! La distribució de les mitjanes també serà exactament normal. Podem aplicar la fórmula per a qualsevol mida de mostra ($n$).
2. Població NO Normal i $\sigma$ coneguda
Què passa si la població no és normal? El Teorema Central del Límit ens salva... però només si la mostra és gran ($n \ge 30$). Farem servir la mateixa fórmula.
3. Realitat ($\sigma$ desconeguda)
A la vida real gairebé mai tenim la $\sigma$. L'hem d'estimar fent servir la desviació de la mostra ($s$). Per fer aquest canvi d'incògnita, la regla de $n \ge 30$ és obligatòria.
Taula de decisions (Resum definitiu):
1. Recollida de dades
Llegim l'enunciat i identifiquem les variables de la mostra i de la població:
L'error estàndard serà:
$\frac{\sigma}{\sqrt{n}} = \frac{30}{\sqrt{49}} = \frac{30}{7} \approx 4.28 \text{ km}$
2. Estructura de l'Interval
Sabem que la mitjana real $\mu$ estarà al voltant de 140, amb un marge d'error $E$:
Aquest error es calcula amb el valor crític de la taula ($z_{\alpha/2}$):
3. Nivell de Confiança: 95%
Per un 95%, $1-\alpha = 0.95$. Mirant la taula normal, $z_{\alpha/2} = 1.96$.
Calculem l'error:
4. Nivell de Confiança: 99%
Volem estar més segurs. Per a 99%, $z_{\alpha/2} = 2.575$.
El marge d'error creix:
Més seguretat implica un interval més ample (menys precisió).
Fins ara mesuràvem variables contínues (pes, alçada...).
Ara passem a l'estadística de comptar èxits.
1. L'Experiment de Bernoulli
És l'experiment aleatori més senzill que existeix: aquell on només hi ha dos resultats possibles i excloents.
2. L'exemple i la mostra ($n$)
En unes eleccions, aturar a 1 persona per preguntar si ha votat la candidata és un exp. de Bernoulli (Ex: Èxit $\implies p=0.4$).
3. La gran pregunta
Si $x$ és el nombre d'èxits...
Volem calcular la probabilitat d'obtenir exactament $k$ èxits en $n$ experiments.
$P(X = k) = ?$
Anem a construir la fórmula pas a pas.
1. Quantes combinacions possibles hi ha?
Els $k$ èxits poden aparèixer en qualsevol ordre al llarg dels $n$ experiments. Per comptar totes les maneres d'escollir $k$ posicions d'un total de $n$ (sense que n'importi l'ordre), fem servir el nombre combinatori:
2. La probabilitat de cada camí
A cada combinació concreta, l'èxit ($p$) es repeteix $k$ vegades, i el fracàs ($q$) es repeteix la resta de vegades ($n - k$). Com que són experiments independents, les probabilitats es multipliquen:
3. La Fórmula Definitiva
Si multipliquem els camins possibles per la probabilitat de cadascun d'ells, obtenim la funció de probabilitat de la distribució Binomial.
Context del problema
El 10% dels telèfons d'un cert model s'espatllen durant el període de pgarantia. D'aquests, el 70% es pot reparar i, la resta, s'ha de canviar. Una empresa compra 20 telèfons mòbils d'aquest model. La probabilitat que un s'hagi de canviar és $p=0.1\cdot 0.3=0.03$ (i $q=0.97$).
$x \sim B(20 \, , \, 0.03)$
1. Cas puntual: $P(x=5)$
Quina probabilitat hi ha que s'hagin de canviar exactament 5 telèfons?
$P(x = 5) \approx 0.00015$
Nota: Com que la $p$ és molt petita, és molt difícil que n'hi hagi 5 de defectuosos.
2. Escenaris múltiples: $P(x=1 \text{ o } 2)$
Quina probabilitat hi ha que n'haguem de canviar un o dos?
$\approx 0.3364 + 0.0988 = \mathbf{0.4352}$
3. Més dificultat: "Com a mínim dos" ($x \ge 2$)
Calcular $P(x=2) + P(x=3) + \dots + P(x=20)$ és massa llarg. Fem servir el contrari:
$1 - (0.5438 + 0.3364) = \mathbf{0.1198}$
1. Naturalesa Discreta
La variable només pot prendre valors enters ($x = 0, 1, 2 \dots$).
Si preguntem a 20 persones, no en podem trobar "2,5" que votin un candidat. Per això el gràfic està fet de barres separades.
2. La Mitjana o Esperança ($\mu$)
És el "centre" del gràfic. Indica quants èxits esperem aconseguir de mitjana.
3. La Desviació Típica ($\sigma$)
Mesura l'amplada i la dispersió de les probabilitats respecte al valor central.
1. La incertesa d'una sola persona ($p \cdot q$)
Matemàticament, la mesura d'incertesa (variància) d'un experiment de Bernoulli és la multiplicació de $p$ i $q$. Per què?
2. Variància de la suma
A l'estadística hi ha una regla inquebrantable: si sumem experiments independents, les seves variàncies se sumen.
Si enquestem a $n$ persones, la variància total de la mostra serà sumar $p \cdot q$ un total de $n$ vegades:
3. Retorn a les unitats reals ($\sigma$)
Com que la variància està elevada al quadrat (ens donaria "vots al quadrat" o "persones al quadrat"), hem de fer l'arrel quadrada per trobar la desviació típica i parlar en unitats normals.
1. El límit de la calculadora
Quan $n$ és molt gran, els càlculs es fan inviables perquè els nombres es fan enormes ($\binom{1000}{300}$ no es pot fer).
2. Aproximació per una normal
Comprova-ho al gràfic de la dreta: a mesura que puges la $n$, els rectangles es fusionen i dibuixen una campana de Gauss gairebé perfecta.
3. La Regla d'Aproximació
Si es compleix que $n \ge 30$, podem abandonar l'estadística discreta i utilitzar directament la distribució Normal:
1. Què és la proporció mostral?
En lloc de comptar quants "SÍ" tenim ($x$), calculem quin percentatge representen sobre el total ($n$):
2. Aproximació a la Normal
Si $n \ge 30$, la proporció mostral també segueix una distribució Normal, però ara centrada en la probabilitat real $p$.
3. Efecte de la mida ($n$)
Fixa't en el gràfic: com més gran és la mostra ($n$), més petita és la desviació típica.
Això significa que, amb mostres grans, la proporció que mesurem serà molt més precisa i propera a la realitat.
L'Enunciat
En unes eleccions a l'alcaldia d'un municipi un candidat va obtenir el 54% dels vots.
Trobeu la probabilitat que, en una mostra de 200 votants escollits a l'atzar, obtingués majoria absoluta.
1. Comprovació i Model Normal
Com que $n = 200 \ge 30$, podem utilitzar la distribució Normal per a la proporció mostral $\hat{p}$:
$\hat{p} \sim N(0.54 \, , \, 0.035)$
2. Plantejament i Tipificació
Per obtenir majoria absoluta, la proporció de la mostra ha de superar el 50% ($\hat{p} > 0.5$). Tipifiquem a $Z$:
3. Càlcul Final
Per buscar un valor de "més gran que un negatiu", fem servir la simetria de la campana de Gauss:
La probabilitat d'obtenir majoria absoluta és del 87,29%.
1. Aproximació per la normal
Acabem de veure que, si la mostra és prou gran ($n \ge 30$), la proporció mostral $\hat{p}$ es comporta com una distribució Normal:
2. Aplicar el que ja sabem
Com que és una Normal, podem aplicar exactament la mateixa lògica que fèiem servir per a les mitjanes.
Amb un nivell de confiança $1 - \alpha$, sabem que el valor real de la població ($p$) caurà a una certa distància (marge d'error) de la nostra $\hat{p}$, marcada pel valor crític $z_{\alpha/2}$.
3. La Fórmula de l'Interval
Substituint la $\sigma$ per la fórmula de la desviació típica de la proporció, obtenim l'interval on es troba la proporció poblacional $p$:
L'Enunciat
Per estudiar el percentatge de peces defectuoses en una cadena de producció, s'analitza una mostra aleatòria de 100 peces i s'observa que dues són defectuoses.
Calcula un interval de confiança del 95% per a la proporció poblacional. (Feu servir que $P(-1.96 < Z < 1.96) = 0.95$).
1. Preparació de les Dades
Primer, calculem la proporció de la mostra ($\hat{p}$) i el seu contrari ($\hat{q}$):
I identifiquem el valor crític per a una confiança del 95%:
2. Aplicació de la Fórmula
Substituïm els valors a l'estructura de l'Interval de Confiança:
3. Resultat i Interpretació
Fent els càlculs obtenim matemàticament l'interval $[-0.0074 \, , \, 0.0474]$.
⚠️ Atenció: Una proporció (un percentatge) mai pot ser negativa! Per tant, hem de truncar el límit inferior a zero.
El percentatge de peces defectuoses de tota la fàbrica es troba entre el 0% i el 4,74%.
Estudi de Mitjanes
1. Variable de la població:
2. Distribució de la mitjana ($\bar{x}$):
3. Interval de Confiança:
Estudi de Proporcions
1. Variable de la població:
2. Distribució de la proporció ($\hat{p}$):
3. Interval de Confiança: