Teoria 6 - Estymacja przedzialowa, statystyka i rachunek prawdopodobieństwa
[ Pobierz całość w formacie PDF ]
TeoriaVI
In»ynieriaBiomedycznaIrok,semestrletni2009/2010
28/29kwietnia2010r.
W biologii i medycynie wszystkie mierzone zjawiska s¡ niepewne, tzn. ka»dy poje-
dynczy pomiar czy obserwacja, jest zale»ny zarówno od kontrolowanych czynników, jak
równie» wielu innych, na które nie mamy wpływu i których nie mo»emy zmierzy¢. Dlatego
te» »adna pojedyncza obserwacja zjawisk biologicznych nie jest miarodajna, za± wszelkie
eksperymenty i pomiary musz¡ si¦ odnosi¢ do całej zbiorowo±ci. Aby móc mówi¢ o prak-
tycznym zastosowaniu wyników bada« naukowych i obserwacji klinicznych, konieczne
jest statystyczne opracowanie otrzymanych wyników. Statystyka daje bowiem mo»liwo±¢
precyzyjnego wnioskowania w oparciu o niepewne i obarczone bł¦dami dane.
Statystyka- zmienna losowa b¦d¡ca funkcj¡ wyników próby.
1Estymacjapunktowa
Estymacja punktowa polega na szacowaniu nieznanego parametru zbiorowo±ci poprzez
pewn¡ wielko±¢, obliczon¡ na podstawie wyników z próby (tzw. estymator). Estymatory
musz¡ spełnia¢ szereg wymaga«, z których najwa»niejsze to:
1. Estymatorefektywny, czyli o mo»liwie małym rozrzucie. Estymator b¦dzie efek-
tywny, gdy ró»ne próby dadz¡ mo»liwie zbli»one do siebie warto±ci oszacowania
nieznanego parametru zbiorowo±ci.
2. Estymatornieobci¡»ony- warto±¢ oczekiwana estymatora jest równa warto±ci
nieznanego parametru populacji. Czyli estymator nieobci¡»ony b¦dzie szacował
nieznany parametr zbiorowo±ci bez bł¦du systematycznego.
3. Estymatorzgodny- ma t¡ własno±¢, »e wi¦ksze liczebnie próby poprawiaj¡ do-
kładno±¢ szacunku.
Przykładowo wszystkie te wymagania spełnia nieobci¡»ony estymator wariancji, dany
poni»szym wzorem:
2
=
P
i=1
(x
i
x)
2
n1
(1)
Natomiast estymator odchylenia standardowego dany wzorem (2) b¦dzie ju» estyma-
torem obci¡»onym:
=
s
P
i=1
(x
i
x)
2
n1
(2)
1
Przy obliczaniu wariancji u»ytecznym mo»e si¦ okaza¢ stosowanie poni»szego prze-
kształcenia matematycznego:
X
(x
i
x)
2
=
X
x
2
i
(
P
x
i
)
2
n
=
X
x
2
i
nx
2
2
=
(3)
i=1
2Estymacjaprzedziałowaparametrów
2.1Ogólnyproblemestymacjiprzedziałowej
Estymacja przedziałowa polega na szacowaniu nieznanego parametru populacji poprzez
budowanie przedziału, który z zadanym z góry prawdopodobie«stwem, pokrywałby nie-
znan¡ warto±¢ parametru.
Przykładowo, gdyby±my chcieli oszacowa¢ ±rednie ci±nienie skurczowe krwi u m¦»czyzn
w wieku 30-40 lat zatrudnionych w przemy±le na stanowiskach robotniczych, mo-
»emy wybra¢ losowo grup¦ 31 m¦»czyzn, spełniaj¡cych podane warunki i prze-
prowadzi¢ na nich badanie. Aby wyci¡gn¡¢ wi¦cej dodatkowych wniosków poza
te uzyskane z estymacji punktowej, mo»emy np. dokładno±¢ szacunku okre±li¢
w ten sposób: z do±¢ du»ym, bo wynosz¡cym 95% prawdopodobie«stwem, prze-
dział1356mmHg pokrywa nieznan¡ warto±¢ ci±nienia skurczowego w naszej
grupie pracowników przemysłu.
Poszukiwany w zadaniu przedział estymacji jest nazywanyprzedziałemufno±ci,
za± prawdopodobie«stwo, z którym ten przedział ma pokrywa¢ nieznan¡ warto±¢ para-
metru okre±lany jest jakowspółczynnik(poziomu)ufno±ci. Współczynnik ufno±ci
podawany jest zwykle jako1 i przyjmuje najcz¦±ciej warto±ci 0.90, 0.95 i 0.99.
2.2Estymacjaprzedziałowa±redniej
red
ni
a x obliczona z próby jest zmienn¡ losow¡ - w ka»dej z prób wylosowanych z popu-
lacji x mo»e przyjmowa¢ troch¦ inne warto±ci. Warto±¢ oczekiwana tej zmiennej losowej
to nieznana ±rednia populacji generalnej:
E(x)=
(4)
Oznacza to, »e wszystkie ±rednie z prób grupuj¡ si¦ wokół rzeczywistej warto±ci ±red-
niej z populacji. Poniewa» wariancja ±redniej z próby n - elementowej wyra»a si¦ wzorem:
2
(x)=
2
n
(5)
to wiadomo, »e im wi¦ksza liczebno±¢ próby, tym warto±ci ±rednich z prób b¦d¡ si¦ gru-
powa¢ bli»ej warto±ci ±redniej z populacji generalnej.
Je»eli znamy rzeczywist¡ warto±¢ wariancji
2
w populacji generalnej, mo»emy wyko-
rzysta¢ własno±ci zmiennej losowej „±rednia z próby n-elementowej” do celów estymacji
przedziałowej. Mo»emy bowiem skorzysta¢ z faktu, »e zmienna losowa x ma rozkład
normalny ze ±redni¡ i wariancj¡
2
n
. A zatem zmienna u dana wzorem (6) ma standa-
ryzowany rozkład normalny.
u=
x
p
n
(6)
2
n
Niestety zazwyczaj
2
nie jest znane, dlatego te» stosuje si¦ zmienn¡ t okre±lon¡
wzorem (7):
t=
x
p
n
(7)
gdzie s jest oszacowaniem odchylenia standardowego, obliczonym na podstawie próby.
Statystyka t, wyznaczona na podstawie n-elementowej próby, ma rozkład t-Studenta
o n 1stopniach swobody. Realizacje zmiennej losowej o rozkładzie t z n1stopniami
swobody, b¦d¡, z prawdopodobie«stwem1 pojawia¢ si¦ w przedziale(
t
(n1)
;
t
(n1)
).
Warto±ci
t
(n1)
mo»na odczyta¢ z tablic statystycznych dla rozkładów t-Studenta.
Rysunek 1: Rozkład t-Studenta o n1stopniach swobody
Po krótkim przekształceniu matematycznym mo»emy wyznaczy¢ przedział ufno±ci (8)
dla nieznanej ±redniej populacji (z zało»onym prawdopodobie«stwem1):
x
t
(n1)
s
< < x+
t
(n1)
s
p
n
(8)
Powy»szy wzór jest słuszny dla populacji o rozkładzie normalnym i próby o niewiel-
kiej nawet liczebno±ci. Je»eli próba jest du»a (n > 100), to przedział ufno±ci mo»emy
wyznaczy¢ przy pomocy statystyki u (danej wzorem (6), ale z t¡ ró»nic¡, »e warto±¢
musimy zast¡pi¢ oszacowaniem odchylenia standardowego s z próby). Wówczas przedział
ufno±ci wyra»a si¦ nast¦puj¡co:
3
p
n
x
us
p
n
< < x+
us
p
n
(9)
Warto±¢
u dla danego współczynnika ufno±ci1 wyznacza si¦ z tablic standary-
zowanego rozkładu normalnego tak, aby spełniona była relacja:
Pf
u < u <
ug=1
(10)
Poni»ej zestawione s¡ w tabeli najcz¦±ciej u»ywane warto±ci
u.
Tablica 1: Warto±ci krytyczne
u rozkładu normalnego standaryzowanego
1
u
0,9 0,1 1,646
0,95 0,05 1,960
0,975 0,025 2,241
0,99 0,01 2,576
0,999 0,001 3,291
2.3Przedziałufno±cidlawariancji
Aby móc oszacowa¢ metod¡ przedziałow¡ wariancj¦ populacji, nale»y sprawdzi¢, czy s¡
podstawy do tego, aby uwa»a¢, »e populacja ma rozkład normalny. Zgodnie z teori¡,
estymatorem nieznanej wariancji
2
z populacji powinien by¢ nieobci¡»ony estymator
s
2
. Warto±¢ oczekiwana takiego estymatora jest równa warto±ci nieznanego parametru
zbiorowo±ci:
E(s
2
)=
2
(11)
natomiast wariancja s
2
dla n-elementowych prób pobranych z populacji o rozkładzie
normalnym wynosi:
2
(s
2
)=
2
n1
(12)
Podczas bada« statystyki s
2
stwierdzono, »e mo»e by¢ ona przedstawiona jako:
s
2
=
2
n1
2
(n1)
(13)
gdzie
2
(n1)
jest zmienn¡ losow¡ o rozkładzie
2
(chi-kwadrat), który równie» (jak to
miało miejsce w przypadku rozkładu t-Studenta) charakteryzuje si¦ liczb¡ stopni swo-
body. Inaczej mówi¡c, rozkład
2
jest rozkładem sumy kwadratów n1standaryzowa-
nych niezale»nych zmiennych losowych o rozkładzie normalnym.
Gdy dysponujemy mał¡, n-elementow¡ prób¡ wylosowan¡ z populacji o rozkładzie
normalnym, mo»emy przedział ufno±ci dla wariancji
2
populacji generalnej okre±li¢ jako:
P
c
2
<
2
<
(n1)s
2
=1
(14)
c
1
4
(n1)s
2
gdzie c
1
i c
2
s¡ warto±ciami zmiennej
2
(n1)
wyznaczonymi z tablic statystycznych
tak, aby spełnione były zale»no±ci:
P(
2
(n1)
< c
1
)=
2
P(
2
(n1)
c
2
)=
2
(15)
Poniewa» tablice podaj¡ warto±ci krytyczne
2
(k)
spełniaj¡ce zale»no±¢ (por. rys. 2):
P(
2
2
(k)
)=
to warto±ci c
1
i c
2
odczytujemy z tablic jako:
c
1
=
1
2
2
(n1)
c
2
=
2
2
(n1)
Rysunek 2: Rozkład
2
Natomiast przy odpowiednio du»ej próbie (n >100) pobranej z populacji o rozkładzie
normalnym lub zbli»onym do normalnego, odchylenie standardowe z populacji mo»emy
w przybli»eniu oszacowa¢ na podstawie wzoru (16):
P
s
1+
p
n
< <
s
1
p
n
'1
(16)
gdzie
u jest warto±ci¡ krytyczn¡ normalnego rozkładu standaryzowanego.
5
[ Pobierz całość w formacie PDF ]