Modelovani 50 - Praktika z operacniho vyzkumu

Testovani hypotez, test Chi kvadrat

Pro danou nahodnou velicinu se muzeme pokusit overit, zda se shoduje s danym rozdelenim (napriklad normalnim).

Nejprve musime (pokud je nemame zadane jinym zpusobem) odhadnout parametry rozdeleni --- stredni hodnotu a rozptyl. Stredni hodnota empiricke nahodne veliciny je E(X)=suma(i=1..n) xi/n, kde xi jsou jednotlive hodnoty diskretni nahodne veliciny a n je pocet realizaci pokusu. Rozptyl je stredni hodnota ctvercu odchylky nahodne veliciny od jeji stredni hodnoty, tedy s2(X)= E(X-E(X))^2. Pokud nemame jinou informaci, pouzijeme parametry empirickeho rozdeleni jako parametry overovaneho teoretickeho rozdeleni.

Namerene empiricke hodnoty rozdelime do k trid. Cim vice je hodnot, tim vice trid muzeme pouzit a tim bude vysledek presnejsi. Spocitame skutecnou frekvenci vyskytu hodnot v jednotlivych tridach a teoretickou frekvenci vyskytu podle overovaneho pravdepodobnostniho rozdeleni. Tabulky teoretickych frekvenci vyskytu pro normalni rozdeleni N(0,1) lze najit napriklad zde, nebo lze pouzit vzorec pro distribucni funkci normalniho rozdeleni.

Za predpokladu, ze namerene empiricke rozdeleni odpovida rozdeleni teoretickemu, musi mit nahodna velicina suma (oi-n*pi)^2/n*pi rozdeleni chi kvadrat. oi je skutecny pocet vyskytu empicke hodnoty v i-te tride, pi je teoreticky pocet vyskytu hodnoty v i-te tride a n je pocet hodnot. Vyslednou hodnotu porovname s kvantilem (tj. hodnotou inverzni distribucni funkce) chi kvadrat rozdelenim s k-1-q stupni volnosti (k je pocet trid, q je pocet odhadovanych parametru rozdeleni, tedy u normalniho rozdeleni 2). Tabulku kvantilu chi kvadrat rozdeleni najdete treba zde . Pokud vyjde hodnota testovane statistiky vyssi nez hodnota kvantilu chi kvadrat pro hodnotu p, lze s hladinou vyznamnosti 1-p zamitnout hypotezu, ze testovana velicina ma navrhovane teoreticke rozdeleni