Varians tergembleng

Daripada testwiki
Semakan 434 pada 12:40, 8 September 2021 oleh imported>InternetArchiveBot (Rescuing 1 sources and tagging 0 as dead.) #IABot (v2.0.8)
(beza) ← Semakan terdahulu | Semakan semasa (beza) | Semakan berikutnya→ (beza)
Pergi ke pandu arah Pergi ke carian

Dalam statistik, kebanyakan masa, data dikumpul bagi variabel terikat, y, melangkau julat nilai bagi variabel bebas, x. Sebagai contoh, pemantauan penggunaan bahan api boleh dikaji sebagai fungsi kelajuan enjin ketika bebanan engin dikekalkan. Jika, untuk mencapai perbezaan kecil pada y, sejumlah besar ujian ulangan diperlukan bagi setiap nilai x, kos menguji menjadi amat mahal. Sebaliknya, anggaran varians yang munasabah boleh ditentukan dengan menggunakan prinsip varians tergembleng[1] selepas mengulangi setiap ujian pada x tertentu hanya beberapa kali. Varians yang dikumpulkan adalah satu kaedah untuk menganggarkan varians, dengan hanya menggunakan beberapa sampel yang diambil dalam keadaan yang berbeza di mana min kemungkinannya berbeza-beza antara sampel tetapi varians yang benar (setara, kejituan) diandaikan tetap sama. Ia dikira melalui

sp2=i=1k((ni1)si2)i=1k(ni1)

atau dengan notasi lebih mudah,

sp2=(n11)s12+(n21)s22++(nk1)sk2n1+n2++nkk

di mana sp2 merupakan varians tergembleng, ni adalah saiz contoh bagi i, si2 merupakan varians bagi contoh i, dan k merupakan bilangan contoh yang digabungkan. n − 1 digunakan bagi menggantikan n sebagai sebab ia mungkin digunakan bagi menganggar variasi berbanding contoh (contoh. pembetulan Bessel).

Punca kuasa dua bagi penganggar varians tergembleng dikenali sebagai "Sisihan piawai terkumpul ‎".

Anggaran segi empat terkecil bebas vs. anggaran kemungkinan maksima berat sebelah

Kedua-dua

sp2=i=1k((ni1)si2)i=1k(ni1)

dan

sp2=i=1k((ni1)si2)i=1kni

digunakan dalam konteks yang berbeza. Yang sebelumnya boleh memberikan sp2 yang adil bagi menganggar σ2 apabila kedua-dua kumpulan berkongsi varians populasi yang sama. Yang terakhir boleh memberi anggaran lebih cekap untuk sp2 bagi menganggar σ2 berat sebelah. Perhatikan bahawa kuantiti si2 pada sebelah kanan kedua persamaan merupakan anggaran adil.

Contoh

Pertimbangkan set data untuk y, yang diperoleh di pelbagai peringkat pembolehubah bebas x berikut.


x y
1 31, 30, 29
2 42, 41, 40, 39
3 31, 28
4 23, 22, 21, 19, 18
5 21, 20, 19, 18,17

Bilangan ujian, min, varians dan Sisihan piawai dibentangkan dalam jadual berikut.

x n ymean Sy2 S
1 3 30.0 1.0 1.0
2 4 40.5 1.67 1.29
3 2 29.5 4.5 2.12
4 5 20.6 4.3 2.07
5 5 19.0 2.5 1.58

Statistik ini mewakili varians dan sisihan piawai untuk setiap subset data di pelbagai peringkat x. Jika kita boleh mengandaikan bahawa fenomena yang sama menjana ralat rawak di setiap peringkat x, data di atas boleh "dikumpulkan" untuk menyatakan anggaran tunggal varians dan sisihan piawai. Dari satu segi, ini menunjukkan mencari min varians atau sisihan piawai di kalangan lima keputusan di atas. Varians min ini dikira dengan pemberat nilai individu dengan saiz subset bagi setiap tahap x. Oleh itu, varians dikumpulkan ditakrifkan oleh

SP2=(n11)S12+(n21)S22++(nk1)Sk2(n11)+(n21)++(nk1)

di mana n1, n2, . . . nk merupakan saiz subset data pada setiap peringkat pelbagai x, and S12, S22, . . ., Sk2 adalah perbezaan masing-masing.

di mana n 1, n 2,. . N k adalah saiz subset data di peringkat setiap x berubah-ubah, dan S 1 2, S 2 2,. . , S k 2 adalah perbezaan masing-masing.

Varians tergembleng data yang ditunjukkan di atas adalah:

SP2=2.765

Rujukan

Pautan luaran