Cara menghitung tingkat signifikansi statistik. Jelaskan yang dimaksud dengan tingkat signifikansi statistik

Parameter distribusi sampel yang ditentukan oleh serangkaian pengukuran adalah variabel acak, oleh karena itu penyimpangannya dari parameter umum juga akan acak. Penilaian penyimpangan ini bersifat probabilistik - dalam analisis statistik, seseorang hanya dapat menunjukkan kemungkinan kesalahan tertentu.

Biarkan untuk parameter umum sebuah berasal dari estimasi pengalaman yang tidak bias sebuah*. Kami menetapkan probabilitas yang cukup besar b (sehingga suatu peristiwa dengan probabilitas b dapat dianggap pasti secara praktis) dan menemukan nilai seperti itu e b = f(b) untuk yang mana

Kisaran nilai kesalahan yang mungkin terjadi saat penggantian sebuah pada sebuah* , akan menjadi ±e b . Kesalahan yang memiliki nilai absolut besar hanya akan muncul dengan probabilitas kecil.

ditelepon tingkat signifikansi. Jika tidak, ekspresi (4.1) dapat diartikan sebagai probabilitas nilai sebenarnya dari parameter sebuah terletak di dalam

. (4.3)

Probabilitas b disebut tingkat kepercayaan diri dan mencirikan keandalan estimasi yang diperoleh. Selang Saya b= sebuah* ± e b dipanggil selang kepercayaan. Batas interval sebuah¢ = sebuah* - e b dan sebuah¢¢ = sebuah* + e b disebut batas kepercayaan. Interval kepercayaan pada tingkat kepercayaan tertentu menentukan keakuratan estimasi. Nilai selang kepercayaan tergantung pada tingkat kepercayaan yang dengannya parameter dijamin ditemukan sebuah di dalam interval kepercayaan: semakin besar nilai b, semakin besar intervalnya Saya b (dan nilai e b). Peningkatan jumlah eksperimen dimanifestasikan dalam pengurangan interval kepercayaan dengan probabilitas kepercayaan konstan atau dalam peningkatan probabilitas kepercayaan sambil mempertahankan interval kepercayaan.

Dalam praktiknya, seseorang biasanya menetapkan nilai probabilitas kepercayaan (0,9; 0,95 atau 0,99) dan kemudian menentukan selang kepercayaan dari hasilnya. Saya b. Saat membangun interval kepercayaan, masalah deviasi absolut diselesaikan:

Dengan demikian, jika hukum distribusi estimasi diketahui sebuah* , tugas menentukan interval kepercayaan akan diselesaikan dengan sederhana. Pertimbangkan konstruksi interval kepercayaan untuk ekspektasi matematis dari variabel acak yang terdistribusi normal X dengan standar umum yang diketahui lebih dari ukuran sampel n. Batas Terbaik untuk Harapan m adalah rata-rata sampel dengan standar deviasi rata-rata

.

Dengan menggunakan fungsi Laplace, kita dapatkan

. (4.5)

Mengingat probabilitas kepercayaan b, kami menentukan dari tabel fungsi Laplace (Lampiran 1) nilainya . Kemudian interval kepercayaan untuk ekspektasi matematis terbentuk

. (4.7)

Dari (4.7) terlihat bahwa penurunan interval kepercayaan berbanding terbalik dengan akar pangkat dua dari jumlah percobaan.

Mengetahui varians umum memungkinkan Anda memperkirakan ekspektasi matematis bahkan untuk satu pengamatan. Jika untuk variabel acak terdistribusi normal X sebagai hasil percobaan, nilai X 1 , maka interval kepercayaan untuk ekspektasi matematis untuk b yang dipilih memiliki bentuk

di mana AS 1-p/2 - kuantil dari distribusi normal standar (Lampiran 2).

Hukum distribusi kelas sebuah* tergantung pada hukum distribusi kuantitas X dan, khususnya, pada parameter itu sendiri sebuah. Untuk mengatasi kesulitan ini, dua metode digunakan dalam statistik matematika:

1) perkiraan - di n³ 50 ganti parameter yang tidak diketahui dalam ekspresi untuk e b dengan perkiraannya, misalnya:

2) dari variabel acak sebuah* pergi ke variabel acak lain Q * , hukum distribusi yang tidak bergantung pada parameter yang diestimasi sebuah, tetapi hanya bergantung pada ukuran sampel. n dan pada jenis hukum distribusi kuantitas X. Kuantitas semacam ini telah dipelajari dengan sangat rinci untuk distribusi normal variabel acak. Kuantil simetris biasanya digunakan sebagai batas kepercayaan untuk Q¢ dan Q¢¢

, (4.9)

atau memperhitungkan (4.2)

. (4.10)

4.2. Pengujian hipotesis statistik, uji signifikansi,

kesalahan jenis pertama dan kedua.

Dibawah hipotesis statistik beberapa asumsi tentang distribusi populasi umum dari satu atau lain variabel acak dipahami. Pengujian hipotesis dipahami sebagai perbandingan beberapa indikator statistik, kriteria verifikasi (kriteria signifikansi) dihitung dari sampel, dengan nilainya ditentukan berdasarkan asumsi bahwa hipotesis yang diberikan benar. Saat menguji hipotesis, beberapa hipotesis biasanya diuji. H 0 dibandingkan dengan hipotesis alternatif H 1 .

Untuk memutuskan apakah akan menerima atau menolak suatu hipotesis, tingkat signifikansi diberikan R. Tingkat signifikansi yang paling umum digunakan adalah 0,10, 0,05, dan 0,01. Menurut probabilitas ini, dengan menggunakan hipotesis tentang distribusi perkiraan Q * (kriteria signifikansi), batas kepercayaan kuantil ditemukan, sebagai aturan, Q simetris p/2 dan Q1- p/2 . nomor Q p/2 dan Q1- p/2 dipanggil nilai-nilai kritis dari hipotesis; Nilai Q *< Qp/2 dan Q * > Q 1- p/2 membentuk kritis


area hipotesis (atau area penolakan hipotesis) (Gbr. 12).

Beras. 12. Daerah kritis Beras. 13. Memeriksa statistik

hipotesis. hipotesis.

Jika Q 0 ditemukan dalam sampel berada di antara Q p/2 dan Q1- p/2 , maka hipotesis mengakui nilai seperti itu sebagai acak dan oleh karena itu tidak ada alasan untuk menolaknya. Jika nilai Q 0 jatuh ke wilayah kritis, maka menurut hipotesis ini, secara praktis tidak mungkin. Namun sejak kemunculannya, hipotesis itu sendiri ditolak.

Ada dua jenis kesalahan yang dapat dibuat saat menguji hipotesis. Kesalahan tipe I Apakah itu menolak hipotesis yang sebenarnya benar. Probabilitas kesalahan semacam itu tidak lebih besar dari tingkat signifikansi yang diterima. Kesalahan tipe II Apakah itu hipotesis diterima, tetapi sebenarnya itu salah. Probabilitas kesalahan ini semakin rendah, semakin tinggi tingkat signifikansinya, karena ini meningkatkan jumlah hipotesis yang ditolak. Jika probabilitas kesalahan jenis kedua adalah a, maka nilai (1 - a) disebut kekuatan kriteria.

Pada ara. 13 menunjukkan dua kurva kepadatan distribusi variabel acak Q, sesuai dengan dua hipotesis H 0 dan H satu . Jika nilai yang diperoleh dari pengalaman adalah Q > Q p, maka hipotesis ditolak. H 0 dan hipotesis diterima H 1 , dan sebaliknya, jika Q< Qp.

Area di bawah kurva kepadatan probabilitas yang sesuai dengan validitas hipotesis H 0 di sebelah kanan nilai Q p, sama dengan tingkat signifikansi R, yaitu probabilitas kesalahan jenis pertama. Area di bawah kurva kepadatan probabilitas yang sesuai dengan validitas hipotesis H 1 di sebelah kiri Q p, sama dengan probabilitas kesalahan jenis kedua a, dan di sebelah kanan Q p- kekuatan kriteria (1 - a). Dengan demikian, semakin banyak R, semakin banyak (1 - a). Saat menguji hipotesis, mereka mencoba untuk memilih dari semua kriteria yang mungkin, yang, pada tingkat signifikansi tertentu, memiliki probabilitas kesalahan Tipe II yang lebih rendah..

Biasanya, sebagai tingkat signifikansi optimal saat menguji hipotesis, gunakan p= 0,05, karena jika hipotesis yang diuji diterima dengan tingkat signifikansi tertentu, maka hipotesis tersebut, tentu saja, harus diakui konsisten dengan data eksperimen; di sisi lain, penggunaan tingkat signifikansi ini tidak memberikan alasan untuk menolak hipotesis.

Misalnya, dua nilai dan beberapa parameter sampel ditemukan, yang dapat dianggap sebagai perkiraan parameter umum sebuah 1 dan sebuah 2. Dihipotesiskan bahwa perbedaan antara dan adalah acak dan parameter umum sebuah 1 dan sebuah 2 sama satu sama lain, yaitu sebuah 1 = sebuah 2. Hipotesis ini disebut batal, atau hipotesis nol. Untuk mengujinya, Anda perlu mencari tahu apakah perbedaan antara dan signifikan di bawah hipotesis nol. Untuk melakukan ini, seseorang biasanya menyelidiki variabel acak D = – dan memeriksa apakah perbedaannya dari nol signifikan. Terkadang lebih nyaman untuk mempertimbangkan nilai / dengan membandingkannya dengan kesatuan.

Menolak hipotesis nol, mereka menerima satu alternatif, yang terbagi menjadi dua: > dan< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется sepihak, dan untuk memeriksanya, gunakan sepihak kriteria signifikansi (sebagai lawan konvensional, bilateral). Dalam hal ini, perlu untuk mempertimbangkan hanya satu dari separuh wilayah kritis (Gbr. 12).

Sebagai contoh, R= 0,05 dengan kriteria dua sisi, nilai kritis Q 0,025 dan Q 0,975 sesuai, yaitu Q * yang telah mengambil nilai Q * dianggap signifikan (tidak acak)< Q 0.025 и Q * >P 0,975 . Dengan kriteria satu sisi, salah satu ketidaksetaraan ini jelas tidak mungkin (misalnya, Q *< Q 0.025) и значимыми будут лишь Q * >P 0,975 . Probabilitas pertidaksamaan terakhir adalah 0,025 sehingga tingkat signifikansinya menjadi 0,025. Jadi, jika angka kritis yang sama digunakan untuk uji signifikansi satu sisi dengan angka kritis dua sisi, nilai ini akan sesuai dengan setengah tingkat signifikansi.

Biasanya, untuk uji satu sisi, tingkat signifikansi yang sama diambil seperti untuk uji dua sisi, karena dalam kondisi ini kedua uji memberikan kesalahan tipe I yang sama. Untuk melakukan ini, uji satu sisi harus diturunkan dari uji dua sisi, sesuai dengan tingkat signifikansi dua kali lipat dari yang diterima.. Untuk mempertahankan tingkat signifikansi untuk uji satu sisi R= 0,05, untuk bilateral perlu diambil R= 0,10, yang memberikan nilai kritis Q 0,05 dan Q 0,95. Dari jumlah tersebut, untuk tes satu sisi, satu akan tetap, misalnya, Q 0,95. Tingkat signifikansi untuk uji satu sisi adalah 0,05. Tingkat signifikansi yang sama untuk uji dua sisi sesuai dengan nilai kritis Q 0,975. Tapi Q 0,95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

Tingkat signifikansi dalam statistik merupakan indikator penting yang mencerminkan tingkat kepercayaan terhadap keakuratan dan kebenaran data yang diterima (diprediksi). Konsep ini banyak digunakan di berbagai bidang: dari penelitian sosiologis hingga pengujian statistik hipotesis ilmiah.

Definisi

Tingkat signifikansi statistik (atau hasil yang signifikan secara statistik) menunjukkan berapa probabilitas kejadian acak dari indikator yang diteliti. Signifikansi statistik keseluruhan dari fenomena tersebut dinyatakan oleh nilai-p (tingkat-p). Dalam percobaan atau pengamatan apa pun, ada kemungkinan data yang diperoleh muncul karena kesalahan pengambilan sampel. Ini terutama berlaku untuk sosiologi.

Artinya, suatu nilai signifikan secara statistik, yang probabilitas kejadian acaknya sangat kecil atau cenderung ekstrem. Ekstrem dalam konteks ini adalah tingkat penyimpangan statistik dari hipotesis nol (hipotesis yang diuji konsistensinya dengan data sampel yang diperoleh). Dalam praktik ilmiah, tingkat signifikansi dipilih sebelum pengumpulan data dan, sebagai aturan, koefisiennya adalah 0,05 (5%). Untuk sistem di mana nilai akurat sangat penting, ini mungkin 0,01 (1%) atau kurang.

Latar belakang

Konsep tingkat signifikansi diperkenalkan oleh ahli statistik dan genetika Inggris Ronald Fisher pada tahun 1925 ketika ia sedang mengembangkan teknik untuk menguji hipotesis statistik. Saat menganalisis proses apa pun, ada kemungkinan tertentu dari fenomena tertentu. Kesulitan muncul ketika bekerja dengan persentase probabilitas yang kecil (atau tidak jelas) yang termasuk dalam konsep "kesalahan pengukuran".

Saat bekerja dengan statistik yang tidak cukup spesifik untuk diuji, para ilmuwan dihadapkan pada masalah hipotesis nol, yang "mencegah" operasi dengan nilai kecil. Fisher mengusulkan sistem seperti itu untuk menentukan probabilitas kejadian pada 5% (0,05) sebagai batas sampel yang nyaman yang memungkinkan seseorang untuk menolak hipotesis nol dalam perhitungan.

Pengenalan koefisien tetap

Pada tahun 1933 Ilmuwan Jerzy Neumann dan Egon Pearson dalam makalahnya merekomendasikan pengaturan tingkat signifikansi tertentu terlebih dahulu (sebelum pengumpulan data). Contoh penggunaan aturan ini terlihat jelas selama pemilu. Misalkan ada dua kandidat, salah satunya sangat populer dan yang lainnya tidak terkenal. Jelas calon pertama akan memenangkan pemilihan, dan peluang calon kedua cenderung nol. Berjuang - tapi tidak sama: selalu ada kemungkinan force majeure, informasi sensasional, keputusan tak terduga yang bisa mengubah prediksi hasil pemilu.

Neumann dan Pearson setuju bahwa tingkat signifikansi yang diusulkan Fisher sebesar 0,05 (dilambangkan dengan simbol α) adalah yang paling sesuai. Namun, Fischer sendiri pada tahun 1956 menentang penetapan nilai ini. Dia percaya bahwa tingkat α harus diatur sesuai dengan keadaan tertentu. Misalnya, dalam fisika partikel nilainya 0,01.

nilai-p

Istilah p-value pertama kali digunakan oleh Brownlee pada tahun 1960. P-level (p-value) merupakan indikator yang berbanding terbalik dengan kebenaran hasil. Nilai p tertinggi sesuai dengan tingkat kepercayaan terendah dalam hubungan sampel antar variabel.

Nilai ini mencerminkan kemungkinan kesalahan yang terkait dengan interpretasi hasil. Asumsikan nilai-p = 0,05 (1/20). Ini menunjukkan kemungkinan lima persen bahwa hubungan antara variabel yang ditemukan dalam sampel hanyalah fitur acak dari sampel. Artinya, jika ketergantungan ini tidak ada, maka dengan percobaan serupa yang berulang, rata-rata, di setiap studi kedua puluh, ketergantungan antar variabel yang sama atau lebih besar dapat diharapkan. Seringkali level-p dianggap sebagai "margin" dari level kesalahan.

Ngomong-ngomong, nilai p mungkin tidak mencerminkan hubungan nyata antara variabel, tetapi hanya menunjukkan nilai rata-rata tertentu dalam asumsi. Secara khusus, analisis akhir data juga akan bergantung pada nilai koefisien yang dipilih. Dengan p-level = 0,05 akan ada beberapa hasil, dan dengan koefisien sama dengan 0,01, yang lain.

Menguji hipotesis statistik

Tingkat signifikansi statistik sangat penting saat menguji hipotesis. Misalnya, saat menghitung uji dua sisi, area penolakan dibagi rata di kedua ujung distribusi pengambilan sampel (relatif terhadap koordinat nol) dan kebenaran data yang diperoleh dihitung.

Misalkan, ketika memantau proses tertentu (fenomena), ternyata informasi statistik baru menunjukkan perubahan kecil relatif terhadap nilai sebelumnya. Pada saat yang sama, perbedaan hasil kecil, tidak jelas, tetapi penting untuk penelitian. Spesialis menghadapi dilema: apakah perubahan benar-benar terjadi atau apakah itu kesalahan pengambilan sampel (ketidaktepatan pengukuran)?

Dalam hal ini, hipotesis nol diterapkan atau ditolak (semuanya dianggap sebagai kesalahan, atau perubahan dalam sistem diakui sebagai fait accompli). Proses penyelesaian masalah didasarkan pada rasio signifikansi statistik keseluruhan (p-value) dan tingkat signifikansi (α). Jika tingkat-p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Nilai bekas

Tingkat signifikansi tergantung pada bahan yang dianalisis. Dalam praktiknya, nilai tetap berikut digunakan:

  • α = 0,1 (atau 10%);
  • α = 0,05 (atau 5%);
  • α = 0,01 (atau 1%);
  • α = 0,001 (atau 0,1%).

Semakin akurat perhitungan yang diperlukan, semakin kecil koefisien α yang digunakan. Secara alami, prakiraan statistik dalam fisika, kimia, farmasi, dan genetika membutuhkan akurasi yang lebih tinggi daripada dalam ilmu politik dan sosiologi.

Ambang batas signifikansi di area tertentu

Dalam bidang presisi tinggi seperti fisika partikel dan manufaktur, signifikansi statistik sering dinyatakan sebagai rasio standar deviasi (dilambangkan dengan koefisien sigma - σ) relatif terhadap distribusi probabilitas normal (distribusi Gaussian). σ adalah indikator statistik yang menentukan penyebaran nilai suatu besaran tertentu relatif terhadap ekspektasi matematis. Digunakan untuk memplot probabilitas kejadian.

Bergantung pada bidang pengetahuan, koefisien σ sangat bervariasi. Misalnya, saat memprediksi keberadaan boson Higgs, parameter σ sama dengan lima (σ=5), yang sesuai dengan nilai-p=1/3,5 juta area.

Efisiensi

Harus diperhatikan bahwa koefisien α dan nilai-p bukanlah karakteristik yang tepat. Apa pun tingkat signifikansinya dalam statistik dari fenomena yang diteliti, itu bukanlah dasar tanpa syarat untuk menerima hipotesis. Misalnya, semakin kecil nilai α, semakin besar kemungkinan bahwa hipotesis yang ditetapkan adalah signifikan. Namun, ada risiko kesalahan, yang mengurangi kekuatan statistik (signifikansi) penelitian.

Peneliti yang berfokus secara eksklusif pada hasil yang signifikan secara statistik dapat menarik kesimpulan yang salah. Pada saat yang sama, sulit untuk memeriksa ulang pekerjaan mereka, karena mereka menerapkan asumsi (yang sebenarnya adalah nilai α dan nilai p). Oleh karena itu, selalu disarankan, bersamaan dengan perhitungan signifikansi statistik, untuk menentukan indikator lain - besarnya pengaruh statistik. Ukuran efek adalah ukuran kuantitatif kekuatan efek.

Nilainya disebut signifikan secara statistik, jika probabilitas kemunculannya yang murni acak atau bahkan nilai yang lebih ekstrem kecil. Di sini, ekstrim adalah tingkat penyimpangan dari hipotesis nol. Suatu perbedaan dikatakan "signifikan secara statistik" jika terdapat data yang kemungkinan tidak akan terjadi, dengan asumsi bahwa perbedaan tersebut tidak ada; ungkapan ini tidak berarti bahwa perbedaan ini harus besar, penting, atau signifikan dalam arti kata secara umum.

Tingkat signifikansi suatu tes adalah gagasan tradisional tentang pengujian hipotesis dalam statistik frekuensi. Ini didefinisikan sebagai probabilitas memutuskan untuk menolak hipotesis nol jika, pada kenyataannya, hipotesis nol itu benar (keputusan itu dikenal sebagai kesalahan Tipe I, atau keputusan positif palsu.) Proses pengambilan keputusan sering bergantung pada nilai-p (baca “nilai-pi”): jika nilai-p kurang dari tingkat signifikansi, maka hipotesis nol ditolak. Semakin kecil nilai p, dikatakan semakin signifikan statistik uji. Semakin kecil nilai p, semakin kuat alasan untuk menolak hipotesis nol.

Tingkat signifikansi biasanya dilambangkan dengan huruf Yunani α (alfa). Tingkat signifikansi yang populer adalah 5%, 1%, dan 0,1%. Jika tes menghasilkan nilai-p kurang dari tingkat α, maka hipotesis nol ditolak. Hasil tersebut secara informal disebut sebagai "signifikan secara statistik". Misalnya, jika seseorang mengatakan bahwa "kemungkinan yang terjadi adalah kebetulan sama dengan satu dari seribu", maka yang mereka maksud adalah tingkat signifikansi 0,1%.

Nilai level α yang berbeda memiliki kelebihan dan kekurangan. Tingkat α yang lebih kecil memberi kepercayaan lebih bahwa hipotesis alternatif yang sudah mapan adalah signifikan, tetapi ada risiko lebih besar untuk tidak menolak hipotesis nol palsu (kesalahan Tipe II, atau "keputusan negatif palsu"), dan dengan demikian kekuatan statistik lebih sedikit. Pilihan tingkat-α pasti membutuhkan pertukaran antara signifikansi dan kekuatan, dan karenanya antara probabilitas kesalahan Tipe I dan Tipe II. Di dalam negeri karya tulis ilmiah sering istilah "signifikansi" yang salah digunakan sebagai pengganti istilah "signifikansi statistik".

Lihat juga

Catatan

George Casella, Roger L. Berger Pengujian Hipotesis // Inferensi Statistik . -Edisi kedua. - Pacific Grove, CA: Duxbury, 2002. - S. 397. - 660 hal. - ISBN 0-534-24312-6


Yayasan Wikimedia. 2010 .

Lihat apa itu "Level of Significance" di kamus lain:

    Jumlahnya sangat kecil sehingga dapat dianggap hampir pasti bahwa suatu peristiwa dengan probabilitas α tidak akan terjadi dalam satu percobaan. Biasanya U.z. ditetapkan sewenang-wenang, yaitu: 0,05, 0,01, dan dengan ketelitian khusus 0,005, dll. Di geol. kerja… … Ensiklopedia Geologi

    tingkat signifikansi- kriteria statistik (juga disebut "tingkat alfa" dan dilambangkan dengan huruf Yunani) adalah batas atas probabilitas kesalahan tipe I (probabilitas menolak hipotesis nol padahal sebenarnya benar). Nilai tipikal adalah... Kamus Statistik Sosiologis

    Bahasa inggris tingkat, signifikansi; Jerman Signifikanzniveau. Tingkat risikonya adalah bahwa peneliti dapat menarik kesimpulan yang salah tentang kekeliruan ekstra, hipotesis berdasarkan data sampel. Antinazi. Ensiklopedia Sosiologi, 2009 ... Ensiklopedia Sosiologi

    tingkat signifikansi- - [L.G. Sumenko. Kamus Teknologi Informasi Bahasa Inggris Rusia. M .: GP TsNIIS, 2003.] Topik teknologi informasi secara umum EN tingkat signifikansi ... Buku Panduan Penerjemah Teknis

    tingkat signifikansi- 3,31 tingkat signifikansi α: Nilai tertentu yang mewakili batas atas probabilitas penolakan hipotesis statistik ketika hipotesis itu benar. Sumber: GOST R ISO 12491 2011: Bahan dan produk bangunan. ... ... Kamus-buku referensi istilah normatif dan teknis dokumentasi

    TINGKAT SIGNIFIKANSI- konsep statistik matematika, yang mencerminkan tingkat kemungkinan kesimpulan yang salah mengenai hipotesis statistik tentang distribusi suatu fitur, diverifikasi berdasarkan data sampel. Dalam penelitian psikologis untuk tingkat yang cukup ... ... Modern proses pendidikan: konsep dan istilah dasar

    tingkat signifikansi- reikšmingumo lygis statusas T sritis automatika atitikmenys: engl. tingkat signifikansi vok. Signifikanzniveau, n rus. tingkat signifikansi, m pranc. niveau de significance, m … Automaticos terminų žodynas

    tingkat signifikansi- reikšmingumo lygis statusas T sritis fizika atitikmenys: engl. tingkat signifikansi; tingkat signifikansi vok. Sicherheitsschwelle, f rus. tingkat signifikansi, fpranc. tingkat signifikansi, m … Fizikos terminų žodynas

    Uji statistik, lihat Tingkat signifikansi... Ensiklopedia Soviet yang Hebat

    TINGKAT SIGNIFIKANSI- Lihat signifikansi, level... Kamus dalam psikologi

Buku

  • "Sangat rahasia" . Lubyanka - kepada Stalin tentang situasi di negara tersebut (1922-1934). Jilid 4. Bagian 1,. Publikasi makalah fundamental multi-volume - ulasan informasi dan ringkasan OGPU - unik dalam signifikansi, nilai, konten, dan ruang lingkup ilmiahnya. Dalam sejarah ini…
  • Program pendidikan sebagai alat untuk sistem manajemen mutu pendidikan kejuruan, Tkacheva Galina Viktorovna, Logachev Maxim Sergeevich, Samarin Yury Nikolaevich. Monograf menganalisis praktik pembentukan konten program pendidikan profesional yang ada. Tempat, struktur, isi, dan tingkat signifikansi ditentukan ...

nilai-p(eng.) - nilai yang digunakan saat menguji hipotesis statistik. Faktanya, ini adalah kemungkinan kesalahan saat menolak hipotesis nol (kesalahan jenis pertama). Pengujian hipotesis dengan menggunakan nilai-P merupakan alternatif dari prosedur pengujian klasik melalui nilai kritis distribusi.

Biasanya, nilai-P sama dengan probabilitas bahwa variabel acak dengan distribusi tertentu (distribusi statistik uji di bawah hipotesis nol) akan mengambil nilai yang tidak kurang dari nilai sebenarnya dari statistik uji. Wikipedia.

Dengan kata lain, nilai-p adalah tingkat signifikansi terkecil (yaitu, probabilitas menolak hipotesis yang benar) yang statistik uji yang dihitung mengarah pada penolakan hipotesis nol. Biasanya, nilai-p dibandingkan dengan tingkat signifikansi standar yang diterima secara umum sebesar 0,005 atau 0,01.

Misalnya, jika nilai uji statistik dihitung dari sampel sesuai dengan p = 0,005, ini menunjukkan probabilitas 0,5% dari hipotesis yang benar. Jadi, semakin kecil nilai p, semakin baik, karena meningkatkan "kekuatan" untuk menolak hipotesis nol dan meningkatkan signifikansi hasil yang diharapkan.

Penjelasan menarik tentang ini ada di Habré.

Analisis statistik mulai terlihat seperti kotak hitam: inputnya adalah data, outputnya adalah tabel hasil utama dan nilai-p.

Apa yang dikatakan nilai-p?

Misalkan kita memutuskan untuk mencari tahu apakah ada hubungan antara kecanduan game komputer berdarah dan agresivitas dalam kehidupan nyata. Untuk ini, dua kelompok anak sekolah yang masing-masing terdiri dari 100 orang dibentuk secara acak (kelompok 1 - penggemar penembak, kelompok 2 - tidak bermain game komputer). Misalnya, jumlah perkelahian dengan teman sebaya merupakan indikator agresivitas. Dalam studi imajiner kami, ternyata kelompok penjudi anak sekolah lebih sering berkonflik dengan rekan-rekan mereka. Tetapi bagaimana kita mengetahui seberapa signifikan secara statistik perbedaan yang dihasilkan? Mungkin kita mendapatkan perbedaan yang diamati secara tidak sengaja? Untuk menjawab pertanyaan-pertanyaan ini, nilai-p digunakan - ini adalah probabilitas mendapatkan perbedaan seperti itu atau lebih jelas, asalkan sebenarnya tidak ada perbedaan dalam populasi umum. Dengan kata lain, ini adalah kemungkinan mendapatkan perbedaan seperti itu atau bahkan lebih kuat di antara kelompok kami, asalkan, pada kenyataannya, permainan komputer sama sekali tidak memengaruhi agresivitas. Kedengarannya tidak sulit. Namun, statistik khusus ini sering disalahartikan.

contoh nilai-p

Jadi, kami membandingkan dua kelompok anak sekolah satu sama lain dalam hal tingkat agresivitas menggunakan uji-t standar (atau uji Chi non-parametrik - kuadrat yang lebih tepat dalam situasi ini) dan menemukan bahwa p- yang didambakan tingkat signifikansi kurang dari 0,05 (misalnya, 0,04). Tapi apa nilai signifikansi-p yang dihasilkan benar-benar memberi tahu kita? Jadi, jika nilai-p adalah probabilitas untuk mendapatkan perbedaan seperti itu atau lebih jelas, asalkan sebenarnya tidak ada perbedaan dalam populasi umum, menurut Anda apa pernyataan yang benar:

1. Game komputer adalah penyebab perilaku agresif dengan probabilitas 96%.
2. Peluang bahwa agresivitas dan permainan komputer tidak berhubungan adalah 0,04.
3. Jika kita mendapatkan p-tingkat signifikansi lebih besar dari 0,05, ini berarti bahwa agresivitas dan permainan komputer tidak berhubungan sama sekali.
4. Peluang mendapatkan selisih tersebut secara kebetulan adalah 0,04.
5. Semua pernyataan salah.

Jika Anda memilih opsi kelima, maka Anda benar sekali! Namun, seperti yang ditunjukkan oleh banyak penelitian, bahkan orang dengan pengalaman signifikan dalam analisis data sering salah mengartikan nilai-p.

Mari kita ambil setiap jawaban secara berurutan:

Pernyataan pertama adalah contoh kesalahan korelasi: fakta bahwa dua variabel terkait secara signifikan tidak memberi tahu kita tentang sebab dan akibat. Mungkin orang yang lebih agresif lebih suka menghabiskan waktu bermain game komputer, dan bukan game komputer yang membuat orang lebih agresif.

Ini adalah pernyataan yang lebih menarik. Masalahnya adalah kita awalnya menerima begitu saja bahwa sebenarnya tidak ada perbedaan. Dan, mengingat ini sebagai fakta, kami menghitung nilai-p. Oleh karena itu, interpretasi yang benar adalah: "Dengan asumsi bahwa agresivitas dan permainan komputer tidak berhubungan sama sekali, maka kemungkinan mendapatkan perbedaan seperti itu atau bahkan lebih jelas adalah 0,04."

Tetapi bagaimana jika kita mendapat perbedaan yang tidak signifikan? Apakah ini berarti bahwa tidak ada hubungan antara variabel yang diteliti? Tidak, itu hanya berarti mungkin ada perbedaan, tetapi hasil kami tidak memungkinkan kami untuk mendeteksinya.

Ini terkait langsung dengan definisi nilai-p itu sendiri. 0,04 adalah probabilitas mendapatkan perbedaan ini atau bahkan lebih ekstrim. Pada prinsipnya, tidak mungkin memperkirakan kemungkinan mendapatkan perbedaan yang persis sama seperti dalam percobaan kami!

Ini adalah jebakan yang dapat disembunyikan dalam interpretasi indikator seperti nilai-p. Oleh karena itu, sangat penting untuk memahami mekanisme yang mendasari metode analisis dan perhitungan indikator statistik utama.

Bagaimana menemukan nilai-p?

1. Tentukan hasil yang diharapkan dari eksperimen Anda

Biasanya, ketika para ilmuwan melakukan percobaan, mereka sudah memiliki gambaran tentang hasil apa yang dianggap "normal" atau "khas". Ini mungkin didasarkan pada hasil eksperimen dari eksperimen masa lalu, pada kumpulan data yang dapat diandalkan, pada data dari literatur ilmiah, atau ilmuwan mungkin didasarkan pada beberapa sumber lain. Untuk eksperimen Anda, tentukan hasil yang diharapkan, dan nyatakan sebagai angka.

Contoh: Sebagai contoh, penelitian sebelumnya menunjukkan bahwa di negara Anda, mobil merah lebih mungkin mendapat tilang daripada mobil biru. Misalnya, skor rata-rata menunjukkan preferensi 2:1 untuk mobil merah daripada mobil biru. Kami ingin menentukan apakah polisi memiliki prasangka yang sama terhadap warna mobil di kota Anda. Untuk melakukan ini, kami akan menganalisis denda yang dikeluarkan untuk ngebut. Jika kita mengambil satu set acak 150 tilang yang dikeluarkan untuk mobil merah atau biru, kita berharap 100 tilang akan diberikan untuk mobil merah dan 50 untuk biru jika polisi di kota kita bias terhadap warna mobil seperti yang diamati ini. di seluruh negara.

2. Tentukan hasil percobaan yang dapat diamati

Sekarang setelah Anda menentukan hasil yang diharapkan, Anda perlu bereksperimen dan menemukan nilai aktual (atau "diamati"). Anda sekali lagi perlu merepresentasikan hasil ini sebagai angka. Jika kita membuat kondisi eksperimental, dan hasil yang diamati berbeda dari yang diharapkan, maka kita memiliki dua kemungkinan - apakah ini terjadi secara kebetulan, atau justru disebabkan oleh eksperimen kita. Tujuan menemukan nilai-p adalah untuk menentukan apakah hasil yang diamati berbeda dari yang diharapkan sedemikian rupa sehingga seseorang tidak dapat menolak "hipotesis nol" - hipotesis bahwa tidak ada hubungan antara variabel eksperimental dan yang diamati. hasil.

Contoh: Misalnya, di kota kami, kami secara acak memilih 150 tilang yang dikeluarkan untuk mobil merah atau biru. Kami menentukan bahwa 90 tiket dikeluarkan untuk mobil merah dan 60 untuk mobil biru. Ini berbeda dengan hasil yang diharapkan, yaitu masing-masing 100 dan 50. Apakah percobaan kami (dalam hal ini, mengubah sumber data dari nasional ke perkotaan) menghasilkan perubahan ini pada hasil, atau apakah polisi kota kami bias dengan cara yang persis sama dengan rata-rata nasional dan kami hanya melihat variasi acak? Nilai p akan membantu kami menentukan ini.

3. Tentukan jumlah derajat kebebasan percobaan Anda

Jumlah derajat kebebasan adalah tingkat variabilitas dalam eksperimen Anda, yang ditentukan oleh jumlah kategori yang Anda jelajahi. Persamaan untuk jumlah derajat kebebasan adalah Jumlah derajat kebebasan = n-1, di mana "n" adalah jumlah kategori atau variabel yang Anda analisis dalam eksperimen Anda.

Contoh: Dalam percobaan kami, ada dua kategori hasil: satu kategori untuk mobil merah, dan satu lagi untuk mobil biru. Oleh karena itu, dalam percobaan kami, kami memiliki 2-1 = 1 derajat kebebasan. Jika kita membandingkan mobil merah, biru, dan hijau, kita akan memiliki 2 derajat kebebasan, dan seterusnya.

4. Bandingkan hasil yang diharapkan dan diamati menggunakan uji chi-square

Chi-kuadrat (ditulis "x2") adalah nilai numerik yang mengukur perbedaan antara nilai yang diharapkan dan yang diamati dari suatu percobaan. Persamaan untuk chi-kuadrat adalah x2 = Σ((o-e)2/e) di mana "o" adalah nilai yang diamati dan "e" adalah nilai yang diharapkan. Jumlahkan hasil persamaan yang diberikan untuk semua hasil yang mungkin (lihat di bawah).

Perhatikan bahwa persamaan ini menyertakan operator penjumlahan Σ (sigma). Dengan kata lain, Anda perlu menghitung ((|o-e|-.05)2/e) untuk setiap kemungkinan hasil, dan menjumlahkan angka-angka tersebut untuk mendapatkan nilai chi-kuadrat. Dalam contoh kami, kami memiliki dua hasil yang mungkin - mobil yang menerima penalti berwarna merah atau biru. Jadi kita harus menghitung ((o-e)2/e) dua kali - sekali untuk mobil merah, dan sekali untuk mobil biru.

Contoh: Mari kita masukkan nilai yang diharapkan dan diamati ke dalam persamaan x2 = Σ((o-e)2/e). Ingat bahwa karena operator penjumlahan, kita perlu menghitung ((o-e)2/e) dua kali - sekali untuk mobil merah, dan sekali untuk mobil biru. Kami akan membuat ini berfungsi sebagai berikut:
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. Pilih Tingkat Signifikansi

Sekarang setelah kita mengetahui jumlah derajat kebebasan dalam percobaan kita, dan kita mengetahui nilai uji chi-kuadrat, kita perlu melakukan satu hal lagi sebelum kita dapat menemukan nilai p kita. Kita perlu menentukan tingkat signifikansi. pembicaraan bahasa sederhana, tingkat signifikansi menunjukkan seberapa yakin kita pada hasil kita. Nilai signifikansi yang rendah sesuai dengan probabilitas rendah bahwa hasil eksperimen diperoleh secara kebetulan, dan sebaliknya. Tingkat signifikansi ditulis sebagai pecahan desimal (seperti 0,01), yang sesuai dengan probabilitas bahwa kami memperoleh hasil eksperimen secara kebetulan (dalam hal ini, probabilitasnya adalah 1%).

Berdasarkan konvensi, para ilmuwan biasanya menetapkan tingkat signifikansi eksperimen mereka menjadi 0,05, atau 5%. Artinya, hasil eksperimen yang memenuhi kriteria signifikansi tersebut hanya dapat diperoleh dengan probabilitas 5% murni secara kebetulan. Dengan kata lain, ada kemungkinan 95% bahwa hasilnya disebabkan oleh cara ilmuwan memanipulasi variabel eksperimental, dan bukan karena kebetulan. Untuk sebagian besar eksperimen, keyakinan 95% bahwa ada hubungan antara dua variabel cukup untuk menganggap bahwa keduanya “benar-benar” terkait satu sama lain.

Contoh: Untuk contoh kita dengan mobil merah dan biru, mari kita ikuti konvensi antara para ilmuwan dan tetapkan tingkat signifikansinya menjadi 0,05.

6. Gunakan lembar data distribusi chi-kuadrat untuk menemukan nilai p Anda

Ilmuwan dan ahli statistik menggunakan spreadsheet besar untuk menghitung nilai p dari percobaan mereka. Data tabel biasanya memiliki sumbu vertikal di sebelah kiri, sesuai dengan jumlah derajat kebebasan, dan sumbu horizontal di atas, sesuai dengan nilai-p. Gunakan data dalam tabel untuk menemukan angka derajat kebebasan Anda terlebih dahulu, lalu lihat deret Anda dari kiri ke kanan hingga Anda menemukan nilai pertama yang lebih besar dari nilai chi-kuadrat Anda. Lihatlah nilai-p yang sesuai di bagian atas kolom Anda. Nilai-p Anda berada di antara angka ini dan angka berikutnya (yang ada di sebelah kiri Anda).

Tabel distribusi chi-kuadrat dapat diperoleh dari banyak sumber (di sini Anda dapat menemukannya di tautan ini).

Contoh: Nilai chi-kuadrat kita adalah 3. Karena kita tahu bahwa hanya ada 1 derajat kebebasan dalam percobaan kita, kita akan memilih baris paling pertama. Kita pergi dari kiri ke kanan sepanjang garis ini sampai kita menemukan nilai yang lebih besar dari 3, nilai uji chi-kuadrat kita. Yang pertama kita temukan adalah 3,84. Melihat kolom kami, kami melihat bahwa nilai p yang sesuai adalah 0,05. Ini berarti bahwa nilai p kami adalah antara 0,05 dan 0,1 (nilai p tertinggi berikutnya dalam tabel).

7. Putuskan apakah akan menolak atau mempertahankan hipotesis nol Anda

Karena Anda telah menentukan perkiraan nilai p untuk eksperimen Anda, Anda perlu memutuskan apakah akan menolak hipotesis nol eksperimen Anda atau tidak (ingat, ini adalah hipotesis bahwa variabel eksperimen yang Anda manipulasi tidak memengaruhi hasil yang Anda amati). Jika nilai p Anda kurang dari tingkat signifikansi Anda, selamat, Anda telah membuktikan bahwa ada kemungkinan besar hubungan antara variabel yang Anda manipulasi dan hasil yang Anda amati. Jika nilai-p Anda lebih tinggi dari tingkat signifikansi Anda, Anda tidak dapat memastikan apakah hasil yang Anda amati disebabkan oleh kebetulan murni atau manipulasi variabel Anda.

Contoh: Nilai p kita antara 0,05 dan 0,1. Ini jelas tidak kurang dari 0,05, jadi sayangnya kami tidak dapat menolak hipotesis nol kami. Artinya kita belum mencapai probabilitas minimal 95% untuk mengatakan polisi di kota kita mengeluarkan tilang mobil merah biru dengan probabilitas yang sangat berbeda dengan rata-rata nasional.

Dengan kata lain, ada kemungkinan 5-10% bahwa hasil yang kami amati bukanlah konsekuensi dari perubahan lokasi (analisis kota, bukan seluruh negara), tetapi hanya kecelakaan. Karena kami membutuhkan akurasi kurang dari 5%, kami tidak dapat mengatakan bahwa kami yakin bahwa polisi di kota kami tidak terlalu bias terhadap mobil merah - ada kemungkinan kecil (tetapi signifikan secara statistik) bahwa tidak demikian.

Pada tabel hasil perhitungan statistik dalam makalah, diploma dan tesis magister psikologi, selalu ada indikator "p".

Misalnya sesuai dengan tujuan penelitian Perbedaan tingkat kebermaknaan hidup pada remaja laki-laki dan perempuan dihitung.

Berarti

Tes Mann-Whitney U

Tingkat signifikansi statistik (p)

Laki-laki (20 orang)

Cewek-cewek

(5 orang)

Sasaran

28,9

35,2

17,5

0,027*

Proses

30,1

32,0

38,5

0,435

Hasil

25,2

29,0

29,5

0,164

Lokus kendali - "Saya"

20,3

23,6

0,067

Lokus Kontrol - "Hidup"

30,4

33,8

27,5

0,126

Kebermaknaan hidup

98,9

111,2

0,103

* - perbedaan signifikan secara statistik (hal0,05)

Kolom kanan menunjukkan nilai "p" dan dengan nilainya seseorang dapat menentukan apakah perbedaan kebermaknaan hidup di masa depan pada anak laki-laki dan perempuan signifikan atau tidak signifikan. Aturannya sederhana:

  • Jika tingkat signifikansi statistik "p" kurang dari atau sama dengan 0,05, maka kami menyimpulkan bahwa perbedaannya signifikan. Pada tabel di atas, perbedaan antara anak laki-laki dan perempuan sangat signifikan terkait dengan indikator "Tujuan" - kebermaknaan hidup di masa depan. Pada anak perempuan, indikator ini secara statistik jauh lebih tinggi daripada anak laki-laki.
  • Jika tingkat signifikansi statistik “p” lebih besar dari 0,05, maka disimpulkan perbedaannya tidak signifikan. Pada tabel di atas, perbedaan antara anak laki-laki dan perempuan tidak signifikan untuk semua indikator lainnya, kecuali yang pertama.

Dari mana tingkat signifikansi statistik "p" berasal

Tingkat signifikansi statistik dihitung program statistik bersama dengan perhitungan kriteria statistik. Dalam program ini, Anda juga dapat menetapkan batas kritis untuk tingkat signifikansi statistik dan indikator terkait akan disorot oleh program.

Misalnya, dalam program STATISTIKA, saat menghitung korelasi, Anda dapat menetapkan batas p, misalnya, 0,05, dan semua hubungan yang signifikan secara statistik akan disorot dengan warna merah.

Jika perhitungan kriteria statistik dilakukan secara manual, maka tingkat signifikansi “p” ditentukan dengan cara membandingkan nilai kriteria yang diperoleh dengan nilai kritis.

Apa yang ditunjukkan oleh tingkat signifikansi statistik "p".

Semua perhitungan statistik adalah perkiraan. Tingkat pendekatan ini menentukan "r". Tingkat signifikansi ditulis dalam bentuk desimal, misalnya 0,023 atau 0,965. Jika kita mengalikan angka ini dengan 100, kita mendapatkan indikator p sebagai persentase: 2,3% dan 96,5%. Persentase ini mencerminkan kemungkinan asumsi kita tentang suatu hubungan, misalnya, antara agresivitas dan kecemasan, salah.

Itu adalah, koefisien korelasi 0,58 antara agresivitas dan kecemasan diperoleh pada tingkat signifikansi statistik 0,05 atau probabilitas kesalahan 5%. Apa sebenarnya artinya ini?

Korelasi yang kami temukan berarti pola berikut diamati dalam sampel kami: semakin tinggi agresivitas, semakin tinggi kecemasannya. Artinya, jika kita mengambil dua remaja, dan salah satunya akan memiliki kecemasan yang lebih tinggi daripada yang lain, maka dengan mengetahui korelasi positifnya, kita dapat mengatakan bahwa remaja tersebut juga akan memiliki agresivitas yang lebih tinggi. Tetapi karena semuanya adalah perkiraan dalam statistik, maka dengan menyatakan ini, kami mengakui bahwa kami dapat membuat kesalahan, dan kemungkinan kesalahan adalah 5%. Artinya, setelah membuat 20 perbandingan seperti itu pada kelompok remaja ini, kita bisa salah memprediksi tingkat agresivitas sekali, mengetahui kecemasan.

Tingkat signifikansi statistik mana yang lebih baik: 0,01 atau 0,05

Tingkat signifikansi statistik mencerminkan kemungkinan kesalahan. Oleh karena itu, hasil pada p=0,01 lebih akurat daripada pada p=0,05.

Dalam penelitian psikologis, dua tingkat signifikansi statistik yang dapat diterima dari hasil diterima:

p=0,01 - keandalan hasil yang tinggi analisis perbandingan atau analisis hubungan;

p=0,05 - akurasi yang cukup.

Saya harap artikel ini akan membantu Anda menulis makalah psikologi sendiri. Jika Anda memerlukan bantuan, silakan hubungi (semua jenis pekerjaan di bidang psikologi; perhitungan statistik).