Banyak yang mengira analisis regresi di Modul 2 cuma soal menggambar garis lurus. Padahal di SATS4211 Metode Statistik 2, inferensi parameter regresi seperti uji t untuk slope sering bikin jawaban meleset karena lupa periksa asumsi. Bedanya tipis antara signifikan dan tidak. soal Universitas Terbuka di halaman ini dikemas per kegiatan belajar supaya kamu bisa langsung latihan bedakan mana yang perlu diuji dan mana yang cukup dideskripsikan.
Satu lagi jebakan yang umum adalah Uji Homogenitas di Modul 5 dan Analisis Variansi Satu Arah di Modul 6. Keduanya pakai tabel kontingensi, tapi tujuan dan rumus hitungnya berbeda. Soal UAS UT sering menggabungkan konsep ini dalam satu kasus studi. Soal UAS UT di bawah ini sengaja memisahkan kedua modul itu agar kamu lebih mudah menangkap perbedaannya.
Soal berikut menyajikan potongan output regresi dari Modul 2 dan tabel chi-square dari Modul 5. Pembahasan di halaman ini mencakup langkah-langkah inferensi hingga interpretasinya. Satu paket dengan kunci jawaban agar kamu bisa langsung cocokkan saat belajar.
Soal UT SATS4211 Metode Statistik 2
Dalam analisis data kategorik bivariat, tabel yang digunakan untuk menampilkan frekuensi dua variabel disebut tabel…
Tabel kontingensi digunakan untuk menampilkan hubungan antara dua variabel kategorik.
Jika variabel kategorik memiliki dua kategori dan variabel lainnya juga memiliki dua kategori, maka tabel kontingensi yang terbentuk berukuran…
Ukuran tabel kontingensi ditentukan oleh jumlah kategori masing-masing variabel, yaitu 2 baris dan 2 kolom.
Ukuran asosiasi yang digunakan untuk data kategorik yang terdiri dari dua variabel biner adalah…
Rasio odds mengukur kekuatan hubungan antara dua variabel biner dalam bentuk peluang.
Jika frekuensi harapan pada tabel kontingensi lebih dari 5, maka uji yang tepat untuk menguji independensi dua variabel kategorik adalah uji…
Uji Chi-kuadrat digunakan untuk menguji independensi variabel kategorik saat frekuensi harapan cukup besar.
Dalam tabel kontingensi 3×2, jumlah baris adalah…
Jumlah baris dalam tabel kontingensi ditentukan oleh kategori variabel pertama, yaitu 3.
Nilai koefisien kontingensi berkisar antara…
Koefisien kontingensi memiliki rentang nilai dari 0 hingga 1, dengan 0 menandakan tidak ada asosiasi.
Dalam data bivariat kontinu, hubungan antara dua variabel dapat dilihat secara visual melalui grafik…
Diagram pencar menunjukkan hubungan antara dua variabel kontinu dengan titik-titik pada sumbu x dan y.
Kovarians antara dua variabel X dan Y dapat dihitung menggunakan rumus…
Kovarians sampel dihitung dengan membagi jumlah produk deviasi oleh n-1.
Jika kovarians antara X dan Y bernilai positif, maka hubungan antara X dan Y adalah…
Kovarians positif menunjukkan bahwa X dan Y cenderung bergerak ke arah yang sama.
Koefisien korelasi Pearson dihitung dengan membagi kovarians dengan…
Koefisien korelasi Pearson adalah kovarians dibagi dengan hasil kali simpangan baku X dan Y.
Nilai korelasi Pearson r = 0,8 menunjukkan hubungan yang…
Nilai r mendekati 1 menandakan korelasi positif yang kuat.
Jika semua titik data terletak pada garis lurus dengan kemiringan negatif, maka nilai korelasi Pearson adalah…
Korelasi Pearson sempurna negatif bernilai -1.
Dalam distribusi normal bivariat, parameter yang mengukur kekuatan hubungan antara dua variabel adalah…
Koefisien korelasi rho mengukur asosiasi linear dalam distribusi normal bivariat.
Jika dua variabel berdistribusi normal bivariat dengan korelasi rho = 0, maka kedua variabel bersifat…
Dalam distribusi normal bivariat, korelasi nol menandakan independensi.
Fungsi densitas normal bivariat melibatkan parameter…
Parameter lengkap normal bivariat mencakup rata-rata, varians masing-masing, dan korelasi.
Kurva level dari distribusi normal bivariat berbentuk…
Kurva level distribusi normal bivariat berbentuk elips.
Dalam distribusi normal bivariat, jika koefisien korelasi ρ = 0, maka bentuk himpunan pasangan (x,y) adalah berbentuk?
Jika ρ = 0, maka tidak ada korelasi linear antara X dan Y, sehingga kontur densitas normal bivariat berbentuk lingkaran atau elips yang sejajar sumbu.
Dalam model regresi linear sederhana Y = β0 + β1X + ε, metode kuadrat terkecil (ordinary least squares) digunakan untuk meminimumkan jumlah dari?
Metode kuadrat terkecil meminimumkan jumlah kuadrat residual, yaitu selisih antara nilai observasi Y dan nilai taksiran dari model β0 + β1X.
Pada regresi linear sederhana, estimator β1 (koefisien regresi) dengan metode kuadrat terkecil dihitung menggunakan rumus?
Rumus estimator β1 adalah Σ(Xi – X̄)(Yi – Ȳ) dibagi dengan Σ(Xi – X̄)^2, yang merupakan rasio kovarians antara X dan Y terhadap varians X.
Dari data berikut: Xi = 1,2,3,4,5 dan Yi = 2,4,5,4,5, nilai koefisien regresi β1 estimasi adalah?
X̄=3, Ȳ=4. Σ(Xi-X̄)(Yi-Ȳ)= ( -2*-2)+(-1*0)+(0*1)+(1*0)+(2*1)=4+0+0+0+2=6. Σ(Xi-X̄)^2=4+1+0+1+4=10. β1=6/10=0,6.
Dalam regresi linear sederhana, nilai residual untuk suatu observasi adalah?
Residual adalah selisih antara nilai observasi Yi dengan nilai taksiran dari model, yaitu β0 + β1Xi.
Pada analisis regresi, jumlah kuadrat total (SST) dapat dinyatakan sebagai?
SST adalah jumlah kuadrat deviasi Yi terhadap rata-rata Ȳ, yaitu Σ(Yi – Ȳ)^2, yang mengukur total variasi pada variabel respon.
Dalam regresi linear sederhana, jika koefisien determinasi R^2 = 0,81, maka korelasi antara X dan Y adalah?
Pada regresi linear sederhana, R^2 adalah kuadrat dari koefisien korelasi Pearson, sehingga r = akar(0,81) = 0,90.
Untuk menguji apakah β1 = 0 dalam regresi linear sederhana, statistik uji yang digunakan adalah?
Uji hipotesis β1 = 0 menggunakan statistik t = β1 dibagi dengan standar error dari β1, yang mengikuti distribusi t dengan n-2 derajat bebas.
Interval kepercayaan 95% untuk β1 adalah?
Interval kepercayaan untuk β1 menggunakan nilai kritis t dengan α/2 = 0,025 dan derajat bebas n-2, karena varians error tidak diketahui dan diestimasi.
Jika dalam regresi linear sederhana diperoleh β1 = 2,5 dan SE(β1) = 0,5 dengan n = 30, nilai statistik uji t untuk H0: β1 = 0 adalah?
t = β1 / SE(β1) = 2,5 / 0,5 = 5,0.
Untuk menguji signifikansi regresi secara keseluruhan dalam regresi linear sederhana, uji F setara dengan uji t karena?
Pada regresi linear sederhana, statistik uji F sama dengan kuadrat dari statistik uji t, karena keduanya menguji hipotesis yang sama tentang β1.
Nilai taksiran untuk Y ketika X = X0 dalam regresi linear sederhana adalah?
Persamaan regresi linear sederhana digunakan untuk menaksir nilai Y pada X tertentu, yaitu Ŷ = β0 + β1X0.
Interval kepercayaan untuk rata-rata Y pada X = X0 diberikan oleh?
Interval kepercayaan untuk mean respons pada X0 menggunakan standar error Ŷi yang melibatkan varians residual dan jarak X0 dari X̄.
Interval prediksi untuk nilai individual Y pada X = X0 diberikan oleh?
Interval prediksi untuk observasi baru memiliki tambahan 1 dalam varians, karena kesalahan individu meliputi variasi residual dan variasi estimasi mean.
Pemeriksaan asumsi normalitas residual dalam regresi dapat dilakukan dengan?
Normal probability plot digunakan untuk memeriksa kenormalan residual dengan membandingkan kuantil residual dengan kuantil distribusi normal.
Jika plot residual versus nilai taksiran menunjukkan pola menyebar secara acak di sekitar nol, ini menandakan bahwa asumsi?
Residual yang menyebar acak tanpa pola sistematis di sekitar nol menunjukkan bahwa asumsi linearitas dan varians konstan (homoskedastisitas) terpenuhi.
Uji Breusch-Pagan digunakan untuk mendeteksi pelanggaran asumsi?
Uji Breusch-Pagan digunakan untuk mendeteksi heteroskedastisitas, yaitu pelanggaran asumsi bahwa varians residual konstan.
Dalam analisis regresi linear sederhana, interval kepercayaan untuk koefisien regresi (beta_1) digunakan untuk mengukur…
Interval kepercayaan memberikan rentang nilai parameter yang mungkin dengan tingkat kepercayaan tertentu, sesuai konsep inferensi parameter regresi.
Dalam pemeriksaan model regresi, jika kita ingin mendeteksi adanya pola non-linear dalam residual, alat yang paling tepat digunakan adalah…
Plot residual terhadap nilai taksiran dapat menunjukkan pola sistematis yang mengindikasikan non-linearitas.
Pada pemeriksaan asumsi homoskedastisitas dalam model regresi linear, kondisi yang ideal adalah…
Homoskedastisitas berarti varians residual sama untuk setiap nilai taksiran, sehingga tidak ada pola melebar atau menyempit.
Uji Durbin-Watson dalam analisis regresi digunakan untuk mendeteksi…
Uji Durbin-Watson menguji ada tidaknya autokorelasi pada residual, terutama untuk data deret waktu.
Nilai R^2 yang mendekati 1 dalam model regresi menunjukkan bahwa…
R^2 mengukur proporsi variasi variabel respons yang dijelaskan oleh model, nilai mendekati 1 menunjukkan model sangat baik dalam menjelaskan data.
Jika titik-titik dalam plot residual terhadap nilai taksiran membentuk pola melebar, hal ini menunjukkan pelanggaran asumsi…
Pola melebar pada plot residual mengindikasikan varians residual tidak konstan, melanggar asumsi homoskedastisitas.
Dalam membandingkan dua persamaan regresi garis lurus untuk dua kelompok data yang berbeda, uji yang digunakan untuk melihat apakah koefisien slope kedua regresi sama adalah…
Uji F membandingkan model penuh yang memungkinkan slope berbeda dengan model tereduksi yang mengasumsikan slope sama.
Jika kita memiliki dua garis regresi untuk data pria dan wanita, dan ingin menguji apakah intercept kedua regresi sama, maka model alternatif harus memperbolehkan…
Untuk menguji intercept, model alternatif harus memberi kebebasan pada kedua parameter, sehingga model lebih fleksibel.
Dalam membandingkan regresi, jika uji F menunjukkan bahwa slope kedua garis regresi berbeda secara signifikan, maka kesimpulannya adalah…
Perbedaan slope berarti hubungan antara prediktor dan respons berbeda antar kelompok.
Saat membandingkan dua regresi, model penuh (unrestricted) biasanya mencakup…
Model penuh memungkinkan intercept dan slope berbeda antar kelompok dengan variabel dummy.
Jika dalam uji perbandingan dua garis regresi diperoleh F hitung lebih kecil dari F tabel, maka keputusan yang diambil adalah…
F hitung kecil berarti tidak cukup bukti untuk menolak H0, sehingga dianggap garis regresi sama.
Dalam analisis regresi berganda, koefisien regresi parsial untuk suatu variabel prediktor mengukur…
Koefisien regresi parsial adalah perubahan respons per unit perubahan prediktor dengan variabel lain tetap.
Salah satu masalah yang sering muncul dalam regresi berganda adalah multikolinearitas, yaitu…
Multikolinearitas terjadi ketika dua atau lebih prediktor berkorelasi kuat, mengganggu estimasi koefisien.
Untuk mendeteksi multikolinearitas, salah satu indikator yang digunakan adalah…
VIF mengukur seberapa besar varians koefisien regresi meningkat akibat multikolinearitas.
Jika dalam regresi berganda suatu variabel prediktor memiliki VIF lebih dari 10, hal tersebut menunjukkan…
Nilai VIF > 10 umumnya dianggap sebagai indikasi multikolinearitas yang serius.
Dalam uji F untuk signifikansi model regresi berganda, jika F hitung > F tabel maka kesimpulannya adalah…
Uji F yang signifikan menunjukkan model secara keseluruhan signifikan, artinya minimal ada satu prediktor yang berpengaruh.
Uji kesesuaian (goodness of fit) digunakan untuk menguji apakah…
Uji kesesuaian membandingkan distribusi observasi dengan distribusi teoritis, misalnya chi-kuadrat.
Uji kesesuaian (goodness of fit) digunakan untuk membandingkan frekuensi observasi dengan frekuensi harapan. Jika terdapat k kategori dan parameter populasi diketahui, distribusi statistik uji yang digunakan adalah
Uji kesesuaian menggunakan statistik chi-kuadrat dengan derajat bebas k-1, di mana k adalah jumlah kategori. Ini mengukur penyimpangan antara frekuensi observasi dan harapan.
Dalam uji kesesuaian, frekuensi harapan untuk setiap kategori dihitung berdasarkan
Frekuensi harapan adalah hasil perkalian probabilitas dari distribusi teoretis dengan ukuran sampel total. Ini menjadi dasar perbandingan dengan frekuensi observasi.
Jika dalam uji kesesuaian diperoleh nilai statistik chi-kuadrat hitung lebih besar dari nilai tabel, maka keputusan yang diambil adalah
Chi-kuadrat hitung > tabel menunjukkan bahwa penyimpangan frekuensi observasi dari harapan cukup besar sehingga H0 ditolak, artinya data tidak sesuai distribusi teoretis.
Dalam uji kesesuaian, syarat yang harus dipenuhi agar uji valid adalah frekuensi harapan setiap kategori minimal
Agar pendekatan chi-kuadrat akurat, frekuensi harapan setiap kategori sebaiknya minimal 5. Jika kurang, kategori dapat digabung dengan kategori tetangga.
Dalam uji independensi dengan tabel kontingensi, hipotesis nol H0 menyatakan bahwa dua variabel
Uji independensi menguji apakah dua variabel bersifat independen. H0 menyatakan tidak ada hubungan, sementara H1 menyatakan ada hubungan.
Dalam tabel kontingensi 3 baris dan 2 kolom, derajat bebas untuk uji independensi adalah
Derajat bebas = (jumlah baris-1)x(jumlah kolom-1) = (3-1)x(2-1) = 2×1 = 2.
Dalam uji homogenitas, frekuensi harapan sel pada baris ke-i dan kolom ke-j dihitung dengan rumus
Frekuensi harapan = (total baris i x total kolom j)/total sampel, merujuk pada prinsip independensi tanpa hubungan antarvariabel.
Jika dalam uji homogenitas chi-kuadrat hitung lebih kecil dari chi-kuadrat tabel, maka kesimpulan yang tepat adalah
Chi-kuadrat hitung < tabel menunjukkan tidak ada bukti cukup untuk menolak H0, sehingga proporsi antarkelompok dianggap homogen.
Dalam uji independensi dengan tabel kontingensi 2×2, nilai chi-kuadrat yang telah dikoreksi kontinuitas disebut
Koreksi Yates diterapkan pada tabel 2×2 untuk menyesuaikan pendekatan chi-kuadrat ke distribusi diskrit, mengurangi bias.
Analisis variansi satu arah digunakan untuk menguji perbedaan rata-rata antara
ANOVA satu arah digunakan untuk membandingkan rata-rata tiga kelompok atau lebih yang independen, guna melihat apakah ada perbedaan signifikan antarkelompok.
Dalam ANOVA satu arah, variansi total dibagi menjadi dua komponen yaitu
ANOVA memisahkan variansi total menjadi variansi antar kelompok (antar grup) dan variansi dalam kelompok (kesalahan), yang digunakan dalam uji F.
Dalam ANOVA satu arah, statistik uji yang digunakan adalah
Uji F digunakan dalam ANOVA untuk membandingkan variansi antar kelompok dengan variansi dalam kelompok.
Jika dalam ANOVA satu arah nilai F hitung lebih besar dari F tabel, maka keputusan yang diambil adalah
F hitung > F tabel menunjukkan perbedaan variansi antar kelompok lebih besar dari variansi dalam kelompok, sehingga H0 ditolak.
Dalam ANOVA satu arah, asumsi yang harus dipenuhi adalah
ANOVA memerlukan asumsi normalitas data dan homogenitas variansi antarkelompok untuk validitas uji.
Analisis variansi dua arah tanpa interaksi menguji dua faktor. Derajat bebas untuk faktor A dengan a level adalah
Dalam ANOVA dua arah, derajat bebas untuk faktor A adalah a-1, di mana a adalah jumlah level faktor A.
Dalam ANOVA dua arah dengan interaksi, istilah interaksi mengukur
Interaksi menunjukkan bahwa pengaruh faktor A tergantung level faktor B, berarti efeknya tidak aditif.
Dalam ANOVA dua arah dengan replikasi, total variansi diuraikan menjadi komponen
Dengan replikasi, variansi total dibagi menjadi komponen faktor A, faktor B, interaksi AB, dan galat, yang masing-masing diuji dengan F.
Dalam analisis variansi dua arah, jika terdapat interaksi antara faktor A dan faktor B, maka yang paling tepat adalah:
Interaksi menunjukkan pengaruh gabungan faktor A dan B tidak bersifat aditif, sehingga efek masing-masing tidak dapat ditafsirkan sendiri-sendiri.
Dari suatu percobaan faktorial 2×2, diperoleh jumlah kuadrat interaksi sebesar 25 dan jumlah kuadrat galat sebesar 80 dengan derajat bebas galat 20. Nilai F hitung untuk interaksi adalah:
Interaksi memiliki derajat bebas (2-1)(2-1)=1 sehingga kuadrat tengah interaksi = 25/1=25. Kuadrat tengah galat = 80/20=4. F hitung = 25/4=6,25.
Pada uji Mann-Whitney untuk dua sampel independen, data yang digunakan adalah:
Uji Mann-Whitney merupakan uji nonparametrik untuk dua sampel independen yang cocok untuk data ordinal atau data interval yang tidak berdistribusi normal.
Dua sampel independen berukuran n1=8 dan n2=7 akan diuji menggunakan uji Mann-Whitney. Nilai U terkecil yang mungkin adalah:
Nilai U terkecil adalah 0, yang terjadi jika seluruh data sampel pertama lebih kecil dari sampel kedua.
Jika dalam uji Mann-Whitney diperoleh nilai U=10 dan n1=6, n2=6, maka nilai U' adalah:
U' = n1*n2 – U = 6*6 – 10 = 36 – 10 = 26.
Statistik uji yang digunakan pada uji Kruskal-Wallis untuk tiga sampel independen berdistribusi mendekati:
Uji Kruskal-Wallis menggunakan statistik H yang mendekati distribusi chi-kuadrat dengan derajat bebas k-1, dengan k adalah jumlah kelompok.
Tiga kelompok data independen dengan ukuran sampel 4, 5, dan 6 diuji dengan Kruskal-Wallis. Derajat bebas untuk distribusi chi-kuadrat adalah:
Derajat bebas untuk uji Kruskal-Wallis adalah k-1 = 3-1 = 2.
Dalam uji tanda (sign test) untuk sampel berpasangan, jika terdapat 8 pasang data dengan 7 tanda positif dan 1 tanda negatif, maka nilai uji statistik yang digunakan adalah:
Pada uji tanda, nilai statistik uji adalah jumlah tanda yang lebih sedikit, yaitu 1.
Uji Wilcoxon untuk data berpasangan menggunakan informasi:
Uji Wilcoxon menggunakan peringkat dari nilai mutlak selisih berpasangan, kemudian memberi tanda sesuai arah selisih.
Dalam uji Wilcoxon untuk sampel berpasangan, jika jumlah peringkat bertanda positif adalah 15 dan negatif 10, maka T hitung adalah:
Statistik T hitung pada uji Wilcoxon adalah jumlah peringkat yang lebih kecil, yaitu 10.
Jika dalam uji Wilcoxon diperoleh T hitung=6 dan n=8, dengan T tabel pada alfa=0,05 sebesar 3, maka keputusannya adalah:
Pada uji Wilcoxon, H0 ditolak jika T hitung <= T tabel. Karena 6 > 3, maka H0 gagal ditolak.
Suatu tabel pendapatan (payoff table) menyajikan informasi berupa:
Tabel pendapatan adalah matriks yang menunjukkan keuntungan atau kerugian untuk setiap kombinasi alternatif keputusan dan keadaan alam.
Jika terdapat tiga alternatif keputusan A1, A2, A3 dan dua keadaan S1, S2 dengan pendapatan sebagai berikut: A1: (10, 5), A2: (8, 7), A3: (6, 9), maka keputusan berdasarkan kriteria maksimin adalah:
Maksimin: pilih maksimum dari nilai minimum tiap alternatif. A1 min=5, A2 min=7, A3 min=6. Nilai maksimum adalah 7 dari A2.
Kesempatan rugi (opportunity loss) untuk suatu alternatif dan keadaan dihitung sebagai:
Kesempatan rugi adalah selisih antara pendapatan tertinggi dalam suatu keadaan dengan pendapatan dari alternatif yang dipilih.
Kriteria Laplace dalam pengambilan keputusan mengasumsikan bahwa:
Kriteria Laplace (equal likelihood) memberikan bobot probabilitas yang sama untuk setiap keadaan alam karena tidak ada informasi prior.
Dalam tabel pendapatan, jika biaya informasi sampel lebih besar dari nilai informasi sampel yang diharapkan, maka keputusan terbaik adalah:
Informasi sampel hanya layak dibeli jika biayanya tidak melebihi nilai informasi sampel yang diharapkan. Jika lebih besar, keputusan tanpa informasi lebih baik.
Dalam teori keputusan, tabel pendapatan menunjukkan nilai keuntungan untuk setiap pasangan tindakan dan keadaan alam. Jika suatu perusahaan memiliki dua pilihan tindakan A dan B serta tiga keadaan alam S1, S2, S3 dengan pendapatan A: 10, 20, 30 dan B: 15, 25, 5, berapakah nilai maksimax (pendekatan optimis) untuk tindakan A?
Pendekatan maksimax memilih nilai maksimum dari setiap tindakan. Untuk tindakan A, nilai maksimum adalah 30.
Dalam analisis keputusan dengan utilitas, fungsi utilitas digunakan untuk mengukur preferensi pengambil keputusan terhadap risiko. Jika seorang pengambil keputusan memiliki fungsi utilitas U(x) = akar(x) dan nilai x adalah 25, berapakah nilai utilitasnya?
Nilai utilitas dihitung dengan U(25) = akar(25) = 5.
Dalam teori keputusan, kesempatan rugi (opportunity loss) dihitung sebagai selisih antara pendapatan maksimum suatu keadaan alam dengan pendapatan aktual. Jika pendapatan maksimum untuk keadaan alam S1 adalah 50 dan pendapatan aktual untuk tindakan X adalah 30, berapakah kesempatan rugi untuk tindakan X pada S1?
Kesempatan rugi = 50 – 30 = 20.
Seorang investor memiliki dua pilihan investasi dengan ekspektasi utilitas masing-masing 0.7 dan 0.5. Jika ia memilih investasi dengan utilitas 0.7, prinsip keputusan apa yang digunakannya?
Investor memilih berdasarkan nilai utilitas tertinggi, yaitu prinsip maksimum ekspektasi utilitas.
Dalam analisis utilitas, kurva utilitas cekung menunjukkan sikap pengambil keputusan terhadap risiko yaitu:
Kurva utilitas cekung (concave) menunjukkan pengambil keputusan menghindari risiko karena utilitas marjinal menurun.
Jika seseorang memiliki nilai utilitas U(0) = 0 dan U(100) = 1, maka nilai utilitas untuk 50 jika fungsi utilitas linier adalah:
Fungsi linier berarti proporsional; 50 adalah setengah dari 100, sehingga utilitasnya 0.5.
Dalam pengambilan keputusan dengan informasi sampel, probabilitas prior digunakan untuk:
Probabilitas prior adalah keyakinan awal sebelum memperoleh informasi sampel.
Jika probabilitas prior untuk keadaan alam A adalah 0.4 dan B adalah 0.6, lalu data sampel memberikan probabilitas likelihood untuk A sebesar 0.2 dan B sebesar 0.3, berapakah probabilitas posterior untuk A?
P(A|data) = (0.4 x 0.2) / ((0.4 x 0.2) + (0.6 x 0.3)) = 0.08 / (0.08 + 0.18) = 0.08/0.26 = 0.3077.
Analisis posterior dalam teori keputusan bertujuan untuk:
Analisis posterior menggunakan informasi sampel untuk memperbarui probabilitas prior menjadi posterior.
Jika nilai harapan informasi sempurna (EVPI) adalah 10 dan nilai harapan sampel (EVSI) adalah 6, maka efisiensi sampel adalah:
Efisiensi sampel = EVSI / EVPI = 6/10 = 0.6.
Dalam analisis keputusan dengan informasi sampel, aturan Bayes digunakan untuk:
Aturan Bayes digunakan untuk memperbarui probabilitas prior menjadi posterior berdasarkan data sampel.
Distribusi probabilitas posterior diperoleh dengan mengalikan probabilitas prior dengan:
Probabilitas posterior = (prior x likelihood) / konstanta normalisasi.
Dalam analisis pre-posterior, nilai harapan sampel (EVSI) digunakan untuk:
EVSI membantu keputusan tentang mengambil sampel dengan membandingkan biaya dan manfaat.
Jika biaya pengambilan sampel adalah 5 dan EVSI adalah 8, maka keputusan yang tepat adalah:
Karena EVSI (8) > biaya (5), manfaat sampel lebih besar dari biaya, sehingga sampel layak diambil.
Dalam analisis posterior, dengan probabilitas prior yang sama untuk dua keadaan alam, dan likelihood 0.3 dan 0.7, maka probabilitas posterior untuk keadaan dengan likelihood 0.3 adalah:
Prior sama, misal 0.5 masing-masing; posterior = (0.5 x 0.3) / ((0.5 x 0.3)+(0.5 x 0.7)) = 0.15/0.5 = 0.3, tetapi karena prior tidak disebutkan, asumsi prior sama menghasilkan 0.3/1.0? Hitung: (0.5*0.3)=0.15, total = 0.5, jadi 0.15/0.5=0.3, sehingga jawabannya 0.3, tetapi pilihan D adalah 0.3/1.0 yang tidak tepat. Koreksi: Perhitungan sebenarnya = 0.3 jika prior sama, tetapi pilihan D salah. Saya revisi jawaban menjadi A? Opsi A adalah 0.3, jadi jawaban A. Saya perbaiki: jawaban seharusnya A=0.3, namun karena opsi D adalah 0.3/1.0 yang tidak standar, maka jawaban yang benar adalah A. Namun, perlu disesuaikan distribusi. Saya akan gunakan opsi A. (Saya perbaiki agar konsisten: prior sama, posterior = 0.3)
Jika nilai harapan tanpa informasi sempurna (EVwoPI) adalah 20 dan EVPI adalah 5, maka nilai harapan dengan informasi sempurna (EVwPI) adalah:
EVwPI = EVwoPI + EVPI = 20 + 5 = 25.
Coba kerjakan soal regresi berganda dulu sebelum lihat kunci jawaban, karena di situlah biasanya kesalahan interpretasi muncul. Modul 2 dan 3 membahas inferensi parameter dan pemeriksaan model yang sering banget diujikan dalam format UO. Bedakan mana soal yang minta hitung manual dan mana yang minta analisis output. Kalau masih bingung, cek satu per satu asumsi klasiknya dulu sebelum menarik kesimpulan. Ada banyak soal ujian UT lain di sini kalau kamu mau lanjut latihan matkul lain.
Di SATS4211 Metode Statistik 2, bagian analisis variansi dan uji kategorik biasanya jadi andalan di UAS karena butuh pemahaman tabel distribusi yang solid. Soal UT sering mengombinasikan konsep dari dua modul, misalnya regresi dengan data kategorik atau teori keputusan dengan analisis posterior. Kalau sudah hafal tabel F dan Chi-square, separuh perjuangan sudah selesai. Sisanya tinggal latihan soal dan teliti saat menghitung.




