Pulang kerja malah ketemu regresi logistik di Modul 4, bingung bedain odds ratio sama peluang biasa. Dua modul awal, yaitu tabel kontingensi di Modul 2 dan uji independensi di Modul 3, jadi dasar yang wajib dikuasai. Ini pondasi banget, sebenarnya. contoh soal UT di halaman ini langsung mengarah ke inti tiap bagian STIK4362 Analisis Data Kategorik.
Modul 6 soal regresi logistik ordinal dan Modul 7 tentang model logit sering bikin mahasiswa UT gregetan sendiri. Bukan materinya berat, tapi istilahnya banyak dan mirip satu sama lain. kumpulan soal UT Statistika ini nyusun soal per topik biar kamu gampang bandingin konsepnya sekaligus.
Soal UAS UT di bawah ini nyerempet semua KB penting, dari konsep generalized linear models di Modul 9 sampai penerapan regresi biner. Setiap soal dilengkapi kunci jawaban dan pembahasan, jadi kalau jawabanmu meleset langsung tahu alasannya. Klik latihan UAS UT untuk cek langsung daftar soalnya.
Soal UT STIK4362 Analisis Data Kategorik
Apa yang dimaksud dengan data kategorik?
Data kategorik adalah data yang dikelompokkan ke dalam kategori atau kelas berdasarkan karakteristik tertentu, bukan berupa angka kontinu.
Di bawah ini yang termasuk contoh data kategorik adalah…
Jenis kelamin merupakan data yang dikategorikan menjadi dua kelompok, yaitu laki-laki dan perempuan, sehingga termasuk data kategorik.
Tipe data kategorik yang memiliki kategori yang tidak dapat diurutkan disebut…
Data nominal adalah tipe data kategorik yang kategorinya tidak memiliki urutan atau tingkatan.
Data kategorik yang memiliki urutan atau tingkatan alami disebut…
Data ordinal adalah data kategorik yang kategorinya memiliki urutan atau tingkatan yang jelas.
Contoh data ordinal adalah…
Tingkat pendidikan memiliki urutan dari yang terendah ke tertinggi, yaitu SD, SMP, SMA, sehingga termasuk data ordinal.
Pada analisis data kategorik, distribusi frekuensi digunakan untuk…
Distribusi frekuensi digunakan untuk menampilkan jumlah observasi atau frekuensi pada setiap kategori data kategorik.
Tujuan utama analisis data kategorik adalah…
Analisis data kategorik bertujuan untuk mempelajari hubungan, asosiasi, atau perbedaan antar variabel kategorik.
Salah satu metode analisis yang digunakan untuk data kategorik adalah…
Uji chi-kuadrat adalah metode statistik yang sering digunakan untuk menganalisis data kategorik, terutama untuk uji independensi.
Dalam analisis data kategorik, tabel kontingensi berfungsi untuk…
Tabel kontingensi menyajikan data kategorik dalam format matriks baris dan kolom untuk melihat hubungan antar variabel.
Data kategorik yang dikumpulkan dari hasil survei dengan pertanyaan tertutup termasuk contoh data…
Data primer adalah data yang dikumpulkan langsung oleh peneliti, seperti hasil survei dengan pertanyaan tertutup.
Perbedaan utama antara data kategorik dan data numerik adalah…
Data kategorik tidak dapat dioperasikan secara matematis seperti penjumlahan atau pengurangan, berbeda dengan data numerik.
Pada analisis data kategorik, probabilitas digunakan untuk…
Probabilitas digunakan dalam analisis data kategorik untuk mengukur peluang atau kemungkinan suatu kejadian terjadi.
Tabel kontingensi 2×2 memiliki jumlah baris dan kolom sebanyak…
Tabel kontingensi 2×2 terdiri dari 2 baris dan 2 kolom, sehingga total ada 4 sel.
Dalam tabel kontingensi 2×2, sel tepi (marginal) menunjukkan…
Sel tepi atau marginal menunjukkan jumlah total frekuensi pada setiap baris atau kolom.
Jika frekuensi observasi pada sel (1,1) adalah 30 dan nilai harapannya 25, maka sel tersebut memiliki…
Deviasi positif terjadi ketika frekuensi observasi lebih besar dari nilai harapan, dalam hal ini 30 lebih besar dari 25.
Rumus untuk menghitung nilai harapan pada tabel kontingensi 2×2 adalah…
Nilai harapan dihitung dengan rumus (total baris * total kolom) dibagi total keseluruhan observasi.
Pada tabel kontingensi 2×2, jika terdapat hubungan antara dua variabel, maka nilai chi-kuadrat akan…
Nilai chi-kuadrat yang besar menunjukkan adanya hubungan atau asosiasi antara dua variabel dalam tabel kontingensi.
Dalam tabel kontingensi 2 x 2, jika frekuensi sel pada baris 1 kolom 1 adalah 30, baris 1 kolom 2 adalah 20, baris 2 kolom 1 adalah 10, dan baris 2 kolom 2 adalah 40, maka total baris 1 adalah
Total baris 1 dihitung dengan menjumlahkan frekuensi baris 1 kolom 1 dan baris 1 kolom 2, yaitu 30 + 20 = 50.
Dalam analisis data kategorik, peluang suatu kejadian didefinisikan sebagai
Peluang adalah ukuran kemungkinan terjadinya suatu kejadian, dinyatakan antara 0 dan 1.
Jika dalam suatu populasi terdapat 60% perempuan dan 40% laki-laki, maka peluang terpilihnya seorang laki-laki secara acak adalah
Peluang terpilih laki-laki adalah proporsi laki-laki dalam populasi, yaitu 40% sama dengan 0,4.
Dalam tabel kontingensi 2 x 2, peluang bersyarat P(A|B) berarti
Peluang bersyarat P(A|B) adalah peluang kejadian A terjadi dengan syarat kejadian B telah terjadi.
Jika dua kejadian A dan B saling bebas, maka P(A dan B) sama dengan
Untuk kejadian saling bebas, peluang keduanya terjadi adalah hasil kali peluang masing-masing.
Dalam suatu studi, dari 100 sampel, 30 menunjukkan karakteristik X. Peluang empiris suatu sampel memiliki karakteristik X adalah
Peluang empiris adalah frekuensi relatif, yaitu 30/100 = 0,3.
Jika peluang hujan adalah 0,2 dan peluang tidak hujan adalah 0,8, maka peluang total kejadian hujan atau tidak hujan adalah
Peluang total semua kemungkinan kejadian dalam ruang sampel adalah 1, yaitu 0,2 + 0,8 = 1,0.
Uji independensi dalam tabel kontingensi 2 x 2 menggunakan statistik uji Chi-kuadrat bertujuan untuk
Uji Chi-kuadrat independensi digunakan untuk menguji hipotesis nol bahwa dua variabel kategorik saling bebas.
Dalam uji independensi, jika nilai Chi-kuadrat hitung lebih besar dari nilai kritis, maka keputusan yang diambil adalah
Jika Chi-kuadrat hitung > nilai kritis, berarti H0 ditolak, sehingga ada bukti hubungan antara variabel.
Derajat bebas untuk uji independensi pada tabel kontingensi 2 x 3 adalah
Derajat bebas = (baris-1) x (kolom-1) = (2-1) x (3-1) = 1 x 2 = 2.
Jika dalam tabel kontingensi 2 x 2, frekuensi observasi dan ekspektasi sangat dekat, maka nilai Chi-kuadrat akan
Chi-kuadrat = jumlah (O-E)^2/E. Jika O dan E dekat, selisih kecil, sehingga nilai Chi-kuadrat kecil.
Dalam uji independensi, hipotesis nol (H0) menyatakan bahwa
H0 dalam uji independensi adalah tidak ada hubungan atau kedua variabel saling bebas.
Syarat penggunaan uji Chi-kuadrat independensi adalah frekuensi ekspektasi pada setiap sel minimal
Syarat umum adalah frekuensi ekspektasi minimal 5 untuk validitas uji Chi-kuadrat.
Ukuran asosiasi yang dapat digunakan untuk tabel 2 x 2 dan berkisar antara -1 hingga 1 adalah
Koefisien phi adalah ukuran asosiasi yang nilainya dari -1 sampai 1 untuk tabel 2 x 2.
Jika rasio odds suatu studi adalah 3, artinya
Rasio odds 3 menunjukkan odds pada kelompok terpapar 3 kali odds pada kelompok tidak terpapar.
Dalam tabel 2 x 2, nilai koefisien phi mendekati 1 menunjukkan
Koefisien phi positif mendekati 1 menunjukkan hubungan positif yang kuat antara dua variabel.
Ukuran asosiasi yang paling tepat untuk studi kasus-kontrol adalah
Dalam studi kasus-kontrol, rasio odds adalah ukuran asosiasi yang sesuai karena dapat dihitung langsung dari data.
Dalam tabel kontingensi 2×2, ukuran asosiasi yang nilainya berkisar antara -1 dan 1 adalah…
Koefisien phi merupakan ukuran asosiasi untuk tabel 2×2 yang nilainya antara -1 dan 1.
Dalam model regresi logistik biner, variabel respons yang digunakan berskala…
Regresi logistik biner digunakan ketika variabel respons bersifat biner atau dikotomus dengan dua kategori.
Fungsi link yang digunakan dalam regresi logistik biner adalah…
Fungsi link dalam regresi logistik biner adalah logit, yaitu log dari odds.
Jika peluang sukses adalah 0,8 maka odds suksesnya adalah…
Odds dihitung sebagai p/(1-p) = 0,8/0,2 = 4.
Dalam regresi logistik biner, parameter model diestimasi menggunakan metode…
Metode estimasi pada regresi logistik adalah maximum likelihood estimation.
Interpretasi dari koefisien regresi logistik biner yang positif adalah…
Koefisien positif menunjukkan bahwa peningkatan variabel prediktor akan meningkatkan nilai logit.
Jika rasio odds suatu variabel prediktor adalah 2, artinya…
Rasio odds sebesar 2 berarti odds sukses menjadi 2 kali lipat untuk setiap kenaikan satu unit prediktor.
Uji yang digunakan untuk menilai signifikansi keseluruhan model regresi logistik adalah…
Uji likelihood ratio digunakan untuk membandingkan model dengan dan tanpa prediktor.
Dalam analisis regresi logistik biner, goodness-of-fit model dapat dievaluasi menggunakan…
Uji Hosmer-Lemeshow adalah uji goodness-of-fit untuk model regresi logistik.
Nilai AIC yang lebih kecil pada regresi logistik menunjukkan…
AIC yang lebih kecil menunjukkan model yang lebih baik karena keseimbangan antara goodness-of-fit dan kompleksitas.
Pada regresi logistik multinomial, variabel respons memiliki kategori lebih dari dua dan berskala…
Regresi logistik multinomial digunakan untuk respons nominal dengan lebih dari dua kategori.
Dalam regresi logistik multinomial, salah satu kategori respons dipilih sebagai…
Satu kategori dipilih sebagai kategori referensi untuk membandingkan kategori lainnya.
Model regresi logistik multinomial menggunakan fungsi link…
Fungsi link yang digunakan adalah generalized logit yang membandingkan setiap kategori dengan kategori referensi.
Jika terdapat tiga kategori respons (A, B, C) dan B sebagai referensi, maka model akan menghasilkan…
Dengan tiga kategori, akan ada dua persamaan logit: satu untuk A vs B dan satu untuk C vs B.
Interpretasi rasio odds pada regresi logistik multinomial adalah…
Rasio odds menunjukkan perubahan odds suatu kategori dibandingkan kategori referensi.
Dalam regresi logistik multinomial, asumsi yang harus dipenuhi adalah…
Asumsi IIA (independence of irrelevant alternatives) harus dipenuhi pada regresi logistik multinomial.
Pada analisis data dengan regresi multinomial, jika variabel prediktor bersifat kategorik, maka perlu dibuat…
Variabel prediktor kategorik harus diubah menjadi variabel dummy sebelum dimasukkan ke model.
Dalam analisis regresi logistik multinomial, variabel respons memiliki karakteristik apa?
Regresi logistik multinomial digunakan untuk variabel respons dengan lebih dari dua kategori yang tidak memiliki urutan, seperti jenis pekerjaan atau warna.
Langkah pertama dalam analisis data dengan regresi multinomial adalah?
Langkah awal adalah mendefinisikan variabel respons dan prediktor untuk membangun model regresi multinomial.
Dalam regresi multinomial, kategori referensi digunakan untuk?
Kategori referensi menjadi dasar perbandingan untuk menginterpretasikan odds ratio kategori lain dalam model.
Interpretasi koefisien dalam regresi multinomial dilakukan dengan menggunakan?
Odds ratio digunakan untuk menginterpretasikan koefisien karena menunjukkan perubahan peluang relatif terhadap kategori referensi.
Konsep dasar regresi logistik ordinal digunakan ketika variabel respons memiliki skala?
Regresi logistik ordinal khusus untuk variabel respons berskala ordinal dengan kategori berurutan.
Asumsi penting dalam regresi logistik ordinal adalah?
Asumsi proporsional odds menyatakan bahwa hubungan antara prediktor dan logit dari setiap kategori adalah sama.
Dalam regresi logistik ordinal, model yang paling umum digunakan adalah?
Model logit kumulatif adalah model standar untuk regresi logistik ordinal karena memanfaatkan fungsi logit.
Jika variabel respons memiliki 3 kategori ordinal, berapa banyak persamaan logit yang diperlukan dalam model logit kumulatif?
Untuk k kategori, diperlukan k-1 persamaan logit, sehingga untuk 3 kategori diperlukan 2 persamaan.
Interpretasi koefisien dalam regresi logistik ordinal menunjukkan?
Koefisien diinterpretasikan sebagai perubahan log odds dari kategori yang lebih tinggi terhadap kategori yang lebih rendah.
Dalam model regresi logistik ordinal, threshold atau cut-point digunakan untuk?
Threshold adalah titik potong yang memisahkan kategori ordinal dalam model kumulatif.
Model regresi logistik ordinal dengan fungsi link logit dikenal sebagai?
Model logit kumulatif menggunakan fungsi link logit untuk memodelkan probabilitas kumulatif.
Uji asumsi proporsional odds dapat dilakukan dengan?
Uji Brant digunakan untuk menguji asumsi proporsional odds dalam regresi logistik ordinal.
Apa yang dimaksud dengan logit dalam model logit?
Logit adalah logaritma natural dari odds, yaitu ln(p/(1-p)), yang menjadi fungsi link dalam model.
Fungsi link yang digunakan dalam model logit adalah?
Model logit menggunakan fungsi logit sebagai fungsi link untuk menghubungkan prediktor dengan probabilitas.
Dalam model logit, interpretasi koefisien dilakukan dengan melihat?
Odds ratio diperoleh dari eksponensial koefisien dan digunakan untuk interpretasi karena lebih intuitif.
Model logit termasuk dalam kelompok model?
Model logit adalah bagian dari generalized linear models (GLM) dengan fungsi link logit dan distribusi binomial.
Contoh penerapan model logit dalam analisis data adalah?
Model logit sering digunakan untuk data biner seperti keputusan membeli atau tidak membeli produk dalam penelitian pasar.
Dalam model logit, fungsi yang menghubungkan peluang sukses dengan prediktor adalah fungsi logit. Fungsi logit didefinisikan sebagai logaritma natural dari apa?
Fungsi logit adalah logaritma natural dari odds sukses, yaitu ln(p/(1-p)), yang merupakan transformasi logit dari peluang sukses.
Dalam model logit, parameter estimasi biasanya diperoleh menggunakan metode berikut, kecuali?
Metode kuadrat terkecil tidak digunakan untuk model logit karena hubungan nonlinier. Metode maksimum likelihood dengan iterasi numerik seperti Newton-Raphson digunakan.
Dalam penerapan model logit, interpretasi koefisien regresi adalah perubahan pada?
Koefisien regresi dalam model logit menunjukkan perubahan pada log odds sukses untuk setiap kenaikan satu unit prediktor, dengan prediktor lain tetap.
Jika model logit memiliki koefisien regresi sebesar 1,5 untuk variabel X, maka odds rasio untuk perubahan satu unit X adalah?
Odds rasio diperoleh dari eksponensial koefisien regresi, yaitu e^(1,5), yang menunjukkan perkalian odds sukses untuk setiap kenaikan satu unit X.
Dalam model logit, uji signifikansi koefisien regresi secara simultan menggunakan statistik uji?
Uji rasio likelihood digunakan untuk uji signifikansi simultan koefisien dalam model logit, membandingkan model penuh dengan model tanpa prediktor.
Jika model logit menunjukkan nilai deviance yang besar, artinya?
Deviance yang besar menunjukkan perbedaan signifikan antara model dugaan dan data, sehingga model kurang cocok dengan data.
Dalam model logit, goodness of fit dapat diukur dengan menggunakan?
AIC dan BIC adalah kriteria untuk menilai goodness of fit model logit, dengan nilai lebih kecil menunjukkan model lebih baik.
Aksiologi realisme hukum berkaitan dengan aspek?
Aksiologi realisme hukum membahas nilai dan etika yang mendasari penegakan hukum, bukan fokus pada aspek teknis statistik.
Dalam aksiologi realisme hukum, tujuan utama hukum adalah?
Aksiologi realisme hukum menekankan keadilan dan ketertiban sosial sebagai tujuan utama hukum, bukan aspek teknis atau ekonomi.
Realisme hukum dalam praktiknya sering mengkritisi pendekatan?
Realisme hukum mengkritisi formalisme hukum yang kaku karena mengabaikan konteks sosial dan nilai-nilai praktis dalam penegakan hukum.
Salah satu tokoh utama realisme hukum yang membahas aspek aksiologi adalah?
Oliver Wendell Holmes adalah tokoh realisme hukum yang menekankan bahwa hukum harus dipahami dalam konteks pengalaman dan nilai sosial.
Dalam aksiologi realisme hukum, nilai keadilan dipandang sebagai?
Aksiologi realisme hukum memandang keadilan sebagai hasil dari proses sosial dan konteks, bukan konsep absolut yang statis.
Dalam model regresi probit, fungsi yang digunakan untuk mentransformasi peluang adalah fungsi?
Model regresi probit menggunakan fungsi kumulatif distribusi normal standar untuk menghubungkan peluang sukses dengan prediktor.
Perbedaan utama antara model probit dan logit adalah pada asumsi distribusi dari?
Model probit mengasumsikan galat berdistribusi normal standar, sedangkan logit mengasumsikan galat berdistribusi logistik.
Dalam model regresi probit, parameter diperkirakan dengan metode?
Seperti model logit, model probit menggunakan metode maksimum likelihood untuk memperkirakan parameter karena sifat nonliniernya.
Jika dalam model probit, nilai probit untuk peluang 0,5 adalah 0, artinya?
Fungsi probit adalah invers dari distribusi normal standar, sehingga pada peluang 0,5 menghasilkan nilai 0 karena median distribusi normal standar adalah 0.
Dalam model regresi probit, fungsi yang menghubungkan peluang dengan prediktor linear adalah fungsi distribusi kumulatif dari distribusi apa?
Model probit menggunakan inverse dari fungsi distribusi kumulatif (CDF) distribusi normal standar untuk memodelkan peluang.
Pada model regresi probit, parameter beta diestimasi menggunakan metode apa?
Estimasi parameter dalam regresi probit dilakukan dengan metode maksimum likelihood (MLE) karena model non-linear.
Jika dalam model probit nilai z = 0, maka peluang yang dihasilkan adalah?
CDF normal standar pada z=0 menghasilkan peluang 0,5 karena distribusi normal simetris di titik nol.
Perbedaan utama antara model probit dan logit terletak pada bentuk fungsi apa?
Model probit menggunakan fungsi link probit (invers CDF normal), sedangkan logit menggunakan fungsi link logit (log odds).
Dalam regresi probit, asumsi distribusi error adalah?
Regresi probit mengasumsikan error berdistribusi normal standar dengan mean 0 dan varians 1.
Jika koefisien prediktor dalam model probit adalah positif, maka pengaruhnya terhadap peluang adalah?
Koefisien positif meningkatkan nilai z, sehingga melalui CDF normal, peluang kejadian meningkat.
Apa komponen utama dalam Generalized Linear Models (GLM)?
GLM terdiri dari tiga komponen: distribusi dari keluarga eksponensial, prediktor linear, dan fungsi link yang menghubungkan mean dengan prediktor.
Fungsi link dalam GLM berfungsi untuk?
Fungsi link menghubungkan nilai harapan (mean) dari variabel respons dengan prediktor linear.
Distribusi apa yang termasuk dalam keluarga eksponensial untuk GLM?
Distribusi dari keluarga eksponensial meliputi normal, binomial, Poisson, gamma, dan lainnya.
Jika variabel respons adalah biner, distribusi yang sesuai dalam GLM adalah?
Untuk data biner, distribusi yang tepat adalah binomial karena merepresentasikan jumlah sukses dalam percobaan.
Fungsi link kanonik untuk distribusi binomial dalam GLM adalah?
Fungsi link kanonik untuk distribusi binomial adalah logit, yang menghubungkan log odds dengan prediktor linear.
Model regresi Poisson menggunakan fungsi link apa?
Untuk data count dengan distribusi Poisson, fungsi link yang umum digunakan adalah log untuk memastikan mean positif.
Untuk data biner, fungsi link apa yang menghasilkan peluang antara 0 dan 1?
Fungsi link logit dan probit memetakan prediktor linear ke interval (0,1) sehingga sesuai untuk peluang.
Interpretasi koefisien dalam GLM dengan fungsi link log adalah?
Dengan fungsi link log, koefisien diinterpretasikan sebagai perubahan log dari mean respons.
Metode estimasi yang digunakan dalam GLM adalah?
GLM menggunakan metode maksimum likelihood untuk mengestimasi parameter.
Dalam GLM untuk data biner, deviance digunakan untuk mengukur?
Deviance adalah ukuran kesesuaian model, membandingkan model yang diestimasi dengan model jenuh.
Regresi logistik ordinal di modul 6 sering jadi titik lemah banyak orang. Soal UAS biasanya menyajikan tabel kontingensi dulu, baru minta kamu menentukan model logit atau probit yang cocok. Antara UTM dan UO bedanya tipis tapi krusial. Kalau asumsi parallel lines-nya terlewat, jawaban analisis kamu langsung meleset dari kunci.
Model logistik biner sampai multinomial itu fondasi utama STIK4362 Analisis Data Kategorik. Soal UO sering menggabungkan tabel peluang dari modul 2 dengan uji independensi di modul 3, baru dilanjut regresi. Ada banyak bank soal UAS UT lain di sini kalau kamu mau cek pola soal serupa buat latihan tambahan.





