Pulang kerja, terus buka modul 1 soal tabel kontingensi , langsung pusing sendiri. Bedanya data biner dengan data nominal di KB 1.1 itu sering bikin bingung pas ngerjain soal. Apalagi kalau udah masuk Modul 2. latihan soal UT di halaman ini nyusun materi dari dua modul awal biar kamu nggak mumet. STIK4362 Analisis Data Kategorik memang suka nguji logika asosiasi variabel.
Modul 3 soal uji independensi dengan Modul 4 soal regresi logistik biner itu dua topik paling bikin geleng kepala di UAS. Bukan karena rumusnya, tapi karena mahasiswa UT sering salah baca tabel outputnya. bank soal UT Statistika ini dikelompokkan per KB, jadi kamu bisa langsung latihan bagian independensi aja dulu. Soal UAS UT dari modul 3 sampai modul 4 biasanya butuh ketelitian tinggi.
Soal Ujian UT di bawah ini ngikutin pola tiap KB, dari model regresi multinomial di modul 5 sampai konsep probit di modul 8. Semua soal dibekali kunci jawaban plus pembahasan langkah demi langkah. contoh soal UAS UT kami sediakan khusus biar kamu gak belajar setengah-setengah. Fokus aja sama logika peluang di tiap modul.
Soal UT STIK4362 Analisis Data Kategorik
Data yang dikategorikan berdasarkan jenis kelamin (laki-laki, perempuan) termasuk dalam tipe data kategorik apa?
Jenis kelamin memiliki kategori tanpa urutan alami sehingga termasuk data nominal.
Dalam tabel kontingensi 2×2, jika sel a=10, b=20, c=30, d=40, berapa total frekuensi baris pertama?
Total frekuensi baris pertama adalah a+b = 10+20 = 30.
Pada uji independensi dalam tabel kontingensi, hipotesis nol menyatakan bahwa dua variabel bersifat:
Hipotesis nol menyatakan bahwa kedua variabel independen satu sama lain.
Dalam regresi logistik biner, transformasi logit dari probabilitas p didefinisikan sebagai:
Logit adalah logaritma natural dari odds, yaitu ln(p/(1-p)).
Pada regresi logistik multinomial, variabel respons memiliki skala:
Regresi logistik multinomial digunakan untuk respons nominal dengan lebih dari dua kategori.
Model regresi logistik ordinal yang mengasumsikan odds proporsional dikenal sebagai:
Model logit kumulatif menggunakan asumsi odds proporsional untuk respons ordinal.
Dalam model logit, odds dihitung sebagai:
Odds adalah perbandingan peluang sukses dengan peluang gagal, yaitu p/(1-p).
Fungsi probit merupakan kebalikan dari fungsi distribusi kumulatif dari distribusi:
Fungsi probit adalah invers dari fungsi distribusi kumulatif normal standar.
Komponen dari Generalized Linear Models (GLM) yang menghubungkan mean respons dengan prediktor linear adalah:
Fungsi link menghubungkan mean respons dengan prediktor linear dalam GLM.
Dalam analisis data kategorik, data yang diperoleh dari hasil pengamatan atau wawancara disebut data:
Data primer dikumpulkan langsung dari sumber pertama seperti wawancara.
Ukuran asosiasi yang nilainya berkisar antara 0 sampai 1 untuk tabel kontingensi 2×2 adalah:
Koefisien phi memiliki rentang 0 hingga 1 untuk tabel 2×2.
Pada regresi logistik biner, metode estimasi parameter yang umum digunakan adalah:
Maximum Likelihood Estimation adalah metode standar untuk regresi logistik biner.
Jika variabel respons memiliki tiga kategori nominal tanpa urutan, model yang tepat adalah:
Regresi logistik multinomial digunakan untuk respons nominal dengan lebih dari dua kategori.
Dalam regresi logistik ordinal, asumsi bahwa efek prediktor sama di semua kategori disebut:
Asumsi odds proporsional menyatakan bahwa koefisien regresi sama di semua perbandingan kumulatif.
Model logit dan model probit umumnya digunakan untuk data dengan variabel respons:
Model logit dan probit sering digunakan untuk data biner.
Dalam GLM untuk data biner, distribusi keluarga yang umum digunakan adalah:
Untuk data biner, distribusi binomial adalah pilihan keluarga dalam GLM.
Pada aksiologi realisme hukum dalam modul model logit, fokus utama adalah pada:
Aksiologi realisme hukum berkaitan dengan nilai dan etika dalam penelitian hukum.
Dalam analisis data kategorik, yang dimaksud dengan data nominal adalah data yang…
Data nominal adalah data kategorik yang kategorinya tidak memiliki urutan atau tingkatan alami.
Tabel kontingensi 2×2 digunakan untuk menyajikan hubungan antara…
Tabel kontingensi 2×2 secara khusus menyajikan data dari dua variabel kategorik yang masing-masing memiliki dua kategori.
Jika dalam suatu tabel kontingensi dua variabel independen, maka peluang bersama kedua variabel sama dengan…
Pada independensi, peluang bersama P(A dan B) sama dengan hasil kali peluang marjinal P(A) * P(B).
Uji independensi pada tabel kontingensi menggunakan statistik uji yang dirumuskan sebagai jumlah dari (observasi – ekspektasi)^2 / ekspektasi. Distribusi dari statistik uji tersebut adalah…
Statistik uji untuk independensi dalam tabel kontingensi mengikuti distribusi chi-kuadrat dengan derajat bebas tertentu.
Ukuran asosiasi yang digunakan untuk mengukur kekuatan hubungan antara dua variabel kategorik dalam tabel 2×2 dengan rentang nilai antara -1 dan 1 adalah…
Koefisien phi dirancang khusus untuk tabel 2×2 dan memiliki nilai antara -1 hingga 1 yang mengindikasikan kekuatan dan arah asosiasi.
Dalam regresi logistik biner, fungsi link yang menghubungkan prediktor dengan rata-rata respons adalah…
Regresi logistik biner menggunakan fungsi logit sebagai fungsi link yang mentransformasi peluang sukses menjadi log-odds.
Interpretasi dari koefisien regresi logistik biner (β) dalam bentuk log-odds adalah…
Koefisien β dalam regresi logistik menunjukkan perubahan pada log-odds dari variabel respons untuk setiap kenaikan satu unit pada prediktor.
Eksponensial dari koefisien regresi logistik (exp(β)) disebut sebagai…
Exp(β) menginterpretasikan rasio odds, yaitu seberapa besar odds berubah untuk setiap kenaikan satu unit pada prediktor.
Dalam regresi logistik multinomial, variabel respons memiliki skala…
Regresi logistik multinomial digunakan ketika variabel respons bersifat nominal dengan lebih dari dua kategori yang tidak memiliki urutan.
Pada regresi multinomial dengan tiga kategori respons, berapa jumlah model logit yang perlu diestimasi?
Dengan tiga kategori, satu kategori dipilih sebagai referensi, dan dua model logit diestimasi untuk membandingkan setiap kategori lainnya dengan referensi.
Asumsi yang mendasari model regresi logistik ordinal adalah…
Asumsi utama pada regresi logistik ordinal adalah asumsi proporsionalitas odds, yang menyatakan bahwa efek prediktor konstan antar kategori respons.
Dalam model logistik ordinal, fungsi link yang biasa digunakan adalah…
Fungsi logit adalah fungsi link yang paling umum digunakan dalam model logistik ordinal untuk menghubungkan peluang kumulatif dengan prediktor.
Model logit untuk data biner pada dasarnya memodelkan…
Model logit memodelkan peluang terjadinya suatu kejadian (sukses) yang dilambangkan dengan P(Y=1) sebagai fungsi dari prediktor.
Dua model non-linear yang umum digunakan untuk data biner adalah model logit dan model probit. Perbedaan utama keduanya terletak pada…
Model logit menggunakan fungsi distribusi kumulatif logistik, sedangkan model probit menggunakan fungsi distribusi kumulatif normal standar.
Estimasi parameter dalam model regresi probit dilakukan dengan metode…
Seperti model logit, model regresi probit juga menggunakan metode maximum likelihood untuk mengestimasi parameter model.
Komponen dari Generalized Linear Models (GLM) yang menjelaskan bahwa variabel respons berasal dari keluarga distribusi eksponensial disebut…
Dalam GLM, komponen acak adalah komponen yang mengidentifikasi distribusi probabilitas dari variabel respons, misalnya binomial atau Poisson.
Untuk data biner dalam kerangka GLM, distribusi yang tepat untuk komponen acak adalah…
Data biner (sukses/gagal) secara alami mengikuti distribusi binomial, sehingga distribusi inilah yang digunakan sebagai komponen acak dalam GLM untuk data biner.
Dalam analisis data kategorik, jenis data yang memiliki dua kategori atau lebih tanpa adanya tingkatan atau urutan disebut data…
Data nominal adalah data kategorik yang kategori-kategorinya tidak memiliki urutan atau tingkatan. Contohnya adalah jenis kelamin atau warna rambut.
Pada sebuah tabel kontingensi 2×2 yang menyilangkan status merokok (perokok/tidak) dan penyakit paru (ya/tidak), frekuensi harapan untuk sel (perokok, ya) dihitung berdasarkan asumsi…
Frekuensi harapan dalam tabel kontingensi dihitung berdasarkan asumsi independensi (tidak ada hubungan) antara dua variabel yang disilangkan.
Dalam uji independensi chi-kuadrat pada tabel kontingensi, jika nilai p-value lebih kecil dari taraf signifikansi alpha, maka kesimpulan yang tepat adalah…
Jika p-value < alpha, maka H0 yang menyatakan independensi ditolak sehingga disimpulkan bahwa kedua variabel dependen atau berasosiasi.
Odds ratio (OR) sebesar 1 pada tabel kontingensi 2×2 mengindikasikan bahwa…
Odds ratio = 1 menunjukkan bahwa odds kejadian pada satu kelompok sama dengan odds pada kelompok lainnya, yang berarti tidak ada asosiasi antara dua variabel.
Dalam model regresi logistik biner, fungsi link yang digunakan untuk menghubungkan rata-rata variabel respons dengan prediktor linear adalah…
Regresi logistik biner menggunakan fungsi logit sebagai fungsi link yang merupakan logaritma natural dari odds.
Jika dalam model regresi logistik biner, koefisien prediktor X adalah 1.5, maka interpretasi dari koefisien tersebut adalah…
Koefisien dalam regresi logistik diinterpretasikan sebagai perubahan log-odds. Untuk mendapatkan odds, digunakan eksponensial dari koefisien tersebut, yaitu exp(1.5).
Regresi logistik multinomial digunakan ketika variabel respons memiliki lebih dari dua kategori yang bersifat…
Regresi logistik multinomial digunakan untuk respons dengan kategori nominal yang tidak memiliki urutan, misalnya pilihan transportasi (bus, kereta, mobil).
Dalam regresi logistik multinomial, untuk suatu variabel respons dengan k kategori, berapa banyak model logit yang perlu diestimasi?
Dalam regresi multinomial, satu kategori dipilih sebagai referensi, sehingga jumlah model logit yang diestimasi adalah k-1.
Regresi logistik ordinal menggunakan asumsi penting yang disebut asumsi…
Asumsi proporsional odds (atau parallel lines) menyatakan bahwa pengaruh prediktor adalah sama pada setiap threshold logit kumulatif.
Model yang paling sesuai untuk variabel respons berupa tingkat pendidikan (SD, SMP, SMA, PT) dengan prediktor usia dan pendapatan adalah…
Tingkat pendidikan memiliki tingkatan (urutan) sehingga termasuk data ordinal. Model yang tepat untuk respons ordinal adalah regresi logistik ordinal.
Dalam model logit, transformasi logit didefinisikan sebagai logaritma natural dari…
Transformasi logit adalah logaritma natural dari odds, yaitu ln(p/(1-p)).
Pada model logit kumulatif untuk data ordinal, fungsi logit diterapkan pada…
Model logit kumulatif menggunakan fungsi logit pada peluang kumulatif, misalnya peluang berada pada kategori j atau lebih rendah.
Perbedaan utama antara model regresi probit dan model regresi logit terletak pada…
Perbedaan utama adalah fungsi link: logit menggunakan fungsi distribusi logistik, sedangkan probit menggunakan fungsi distribusi normal kumulatif (inversnya).
Dalam model regresi probit, interpretasi koefisien lebih sering dilakukan dengan melihat…
Interpretasi langsung koefisien probit sulit karena menggunakan skala z. Oleh karena itu, efek marginal sering digunakan untuk melihat perubahan peluang prediksi.
Generalized Linear Models (GLM) merupakan perluasan dari regresi linear yang memiliki tiga komponen. Komponen yang mendeskripsikan distribusi dari variabel respons disebut…
Komponen acak (random component) dalam GLM mendefinisikan distribusi probabilitas dari variabel respons, misalnya distribusi binomial untuk data biner.
Untuk data biner (sukses/gagal) yang dianalisis menggunakan GLM, distribusi yang tepat untuk komponen acak adalah…
Untuk data biner, variabel respons mengikuti distribusi Bernoulli yang merupakan kasus khusus dari distribusi binomial dengan jumlah percobaan satu.
Bagian paling tricky dari mata kuliah ini adalah bedain kapan pakai regresi logistik biner dan kapan pakai multinomial. Banyak yang baru sadar setelah lupa ngecek level pengukuran variabel responsnya. Kalau responsnya cuma dua kategori, biner, tapi kalau lebih dari dua dan nggak berurutan, langsung ke multinomial. Perbedaan ordinal di Modul 6 juga sering bikin bingung karena pakai asumsi proportional odds yang jarang dipahami. Ada banyak Soal UAS UT lain di sini kalau kamu mau bandingkan tipe soal dari matkul lain.
Di STIK4362 Analisis Data Kategorik, ujian biasanya gabungin teori tabel kontingensi dari UTM dengan aplikasi regresi di UO. Modul 2 soal tabel 2×2 sering keluar sebagai dasar pemahaman peluang, lalu loncat ke regresi logistik biner di Modul 4. Soal UAS UT yang paling bikin nilai jeblok biasanya karena lupa ngebaca output odds ratio dengan benar. Kalau udah paham asumsi independensi di Modul 3, sisanya lebih ke ngepasin model, coba ulang dari Modul 5 kalau masih mentok.




