💜 Selalu gratis

Soalut.com tetap gratis karena kamu. Yuk, bantu kami terus hadir!💜 Selalu gratis

Soal UAS UT STIK4362 Analisis Data Kategorik dan Kunci Jawaban

Soal UT STIK4362 Analisis Data Kategorik
Soal UT STIK4362 Analisis Data Kategorik

Pulang kerja, terus buka modul 1 soal tabel kontingensi , langsung pusing sendiri. Bedanya data biner dengan data nominal di KB 1.1 itu sering bikin bingung pas ngerjain soal. Apalagi kalau udah masuk Modul 2. latihan soal UT di halaman ini nyusun materi dari dua modul awal biar kamu nggak mumet. STIK4362 Analisis Data Kategorik memang suka nguji logika asosiasi variabel.

Modul 3 soal uji independensi dengan Modul 4 soal regresi logistik biner itu dua topik paling bikin geleng kepala di UAS. Bukan karena rumusnya, tapi karena mahasiswa UT sering salah baca tabel outputnya. bank soal UT Statistika ini dikelompokkan per KB, jadi kamu bisa langsung latihan bagian independensi aja dulu. Soal UAS UT dari modul 3 sampai modul 4 biasanya butuh ketelitian tinggi.

Soal Ujian UT di bawah ini ngikutin pola tiap KB, dari model regresi multinomial di modul 5 sampai konsep probit di modul 8. Semua soal dibekali kunci jawaban plus pembahasan langkah demi langkah. contoh soal UAS UT kami sediakan khusus biar kamu gak belajar setengah-setengah. Fokus aja sama logika peluang di tiap modul.

Soal UT STIK4362 Analisis Data Kategorik

1.

Data yang dikategorikan berdasarkan jenis kelamin (laki-laki, perempuan) termasuk dalam tipe data kategorik apa?

  • A. Rasio
  • B. Ordinal
  • C. Interval
  • D. Nominal
Jawaban: D
Jenis kelamin memiliki kategori tanpa urutan alami sehingga termasuk data nominal.
2.

Dalam tabel kontingensi 2×2, jika sel a=10, b=20, c=30, d=40, berapa total frekuensi baris pertama?

  • A. 10
  • B. 20
  • C. 30
  • D. 50
Jawaban: C
Total frekuensi baris pertama adalah a+b = 10+20 = 30.
3.

Pada uji independensi dalam tabel kontingensi, hipotesis nol menyatakan bahwa dua variabel bersifat:

  • A. Independen
  • B. Bergantung
  • C. Berkorelasi positif
  • D. Berkorelasi negatif
Jawaban: A
Hipotesis nol menyatakan bahwa kedua variabel independen satu sama lain.
4.

Dalam regresi logistik biner, transformasi logit dari probabilitas p didefinisikan sebagai:

  • A. ln(1-p)
  • B. ln(p/(1-p))
  • C. p/(1-p)
  • D. e^(p)
Jawaban: B
Logit adalah logaritma natural dari odds, yaitu ln(p/(1-p)).
5.

Pada regresi logistik multinomial, variabel respons memiliki skala:

  • A. Biner
  • B. Nominal dengan lebih dari dua kategori
  • C. Ordinal
  • D. Kontinu
Jawaban: B
Regresi logistik multinomial digunakan untuk respons nominal dengan lebih dari dua kategori.
6.

Model regresi logistik ordinal yang mengasumsikan odds proporsional dikenal sebagai:

  • A. Model probit
  • B. Model baseline-category
  • C. Model logit kumulatif
  • D. Model linear umum
Jawaban: C
Model logit kumulatif menggunakan asumsi odds proporsional untuk respons ordinal.
7.

Dalam model logit, odds dihitung sebagai:

  • A. p^2
  • B. ln(p)
  • C. 1-p
  • D. p/(1-p)
Jawaban: D
Odds adalah perbandingan peluang sukses dengan peluang gagal, yaitu p/(1-p).
8.

Fungsi probit merupakan kebalikan dari fungsi distribusi kumulatif dari distribusi:

  • A. Normal standar
  • B. Logistik
  • C. Poisson
  • D. Binomial
Jawaban: A
Fungsi probit adalah invers dari fungsi distribusi kumulatif normal standar.
9.

Komponen dari Generalized Linear Models (GLM) yang menghubungkan mean respons dengan prediktor linear adalah:

  • A. Komponen acak
  • B. Distribusi keluarga
  • C. Fungsi link
  • D. Komponen sistematik
Jawaban: C
Fungsi link menghubungkan mean respons dengan prediktor linear dalam GLM.
10.

Dalam analisis data kategorik, data yang diperoleh dari hasil pengamatan atau wawancara disebut data:

  • A. Diskrit
  • B. Sekunder
  • C. Kuantitatif
  • D. Primer
Jawaban: D
Data primer dikumpulkan langsung dari sumber pertama seperti wawancara.
11.

Ukuran asosiasi yang nilainya berkisar antara 0 sampai 1 untuk tabel kontingensi 2×2 adalah:

  • A. Koefisien phi
  • B. Odds ratio
  • C. Gamma
  • D. Kendall's tau
Jawaban: A
Koefisien phi memiliki rentang 0 hingga 1 untuk tabel 2×2.
12.

Pada regresi logistik biner, metode estimasi parameter yang umum digunakan adalah:

  • A. Ordinary Least Squares
  • B. Bayesian Estimation
  • C. Method of Moments
  • D. Maximum Likelihood Estimation
Jawaban: D
Maximum Likelihood Estimation adalah metode standar untuk regresi logistik biner.
13.

Jika variabel respons memiliki tiga kategori nominal tanpa urutan, model yang tepat adalah:

  • A. Regresi logistik biner
  • B. Regresi logistik multinomial
  • C. Regresi logistik ordinal
  • D. Regresi probit
Jawaban: B
Regresi logistik multinomial digunakan untuk respons nominal dengan lebih dari dua kategori.
14.

Dalam regresi logistik ordinal, asumsi bahwa efek prediktor sama di semua kategori disebut:

  • A. Asumsi linearitas
  • B. Asumsi odds proporsional
  • C. Asumsi normalitas
  • D. Asumsi homoskedastisitas
Jawaban: B
Asumsi odds proporsional menyatakan bahwa koefisien regresi sama di semua perbandingan kumulatif.
15.

Model logit dan model probit umumnya digunakan untuk data dengan variabel respons:

  • A. Biner
  • B. Kontinu
  • C. Multinomial
  • D. Ordinal
Jawaban: A
Model logit dan probit sering digunakan untuk data biner.
16.

Dalam GLM untuk data biner, distribusi keluarga yang umum digunakan adalah:

  • A. Normal
  • B. Poisson
  • C. Binomial
  • D. Gamma
Jawaban: C
Untuk data biner, distribusi binomial adalah pilihan keluarga dalam GLM.
17.

Pada aksiologi realisme hukum dalam modul model logit, fokus utama adalah pada:

  • A. Nilai dan etika dalam penelitian hukum
  • B. Penerapan model pada data hukum
  • C. Aspek ontologis hukum
  • D. Metode pengumpulan data
Jawaban: A
Aksiologi realisme hukum berkaitan dengan nilai dan etika dalam penelitian hukum.
18.

Dalam analisis data kategorik, yang dimaksud dengan data nominal adalah data yang…

  • A. tidak memiliki tingkatan atau urutan
  • B. hanya memiliki dua kategori saja
  • C. memiliki tingkatan atau urutan
  • D. berupa bilangan kontinu
Jawaban: A
Data nominal adalah data kategorik yang kategorinya tidak memiliki urutan atau tingkatan alami.
19.

Tabel kontingensi 2×2 digunakan untuk menyajikan hubungan antara…

  • A. dua variabel kategorik masing-masing dengan dua kategori
  • B. satu variabel kategorik dengan satu variabel numerik
  • C. dua variabel numerik
  • D. tiga variabel kategorik
Jawaban: A
Tabel kontingensi 2×2 secara khusus menyajikan data dari dua variabel kategorik yang masing-masing memiliki dua kategori.
20.

Jika dalam suatu tabel kontingensi dua variabel independen, maka peluang bersama kedua variabel sama dengan…

  • A. jumlah peluang marjinal masing-masing variabel
  • B. selisih peluang marjinal masing-masing variabel
  • C. hasil kali peluang marjinal masing-masing variabel
  • D. peluang bersyarat salah satu variabel
Jawaban: C
Pada independensi, peluang bersama P(A dan B) sama dengan hasil kali peluang marjinal P(A) * P(B).
21.

Uji independensi pada tabel kontingensi menggunakan statistik uji yang dirumuskan sebagai jumlah dari (observasi – ekspektasi)^2 / ekspektasi. Distribusi dari statistik uji tersebut adalah…

  • A. distribusi normal standar
  • B. distribusi chi-kuadrat
  • C. distribusi F
  • D. distribusi t
Jawaban: B
Statistik uji untuk independensi dalam tabel kontingensi mengikuti distribusi chi-kuadrat dengan derajat bebas tertentu.
22.

Ukuran asosiasi yang digunakan untuk mengukur kekuatan hubungan antara dua variabel kategorik dalam tabel 2×2 dengan rentang nilai antara -1 dan 1 adalah…

  • A. rasio odds
  • B. koefisien phi
  • C. koefisien kontingensi
  • D. Cramer's V
Jawaban: B
Koefisien phi dirancang khusus untuk tabel 2×2 dan memiliki nilai antara -1 hingga 1 yang mengindikasikan kekuatan dan arah asosiasi.
23.

Dalam regresi logistik biner, fungsi link yang menghubungkan prediktor dengan rata-rata respons adalah…

  • A. fungsi identitas
  • B. fungsi probit
  • C. fungsi log
  • D. fungsi logit
Jawaban: D
Regresi logistik biner menggunakan fungsi logit sebagai fungsi link yang mentransformasi peluang sukses menjadi log-odds.
24.

Interpretasi dari koefisien regresi logistik biner (β) dalam bentuk log-odds adalah…

  • A. perubahan peluang akibat perubahan satu unit variabel prediktor
  • B. perubahan log-odds akibat perubahan satu unit variabel prediktor
  • C. perubahan odds akibat perubahan satu unit variabel prediktor
  • D. perubahan variabel respons akibat perubahan satu unit prediktor
Jawaban: B
Koefisien β dalam regresi logistik menunjukkan perubahan pada log-odds dari variabel respons untuk setiap kenaikan satu unit pada prediktor.
25.

Eksponensial dari koefisien regresi logistik (exp(β)) disebut sebagai…

  • A. rasio odds
  • B. peluang sukses
  • C. log-odds
  • D. nilai prediksi
Jawaban: A
Exp(β) menginterpretasikan rasio odds, yaitu seberapa besar odds berubah untuk setiap kenaikan satu unit pada prediktor.
26.

Dalam regresi logistik multinomial, variabel respons memiliki skala…

  • A. biner
  • B. ordinal dengan lebih dari dua kategori
  • C. nominal dengan lebih dari dua kategori
  • D. kontinu
Jawaban: C
Regresi logistik multinomial digunakan ketika variabel respons bersifat nominal dengan lebih dari dua kategori yang tidak memiliki urutan.
27.

Pada regresi multinomial dengan tiga kategori respons, berapa jumlah model logit yang perlu diestimasi?

  • A. satu model
  • B. empat model
  • C. tiga model
  • D. dua model
Jawaban: D
Dengan tiga kategori, satu kategori dipilih sebagai referensi, dan dua model logit diestimasi untuk membandingkan setiap kategori lainnya dengan referensi.
28.

Asumsi yang mendasari model regresi logistik ordinal adalah…

  • A. proporsionalitas odds
  • B. multikolinearitas antar prediktor
  • C. independensi antar observasi
  • D. linearitas antar prediktor
Jawaban: A
Asumsi utama pada regresi logistik ordinal adalah asumsi proporsionalitas odds, yang menyatakan bahwa efek prediktor konstan antar kategori respons.
29.

Dalam model logistik ordinal, fungsi link yang biasa digunakan adalah…

  • A. probit
  • B. logit
  • C. complementary log-log
  • D. inverse
Jawaban: B
Fungsi logit adalah fungsi link yang paling umum digunakan dalam model logistik ordinal untuk menghubungkan peluang kumulatif dengan prediktor.
30.

Model logit untuk data biner pada dasarnya memodelkan…

  • A. nilai variabel respons secara langsung
  • B. rata-rata variabel prediktor
  • C. peluang kejadian sukses
  • D. varians dari variabel respons
Jawaban: C
Model logit memodelkan peluang terjadinya suatu kejadian (sukses) yang dilambangkan dengan P(Y=1) sebagai fungsi dari prediktor.
31.

Dua model non-linear yang umum digunakan untuk data biner adalah model logit dan model probit. Perbedaan utama keduanya terletak pada…

  • A. jenis variabel prediktor
  • B. jumlah parameter yang diestimasi
  • C. ukuran sampel yang dibutuhkan
  • D. fungsi distribusi kumulatif yang digunakan
Jawaban: D
Model logit menggunakan fungsi distribusi kumulatif logistik, sedangkan model probit menggunakan fungsi distribusi kumulatif normal standar.
32.

Estimasi parameter dalam model regresi probit dilakukan dengan metode…

  • A. maximum likelihood
  • B. ordinary least squares
  • C. weighted least squares
  • D. method of moments
Jawaban: A
Seperti model logit, model regresi probit juga menggunakan metode maximum likelihood untuk mengestimasi parameter model.
33.

Komponen dari Generalized Linear Models (GLM) yang menjelaskan bahwa variabel respons berasal dari keluarga distribusi eksponensial disebut…

  • A. fungsi link
  • B. prediktor linear
  • C. komponen sistematis
  • D. komponen acak
Jawaban: D
Dalam GLM, komponen acak adalah komponen yang mengidentifikasi distribusi probabilitas dari variabel respons, misalnya binomial atau Poisson.
34.

Untuk data biner dalam kerangka GLM, distribusi yang tepat untuk komponen acak adalah…

  • A. distribusi normal
  • B. distribusi Poisson
  • C. distribusi binomial
  • D. distribusi gamma
Jawaban: C
Data biner (sukses/gagal) secara alami mengikuti distribusi binomial, sehingga distribusi inilah yang digunakan sebagai komponen acak dalam GLM untuk data biner.
35.

Dalam analisis data kategorik, jenis data yang memiliki dua kategori atau lebih tanpa adanya tingkatan atau urutan disebut data…

  • A. Ordinal
  • B. Nominal
  • C. Interval
  • D. Rasio
Jawaban: B
Data nominal adalah data kategorik yang kategori-kategorinya tidak memiliki urutan atau tingkatan. Contohnya adalah jenis kelamin atau warna rambut.
36.

Pada sebuah tabel kontingensi 2×2 yang menyilangkan status merokok (perokok/tidak) dan penyakit paru (ya/tidak), frekuensi harapan untuk sel (perokok, ya) dihitung berdasarkan asumsi…

  • A. Ada hubungan kuat antara merokok dan penyakit paru
  • B. Data berdistribusi normal
  • C. Proporsi perokok lebih besar dari bukan perokok
  • D. Tidak ada hubungan antara merokok dan penyakit paru
Jawaban: D
Frekuensi harapan dalam tabel kontingensi dihitung berdasarkan asumsi independensi (tidak ada hubungan) antara dua variabel yang disilangkan.
37.

Dalam uji independensi chi-kuadrat pada tabel kontingensi, jika nilai p-value lebih kecil dari taraf signifikansi alpha, maka kesimpulan yang tepat adalah…

  • A. Gagal tolak H0, artinya kedua variabel independen
  • B. Tolak H0, artinya kedua variabel independen
  • C. Gagal tolak H0, artinya kedua variabel dependen
  • D. Tolak H0, artinya kedua variabel dependen (berasosiasi)
Jawaban: D
Jika p-value < alpha, maka H0 yang menyatakan independensi ditolak sehingga disimpulkan bahwa kedua variabel dependen atau berasosiasi.
38.

Odds ratio (OR) sebesar 1 pada tabel kontingensi 2×2 mengindikasikan bahwa…

  • A. Ada asosiasi negatif yang kuat
  • B. Ada asosiasi positif yang kuat
  • C. Tidak ada asosiasi antara dua variabel
  • D. Variabel dependen memiliki pengaruh besar
Jawaban: C
Odds ratio = 1 menunjukkan bahwa odds kejadian pada satu kelompok sama dengan odds pada kelompok lainnya, yang berarti tidak ada asosiasi antara dua variabel.
39.

Dalam model regresi logistik biner, fungsi link yang digunakan untuk menghubungkan rata-rata variabel respons dengan prediktor linear adalah…

  • A. Fungsi identitas
  • B. Fungsi log
  • C. Fungsi logit
  • D. Fungsi probit
Jawaban: C
Regresi logistik biner menggunakan fungsi logit sebagai fungsi link yang merupakan logaritma natural dari odds.
40.

Jika dalam model regresi logistik biner, koefisien prediktor X adalah 1.5, maka interpretasi dari koefisien tersebut adalah…

  • A. Setiap kenaikan satu unit X akan menurunkan log-odds sebesar 1.5
  • B. Setiap kenaikan satu unit X akan menaikkan log-odds sebesar 0.5
  • C. Tidak ada pengaruh X terhadap variabel respons
  • D. Setiap kenaikan satu unit X akan menaikkan odds sebesar exp(1.5)
Jawaban: D
Koefisien dalam regresi logistik diinterpretasikan sebagai perubahan log-odds. Untuk mendapatkan odds, digunakan eksponensial dari koefisien tersebut, yaitu exp(1.5).
41.

Regresi logistik multinomial digunakan ketika variabel respons memiliki lebih dari dua kategori yang bersifat…

  • A. Nominal
  • B. Biner
  • C. Kontinu
  • D. Ordinal
Jawaban: A
Regresi logistik multinomial digunakan untuk respons dengan kategori nominal yang tidak memiliki urutan, misalnya pilihan transportasi (bus, kereta, mobil).
42.

Dalam regresi logistik multinomial, untuk suatu variabel respons dengan k kategori, berapa banyak model logit yang perlu diestimasi?

  • A. k
  • B. k-1
  • C. k+1
  • D. 2k
Jawaban: B
Dalam regresi multinomial, satu kategori dipilih sebagai referensi, sehingga jumlah model logit yang diestimasi adalah k-1.
43.

Regresi logistik ordinal menggunakan asumsi penting yang disebut asumsi…

  • A. Homoskedastisitas
  • B. Normalitas residual
  • C. Proporsional odds
  • D. Multikolinearitas
Jawaban: C
Asumsi proporsional odds (atau parallel lines) menyatakan bahwa pengaruh prediktor adalah sama pada setiap threshold logit kumulatif.
44.

Model yang paling sesuai untuk variabel respons berupa tingkat pendidikan (SD, SMP, SMA, PT) dengan prediktor usia dan pendapatan adalah…

  • A. Regresi logistik biner
  • B. Regresi logistik ordinal
  • C. Regresi logistik multinomial
  • D. Regresi linear sederhana
Jawaban: B
Tingkat pendidikan memiliki tingkatan (urutan) sehingga termasuk data ordinal. Model yang tepat untuk respons ordinal adalah regresi logistik ordinal.
45.

Dalam model logit, transformasi logit didefinisikan sebagai logaritma natural dari…

  • A. Odds
  • B. Peluang sukses
  • C. Risiko relatif
  • D. Varians
Jawaban: A
Transformasi logit adalah logaritma natural dari odds, yaitu ln(p/(1-p)).
46.

Pada model logit kumulatif untuk data ordinal, fungsi logit diterapkan pada…

  • A. Peluang setiap kategori secara individual
  • B. Peluang kumulatif dari kategori tertentu ke bawah
  • C. Rata-rata variabel respons
  • D. Median variabel respons
Jawaban: B
Model logit kumulatif menggunakan fungsi logit pada peluang kumulatif, misalnya peluang berada pada kategori j atau lebih rendah.
47.

Perbedaan utama antara model regresi probit dan model regresi logit terletak pada…

  • A. Jenis variabel respons
  • B. Jumlah prediktor yang dapat dimasukkan
  • C. Fungsi link yang digunakan
  • D. Ukuran sampel minimum
Jawaban: C
Perbedaan utama adalah fungsi link: logit menggunakan fungsi distribusi logistik, sedangkan probit menggunakan fungsi distribusi normal kumulatif (inversnya).
48.

Dalam model regresi probit, interpretasi koefisien lebih sering dilakukan dengan melihat…

  • A. Odds ratio
  • B. Nilai p-value saja
  • C. Koefisien determinasi
  • D. Efek marginal
Jawaban: D
Interpretasi langsung koefisien probit sulit karena menggunakan skala z. Oleh karena itu, efek marginal sering digunakan untuk melihat perubahan peluang prediksi.
49.

Generalized Linear Models (GLM) merupakan perluasan dari regresi linear yang memiliki tiga komponen. Komponen yang mendeskripsikan distribusi dari variabel respons disebut…

  • A. Komponen acak
  • B. Komponen sistematik
  • C. Fungsi link
  • D. Prediktor linear
Jawaban: A
Komponen acak (random component) dalam GLM mendefinisikan distribusi probabilitas dari variabel respons, misalnya distribusi binomial untuk data biner.
50.

Untuk data biner (sukses/gagal) yang dianalisis menggunakan GLM, distribusi yang tepat untuk komponen acak adalah…

  • A. Binomial
  • B. Poisson
  • C. Normal
  • D. Gamma
Jawaban: A
Untuk data biner, variabel respons mengikuti distribusi Bernoulli yang merupakan kasus khusus dari distribusi binomial dengan jumlah percobaan satu.

Bagian paling tricky dari mata kuliah ini adalah bedain kapan pakai regresi logistik biner dan kapan pakai multinomial. Banyak yang baru sadar setelah lupa ngecek level pengukuran variabel responsnya. Kalau responsnya cuma dua kategori, biner, tapi kalau lebih dari dua dan nggak berurutan, langsung ke multinomial. Perbedaan ordinal di Modul 6 juga sering bikin bingung karena pakai asumsi proportional odds yang jarang dipahami. Ada banyak Soal UAS UT lain di sini kalau kamu mau bandingkan tipe soal dari matkul lain.

Di STIK4362 Analisis Data Kategorik, ujian biasanya gabungin teori tabel kontingensi dari UTM dengan aplikasi regresi di UO. Modul 2 soal tabel 2×2 sering keluar sebagai dasar pemahaman peluang, lalu loncat ke regresi logistik biner di Modul 4. Soal UAS UT yang paling bikin nilai jeblok biasanya karena lupa ngebaca output odds ratio dengan benar. Kalau udah paham asumsi independensi di Modul 3, sisanya lebih ke ngepasin model, coba ulang dari Modul 5 kalau masih mentok.

Bagikan

error: Content is protected !!