Soal UAS UT MSIM4310 Analisis dan Visualisasi Data Beserta Kunci Jawaban

Lagi ngulang visualisasi data, eh malah galau antara mean di Modul 1 sama teknik transformasi di Modul 2. Dua topik itu sering banget nyerempet soal UAS, padahal keliatannya simpel. Nyesel kalau diremehin. Soal UT di halaman ini sengaja dirancang biar kamu jago bedain konsep dasar penyajian data dan transformasi data di MSIM4310 Analisis dan Visualisasi Data.

Modul 4 soal regresi sederhana juga penting, apalagi bagian eksplorasi dan konfirmasi. Bank soal UT Statistika ini disetel per KB, jadi kamu bisa asah langsung di topik yang bikin pusing. Coba deh fokus ke sana dulu sebelum lihat yang lain.

Soal UAS UT di bawah ini nyerempet sampai analisis kelompok data dan penanganan data hilang. Setiap soal dilengkapi kunci jawaban dan pembahasan yang mengupas logika di baliknya. Kumpulan soal UAS UT ini memang bukan sekadar contekan, tapi senjata buat nalar.

Soal UT MSIM4310 Analisis dan Visualisasi Data

Nilai rata-rata dari data 5, 7, 8, 10, 12 adalah

A. 8.2
B. 8.4
C. 8.6
D. 8.8

Jawaban: B
Jumlah data 5+7+8+10+12 = 42, dibagi 5 menghasilkan 8.4

Median dari data 3, 6, 8, 9, 12, 15 adalah

A. 8.0
B. 9.5
C. 9.0
D. 8.5

Jawaban: D
Data genap, median adalah rata-rata data ke-3 dan ke-4 yaitu (8+9)/2 = 8.5

Modus dari data 4, 5, 5, 6, 7, 7, 7, 8 adalah

A. 5
B. 7
C. 6
D. 8

Jawaban: B
Nilai 7 muncul 3 kali, paling sering dibanding nilai lain

Rentang (range) dari data 15, 20, 25, 30, 35 adalah

A. 10
B. 15
C. 25
D. 20

Jawaban: D
Data maksimum 35, minimum 15, rentang 35-15=20

Variansi dari data 2, 4, 6, 8, 10 adalah

A. 8.0
B. 10.0
C. 6.0
D. 12.0

Jawaban: A
Rata-rata 6, simpangan kuadrat: (16+4+0+4+16)/5 = 40/5 = 8

Simpangan baku dari data 3, 5, 7, 9, 11 adalah

A. 2.828
B. 3.464
C. 2.449
D. 3.162

Jawaban: D
Rata-rata 7, variansi (16+4+0+4+16)/5=8, akar(8)=2.828? Hitung ulang: nilai 3,5,7,9,11 rata-rata 7, simpangan kuadrat 16,4,0,4,16 total 40, variansi 8, simpangan baku akar(8)=2.828, namun opsi A 2.828, koreksi jawaban A

Jika data memiliki nilai ekstrem, ukuran pemusatan yang paling tepat adalah

A. Mean
B. Median
C. Modus
D. Rentang

Jawaban: B
Median tidak terpengaruh oleh nilai ekstrem, lebih robust

Koefisien variasi digunakan untuk membandingkan penyebaran data dengan satuan berbeda. Rumusnya adalah

A. (simpangan baku/mean) x 100%
B. (mean/simpangan baku) x 100%
C. simpangan baku x mean
D. (rentang/mean) x 100%

Jawaban: A
Koefisien variasi = (simpangan baku/mean) x 100%, untuk perbandingan relatif

Dua kelompok data: Kelompok A mean = 50, simpangan baku = 5. Kelompok B mean = 100, simpangan baku = 10. Manakah yang lebih bervariasi relatif?

A. Kelompok A
B. Kelompok B
C. Sama
D. Tidak bisa ditentukan

Jawaban: A
CV A = 5/50=10%, CV B = 10/100=10%, sama, sehingga keduanya sama bervariasi, koreksi jawaban C

10.

Nilai kuartil pertama (Q1) dari data 10, 12, 14, 16, 18, 20 adalah

A. 14
B. 13
C. 12
D. 15

Jawaban: C
Data 6, Q1 adalah median dari bagian bawah 10,12,14, yaitu 12

11.

Jangkauan interkuartil (IQR) dari data 5, 8, 12, 15, 20, 25, 30 adalah

A. 20
B. 15
C. 17
D. 13

Jawaban: D
Q1=8, Q3=25, IQR=25-8=17, koreksi jawaban C

12.

Jika data berdistribusi normal, sekitar 95% data terletak dalam rentang

A. mean plus minus 1 simpangan baku
B. mean plus minus 3 simpangan baku
C. mean plus minus 2 simpangan baku
D. mean plus minus 4 simpangan baku

Jawaban: C
Aturan empiris: 95% data dalam 2 simpangan baku dari mean

13.

Skor Z untuk data 50 dari populasi mean 40 dan simpangan baku 8 adalah

A. 1.00
B. 1.50
C. 1.25
D. 0.80

Jawaban: C
Z = (50-40)/8 = 10/8 = 1.25

14.

Jika data memiliki mean 100 dan median 95, maka distribusi data cenderung

A. Simetris
B. Menceng kanan
C. Menceng kiri
D. Normal

Jawaban: B
Mean > median menunjukkan distribusi menceng kanan (positif)

15.

Histogram yang menunjukkan frekuensi tinggi di ujung kiri dan ekor panjang di kanan disebut

A. Distribusi menceng kanan
B. Distribusi menceng kiri
C. Distribusi normal
D. Distribusi seragam

Jawaban: A
Ekor panjang di kanan menunjukkan menceng kanan

16.

Dalam boxplot, titik yang berada di luar 1.5 kali IQR disebut

A. Nilai tengah
B. Kuartil
C. Pencilan
D. Median

Jawaban: C
Pencilan atau outlier adalah data di luar 1.5 IQR

17.

Dua kelompok data berikut: Kelompok 1: 2,4,6,8,10. Kelompok 2: 5,5,5,5,5. Pernyataan yang benar adalah

A. Kelompok 1 memiliki variansi lebih besar
B. Mean kedua kelompok berbeda
C. Kelompok 2 memiliki variansi lebih besar
D. Kedua kelompok memiliki variansi sama

Jawaban: A
Kelompok 1 bervariasi dengan nilai berbeda, kelompok 2 seragam, variansi Kelompok 1 > 0, Kelompok 2=0

18.

Dalam membandingkan dua kelompok data, ukuran apa yang paling tepat digunakan jika data mengandung pencilan?

A. Rata-rata
B. Modus
C. Median
D. Rentang

Jawaban: C
Median lebih robust terhadap pencilan dibandingkan rata-rata, sehingga lebih tepat digunakan saat membandingkan kelompok data yang memiliki pencilan.

19.

Diketahui kelompok A memiliki mean 50 dan standar deviasi 5, kelompok B memiliki mean 45 dan standar deviasi 10. Berdasarkan koefisien variasi, kelompok mana yang lebih bervariasi?

A. Kelompok A
B. Sama saja
C. Kelompok B
D. Tidak dapat ditentukan

Jawaban: C
Koefisien variasi = (standar deviasi/mean)*100%. Kelompok A: 5/50=0,1 (10%); Kelompok B: 10/45≈0,222 (22,2%). Jadi kelompok B lebih bervariasi.

20.

Ketika membandingkan sebaran data dua kelompok, boxplot paling berguna untuk menunjukkan…

A. Mean dan modus
B. Median, kuartil, dan pencilan
C. Hanya rata-rata
D. Distribusi frekuensi

Jawaban: B
Boxplot menampilkan median, kuartil pertama dan ketiga, serta pencilan, sehingga sangat berguna untuk membandingkan sebaran data.

21.

Dua kelompok data memiliki rentang interkuartil yang sama tetapi mean berbeda. Interpretasi yang tepat adalah…

A. Penyebaran data di sekitar median berbeda
B. Data tidak mengandung pencilan
C. Penyebaran data di kuartil tengah sama
D. Kedua kelompok identik

Jawaban: C
Rentang interkuartil mengukur penyebaran data di antara kuartil pertama dan ketiga, sehingga jika sama berarti penyebaran di kuartil tengah sama.

22.

Dalam membandingkan dua kelompok data, jika salah satu kelompok memiliki skewness positif yang kuat, ukuran pemusatan yang paling representatif adalah…

A. Median
B. Rata-rata
C. Modus
D. Rentang

Jawaban: A
Median tidak terpengaruh oleh skewness ekstrem, sehingga lebih representatif untuk data yang miring.

23.

Untuk membandingkan variabilitas dua kelompok data dengan satuan berbeda, ukuran yang tepat adalah…

A. Koefisien variasi
B. Variansi
C. Standar deviasi
D. Rentang

Jawaban: A
Koefisien variasi adalah rasio standar deviasi terhadap mean, sehingga memungkinkan perbandingan antar kelompok dengan satuan berbeda.

24.

Diketahui kelompok X: 10, 12, 14, 16, 18 dan kelompok Y: 5, 7, 9, 11, 13. Perbedaan mean antara kedua kelompok adalah…

A. 3
B. 4
C. 5
D. 6

Jawaban: C
Mean X = (10+12+14+16+18)/5 = 14; Mean Y = (5+7+9+11+13)/5 = 9; Selisih = 14 – 9 = 5.

25.

Transformasi data bertujuan untuk…

A. Menambah jumlah data
B. Membuat data menjadi kategorikal
C. Menghapus data yang hilang
D. Mengubah skala atau distribusi data agar lebih sesuai untuk analisis

Jawaban: D
Transformasi data dilakukan untuk mengubah skala atau distribusi data agar memenuhi asumsi analisis atau memudahkan interpretasi.

26.

Manakah dari berikut ini yang merupakan contoh transformasi data yang umum?

A. Transformasi logaritmik
B. Menambahkan dua kolom
C. Menghapus baris kosong
D. Mengganti nama variabel

Jawaban: A
Transformasi logaritmik adalah teknik yang umum digunakan untuk mengurangi skewness atau menstabilkan variansi.

27.

Transformasi Box-Cox termasuk dalam jenis transformasi…

A. Non-linear
B. Linear
C. Kategorikal
D. Diskrit

Jawaban: A
Transformasi Box-Cox adalah transformasi non-linear karena menggunakan pangkat yang bervariasi untuk membuat data lebih normal.

28.

Jika data memiliki distribusi miring ke kanan (positif), transformasi yang paling cocok adalah…

A. Transformasi kuadrat
B. Transformasi logaritmik
C. Transformasi linear
D. Transformasi identitas

Jawaban: B
Transformasi logaritmik efektif untuk mengurangi kemiringan positif karena memampatkan nilai besar lebih banyak.

29.

Tujuan utama transformasi data adalah untuk…

A. Menambah varians data
B. Membuat data lebih mudah dibaca
C. Mengurangi ukuran dataset
D. Memperbaiki normalitas atau linieritas hubungan

Jawaban: D
Transformasi data dilakukan untuk memenuhi asumsi analisis statistik seperti normalitas dan linieritas.

30.

Dalam transformasi data, transformasi akar kuadrat paling sering digunakan untuk data…

A. Proporsi atau persentase
B. Count data yang rendah
C. Data kontinu normal
D. Data kategorikal

Jawaban: B
Transformasi akar kuadrat sering digunakan untuk data hitungan (count) yang rendah, terutama jika variansinya sebanding dengan mean.

31.

Transformasi data yang tepat untuk data proporsi adalah…

A. Transformasi log
B. Transformasi arcsin
C. Transformasi Box-Cox
D. Transformasi kuadrat

Jawaban: B
Transformasi arcsin (atau arcsin square root) sering digunakan untuk menstabilkan variansi data proporsi.

32.

Transformasi data dapat mempengaruhi…

A. Baik mean maupun varians data
B. Hanya varians data
C. Hanya mean data
D. Tidak mempengaruhi statistik apapun

Jawaban: A
Transformasi data akan mengubah nilai-nilai data, sehingga baik mean maupun varians dapat berubah.

33.

Transformasi data yang bersifat monotonik (misalnya log atau akar) bertujuan untuk…

A. Mengubah urutan data
B. Menggabungkan dua variabel
C. Menghilangkan data pencilan
D. Mempertahankan urutan relatif data

Jawaban: D
Transformasi monotonik mempertahankan urutan data, sehingga data yang lebih besar tetap lebih besar setelah transformasi.

34.

Transformasi data dengan menggunakan z-score termasuk dalam…

A. Transformasi non-linear
B. Transformasi logaritmik
C. Transformasi pangkat
D. Transformasi linear

Jawaban: D
Z-score merupakan transformasi linear karena dilakukan dengan mengurangi mean dan membagi dengan standar deviasi.

35.

Dalam transformasi data, jenis transformasi yang menggunakan fungsi logaritma natural (ln) termasuk dalam kategori…

A. Transformasi linier
B. Transformasi z-score
C. Transformasi non-linier
D. Transformasi rank

Jawaban: C
Transformasi logaritma merupakan transformasi non-linier karena hubungan antara data asli dan data transformasi tidak berbentuk garis lurus.

36.

Transformasi Box-Cox adalah salah satu bentuk transformasi data yang bertujuan untuk…

A. Menghilangkan outlier secara permanen
B. Mengubah data kategorik menjadi numerik
C. Menggandakan jumlah data
D. Menstabilkan varians dan membuat data mendekati distribusi normal

Jawaban: D
Transformasi Box-Cox digunakan untuk menstabilkan varians dan membuat data lebih mendekati distribusi normal, bukan untuk menghilangkan outlier secara permanen.

37.

Jika data memiliki kemencengan positif (positively skewed), transformasi yang paling tepat untuk mengurangi kemencengan tersebut adalah…

A. Transformasi linier
B. Transformasi kuadrat
C. Transformasi logaritma
D. Transformasi pangkat dua

Jawaban: C
Transformasi logaritma efektif mengurangi kemencengan positif karena menarik nilai-nilai ekstrem yang besar ke arah pusat.

38.

Transformasi data dengan menggunakan akar kuadrat (sqrt) sangat cocok digunakan ketika data…

A. Berupa data kategorik
B. Berupa data biner
C. Berupa data kontinu yang simetris
D. Berupa data count atau hitungan yang rendah

Jawaban: D
Transformasi akar kuadrat sering digunakan untuk data count atau hitungan, terutama jika nilainya rendah, karena dapat menstabilkan varians.

39.

Dalam transformasi data, jika kita menggunakan fungsi y' = y^2, maka transformasi ini termasuk dalam bentuk…

A. Transformasi pangkat dengan lambda > 1
B. Transformasi logaritma
C. Transformasi akar
D. Transformasi invers

Jawaban: A
y' = y^2 adalah transformasi pangkat dengan lambda = 2, yang berarti lambda > 1, sehingga termasuk dalam kategori transformasi pangkat dengan lambda > 1.

40.

Keuntungan utama dari transformasi data adalah…

A. Menambah jumlah data
B. Mengubah skala data tanpa mengubah hubungan antar variabel
C. Menghilangkan semua outlier
D. Membuat data menjadi lebih mudah diinterpretasi secara visual

Jawaban: D
Transformasi data dapat membuat data lebih mudah diinterpretasi secara visual, misalnya dengan mengurangi kemencengan atau menstabilkan varians.

41.

Data hilang yang memiliki pola yang sama sekali tidak terduga dan tidak berhubungan dengan variabel lain disebut sebagai…

A. Missing by Design
B. Missing at Random (MAR)
C. Missing Not at Random (MNAR)
D. Missing Completely at Random (MCAR)

Jawaban: D
MCAR adalah kondisi di mana data hilang secara acak tanpa pola yang terkait dengan variabel lain, baik yang teramati maupun tidak teramati.

42.

Jika probabilitas data hilang bergantung pada variabel lain yang teramati, tetapi tidak pada nilai variabel itu sendiri, maka jenis data hilang tersebut adalah…

A. MAR
B. MCAR
C. MNAR
D. Non-random missing

Jawaban: A
MAR terjadi ketika data hilang dipengaruhi oleh variabel lain yang teramati, tetapi tidak tergantung pada nilai variabel yang hilang itu sendiri.

43.

Contoh data hilang yang termasuk dalam kategori MNAR adalah…

A. Responden tidak mengisi pendapatan karena lupa
B. Responden dengan pendapatan tinggi sengaja tidak mengisi pendapatan
C. Data hilang secara acak karena kerusakan alat
D. Data hilang karena responden pindah alamat

Jawaban: B
MNAR terjadi ketika probabilitas data hilang bergantung pada nilai variabel itu sendiri, misalnya responden dengan pendapatan tinggi sengaja tidak mengisi karena alasan privasi.

44.

Dampak utama dari data hilang pada analisis statistik adalah…

A. Meningkatkan akurasi model
B. Menyebabkan bias dan penurunan efisiensi estimator
C. Mempercepat proses komputasi
D. Menambah varians data

Jawaban: B
Data hilang dapat menyebabkan bias dalam estimasi parameter dan mengurangi efisiensi statistik karena informasi yang tidak lengkap.

45.

Dalam identifikasi pola data hilang, jika data hilang hanya terjadi pada satu variabel dan tidak terkait dengan variabel lain, pola tersebut disebut…

A. Univariate missing pattern
B. Monotone missing pattern
C. Arbitrary missing pattern
D. Systematic missing pattern

Jawaban: A
Pola univariate missing pattern terjadi ketika data hilang hanya pada satu variabel saja, tanpa pola khusus terkait variabel lain.

46.

Missing Not at Random (MNAR) sering menjadi masalah serius dalam analisis karena…

A. Data hilang dapat diabaikan tanpa bias
B. Probabilitas data hilang tergantung pada variabel yang tidak teramati
C. Data hilang selalu bersifat acak
D. Data hilang mudah diperbaiki dengan interpolasi

Jawaban: B
Pada MNAR, probabilitas data hilang bergantung pada nilai yang hilang itu sendiri atau variabel tidak teramati, sehingga sulit diatasi dan menyebabkan bias yang tidak dapat diabaikan.

47.

Salah satu cara mendeteksi pola data hilang adalah dengan membuat matriks korelasi antara indikator missing (missing indicator) dan variabel lain. Jika korelasi signifikan, hal ini menunjukkan kemungkinan…

A. MCAR
B. MNAR
C. MAR
D. Data hilang acak sempurna

Jawaban: C
Jika korelasi signifikan antara missing indicator dan variabel lain, hal ini menandakan bahwa probabilitas data hilang bergantung pada variabel lain, yang merupakan ciri MAR.

48.

Data hilang yang disebabkan oleh kesalahan input operator termasuk dalam kategori…

A. MNAR
B. MAR
C. MCAR
D. Ignorable missing

Jawaban: C
Kesalahan input operator biasanya terjadi secara acak dan tidak terkait dengan nilai variabel, sehingga termasuk MCAR.

49.

Metode imputasi yang mengganti data hilang dengan rata-rata dari variabel tersebut disebut…

A. Median imputation
B. Mean imputation
C. Regression imputation
D. Hot deck imputation

Jawaban: B
Mean imputation adalah metode mengganti data hilang dengan nilai rata-rata dari variabel yang sama, meskipun dapat mengurangi varians.

50.

Salah satu kelemahan dari metode listwise deletion (penghapusan kasus dengan data hilang) adalah…

A. Mengurangi ukuran sampel secara signifikan dan potensial bias jika data tidak MCAR
B. Menambah jumlah data
C. Meningkatkan varians data
D. Memerlukan komputasi yang kompleks

Jawaban: A
Listwise deletion menghapus seluruh observasi yang memiliki data hilang, sehingga mengurangi ukuran sampel dan dapat menyebabkan bias jika data tidak MCAR.

51.

Metode multiple imputation menghasilkan…

A. Beberapa set data imputasi yang kemudian digabungkan hasil analisisnya
B. Satu set data lengkap tunggal
C. Hanya estimasi parameter tanpa data imputasi
D. Data yang dihapus secara otomatis

Jawaban: A
Multiple imputation menghasilkan beberapa set data imputasi (biasanya 5 atau lebih), lalu hasil analisis dari masing-masing set digabungkan untuk menghasilkan estimasi yang lebih akurat.

52.

Teknik penanganan data hilang yang dilakukan dengan menghapus seluruh baris yang mengandung data hilang disebut dengan…

A. listwise deletion
B. pairwise deletion
C. mean imputation
D. regression imputation

Jawaban: A
Listwise deletion adalah metode menghapus seluruh observasi/baris yang memiliki data hilang. Ini adalah cara paling sederhana namun dapat mengurangi jumlah sampel secara signifikan.

53.

Metode imputasi data hilang dengan menggantikan nilai yang hilang menggunakan rata-rata dari variabel yang sama disebut…

A. hot-deck imputation
B. multiple imputation
C. mean imputation
D. k-NN imputation

Jawaban: C
Mean imputation mengganti nilai hilang dengan rata-rata dari data yang tersedia pada variabel tersebut. Metode ini mudah dilakukan namun dapat mengurangi variabilitas data.

54.

Dalam Multiple Imputation, data hilang diganti sebanyak…

A. satu kali
B. beberapa kali
C. dua kali
D. hanya sekali jika data kecil

Jawaban: B
Multiple imputation mengganti data hilang dengan beberapa nilai estimasi (biasanya 5-10 kali) untuk mempertimbangkan ketidakpastian estimasi, kemudian hasilnya digabungkan.

55.

Teknik penanganan data hilang yang memanfaatkan hubungan antar variabel untuk memprediksi nilai yang hilang adalah…

A. regression imputation
B. mean imputation
C. listwise deletion
D. deletion berbasis variabel

Jawaban: A
Regression imputation menggunakan model regresi untuk memprediksi nilai hilang berdasarkan variabel lain yang tersedia, sehingga memanfaatkan hubungan antar variabel.

56.

Data hilang yang memiliki pola tidak acak dan berhubungan langsung dengan nilai variabel itu sendiri disebut…

A. MCAR (Missing Completely at Random)
B. MAR (Missing at Random)
C. NMAR (Non-Missing at Random)
D. MNAR (Missing Not at Random)

Jawaban: D
MNAR adalah kondisi data hilang yang bergantung pada nilai variabel itu sendiri yang tidak teramati, pola ini paling sulit ditangani dan memerlukan asumsi khusus.

57.

Dalam analisis regresi cara eksplorasi, scatter plot digunakan untuk…

A. melihat distribusi residual
B. melihat hubungan antara dua variabel
C. menguji signifikansi model
D. menghitung koefisien korelasi

Jawaban: B
Scatter plot adalah alat visualisasi untuk melihat hubungan antara dua variabel secara grafis, membantu mendeteksi pola atau tren awal dalam eksplorasi data.

58.

Nilai korelasi Pearson sebesar -0,8 menunjukkan…

A. hubungan negatif kuat
B. hubungan positif lemah
C. hubungan positif kuat
D. hubungan negatif lemah

Jawaban: A
Korelasi Pearson -0,8 memiliki nilai absolut mendekati 1 (kuat) dan tanda negatif menunjukkan hubungan negatif (satu variabel naik, yang lain turun).

59.

Jika koefisien determinasi (R^2) suatu model regresi adalah 0,64, maka…

A. korelasi antara X dan Y adalah 0,36
B. 36 persen variasi Y dijelaskan oleh X
C. hubungan X dan Y lemah
D. 64 persen variasi Y dijelaskan oleh X

Jawaban: D
R^2 menunjukkan proporsi variasi variabel dependen yang dapat dijelaskan oleh variabel independen. R^2 = 0,64 berarti 64 persen variasi Y dijelaskan oleh X.

60.

Dalam scatter plot, jika titik-titik membentuk pola linear dengan kemiringan positif, maka korelasi antara kedua variabel adalah…

A. tidak ada korelasi
B. korelasi positif
C. korelasi negatif
D. korelasi sempurna

Jawaban: B
Pola linear dengan kemiringan positif menunjukkan bahwa ketika satu variabel naik, variabel lain juga naik, yang berarti korelasi positif antara keduanya.

61.

Langkah pertama dalam analisis regresi cara eksplorasi adalah…

A. menguji signifikansi model
B. menghitung regresi linear
C. membuat scatter plot
D. menganalisis residual

Jawaban: C
Eksplorasi dimulai dengan visualisasi data melalui scatter plot untuk melihat pola hubungan antar variabel sebelum melakukan pemodelan formal.

62.

Data berikut: X = (1,2,3,4,5) dan Y = (2,4,6,8,10). Korelasi Pearson antara X dan Y adalah…

A. 0
B. 0,5
C. 1
D. -1

Jawaban: C
Hubungan X dan Y sempurna linear positif dengan semua titik berada pada garis Y = 2X, sehingga nilai korelasi Pearson adalah 1.

63.

Outlier dalam scatter plot dapat mempengaruhi analisis regresi dengan cara…

A. meningkatkan R^2 secara otomatis
B. menurunkan R^2 secara otomatis
C. tidak berpengaruh sama sekali
D. mempengaruhi estimasi koefisien regresi

Jawaban: D
Outlier dapat menarik garis regresi menjauh dari pola umum data, sehingga mengubah estimasi koefisien regresi dan mempengaruhi interpretasi model.

64.

Setelah scatter plot, langkah eksplorasi regresi selanjutnya bisa berupa…

A. uji t
B. matriks korelasi
C. uji F
D. analisis varians

Jawaban: B
Matriks korelasi membantu melihat hubungan linear antar semua pasang variabel secara numerik, melengkapi informasi dari scatter plot dalam eksplorasi.

65.

Dalam analisis regresi cara konfirmasi, uji t digunakan untuk…

A. menguji signifikansi model secara keseluruhan
B. menguji normalitas residual
C. menguji signifikansi koefisien regresi individual
D. menguji homoskedastisitas

Jawaban: C
Uji t dalam regresi konfirmasi menguji apakah setiap koefisien regresi (termasuk intercept) berbeda signifikan dari nol secara individual.

66.

Jika nilai p-value pada uji F kurang dari alpha (misal 0,05), maka…

A. model regresi signifikan secara keseluruhan
B. model regresi tidak signifikan
C. koefisien regresi tidak signifikan
D. residual tidak normal

Jawaban: A
Uji F menguji signifikansi model secara keseluruhan. Jika p-value < alpha, tolak H0 yang menyatakan semua koefisien regresi sama dengan nol, berarti model signifikan.

67.

Asumsi normalitas residual dalam regresi konfirmasi dapat diuji menggunakan…

A. uji Kolmogorov-Smirnov
B. uji F
C. uji t
D. uji korelasi

Jawaban: A
Uji Kolmogorov-Smirnov adalah salah satu uji statistik yang digunakan untuk menguji apakah residual berdistribusi normal, yang merupakan asumsi dalam regresi konfirmasi.

68.

Jika interval kepercayaan 95 persen untuk koefisien regresi mencakup angka nol, maka…

A. koefisien tersebut signifikan
B. korelasi antara variabel kuat
C. model regresi terbukti benar
D. koefisien tersebut tidak signifikan

Jawaban: D
Interval kepercayaan yang mencakup nol berarti nilai koefisien tidak berbeda signifikan dari nol pada tingkat kepercayaan tersebut, sehingga koefisien tidak signifikan.

69.

Dalam analisis regresi cara konfirmasi, apa tujuan utama dari pengujian hipotesis terhadap koefisien regresi?

A. Mengetahui besarnya pengaruh variabel independen terhadap variabel dependen
B. Menentukan apakah model regresi cocok dengan data
C. Mengidentifikasi data pencilan
D. Mengelompokkan data ke dalam cluster

Jawaban: A
Pengujian hipotesis pada koefisien regresi bertujuan untuk mengetahui signifikansi pengaruh variabel independen terhadap variabel dependen.

70.

Pada regresi konfirmasi, nilai p-value yang lebih kecil dari alpha (misal 0,05) mengindikasikan bahwa:

A. Variabel independen tidak berpengaruh signifikan
B. Model regresi tidak layak digunakan
C. Variabel independen berpengaruh signifikan
D. Data bersifat heteroskedastisitas

Jawaban: C
Jika p-value kurang dari alpha maka terdapat bukti cukup untuk menolak hipotesis nol, sehingga variabel independen berpengaruh signifikan.

71.

Dalam analisis regresi konfirmasi, koefisien determinasi (R^2) digunakan untuk:

A. Mengukur kekuatan hubungan linear antara dua variabel
B. Menguji normalitas residual
C. Menentukan korelasi antara variabel independen dan dependen
D. Mengukur proporsi variansi variabel dependen yang dijelaskan oleh model

Jawaban: D
R^2 menunjukkan seberapa besar variasi variabel dependen yang mampu dijelaskan oleh variabel independen dalam model.

72.

Langkah pertama dalam analisis regresi konfirmasi adalah:

A. Membuat scatter plot
B. Menghitung koefisien regresi
C. Menguji asumsi klasik
D. Menyusun model regresi berdasarkan teori

Jawaban: D
Regresi konfirmasi dimulai dengan spesifikasi model yang didasarkan pada teori atau penelitian sebelumnya.

73.

Apa yang dimaksud dengan data teks?

A. Data yang disimpan dalam format angka
B. Data yang terdiri dari kata-kata atau kalimat dalam bahasa alami
C. Data yang hanya berupa gambar
D. Data yang terstruktur dalam tabel

Jawaban: B
Data teks merujuk pada informasi yang disajikan dalam bentuk kata-kata atau kalimat dari bahasa alami.

74.

Salah satu karakteristik utama data teks adalah:

A. Memiliki struktur yang tetap
B. Tidak terstruktur atau semi-terstruktur
C. Hanya berisi bilangan bulat
D. Mudah dihitung secara langsung

Jawaban: B
Data teks umumnya tidak terstruktur atau semi-terstruktur karena tidak mengikuti format tabel yang kaku.

75.

Teknik yang digunakan untuk mengubah data teks menjadi representasi numerik adalah:

A. Regresi linear
B. Clustering
C. Tokenisasi dan vektorisasi
D. Normalisasi

Jawaban: C
Tokenisasi memecah teks menjadi token dan vektorisasi mengubah token menjadi vektor numerik untuk analisis lebih lanjut.

76.

Apa perbedaan utama antara data teks dan data numerik?

A. Data teks lebih mudah divisualisasikan
B. Data numerik tidak memerlukan preprocessing
C. Data teks memerlukan langkah preprocessing khusus seperti stemming dan stopword removal
D. Data numerik selalu lebih besar ukurannya

Jawaban: C
Data teks membutuhkan preprocessing seperti stemming, stopword removal, dan tokenisasi agar dapat dianalisis secara efektif.

77.

Contoh aplikasi dari analisis data teks adalah:

A. Sentimen analisis pada ulasan produk
B. Prediksi harga saham dengan time series
C. Menghitung rata-rata nilai ujian
D. Membuat grafik batang penjualan

Jawaban: A
Sentimen analisis adalah aplikasi umum data teks untuk mengklasifikasikan opini atau emosi dari teks.

78.

Dalam konteks data teks, apa yang dimaksud dengan stopwords?

A. Kata-kata yang memiliki makna penting
B. Kata-kata yang dihapus karena sulit diucapkan
C. Kata-kata yang sering muncul dan tidak memberikan banyak informasi
D. Kata-kata yang digunakan sebagai kata kunci

Jawaban: C
Stopwords adalah kata-kata umum seperti 'dan', 'di', 'ke' yang sering dihilangkan karena tidak signifikan dalam analisis teks.

79.

Proses mengubah teks menjadi huruf kecil semua dan menghapus tanda baca merupakan bagian dari:

A. Stemming
B. Tokenisasi
C. Vektorisasi
D. Normalisasi teks

Jawaban: D
Normalisasi teks meliputi case folding dan penghapusan tanda baca untuk menyeragamkan data teks.

80.

Salah satu bentuk visualisasi data teks yang umum adalah:

A. Diagram lingkaran
B. Word cloud
C. Histogram
D. Scatter plot

Jawaban: B
Word cloud menampilkan frekuensi kata dalam teks dengan ukuran kata yang berbeda secara visual.

81.

Apa kegunaan dari teknik TF-IDF dalam visualisasi data teks?

A. Memberikan bobot pada kata berdasarkan frekuensi dalam dokumen dan inversi frekuensi dalam korpus
B. Menampilkan hubungan antar kata dalam jaringan
C. Mengukur frekuensi absolut setiap kata
D. Membuat grafik batang dari topik

Jawaban: A
TF-IDF memberikan bobot lebih tinggi pada kata yang sering muncul dalam suatu dokumen tetapi jarang di korpus, berguna untuk menentukan pentingnya kata.

82.

Visualisasi data teks seperti diagram batang horizontal sering digunakan untuk:

A. Menunjukkan frekuensi kata tertentu dalam teks
B. Menampilkan distribusi usia responden
C. Menggambarkan hubungan antara dua variabel numerik
D. Menyajikan data deret waktu

Jawaban: A
Diagram batang horizontal dapat menampilkan frekuensi kata dalam teks dengan jelas dan mudah dibaca.

83.

Dalam membuat word cloud, parameter yang mempengaruhi ukuran kata adalah:

A. Panjang kata
B. Jenis huruf
C. Urutan abjad
D. Frekuensi kemunculan kata

Jawaban: D
Pada word cloud, ukuran kata sebanding dengan frekuensinya, semakin sering muncul semakin besar ukurannya.

84.

Alat visualisasi data teks seperti jaringan kata (network graph) berguna untuk:

A. Menampilkan urutan kata dalam kalimat
B. Menggambarkan hubungan antara kata-kata yang sering muncul bersamaan
C. Menghitung jumlah total kata
D. Menyediakan ringkasan numerik data teks

Jawaban: B
Jaringan kata menunjukkan keterkaitan antar kata berdasarkan kemunculannya dalam konteks yang sama, misalnya dalam satu kalimat.

85.

Apa yang dimaksud dengan 'word cloud' dalam visualisasi data teks?

A. Diagram batang yang menunjukkan frekuensi kata
B. Grafik garis yang menghubungkan kata-kata dalam teks
C. Tampilan visual kata-kata di mana ukuran kata mencerminkan frekuensinya
D. Tabel yang berisi daftar kata unik

Jawaban: C
Word cloud adalah teknik visualisasi di mana kata-kata ditampilkan dengan ukuran yang proporsional terhadap frekuensi kemunculannya.

86.

Alat visualisasi mana yang paling cocok untuk menampilkan hubungan antar kata dalam sebuah dokumen teks?

A. Network graph
B. Pie chart
C. Histogram
D. Scatter plot

Jawaban: A
Network graph digunakan untuk menampilkan hubungan antar kata, seperti kookurensi atau keterkaitan semantik.

87.

Pada visualisasi data interaktif, apa fungsi utama dari 'tooltip'?

A. Menyembunyikan data tertentu
B. Mengubah warna grafik
C. Memperbesar area visualisasi
D. Menampilkan informasi tambahan saat pengguna mengarahkan kursor

Jawaban: D
Tooltip adalah elemen interaktif yang menampilkan detail data saat kursor diarahkan ke suatu titik atau area.

88.

Apa yang dimaksud dengan 'brush' dalam konteks visualisasi interaktif?

A. Alat untuk menggambar pada grafik
B. Teknik untuk memilih subset data dengan cara menyorot area
C. Fitur untuk menghapus data palsu
D. Metode untuk menambahkan anotasi otomatis

Jawaban: B
Brush adalah teknik interaksi yang memungkinkan pengguna memilih data dengan menyorot area tertentu pada visualisasi.

89.

Manakah pernyataan yang benar tentang 'linked views' dalam visualisasi interaktif?

A. Perubahan pada satu view akan memperbarui view lain secara sinkron
B. Perubahan pada satu view tidak mempengaruhi view lain
C. Setiap view menampilkan data yang independen
D. Linked views hanya digunakan pada dashboard statis

Jawaban: A
Linked views memungkinkan interaksi pada satu view mempengaruhi tampilan view lainnya secara real-time.

90.

Apa kelebihan utama visualisasi data interaktif dibandingkan visualisasi statis?

A. Hemat waktu pembuatan
B. Lebih murah biayanya
C. Memungkinkan eksplorasi data oleh pengguna
D. Tidak memerlukan data bersih

Jawaban: C
Visualisasi interaktif memberikan pengguna kemampuan untuk menjelajahi data lebih dalam secara mandiri.

91.

Dalam dashboard interaktif, komponen 'filter' berfungsi untuk…?

A. Menyimpan data ke basis data
B. Menambahkan efek animasi
C. Mengubah tipe grafik
D. Menyaring data yang ditampilkan berdasarkan kriteria

Jawaban: D
Filter memungkinkan pengguna membatasi data yang ditampilkan sesuai dengan kondisi yang dipilih.

92.

Apa yang dimaksud dengan 'drill-down' dalam interaksi dashboard?

A. Menampilkan ringkasan data
B. Menghapus data lama
C. Memperluas tampilan ke detail yang lebih spesifik
D. Menggabungkan beberapa grafik

Jawaban: C
Drill-down memungkinkan pengguna menavigasi dari data agregat ke data yang lebih rinci.

93.

Teknik visualisasi interaktif mana yang paling efektif untuk menampilkan perubahan data seiring waktu?

A. Animated bubble chart
B. Pie chart statis
C. Bar chart tetap
D. Word cloud

Jawaban: A
Animated bubble chart dapat menunjukkan perubahan data temporal secara dinamis dan menarik.

94.

Pada dashboard, apa fungsi dari 'slider' interaktif?

A. Menampilkan pop-up iklan
B. Membuka tautan eksternal
C. Mengontrol nilai parameter secara kontinu
D. Mengatur suara

Jawaban: C
Slider memungkinkan pengguna menyesuaikan nilai parameter dalam rentang tertentu untuk memicu perubahan visualisasi.

95.

Apa perbedaan utama antara 'dashboard operasional' dan 'dashboard strategis'?

A. Dashboard operasional lebih interaktif
B. Dashboard operasional fokus pada metrik harian, strategis fokus pada KPI jangka panjang
C. Dashboard strategis hanya untuk manajer
D. Tidak ada perbedaan

Jawaban: B
Dashboard operasional memonitor aktivitas harian, sedangkan dashboard strategis menyajikan indikator kinerja utama untuk perencanaan jangka panjang.

96.

Dalam visualisasi interaktif, teknik 'zooming' digunakan untuk…?

A. Mengubah warna latar
B. Memperkecil tampilan keseluruhan
C. Menghapus data outlier
D. Memperbesar area tertentu untuk melihat detail

Jawaban: D
Zooming memungkinkan pengguna memperbesar bagian tertentu dari visualisasi untuk mengamati detail yang lebih halus.

97.

Apa yang dimaksud dengan 'dashboard real-time'?

A. Dashboard yang hanya bisa diakses pada jam kerja
B. Dashboard yang diperbarui secara otomatis dengan data terbaru
C. Dashboard yang membutuhkan koneksi internet cepat
D. Dashboard yang menampilkan data historis

Jawaban: B
Dashboard real-time menyajikan data yang terus diperbarui secara langsung dari sumber data.

98.

Alat visualisasi mana yang paling sesuai untuk membuat dashboard interaktif dengan banyak sumber data?

A. Microsoft Excel
B. Paint
C. Notepad
D. Tableau

Jawaban: D
Tableau dirancang khusus untuk visualisasi interaktif dan dapat menggabungkan berbagai sumber data.

99.

Pada visualisasi interaktif, 'hover effect' berguna untuk…?

A. Menampilkan informasi detail saat mouse berada di atas elemen
B. Mengubah suara latar
C. Menjalankan animasi otomatis
D. Membagikan grafik ke media sosial

Jawaban: A
Hover effect memberikan informasi tambahan ketika pengguna mengarahkan mouse ke elemen visualisasi.

100.

Apa tantangan utama dalam membangun dashboard interaktif?

A. Menentukan warna yang menarik
B. Memastikan performa responsif saat data besar
C. Memilih jenis grafik yang umum
D. Menambahkan terlalu banyak animasi

Jawaban: B
Dashboard interaktif harus responsif meskipun menangani volume data besar agar pengalaman pengguna tetap mulus.

Soal transformasi data dan data hilang itu yang paling bikin mikir ulang. Biasanya di UAS UT, konsep dari Modul 2 dan 3 sering muncul dalam bentuk studi kasus yang harus kamu bedah satu per satu. Regresi sederhana juga nggak kalah penting. Modul 4 itu jadi jembatan antara teori dan praktek lapangan. Banyak yang kalap begitu lihat data teks di Modul 5, padahal soal deksripsinya mirip analisis sentimen biasa kalau sudah paham dasarnya.

Di MSIM4310 Analisis dan Visualisasi Data, visualisasi data interaktif di Modul 6 itu biasanya format UO yang bikin kamu harus ngerti alasan di balik dashboard yang dibangun. Soal UT di atas coba ngasih gambaran variasi tipe soal dari UTM yang hitungan sampai UO yang analisa. Ada banyak soal ujian UT lain di sini kalau kamu mau lanjut latihan. Pastikan juga paham perbandingan antar kelompok data di Modul 1, karena sering jadi jebakan di ujian.

Soal UAS UT MSIM4310 Analisis dan Visualisasi Data Beserta Kunci Jawaban

Soal UT MSIM4310 Analisis dan Visualisasi Data

Baca juga

Soal UAS UT BIOL4317 Evolusi dan Kunci Jawaban

Soal UAS UT STBI4102 Struktur dan Perkembangan Tumbuhan Beserta Kunci Jawaban

Soal UAS UT STMA4224 Panduan Praktikum Komputasi dan Pemrograman Beserta Kunci Jawaban

Soal UAS UT MATA4302 Pengantar Teori Grup dan Kunci Jawaban

Soalut.com

Soal UAS UT MSIM4310 Analisis dan Visualisasi Data Beserta Kunci Jawaban

Soal UT MSIM4310 Analisis dan Visualisasi Data

Baca juga

Soal UAS UT BIOL4317 Evolusi dan Kunci Jawaban

Soal UAS UT STBI4102 Struktur dan Perkembangan Tumbuhan Beserta Kunci Jawaban

Soal UAS UT STMA4224 Panduan Praktikum Komputasi dan Pemrograman Beserta Kunci Jawaban

Soal UAS UT MATA4302 Pengantar Teori Grup dan Kunci Jawaban

Soalut.com

🔥 Post Terbaru