Soalut.com gratis berkat dukungan kamu. Bantu kami tetap online.❤ Gratis selamanya

Donasi sekarang

Soal UAS UT MSIM4310 Analisis dan Visualisasi Data Beserta Kunci Jawaban

Aplikasi Resmi

Soalut.com — Soal Ujian UT

★★★★★ · Gratis · 9 MB · Android
Unduh
Soal UAS UT MSIM4310 Analisis dan Visualisasi Data Beserta Kunci Jawaban
Soal UT MSIM4310 Analisis dan Visualisasi Data

Bagi mahasiswa Universitas Terbuka, masa menjelang UAS bukan sekadar soal duduk dan membuka modul. Ada tantangan yang lebih nyata, yaitu bagaimana menyerap tumpukan materi dari berbagai sumber. Soal UAS UT bisa terasa berat kalau persiapannya tidak terstruktur sejak awal.

MSIM4310 Analisis dan Visualisasi Data adalah salah satu mata kuliah yang butuh pendekatan belajar lebih serius. Materi di dalamnya mencakup cara merancang pesan komunikasi yang efektif dan memilih media yang paling tepat sasaran. Dua kemampuan itu bukan hanya berguna untuk ujian.

Cara paling efektif untuk mengukur kesiapan kamu adalah dengan rajin berlatih mengerjakan Soal UAS UT MSIM4310 Analisis dan Visualisasi Data. Dari latihan itulah kamu bisa mengenali pola soal yang sering muncul, melatih kecepatan berpikir, dan menambal celah pemahaman yang mungkin belum kamu sadari.

Catatan: Soal-soal ini akan terus diperbarui mengikuti modul terbaru Universitas Terbuka.

Soal UT MSIM4310 Analisis dan Visualisasi Data

1.

Ukuran pemusatan data yang paling tepat digunakan ketika terdapat nilai ekstrem (outlier) dalam suatu kumpulan data adalah…

  • A. Mean
  • B. Median
  • C. Modus
  • D. Rata-rata tertimbang
Jawaban: B. Median.
Median tidak terpengaruh oleh nilai ekstrem karena hanya mempertimbangkan nilai tengah setelah data diurutkan, berbeda dengan mean yang memperhitungkan semua nilai termasuk outlier.
2.

Nilai yang paling sering muncul dalam suatu kumpulan data disebut…

  • A. Modus
  • B. Median
  • C. Mean
  • D. Kuartil
Jawaban: A. Modus.
Modus adalah ukuran pemusatan data yang didefinisikan sebagai nilai yang paling sering muncul atau memiliki frekuensi tertinggi dalam suatu distribusi data.
3.

Ukuran penyebaran data yang menunjukkan rata-rata jarak setiap nilai data dari nilai mean-nya disebut…

  • A. Jangkauan (range)
  • B. Jangkauan interkuartil
  • C. Deviasi standar
  • D. Koefisien variasi
Jawaban: C. Deviasi standar.
Deviasi standar mengukur seberapa jauh nilai-nilai data menyebar dari mean, dihitung sebagai akar kuadrat dari varians yang merupakan rata-rata kuadrat jarak tiap nilai dari mean.
4.

Sebuah perusahaan ingin membandingkan variabilitas gaji karyawan di dua divisi yang memiliki rata-rata gaji sangat berbeda. Ukuran penyebaran yang paling tepat digunakan adalah…

  • A. Varians
  • B. Deviasi standar
  • C. Jangkauan interkuartil
  • D. Koefisien variasi
Jawaban: D. Koefisien variasi.
Koefisien variasi menyatakan deviasi standar sebagai persentase dari mean sehingga memungkinkan perbandingan variabilitas antar kelompok data yang memiliki satuan atau skala yang berbeda.
5.

Tabel frekuensi yang menampilkan data numerik dalam bentuk kelas-kelas interval beserta frekuensinya termasuk ke dalam bentuk penyajian data…

  • A. Tabel kontingensi
  • B. Distribusi frekuensi
  • C. Tabel silang
  • D. Tabel distribusi kumulatif
Jawaban: B. Distribusi frekuensi.
Distribusi frekuensi adalah tabel yang menyajikan data numerik dalam kelompok kelas interval disertai frekuensi masing-masing kelas, digunakan untuk meringkas dan mengorganisasi data dalam jumlah besar.
6.

Grafik yang paling tepat untuk menyajikan data kategorik dengan tujuan membandingkan frekuensi antar kategori adalah…

  • A. Histogram
  • B. Ogive
  • C. Diagram batang
  • D. Poligon frekuensi
Jawaban: C. Diagram batang.
Diagram batang digunakan untuk membandingkan frekuensi atau nilai antar kategori diskrit, sedangkan histogram diperuntukkan data kontinu yang disajikan dalam interval kelas.
7.

Grafik yang menunjukkan kurva akumulasi frekuensi dari suatu distribusi data disebut…

  • A. Ogive
  • B. Histogram
  • C. Poligon frekuensi
  • D. Diagram lingkaran
Jawaban: A. Ogive.
Ogive adalah grafik kurva yang menggambarkan frekuensi kumulatif data, digunakan untuk mengetahui berapa banyak data yang berada di bawah atau di atas nilai tertentu.
8.

Seorang analis ingin membandingkan distribusi nilai ujian dua kelas yang berbeda secara visual sekaligus. Bentuk penyajian yang paling sesuai adalah…

  • A. Diagram lingkaran ganda
  • B. Histogram tunggal
  • C. Ogive kumulatif
  • D. Diagram batang back-to-back (stem-and-leaf)
Jawaban: D. Diagram batang back-to-back (stem-and-leaf).
Diagram batang back-to-back atau stem-and-leaf ganda memungkinkan perbandingan distribusi dua kelompok data secara berdampingan sehingga perbedaan pola distribusi dapat langsung terlihat.
9.

Ketika membandingkan dua kelompok data, box plot digunakan karena mampu menampilkan informasi tentang…

  • A. Frekuensi tiap nilai dalam distribusi
  • B. Median, kuartil, dan nilai ekstrem secara bersamaan
  • C. Rata-rata dan deviasi standar kelompok
  • D. Korelasi antara dua variabel kelompok
Jawaban: B. Median, kuartil, dan nilai ekstrem secara bersamaan.
Box plot (diagram kotak-kumis) merangkum lima statistik ringkasan yaitu nilai minimum, kuartil pertama, median, kuartil ketiga, dan nilai maksimum sehingga berguna untuk membandingkan distribusi antar kelompok.
10.

Jangkauan interkuartil (IQR) dihitung dengan cara…

  • A. Q3 dibagi Q1
  • B. Q2 dikurangi Q1
  • C. Q3 dikurangi Q1
  • D. Q4 dikurangi Q2
Jawaban: C. Q3 dikurangi Q1.
Jangkauan interkuartil (IQR) adalah selisih antara kuartil ketiga (Q3) dan kuartil pertama (Q1), yang mencerminkan sebaran 50% data tengah dalam distribusi.
11.

Transformasi data yang dilakukan dengan mengubah setiap nilai x menjadi logaritma dari x bertujuan untuk…

  • A. Mengurangi kemiringan distribusi data yang sangat positif
  • B. Meningkatkan nilai rata-rata data
  • C. Membuat semua nilai data menjadi positif
  • D. Mengubah skala data dari rasio menjadi interval
Jawaban: A. Mengurangi kemiringan distribusi data yang sangat positif.
Transformasi logaritma efektif untuk mereduksi skewness positif pada data karena nilai-nilai besar akan dikompres lebih kuat dibandingkan nilai-nilai kecil sehingga distribusi menjadi lebih simetris.
12.

Proses transformasi data yang mengubah nilai data sehingga memiliki rata-rata 0 dan deviasi standar 1 disebut…

  • A. Normalisasi min-max
  • B. Transformasi log
  • C. Transformasi akar kuadrat
  • D. Standarisasi (z-score)
Jawaban: D. Standarisasi (z-score).
Standarisasi menggunakan z-score dihitung dengan rumus (x – mean) / deviasi standar sehingga menghasilkan distribusi baru dengan mean = 0 dan deviasi standar = 1.
13.

Normalisasi min-max mengubah nilai data x menjadi nilai baru yang berada dalam rentang 0 sampai 1 menggunakan rumus…

  • A. (x – mean) / deviasi standar
  • B. (x – x_min) / (x_max – x_min)
  • C. x / x_max
  • D. (x – median) / IQR
Jawaban: B. (x – x_min) / (x_max – x_min).
Normalisasi min-max menggunakan rumus tersebut untuk memetakan setiap nilai data ke dalam rentang [0, 1] dengan mempertahankan proporsi relatif antar nilai data asli.
14.

Transformasi data yang paling tepat digunakan ketika data memiliki distribusi sangat skew ke kanan dan nilai datanya positif adalah…

  • A. Transformasi kuadrat
  • B. Standarisasi z-score
  • C. Transformasi logaritma
  • D. Normalisasi min-max
Jawaban: C. Transformasi logaritma.
Transformasi logaritma sangat efektif untuk menangani data dengan skewness positif yang tinggi karena mampu mengompres ekor distribusi kanan sehingga data mendekati distribusi normal.
15.

Transformasi data yang mengubah skala variabel sehingga memudahkan perbandingan dan pemodelan, tanpa mengubah bentuk distribusinya secara fundamental, merupakan tujuan dari transformasi jenis…

  • A. Transformasi linier
  • B. Transformasi akar kuadrat
  • C. Transformasi Box-Cox
  • D. Transformasi logaritma natural
Jawaban: A. Transformasi linier.
Transformasi linier seperti standarisasi dan normalisasi hanya mengubah skala dan titik pusat data tanpa mengubah bentuk distribusi, karena hubungan antar nilai tetap proporsional.
16.

Transformasi Box-Cox berbeda dari transformasi logaritma biasa karena…

  • A. Box-Cox hanya berlaku untuk data kategorik
  • B. Box-Cox tidak memerlukan data bernilai positif
  • C. Box-Cox menghasilkan distribusi uniform
  • D. Box-Cox menggunakan parameter lambda yang dioptimalkan untuk mendekati normalitas
Jawaban: D. Box-Cox menggunakan parameter lambda yang dioptimalkan untuk mendekati normalitas.
Transformasi Box-Cox merupakan keluarga transformasi yang mencakup berbagai bentuk transformasi tergantung nilai lambda, dan lambda dipilih secara optimal untuk membuat data mendekati distribusi normal.
17.

Data hilang yang terjadi secara acak murni tanpa berkaitan dengan variabel lain dalam dataset disebut…

  • A. Missing At Random (MAR)
  • B. Missing Completely At Random (MCAR)
  • C. Missing Not At Random (MNAR)
  • D. Structural Missing
Jawaban: B. Missing Completely At Random (MCAR).
MCAR terjadi ketika probabilitas data hilang tidak berkaitan sama sekali dengan nilai data yang hilang maupun dengan variabel lain dalam dataset, sehingga data yang tersedia merupakan sampel acak dari data lengkap.
18.

Data hilang dikategorikan sebagai Missing Not At Random (MNAR) ketika…

  • A. Kemungkinan data hilang berkaitan dengan variabel lain yang teramati
  • B. Data hilang terjadi secara acak tanpa pola tertentu
  • C. Kemungkinan data hilang berkaitan dengan nilai data itu sendiri yang tidak teramati
  • D. Data hilang disebabkan oleh kesalahan entri data
Jawaban: C. Kemungkinan data hilang berkaitan dengan nilai data itu sendiri yang tidak teramati.
MNAR (Missing Not At Random) adalah kondisi paling bermasalah di mana data hilang karena nilai itu sendiri, misalnya responden berpendapatan tinggi tidak mengisi pertanyaan tentang pendapatan karena nilainya tinggi.
19.

Teknik penanganan data hilang yang paling sederhana namun berisiko mengurangi ukuran sampel secara signifikan adalah…

  • A. Listwise deletion (complete case analysis)
  • B. Imputasi rata-rata
  • C. Imputasi regresi
  • D. Multiple imputation
Jawaban: A. Listwise deletion (complete case analysis).
Listwise deletion menghapus seluruh baris data yang mengandung nilai hilang, cara ini paling mudah diterapkan namun dapat mengurangi sampel secara drastis dan berpotensi menghasilkan bias jika data tidak MCAR.
20.

Kelemahan utama imputasi rata-rata sebagai teknik penanganan data hilang adalah…

  • A. Sulit dihitung dan memerlukan komputasi tinggi
  • B. Hanya dapat digunakan untuk data kategorik
  • C. Menghasilkan nilai yang selalu lebih besar dari nilai aslinya
  • D. Mengurangi variabilitas data dan dapat membiaskan hubungan antar variabel
Jawaban: D. Mengurangi variabilitas data dan dapat membiaskan hubungan antar variabel.
Imputasi rata-rata mengisi semua nilai hilang dengan nilai yang sama sehingga memperkecil varians distribusi dan melemahkan korelasi antar variabel, yang dapat menghasilkan estimasi yang bias.
21.

Metode imputasi yang mengisi nilai hilang dengan cara mengambil nilai dari observasi lain yang paling mirip berdasarkan variabel-variabel prediktor disebut…

  • A. Imputasi median
  • B. Imputasi hot-deck
  • C. Imputasi regresi
  • D. Multiple imputation
Jawaban: B. Imputasi hot-deck.
Imputasi hot-deck mengisi nilai yang hilang menggunakan nilai aktual dari observasi donor yang memiliki karakteristik serupa dalam dataset yang sama, sehingga nilai imputasi tetap realistis.
22.

Pendekatan multiple imputation berbeda dari single imputation karena…

  • A. Multiple imputation hanya mengisi satu nilai untuk setiap data yang hilang
  • B. Multiple imputation menggunakan nilai rata-rata dari seluruh variabel
  • C. Multiple imputation menghasilkan beberapa dataset lengkap yang kemudian dianalisis dan digabungkan
  • D. Multiple imputation menghapus observasi yang memiliki lebih dari satu nilai hilang
Jawaban: C. Multiple imputation menghasilkan beberapa dataset lengkap yang kemudian dianalisis dan digabungkan.
Multiple imputation membuat beberapa versi dataset dengan nilai imputasi yang berbeda untuk mencerminkan ketidakpastian, kemudian hasil analisis dari setiap dataset digabungkan menggunakan aturan Rubin.
23.

Dalam analisis regresi sederhana, variabel yang digunakan untuk memprediksi atau menjelaskan variabel lain disebut…

  • A. Variabel prediktor (independen)
  • B. Variabel dependen
  • C. Variabel moderator
  • D. Variabel kontrol
Jawaban: A. Variabel prediktor (independen).
Variabel prediktor atau independen adalah variabel yang digunakan untuk memprediksi nilai variabel lain (dependen/respons), dan nilainya dianggap bebas atau tidak dipengaruhi oleh variabel respons dalam model.
24.

Analisis regresi eksplorasi (Exploratory Data Analysis dalam konteks regresi) bertujuan untuk…

  • A. Membuktikan hubungan kausalitas antar variabel
  • B. Menguji signifikansi koefisien regresi secara formal
  • C. Menentukan model regresi terbaik menggunakan kriteria AIC
  • D. Memahami pola hubungan antarvariabel sebelum membangun model formal
Jawaban: D. Memahami pola hubungan antarvariabel sebelum membangun model formal.
Analisis regresi cara eksplorasi merupakan tahap awal untuk mengidentifikasi pola, mendeteksi outlier, dan memahami hubungan antarvariabel secara visual sebelum menerapkan prosedur pemodelan formal.
25.

Scatter plot digunakan dalam analisis regresi eksplorasi untuk…

  • A. Menghitung nilai koefisien korelasi secara tepat
  • B. Melihat pola hubungan dan kemungkinan linearitas antara dua variabel
  • C. Menentukan distribusi residual model regresi
  • D. Membandingkan mean dua kelompok yang berbeda
Jawaban: B. Melihat pola hubungan dan kemungkinan linearitas antara dua variabel.
Scatter plot menampilkan titik-titik data pada bidang koordinat dua variabel sehingga analis dapat secara visual menilai apakah hubungan antara variabel X dan Y bersifat linier, non-linier, atau tidak berkorelasi.
26.

Koefisien determinasi (R-squared) dalam analisis regresi mengukur…

  • A. Kekuatan dan arah hubungan linier antara dua variabel
  • B. Signifikansi statistik dari koefisien regresi
  • C. Proporsi variabilitas variabel dependen yang dapat dijelaskan oleh model
  • D. Rata-rata jarak antara nilai prediksi dan nilai aktual
Jawaban: C. Proporsi variabilitas variabel dependen yang dapat dijelaskan oleh model.
R-squared (koefisien determinasi) bernilai antara 0 dan 1 dan menunjukkan seberapa besar proporsi variasi dalam variabel dependen yang mampu dijelaskan oleh variabel prediktor dalam model regresi.
27.

Asumsi homoskedastisitas dalam analisis regresi linier mensyaratkan bahwa…

  • A. Varians residual bersifat konstan di seluruh nilai variabel prediktor
  • B. Residual berdistribusi normal dengan mean nol
  • C. Tidak ada korelasi antara variabel prediktor
  • D. Hubungan antara variabel prediktor dan dependen bersifat linier
Jawaban: A. Varians residual bersifat konstan di seluruh nilai variabel prediktor.
Homoskedastisitas berarti varians dari galat (residual) adalah sama untuk semua level variabel prediktor, pelanggarannya disebut heteroskedastisitas yang dapat mengakibatkan estimasi koefisien yang tidak efisien.
28.

Dalam analisis regresi konfirmasi, uji t pada koefisien regresi digunakan untuk…

  • A. Menguji apakah distribusi residual bersifat normal
  • B. Menguji kebaikan model secara keseluruhan (goodness of fit)
  • C. Membandingkan dua model regresi yang berbeda
  • D. Menguji apakah koefisien regresi secara individual berbeda signifikan dari nol
Jawaban: D. Menguji apakah koefisien regresi secara individual berbeda signifikan dari nol.
Uji t pada koefisien regresi menguji hipotesis nol bahwa koefisien tersebut sama dengan nol, yang berarti variabel prediktor yang bersangkutan tidak memiliki pengaruh signifikan terhadap variabel dependen.
29.

Plot residual vs nilai prediksi (residual vs fitted plot) dalam diagnostik model regresi digunakan untuk mendeteksi…

  • A. Normalitas distribusi residual
  • B. Pelanggaran asumsi linearitas dan homoskedastisitas
  • C. Multikolinearitas antar variabel prediktor
  • D. Autokorelasi dalam data deret waktu
Jawaban: B. Pelanggaran asumsi linearitas dan homoskedastisitas.
Residual vs fitted plot membantu mengidentifikasi pola non-linear (yang menunjukkan hubungan non-linier antarvariabel) dan pola berbentuk corong (yang mengindikasikan heteroskedastisitas) dalam model regresi.
30.

Nilai leverage dalam diagnostik regresi mengukur…

  • A. Seberapa besar residual dari suatu observasi
  • B. Pengaruh observasi terhadap nilai koefisien regresi
  • C. Sejauh mana nilai prediktor suatu observasi berbeda dari rata-rata prediktor
  • D. Kekuatan hubungan antara variabel prediktor dan dependen
Jawaban: C. Sejauh mana nilai prediktor suatu observasi berbeda dari rata-rata prediktor.
Leverage mengukur posisi suatu observasi dalam ruang prediktor relatif terhadap rata-rata, observasi dengan leverage tinggi berada jauh dari pusat data prediktor dan berpotensi besar mempengaruhi garis regresi.
31.

Visualisasi data teks yang menampilkan kata-kata dengan ukuran berbeda berdasarkan frekuensi kemunculannya disebut…

  • A. Word cloud (awan kata)
  • B. Treemap
  • C. Heatmap teks
  • D. Bubble chart kata
Jawaban: A. Word cloud (awan kata).
Word cloud adalah representasi visual data teks di mana setiap kata ditampilkan dengan ukuran font proporsional terhadap frekuensi kemunculannya, memudahkan identifikasi kata-kata yang paling dominan dalam teks.
32.

Proses menghilangkan kata-kata umum seperti “dan”, “atau”, “yang”, “di” sebelum analisis teks dilakukan disebut…

  • A. Stemming
  • B. Tokenisasi
  • C. Lemmatisasi
  • D. Stop word removal
Jawaban: D. Stop word removal.
Stop word removal adalah proses preprocessing teks yang menghapus kata-kata frekuensi tinggi namun minim makna (stop words) seperti kata hubung dan kata depan, agar analisis fokus pada kata-kata yang bermakna.
33.

Proses mengubah kata menjadi bentuk dasar atau akar katanya (misalnya “berlari” menjadi “lari”) disebut…

  • A. Tokenisasi
  • B. Stemming
  • C. Stop word removal
  • D. Vektorisasi
Jawaban: B. Stemming.
Stemming adalah teknik preprocessing teks yang memangkas afiks (awalan, akhiran) dari sebuah kata untuk mendapatkan bentuk dasarnya, berbeda dengan lemmatisasi yang menghasilkan bentuk kamus yang valid secara linguistik.
34.

Metode TF-IDF dalam analisis teks digunakan untuk mengukur…

  • A. Panjang rata-rata kalimat dalam dokumen
  • B. Frekuensi absolut setiap kata dalam seluruh korpus
  • C. Pentingnya suatu kata dalam dokumen relatif terhadap korpus dokumen lainnya
  • D. Jumlah topik yang terdapat dalam kumpulan dokumen
Jawaban: C. Pentingnya suatu kata dalam dokumen relatif terhadap korpus dokumen lainnya.
TF-IDF (Term Frequency-Inverse Document Frequency) menggabungkan frekuensi kata dalam dokumen dengan kebalikan frekuensinya di seluruh korpus, sehingga kata yang sering dalam satu dokumen namun jarang di dokumen lain mendapat bobot tinggi.
35.

Analisis sentimen pada data teks bertujuan untuk…

  • A. Mengklasifikasikan teks berdasarkan opini atau perasaan yang terkandung di dalamnya
  • B. Menemukan topik tersembunyi dalam kumpulan dokumen
  • C. Menghitung frekuensi kemunculan setiap kata dalam teks
  • D. Mengubah teks menjadi representasi numerik untuk pemodelan
Jawaban: A. Mengklasifikasikan teks berdasarkan opini atau perasaan yang terkandung di dalamnya.
Analisis sentimen adalah teknik dalam pengolahan teks yang bertujuan mengidentifikasi dan mengklasifikasikan sikap, opini, atau emosi penulis dalam teks menjadi kategori seperti positif, negatif, atau netral.
36.

Proses memecah teks menjadi unit-unit terkecil seperti kata atau kalimat untuk diproses lebih lanjut disebut…

  • A. Lemmatisasi
  • B. Stemming
  • C. Normalisasi teks
  • D. Tokenisasi
Jawaban: D. Tokenisasi.
Tokenisasi adalah langkah awal preprocessing teks yang memecah teks menjadi unit-unit lebih kecil yang disebut token, dapat berupa kata, kalimat, atau karakter, sesuai dengan keperluan analisis.
37.

Visualisasi data interaktif berbeda dari visualisasi statis karena memungkinkan pengguna untuk…

  • A. Mencetak grafik dalam resolusi yang lebih tinggi
  • B. Mengeksplorasi data secara langsung melalui interaksi seperti zoom, filter, dan hover
  • C. Mengunduh dataset yang digunakan dalam grafik
  • D. Menambahkan animasi dekoratif pada tampilan grafik
Jawaban: B. Mengeksplorasi data secara langsung melalui interaksi seperti zoom, filter, dan hover.
Visualisasi interaktif memberikan kemampuan kepada pengguna untuk terlibat aktif dengan grafik melalui berbagai tindakan seperti memperbesar area tertentu, memfilter data, atau menampilkan detail saat kursor diarahkan ke elemen grafik.
38.

Fitur tooltip dalam visualisasi data interaktif berfungsi untuk…

  • A. Mengubah jenis grafik yang ditampilkan secara dinamis
  • B. Memungkinkan pengguna memilih subset data untuk ditampilkan
  • C. Menampilkan informasi detail suatu elemen data saat kursor diarahkan ke elemen tersebut
  • D. Menghubungkan dua grafik berbeda agar berinteraksi satu sama lain
Jawaban: C. Menampilkan informasi detail suatu elemen data saat kursor diarahkan ke elemen tersebut.
Tooltip adalah kotak informasi kecil yang muncul ketika pengguna mengarahkan kursor ke elemen visualisasi, memberikan konteks tambahan seperti nilai numerik, label, atau keterangan tanpa membuat tampilan grafik menjadi penuh.
39.

Dashboard dalam konteks visualisasi data didefinisikan sebagai…

  • A. Tampilan visual terpadu yang menyajikan beberapa metrik dan grafik penting dalam satu layar
  • B. Laporan statis berbentuk dokumen yang berisi grafik dan tabel data
  • C. Basis data yang menyimpan semua visualisasi yang pernah dibuat
  • D. Antarmuka untuk menginput data baru ke dalam sistem
Jawaban: A. Tampilan visual terpadu yang menyajikan beberapa metrik dan grafik penting dalam satu layar.
Dashboard adalah antarmuka visual yang mengkonsolidasikan berbagai indikator kinerja, grafik, dan ringkasan data dalam satu tampilan terintegrasi untuk memudahkan pemantauan dan pengambilan keputusan.
40.

Prinsip utama desain dashboard yang efektif adalah…

  • A. Menampilkan sebanyak mungkin informasi agar pengguna mendapatkan gambaran lengkap
  • B. Menggunakan warna yang beragam agar tampilan menarik
  • C. Memprioritaskan estetika grafis di atas kejelasan data
  • D. Menyajikan informasi yang relevan secara ringkas, jelas, dan mudah dipahami pengguna
Jawaban: D. Menyajikan informasi yang relevan secara ringkas, jelas, dan mudah dipahami pengguna.
Dashboard yang efektif mengutamakan kejelasan dan relevansi informasi bagi penggunanya, menghindari kekacauan visual (clutter), dan memastikan metrik terpenting mudah ditemukan dan dipahami dengan cepat.
41.

Salah satu keunggulan visualisasi data interaktif dibandingkan visualisasi statis dalam konteks eksplorasi data adalah…

  • A. Lebih mudah dicetak dan dibagikan dalam format fisik
  • B. Memungkinkan pengguna menemukan pola tersembunyi melalui eksplorasi mandiri
  • C. Tidak memerlukan koneksi internet untuk diakses
  • D. Selalu lebih akurat dalam merepresentasikan data dibanding grafik statis
Jawaban: B. Memungkinkan pengguna menemukan pola tersembunyi melalui eksplorasi mandiri.
Visualisasi interaktif memberdayakan pengguna untuk mengeksplorasi data secara mandiri dengan memfilter, memperbesar, dan menelusuri detail, sehingga meningkatkan kemungkinan menemukan wawasan dan pola yang tidak terlihat pada visualisasi statis.
42.

Seorang analis menganalisis nilai ujian 60 mahasiswa dengan mean 72 dan median 78. Kondisi distribusi data tersebut dapat disimpulkan sebagai…

  • A. Distribusi simetris dengan mean sama dengan median
  • B. Distribusi skew positif karena mean lebih kecil dari median
  • C. Distribusi skew negatif karena mean lebih kecil dari median
  • D. Distribusi bimodal karena terdapat perbedaan antara mean dan median
Jawaban: C. Distribusi skew negatif karena mean lebih kecil dari median.
Ketika mean lebih kecil dari median, ekor distribusi memanjang ke arah kiri (nilai rendah), yang merupakan ciri khas distribusi dengan kemiringan negatif (negative skew atau left-skewed).
43.

Seorang peneliti memiliki data pendapatan bulanan karyawan dengan banyak nilai yang sangat tinggi. Untuk membandingkan dua departemen, ia menggunakan koefisien variasi. Alasan pemilihan ini paling tepat karena…

  • A. Koefisien variasi memungkinkan perbandingan yang adil meski kedua departemen memiliki rata-rata pendapatan yang berbeda
  • B. Koefisien variasi tidak terpengaruh oleh nilai outlier dalam data
  • C. Koefisien variasi menghasilkan nilai yang selalu positif
  • D. Koefisien variasi lebih mudah dihitung dibandingkan deviasi standar
Jawaban: A. Koefisien variasi memungkinkan perbandingan yang adil meski kedua departemen memiliki rata-rata pendapatan yang berbeda.
Koefisien variasi adalah ukuran penyebaran relatif yang menstandarisasi deviasi standar terhadap mean, sehingga perbandingan variabilitas antar kelompok dengan skala berbeda menjadi bermakna dan setara.
44.

Data penjualan mingguan suatu toko selama setahun menunjukkan pola musiman. Jenis transformasi yang paling tepat dilakukan sebelum membangun model prediksi adalah…

  • A. Normalisasi min-max untuk meratakan nilai
  • B. Transformasi logaritma untuk mengurangi skewness
  • C. Standarisasi z-score untuk menyamakan skala
  • D. Dekomposisi musiman untuk memisahkan komponen tren dan musiman
Jawaban: D. Dekomposisi musiman untuk memisahkan komponen tren dan musiman.
Data dengan pola musiman perlu didekomposisi untuk memisahkan komponen tren, musiman, dan residual sebelum pemodelan, sehingga model dapat menangkap dan memprediksi setiap komponen secara tepat.
45.

Suatu dataset survei kepuasan pelanggan memiliki 15% data hilang pada variabel “usia” secara acak murni. Teknik penanganan yang menghasilkan estimasi paling tidak bias adalah…

  • A. Menghapus seluruh baris yang memiliki nilai hilang (listwise deletion)
  • B. Multiple imputation berbasis variabel-variabel lain yang berkorelasi
  • C. Mengisi nilai hilang dengan median usia seluruh responden
  • D. Mengisi nilai hilang dengan nilai usia terakhir yang tersedia
Jawaban: B. Multiple imputation berbasis variabel-variabel lain yang berkorelasi.
Multiple imputation memanfaatkan informasi dari variabel lain yang berkorelasi untuk mengisi nilai hilang secara lebih akurat dan memperhitungkan ketidakpastian imputasi, menghasilkan estimasi yang tidak bias dibandingkan imputasi tunggal.
46.

Dalam model regresi sederhana Y = a + bX + e, nilai b negatif mengindikasikan bahwa…

  • A. Model regresi tidak signifikan secara statistik
  • B. Variabel X tidak berpengaruh terhadap variabel Y
  • C. Ketika X meningkat, Y cenderung menurun
  • D. Kesalahan prediksi model lebih besar dari nilai Y
Jawaban: C. Ketika X meningkat, Y cenderung menurun.
Koefisien regresi b menunjukkan arah dan besar perubahan Y untuk setiap unit kenaikan X. Nilai b negatif berarti hubungan antara X dan Y bersifat terbalik, yaitu peningkatan X diikuti penurunan Y.
47.

Seorang analis membangun model regresi dengan R-squared = 0,85. Interpretasi yang paling tepat dari nilai tersebut adalah…

  • A. Model mampu menjelaskan 85% variabilitas dalam variabel dependen
  • B. Korelasi antara variabel prediktor dan dependen sebesar 0,85
  • C. Model memiliki akurasi prediksi sebesar 85% untuk semua data baru
  • D. Sebesar 85% data berada dalam interval kepercayaan model
Jawaban: A. Model mampu menjelaskan 85% variabilitas dalam variabel dependen.
R-squared = 0,85 berarti 85% dari total variasi nilai variabel dependen dapat dijelaskan oleh variabel prediktor dalam model, sedangkan 15% sisanya disebabkan faktor lain yang tidak masuk dalam model.
48.

Analisis n-gram dalam visualisasi data teks bertujuan untuk…

  • A. Menghitung jumlah total kata dalam sebuah dokumen
  • B. Menentukan bahasa yang digunakan dalam teks
  • C. Mengeliminasi kata-kata yang jarang muncul dalam korpus
  • D. Menganalisis urutan dan kombinasi kata yang sering muncul berdampingan
Jawaban: D. Menganalisis urutan dan kombinasi kata yang sering muncul berdampingan.
N-gram adalah urutan n item berturutan dari teks (misalnya bigram = 2 kata, trigram = 3 kata), analisisnya mengungkap frasa dan pola linguistik yang sering muncul berdampingan dalam korpus yang tidak dapat diungkap analisis kata tunggal.
49.

Fitur linked views (tampilan terhubung) pada visualisasi interaktif berfungsi agar…

  • A. Setiap grafik dalam dashboard dapat dicetak secara terpisah
  • B. Pemilihan data pada satu grafik secara otomatis menyorot data terkait di grafik lain
  • C. Data dari berbagai sumber dapat digabungkan dalam satu tampilan
  • D. Pengguna dapat berbagi tampilan dashboard kepada pengguna lain secara real-time
Jawaban: B. Pemilihan data pada satu grafik secara otomatis menyorot data terkait di grafik lain.
Linked views memungkinkan koordinasi antar grafik dalam dashboard sehingga ketika pengguna memilih atau memfilter suatu subset data di satu tampilan, semua tampilan lain secara otomatis diperbarui untuk mencerminkan seleksi yang sama.
50.

Ketika merancang dashboard untuk eksekutif senior, prinsip yang paling tepat diterapkan adalah…

  • A. Menampilkan semua data mentah agar eksekutif dapat melakukan analisis mendalam sendiri
  • B. Mengutamakan grafik yang kompleks agar terlihat profesional dan komprehensif
  • C. Menonjolkan KPI dan ringkasan tren utama yang mendukung pengambilan keputusan strategis
  • D. Menyertakan seluruh riwayat data historis tanpa filter agar tidak ada informasi yang terlewat
Jawaban: C. Menonjolkan KPI dan ringkasan tren utama yang mendukung pengambilan keputusan strategis.
Dashboard untuk eksekutif harus berfokus pada indikator kinerja kunci (KPI) dan tren strategis yang relevan, disajikan secara ringkas dan langsung, karena eksekutif membutuhkan gambaran cepat untuk mendukung pengambilan keputusan tingkat tinggi.

Berlatih mengerjakan Soal Ujian UT secara rutin terbukti membantu mahasiswa beradaptasi dengan berbagai format penilaian. Ujian Tatap Muka (UTM) menuntut ketangkasan menjawab di tempat, sementara Ujian Online (UO) membutuhkan ketenangan dan koneksi yang stabil. Ada pula Take Home Exam (THE).

Percayai proses yang sudah kamu jalani selama ini. Setiap sesi mengerjakan Soal UO UT, setiap modul yang kamu baca ulang, semuanya adalah tabungan yang akan terbayar di hari ujian. Tetap fokus, kelola waktumu dengan baik, dan biarkan persiapan matang untuk Soal UAS UT MSIM4310 Analisis dan Visualisasi Data membawamu ke hasil yang kamu inginkan.

Bagikan

error: Content is protected !!