Soalut.com gratis berkat dukungan kamu. Bantu kami tetap online.

Donasi sekarang

Soal UAS UT STDA4101 Pengantar Sains Data dan Kunci Jawaban

Soal UAS UT STDA4101 Pengantar Sains Data dan Kunci Jawaban
Soal UT STDA4101 Pengantar Sains Data

Menghadapi Ujian Akhir Semester di Universitas Terbuka bukan sekadar soal hafalan, melainkan tentang kesiapan menyeluruh. Mahasiswa UT dituntut mampu menyerap materi dari berbagai modul sekaligus, lalu mengolahnya menjadi pemahaman yang benar-benar matang sebelum duduk di meja ujian.

Salah satu mata kuliah yang patut mendapat perhatian serius adalah STDA4101 Pengantar Sains Data. Lebih dari sekadar nilai di transkrip, mata kuliah ini dirancang untuk membangun cara berpikir analitis yang relevan dengan kebutuhan dunia data masa kini.

Berlatih dengan Soal UAS UT STDA4101 Pengantar Sains Data adalah langkah paling cerdas yang bisa Anda ambil sekarang. Kisi-kisi Soal UT dan latihan soal akan membentuk intuisi Anda terhadap pola ujian, sekaligus mengukur sejauh mana penguasaan materi yang telah Anda bangun selama satu semester.

Catatan: Soal-soal ini akan terus diperbarui mengikuti modul terbaru Universitas Terbuka.

Soal UAS UT STDA4101 Pengantar Sains Data

1.

Apa yang dimaksud dengan Sains Data (Data Science)?

  • A. Ilmu yang mempelajari cara membuat perangkat keras komputer
  • B. Disiplin ilmu yang menggunakan metode ilmiah untuk mengekstrak pengetahuan dari data
  • C. Teknik pembuatan basis data relasional
  • D. Proses instalasi perangkat lunak analitik
B. Disiplin ilmu yang menggunakan metode ilmiah untuk mengekstrak pengetahuan dari data
2.

Siapakah yang disebut sebagai Data Scientist?

  • A. Seseorang yang hanya bertugas menyimpan data di server
  • B. Teknisi yang memperbaiki komputer rusak
  • C. Profesional yang menganalisis dan menginterpretasikan data kompleks untuk pengambilan keputusan
  • D. Programmer yang membuat aplikasi mobile
C. Profesional yang menganalisis dan menginterpretasikan data kompleks untuk pengambilan keputusan
3.

Kerangka CRISP-DM merupakan singkatan dari…

  • A. Cross Industry Standard Process for Data Mining
  • B. Central Information Resource System for Data Management
  • C. Comprehensive Integration Standard Protocol for Data Modeling
  • D. Critical Index Research System for Data Metrics
A. Cross Industry Standard Process for Data Mining
4.

Berapa jumlah tahapan utama dalam kerangka CRISP-DM?

  • A. Empat tahapan
  • B. Lima tahapan
  • C. Tujuh tahapan
  • D. Enam tahapan
D. Enam tahapan
5.

Statistik deskriptif bertujuan untuk…

  • A. Membuat prediksi masa depan berdasarkan model probabilitas
  • B. Mendeskripsikan, meringkas, dan membuat summary data agar mudah dipahami
  • C. Melakukan uji hipotesis pada populasi besar
  • D. Membangun model machine learning otomatis
B. Mendeskripsikan, meringkas, dan membuat summary data agar mudah dipahami
6.

Tahap pertama dalam proses CRISP-DM adalah…

  • A. Data Preparation
  • B. Data Understanding
  • C. Business Understanding
  • D. Modeling
C. Business Understanding
7.

Ekosistem data dalam konteks Data Science mencakup…

  • A. Hanya perangkat keras penyimpanan data
  • B. Hanya bahasa pemrograman Python dan R
  • C. Kombinasi alat, teknologi, dan infrastruktur yang mendukung pengelolaan dan analisis data
  • D. Hanya database relasional seperti MySQL
C. Kombinasi alat, teknologi, dan infrastruktur yang mendukung pengelolaan dan analisis data
8.

Dalam CRISP-DM, tahap “Evaluation” bertujuan untuk…

  • A. Mengumpulkan data mentah dari berbagai sumber
  • B. Menilai apakah model yang dibangun memenuhi tujuan bisnis
  • C. Menyebarkan model ke lingkungan produksi
  • D. Membersihkan data dari nilai yang hilang
B. Menilai apakah model yang dibangun memenuhi tujuan bisnis
9.

Salah satu contoh aplikasi Sains Data di bidang kesehatan adalah…

  • A. Pembuatan sistem operasi baru
  • B. Desain antarmuka aplikasi mobile
  • C. Pengelolaan jaringan telekomunikasi
  • D. Prediksi penyebaran penyakit menggunakan analisis data pasien
D. Prediksi penyebaran penyakit menggunakan analisis data pasien
10.

Tahap “Data Understanding” dalam CRISP-DM melibatkan kegiatan…

  • A. Mengembangkan algoritma machine learning baru
  • B. Mengumpulkan data awal dan mengeksplorasi karakteristiknya
  • C. Menyebarkan model ke pengguna akhir
  • D. Mendefinisikan tujuan proyek dari sisi bisnis
B. Mengumpulkan data awal dan mengeksplorasi karakteristiknya
11.

Statistik inferensial digunakan untuk…

  • A. Hanya menggambarkan data yang sudah ada
  • B. Membuat kesimpulan tentang populasi berdasarkan sampel data
  • C. Menyimpan data dalam format terstruktur
  • D. Mengvisualisasikan data dalam bentuk grafik
B. Membuat kesimpulan tentang populasi berdasarkan sampel data
12.

Proses data science bersifat berulang karena…

  • A. Komputer memerlukan pengulangan untuk memproses data
  • B. Data selalu bertambah setiap detik
  • C. Setiap tahap dapat memerlukan kembali ke tahap sebelumnya untuk penyempurnaan
  • D. Regulasi pemerintah mengharuskan pengulangan proses
C. Setiap tahap dapat memerlukan kembali ke tahap sebelumnya untuk penyempurnaan
13.

Apa peran utama seorang Data Scientist dalam sebuah organisasi?

  • A. Menginstall dan memelihara server jaringan
  • B. Mendesain tampilan visual website perusahaan
  • C. Menjual produk berbasis data kepada pelanggan
  • D. Mengubah data mentah menjadi wawasan (insight) yang dapat mendukung keputusan strategis
D. Mengubah data mentah menjadi wawasan (insight) yang dapat mendukung keputusan strategis
14.

Tahap “Deployment” dalam CRISP-DM adalah…

  • A. Tahap pengumpulan data dari berbagai sumber
  • B. Tahap penyebaran dan penerapan model ke lingkungan nyata
  • C. Tahap evaluasi kualitas model yang telah dibangun
  • D. Tahap pembersihan dan transformasi data
B. Tahap penyebaran dan penerapan model ke lingkungan nyata
15.

Mean, median, dan modus merupakan ukuran statistik yang termasuk dalam kategori…

  • A. Statistik inferensial
  • B. Statistik probabilistik
  • C. Statistik deskriptif
  • D. Statistik parametrik
C. Statistik deskriptif
16.

Sains Data dapat diterapkan di bidang keuangan, salah satunya untuk…

  • A. Mendesain mata uang baru
  • B. Mendeteksi transaksi penipuan (fraud detection) secara real-time
  • C. Mencetak laporan keuangan manual
  • D. Mengatur jam operasional bank
B. Mendeteksi transaksi penipuan (fraud detection) secara real-time
17.

Tahap “Data Preparation” dalam CRISP-DM mencakup…

  • A. Mendefinisikan pertanyaan bisnis yang ingin dijawab
  • B. Memilih algoritma terbaik untuk pemodelan
  • C. Pembersihan, transformasi, dan integrasi data untuk pemodelan
  • D. Menyebarkan hasil model kepada pemangku kepentingan
C. Pembersihan, transformasi, dan integrasi data untuk pemodelan
18.

Salah satu konsep dasar dalam Sains Data adalah…

  • A. Data hanya bernilai jika disimpan dalam format Excel
  • B. Hanya data numerik yang dapat dianalisis
  • C. Pengetahuan dapat diekstrak dari data melalui proses analisis yang sistematis
  • D. Analisis data hanya bisa dilakukan oleh programmer berpengalaman
C. Pengetahuan dapat diekstrak dari data melalui proses analisis yang sistematis
19.

Distribusi frekuensi dalam statistik deskriptif digunakan untuk…

  • A. Memprediksi nilai data di masa mendatang
  • B. Menguji hipotesis null pada populasi
  • C. Menunjukkan seberapa sering setiap nilai atau rentang nilai muncul dalam dataset
  • D. Mengukur korelasi antara dua variabel berbeda
C. Menunjukkan seberapa sering setiap nilai atau rentang nilai muncul dalam dataset
20.

Proses “pemahaman masalah” dalam data science bertujuan untuk…

  • A. Langsung membangun model prediktif tanpa eksplorasi data
  • B. Memahami konteks dan tujuan bisnis sebelum memulai analisis data
  • C. Mengumpulkan data sebanyak mungkin tanpa filter
  • D. Menyebarkan hasil analisis kepada publik
B. Memahami konteks dan tujuan bisnis sebelum memulai analisis data
21.

Apa yang dimaksud dengan “ekosistem data”?

  • A. Lingkungan alam yang menghasilkan data biologis
  • B. Komunitas ilmuwan yang mengumpulkan data lapangan
  • C. Jaringan entitas, teknologi, proses, dan orang yang bekerja sama dalam pengelolaan data
  • D. Sistem penyimpanan data berbasis cloud saja
C. Jaringan entitas, teknologi, proses, dan orang yang bekerja sama dalam pengelolaan data
22.

Dalam konteks statistik, populasi mengacu pada…

  • A. Jumlah penduduk suatu negara
  • B. Seluruh kumpulan data atau subjek yang menjadi objek penelitian
  • C. Sampel data yang diambil untuk analisis
  • D. Nilai rata-rata dari suatu dataset
B. Seluruh kumpulan data atau subjek yang menjadi objek penelitian
23.

Uji t (t-test) merupakan salah satu metode dalam…

  • A. Statistik deskriptif
  • B. Pemodelan data
  • C. Visualisasi data
  • D. Statistik inferensial
D. Statistik inferensial
24.

Kegiatan Belajar 3 pada Modul 1 membahas tentang…

  • A. Teknik pengumpulan data primer
  • B. Algoritma klasifikasi data
  • C. Aplikasi Sains Data di berbagai bidang
  • D. Pembuatan model regresi linear
C. Aplikasi Sains Data di berbagai bidang
25.

Tahap “Modeling” dalam CRISP-DM adalah…

  • A. Mengidentifikasi kebutuhan bisnis
  • B. Mengumpulkan dan mengeksplorasi data awal
  • C. Memilih dan menerapkan teknik pemodelan yang sesuai pada data
  • D. Mengintegrasikan data dari berbagai sumber
C. Memilih dan menerapkan teknik pemodelan yang sesuai pada data
26.

Varians dan standar deviasi adalah ukuran yang menggambarkan…

  • A. Nilai tengah dari suatu distribusi data
  • B. Sebaran atau dispersi data terhadap nilai rata-ratanya
  • C. Frekuensi kemunculan nilai tertentu dalam data
  • D. Hubungan linier antara dua variabel
B. Sebaran atau dispersi data terhadap nilai rata-ratanya
27.

Salah satu bidang penerapan Sains Data yang penting adalah e-commerce, yaitu untuk…

  • A. Merancang tampilan toko online
  • B. Sistem rekomendasi produk berdasarkan perilaku pengguna
  • C. Mengelola gudang barang secara manual
  • D. Membuat konten iklan kreatif
B. Sistem rekomendasi produk berdasarkan perilaku pengguna
28.

Proses persiapan sampel data dalam data science bertujuan untuk…

  • A. Memastikan data yang digunakan bersih, relevan, dan siap dianalisis
  • B. Memperbanyak jumlah data secara acak
  • C. Mengubah semua data ke dalam format teks
  • D. Menghapus semua data yang memiliki nilai ekstrem
A. Memastikan data yang digunakan bersih, relevan, dan siap dianalisis
29.

Koefisien korelasi Pearson digunakan untuk mengukur…

  • A. Perbedaan rata-rata antara dua kelompok data
  • B. Distribusi normal suatu variabel
  • C. Kekuatan dan arah hubungan linear antara dua variabel
  • D. Proporsi varians yang dijelaskan oleh model
C. Kekuatan dan arah hubungan linear antara dua variabel
30.

Peran Data Scientist berbeda dari Database Administrator karena…

  • A. Data Scientist tidak bekerja dengan data sama sekali
  • B. Data Scientist fokus pada analisis dan interpretasi data untuk menghasilkan insight
  • C. Database Administrator bertugas membuat model prediktif
  • D. Database Administrator menggunakan machine learning setiap hari
B. Data Scientist fokus pada analisis dan interpretasi data untuk menghasilkan insight
31.

Histogram merupakan alat visualisasi yang termasuk dalam…

  • A. Statistik inferensial
  • B. Pemodelan prediktif
  • C. Analisis regresi
  • D. Statistik deskriptif
D. Statistik deskriptif
32.

Manakah yang BUKAN merupakan tahapan dalam CRISP-DM?

  • A. Business Understanding
  • B. Data Understanding
  • C. Network Configuration
  • D. Deployment
C. Network Configuration
33.

Big Data merupakan salah satu pendorong perkembangan Sains Data karena…

  • A. Big Data menyederhanakan proses analisis data
  • B. Volume, kecepatan, dan variasi data yang besar membutuhkan teknik analisis canggih
  • C. Big Data hanya berisi data numerik yang mudah diolah
  • D. Big Data menghilangkan kebutuhan akan statistik
B. Volume, kecepatan, dan variasi data yang besar membutuhkan teknik analisis canggih
34.

Analisis statistik deskriptif yang berkaitan dengan pengumpulan dan penyajian data bertujuan untuk…

  • A. Membuat kesimpulan yang berlaku bagi populasi yang lebih luas
  • B. Memberikan informasi yang berguna tentang karakteristik data yang diamati
  • C. Membangun model machine learning yang akurat
  • D. Melakukan validasi silang pada model prediktif
B. Memberikan informasi yang berguna tentang karakteristik data yang diamati
35.

Seorang Data Scientist biasanya perlu menguasai kombinasi kemampuan berikut…

  • A. Hanya pemrograman tanpa pengetahuan statistik
  • B. Hanya statistik tanpa kemampuan komunikasi
  • C. Statistik, pemrograman, dan pemahaman domain bisnis
  • D. Hanya desain grafis dan manajemen proyek
C. Statistik, pemrograman, dan pemahaman domain bisnis
36.

Nilai p-value dalam pengujian hipotesis statistik digunakan untuk…

  • A. Mengukur rata-rata populasi secara langsung
  • B. Menentukan ukuran sampel yang diperlukan
  • C. Menggambarkan distribusi data secara visual
  • D. Menentukan apakah hasil uji statistik signifikan secara statistis
D. Menentukan apakah hasil uji statistik signifikan secara statistis
37.

Konsep “pemeliharaan model” dalam data science mengacu pada…

  • A. Memperbaiki perangkat keras server
  • B. Memperbarui dan memantau model agar tetap akurat seiring perubahan data
  • C. Menghapus model lama dari sistem
  • D. Mendokumentasikan kode pemrograman model
B. Memperbarui dan memantau model agar tetap akurat seiring perubahan data
38.

Dalam Kegiatan Belajar 2 Modul 1, yang dibahas adalah…

  • A. Teknik visualisasi data lanjutan
  • B. Metode pengumpulan data primer dan sekunder
  • C. Peran Data Scientist dan ekosistem data
  • D. Algoritma clustering dan klasifikasi
C. Peran Data Scientist dan ekosistem data
39.

Outlier dalam dataset adalah…

  • A. Nilai yang paling sering muncul dalam data
  • B. Nilai tengah dari seluruh data
  • C. Data yang nilainya jauh berbeda dari sebagian besar data lainnya
  • D. Nilai minimum dalam suatu distribusi
C. Data yang nilainya jauh berbeda dari sebagian besar data lainnya
40.

Pengaplikasian model pada dataset dalam proses data science bertujuan untuk…

  • A. Mengumpulkan lebih banyak data training
  • B. Menguji seberapa baik model bekerja pada data yang belum pernah dilihat sebelumnya
  • C. Mempercepat kecepatan pemrosesan server
  • D. Membersihkan data dari nilai duplikat
B. Menguji seberapa baik model bekerja pada data yang belum pernah dilihat sebelumnya
41.

Sains Data berbeda dari ilmu statistik tradisional dalam hal…

  • A. Sains Data tidak menggunakan metode statistik sama sekali
  • B. Ilmu statistik selalu menggunakan machine learning
  • C. Sains Data tidak memerlukan interpretasi hasil analisis
  • D. Sains Data menggabungkan statistik dengan ilmu komputer dan pengetahuan domain untuk menangani data berskala besar
D. Sains Data menggabungkan statistik dengan ilmu komputer dan pengetahuan domain untuk menangani data berskala besar
42.

Dalam statistik deskriptif, median adalah…

  • A. Nilai yang paling sering muncul dalam dataset
  • B. Nilai tengah dari data yang telah diurutkan
  • C. Rata-rata aritmatika dari seluruh data
  • D. Selisih antara nilai maksimum dan minimum
B. Nilai tengah dari data yang telah diurutkan
43.

Tahap “Business Understanding” dalam CRISP-DM terutama berfokus pada…

  • A. Memilih algoritma terbaik untuk analisis
  • B. Memahami tujuan proyek dari perspektif bisnis dan mendefinisikan masalah data mining
  • C. Mengumpulkan dan memvalidasi data mentah
  • D. Mengevaluasi performa model yang telah dibangun
B. Memahami tujuan proyek dari perspektif bisnis dan mendefinisikan masalah data mining
44.

Analisis regresi linear termasuk dalam kategori metode…

  • A. Statistik deskriptif
  • B. Visualisasi data
  • C. Statistik inferensial dan pemodelan prediktif
  • D. Pengumpulan data
C. Statistik inferensial dan pemodelan prediktif
45.

Sains Data di bidang pendidikan dapat digunakan untuk…

  • A. Hanya mengelola absensi siswa secara digital
  • B. Menganalisis pola belajar siswa untuk meningkatkan efektivitas pembelajaran
  • C. Membuat jadwal pelajaran secara otomatis
  • D. Mendesain seragam sekolah berbasis data warna
B. Menganalisis pola belajar siswa untuk meningkatkan efektivitas pembelajaran
46.

Interval kepercayaan (confidence interval) merupakan konsep yang digunakan dalam…

  • A. Statistik deskriptif untuk merangkum data
  • B. Visualisasi data dalam bentuk grafik batang
  • C. Statistik inferensial untuk memperkirakan parameter populasi
  • D. Pembersihan data dari nilai yang hilang
C. Statistik inferensial untuk memperkirakan parameter populasi
47.

Kegiatan Belajar 1 pada Modul 1 membahas tentang…

  • A. Proses CRISP-DM secara mendetail
  • B. Metode statistik inferensial
  • C. Pengertian dan konsep dasar Sains Data
  • D. Teknik deployment model machine learning
C. Pengertian dan konsep dasar Sains Data
48.

Skewness (kemiringan) dalam statistik deskriptif menggambarkan…

  • A. Seberapa jauh data tersebar dari rata-ratanya
  • B. Hubungan antara dua variabel dalam dataset
  • C. Nilai tengah dari distribusi data
  • D. Tingkat asimetri distribusi data terhadap nilai rata-ratanya
D. Tingkat asimetri distribusi data terhadap nilai rata-ratanya
49.

Dalam proses data science, “pembangunan model” mengacu pada…

  • A. Konstruksi fisik pusat data baru
  • B. Penerapan algoritma untuk menemukan pola atau membuat prediksi dari data
  • C. Pembuatan laporan statistik deskriptif
  • D. Pengumpulan data dari sumber eksternal
B. Penerapan algoritma untuk menemukan pola atau membuat prediksi dari data
50.

Manakah pernyataan yang paling tepat menggambarkan hubungan antara statistik deskriptif dan inferensial?

  • A. Keduanya identik dan dapat digunakan secara bergantian
  • B. Statistik deskriptif menggambarkan data yang ada, sedangkan inferensial menarik kesimpulan tentang populasi dari sampel
  • C. Statistik inferensial lebih sederhana dibandingkan statistik deskriptif
  • D. Statistik deskriptif hanya digunakan untuk data kualitatif
B. Statistik deskriptif menggambarkan data yang ada, sedangkan inferensial menarik kesimpulan tentang populasi dari sampel

Konsistensi dalam mengerjakan Soal Latihan UT terbukti mempertajam kemampuan analisis sekaligus mempercepat respons saat ujian berlangsung, baik dalam format Ujian Tatap Muka (UTM), Ujian Online (UO), maupun Take Home Exam (THE). Kenali format mana yang akan Anda hadapi, lalu sesuaikan strategi belajar Anda dari sekarang.

Setiap halaman modul yang Anda baca dan setiap Soal UT yang Anda kerjakan adalah investasi nyata untuk hasil terbaik. Percayai proses yang sudah Anda jalani, karena kerja keras hari ini adalah pondasi nilai memuaskan di hari ujian nanti.

Bagikan:

error: Content is protected !!