Soal UAS UT STDA4404 Deep Learning dan Kunci Jawaban

Baru belajar backpropagation, langsung disuruh turunin gradien manual. Modul 2 KB 1 memang terasa berat kalau baru pertama ketemu. Konsep loss function dan learning rate di STDA4404 Deep Learning bisa bikin kamu bolak-balik catatan. Saya dulu sempat stuck juga di situ. Coba intip prediksi soal UAS Sains Data untuk lihat pola soalnya.

Modul 3 soal CNN dan Modul 7 tentang Graph Neural Network sama menantangnya. Operasi konvolusi di CNN itu core-nya computer vision. Sementara message passing di GNN bikin paham cara data grafik diproses. Dua topik ini bertolak belakang tapi sering muncul. Jangan cuma baca teori. Kerjakan variasi soal dari kumpulan soal UAS UT buat ngetes pemahaman kamu.

Di halaman ini, soal-soal UAS sudah kami pecah per modul. Tiap soal ada kunci jawaban dan pembahasannya. Kamu bisa langsung tahu letak salahmu. Tidak perlu nebak-nebak lagi.

Soal UT STDA4404 Deep Learning

Sebuah perusahaan rintisan teknologi mengembangkan sistem yang dapat mengenali wajah dan memutuskan akses masuk gedung tanpa aturan yang diprogram secara eksplisit, melainkan belajar dari ribuan contoh foto…

A. Machine Learning
B. Artificial Intelligence
C. Deep Learning
D. Computer Vision

Jawaban: A
Machine Learning adalah subset AI yang memungkinkan sistem belajar dari data tanpa diprogram secara eksplisit, tepat menggambarkan sistem yang belajar dari contoh foto.

Dalam hierarki kecerdasan buatan, deep learning memiliki karakteristik utama yang membedakannya dari machine learning konvensional, yaitu…

A. Pembelajaran representasi hierarkis melalui banyak lapisan neural network
B. Penggunaan aturan if-then yang kompleks untuk pengambilan keputusan
C. Kemampuan memproses data tanpa preprocessing manual
D. Ketergantungan eksklusif pada data terstruktur dan terlabeli

Jawaban: A
Deep learning menggunakan neural network dengan banyak lapisan untuk mempelajari representasi data secara hierarkis, dari fitur sederhana hingga kompleks.

Andi diminta membangun model yang memperkirakan harga rumah berdasarkan luas, lokasi, dan jumlah kamar. Data historis tersedia dalam jumlah sedang. Andi memilih neural network dua lapisan dan berhasil. Pilihan Andi paling tepat dikategorikan sebagai…

A. Artificial Intelligence eksklusif
B. Symbolic AI
C. Deep Learning murni
D. Machine Learning tanpa deep learning

Jawaban: D
Dengan hanya dua lapisan, model ini tergolong shallow neural network yang masuk kategori machine learning konvensional, bukan deep learning yang memerlukan banyak lapisan.

Seorang peneliti menyatakan bahwa perkembangan deep learning saat ini sangat didorong oleh ketersediaan big data. Pernyataan yang paling tepat menjelaskan hubungan ini adalah…

A. Model deep learning dengan banyak parameter memerlukan volume data besar untuk belajar representasi yang bermakna tanpa overfitting
B. Deep learning membutuhkan big data karena setiap neuron menyimpan satu sampel data
C. Big data menggantikan kebutuhan akan arsitektur neural network yang kompleks
D. Big data hanya relevan untuk unsupervised learning, bukan deep learning

Jawaban: A
Deep learning memiliki jutaan parameter yang memerlukan data besar agar dapat menggeneralisasi dengan baik; tanpa big data, model dalam cenderung overfitting.

Sistem diagnosa medis berbasis deep learning mampu mendeteksi kanker kulit dari foto dengan akurasi setara dokter spesialis. Aplikasi ini menggambarkan peran deep learning di bidang…

A. Keamanan siber
B. Kesehatan dan diagnostik
C. Manufaktur otomatis
D. Sistem rekomendasi e-commerce

Jawaban: B
Deteksi kanker kulit dari citra medis merupakan contoh aplikasi deep learning dalam bidang kesehatan, khususnya diagnostik berbantuan AI.

Dalam perceptron, bobot dan bias memiliki peran krusial. Manakah pernyataan yang paling tepat tentang fungsi bias dalam neuron buatan…

A. Bias menggantikan fungsi aktivasi pada kasus tertentu
B. Bias selalu bernilai sama dengan rata-rata bobot input
C. Bias menggeser kurva fungsi aktivasi sehingga neuron dapat aktif meskipun input bernilai nol
D. Bias hanya digunakan pada lapisan output, bukan lapisan tersembunyi

Jawaban: C
Bias memungkinkan pergeseran ambang aktivasi; tanpa bias, neuron hanya dapat aktif jika kombinasi linear input melebihi nol, sehingga mengurangi fleksibilitas.

Seorang engineer melatih neural network dan mengamati bahwa konvergensi terjadi sangat cepat. Ia menggunakan fungsi aktivasi yang outputnya linear untuk input positif dan nol untuk input negatif. Fungsi aktivasi yang dimaksud adalah…

A. Sigmoid
B. ReLU
C. Softmax
D. Tanh

Jawaban: B
ReLU menghasilkan output nol untuk input negatif dan identitas linear untuk input positif, yang mempercepat konvergensi karena mengurangi vanishing gradient pada daerah positif.

Dibandingkan dengan fungsi aktivasi sigmoid, ReLU lebih disukai pada hidden layer jaringan dalam karena…

A. ReLU memiliki output terbatas antara 0 dan 1
B. ReLU selalu menghasilkan output negatif yang mempercepat pembelajaran
C. ReLU memiliki komputasi eksponensial yang lebih berat
D. ReLU menghindari vanishing gradient pada daerah positif, sedangkan sigmoid menjenuhkan gradien pada nilai ekstrem

Jawaban: D
Sigmoid menjenuh pada nilai besar atau kecil sehingga gradien mendekati nol; ReLU bersifat linear pada daerah positif sehingga gradien tetap mengalir.

Ketika menghitung forward propagation pada neural network tiga lapisan, matriks bobot W^[2] menghubungkan…

A. Input ke lapisan tersembunyi pertama
B. Lapisan tersembunyi pertama ke lapisan output
C. Lapisan tersembunyi pertama ke lapisan tersembunyi kedua
D. Lapisan output kembali ke input

Jawaban: C
Notasi W^[l] merepresentasikan bobot yang menghubungkan lapisan l-1 ke lapisan l. W^[2] menghubungkan lapisan tersembunyi pertama ke lapisan tersembunyi kedua.

10.

Neuron buatan dalam deep learning terinspirasi dari neuron biologis, tetapi memiliki perbedaan mendasar. Perbedaan yang paling tepat adalah…

A. Neuron buatan mengirim output berupa nilai numerik kontinu melalui fungsi aktivasi matematis, neuron biologis menembakkan potensial aksi berdasarkan potensial membran
B. Neuron buatan menggunakan sinyal elektrik, neuron biologis menggunakan sinyal optik
C. Neuron buatan hanya menerima satu input, neuron biologis menerima banyak input
D. Neuron buatan dan neuron biologis bekerja dengan mekanisme identik tanpa perbedaan

Jawaban: A
Neuron buatan menyederhanakan proses biologis: output berupa hasil fungsi aktivasi matematis, sedangkan neuron biologis menembakkan spike ketika potensial membran melampaui ambang.

11.

Seorang mahasiswa ingin membangun model deep learning dengan cepat menggunakan API high-level yang modular. Ia perlu framework yang memungkinkan eksperimen cepat tanpa mengelola graph komputasi secara manual. Framework yang paling tepat adalah…

A. Keras
B. OpenCV
C. TensorFlow low-level API
D. NumPy

Jawaban: A
Keras adalah API high-level yang berjalan di atas TensorFlow, dirancang untuk membangun dan melatih model deep learning secara cepat dan modular dengan kode minimal.

12.

Fitur dynamic computational graph menjadi keunggulan utama salah satu framework deep learning. Fitur ini memungkinkan perubahan graph saat runtime. Framework dengan karakteristik tersebut adalah…

A. TensorFlow 1.x
B. Keras standalone
C. scikit-learn
D. PyTorch

Jawaban: D
PyTorch menggunakan dynamic computational graph yang dibangun saat runtime, memberikan fleksibilitas tinggi untuk debugging dan eksperimen, berbeda dengan static graph pada TensorFlow 1.x.

13.

Peneliti deep learning sering memilih TensorFlow ketika deployment ke production environment menjadi prioritas, sementara PyTorch lebih populer untuk riset. Alasan utama preferensi ini adalah…

A. PyTorch tidak mendukung GPU
B. PyTorch hanya dapat digunakan pada sistem operasi Linux
C. TensorFlow memiliki ekosistem deployment yang lebih matang termasuk TensorFlow Serving dan TensorFlow Lite
D. TensorFlow tidak mendukung pembangunan model neural network

Jawaban: C
TensorFlow memiliki alat production-ready seperti TF Serving dan TF Lite, sementara PyTorch awalnya lebih fokus pada fleksibilitas riset meskipun kini juga berkembang ke arah deployment.

14.

Lingkungan pengembangan berbasis cloud yang menyediakan GPU gratis dan terintegrasi dengan Google Drive untuk eksperimen deep learning adalah…

A. Jupyter Notebook lokal
B. VS Code
C. Google Colab
D. PyCharm Community Edition

Jawaban: C
Google Colab adalah platform cloud yang menyediakan akses gratis ke GPU dan terintegrasi dengan Google Drive, memudahkan eksperimen deep learning tanpa investasi perangkat keras.

15.

Data scientist di PT Maju Jaya memilih TensorFlow untuk proyek deployment model klasifikasi gambar ke aplikasi mobile. Pertimbangan paling tepat untuk pilihan ini adalah…

A. TensorFlow adalah satu-satunya framework yang mendukung Python
B. TensorFlow menyediakan TensorFlow Lite yang mengonversi model untuk inferensi pada perangkat mobile
C. PyTorch tidak dapat digunakan untuk klasifikasi gambar
D. Keras hanya mendukung pelatihan model, bukan deployment

Jawaban: B
TensorFlow Lite memungkinkan konversi model deep learning ke format yang dioptimalkan untuk inferensi pada perangkat mobile dan embedded, menjadi alasan kuat memilih TensorFlow.

16.

Dalam pelatihan neural network, fungsi loss berperan sebagai…

A. Metrik akhir yang menentukan akurasi model pada data uji
B. Fungsi yang mengukur selisih antara output prediksi dan target, yang gradiennya digunakan untuk memperbarui parameter
C. Teknik regularisasi untuk mencegah overfitting
D. Fungsi aktivasi pada lapisan output

Jawaban: B
Fungsi loss mengukur error antara prediksi dan target; gradien dari fungsi loss terhadap parameter dihitung melalui backpropagation untuk memandu pembaruan bobot.

17.

Ibu Siti melatih model pada dataset berukuran 2 juta sampel. Ia mengamati bahwa menggunakan satu sampel per pembaruan memberikan osilasi loss yang tinggi, sedangkan seluruh dataset terlalu lambat per epoch. Ia memilih mini-batch berukuran 64. Strategi ini dikenal sebagai…

A. Batch Gradient Descent
B. Deterministic Gradient Descent
C. Full-batch Learning
D. Stochastic Gradient Descent dengan mini-batch

Jawaban: D
Mini-batch SGD menggunakan sebagian kecil data untuk setiap pembaruan parameter, mengkompromikan kecepatan komputasi batch GD dan kestabilan SGD dengan satu sampel.

18.

Perusahaan e-commerce melatih model neural network untuk memprediksi apakah pelanggan akan membeli produk tertentu. Mereka menggunakan fungsi loss yang mengukur selisih antara probabilitas prediksi dan label biner aktual. Fungsi loss yang paling tepat untuk kasus ini adalah…

A. Hinge loss
B. Mean squared error
C. Categorical cross-entropy
D. Binary cross-entropy

Jawaban: D
Binary cross-entropy dirancang khusus untuk tugas klasifikasi biner dengan mengukur divergensi antara distribusi prediksi dan distribusi target bernilai 0 atau 1.

19.

Budi mengimplementasikan backpropagation pada neural network tiga lapisan. Ia mengamati bahwa gradien terhadap bobot di lapisan pertama dihitung menggunakan aturan rantai yang melibatkan turunan fungsi aktivasi lapisan kedua dan ketiga. Proses ini menggambarkan bahwa backpropagation pada dasarnya…

A. Memperbarui bobot dari input menuju output
B. Menghitung gradien dari output menuju input
C. Menginisialisasi bobot secara adaptif
D. Menormalisasi aktivasi setiap lapisan

Jawaban: B
Backpropagation bekerja mundur dari lapisan output ke input, mengaplikasikan aturan rantai untuk menghitung kontribusi setiap parameter terhadap error total.

20.

Pada dataset berisi 500 ribu sampel, seorang praktisi membandingkan dua strategi: (1) menghitung gradien menggunakan seluruh dataset sebelum setiap pembaruan bobot, dan (2) menghitung gradien menggunakan satu sampel acak per pembaruan. Kelemahan utama strategi pertama dibandingkan strategi kedua adalah…

A. Osilasi loss yang lebih tinggi
B. Membutuhkan learning rate yang lebih tinggi
C. Ketidakmampuan mencapai konvergensi
D. Waktu komputasi per epoch yang jauh lebih besar

Jawaban: D
Batch gradient descent menggunakan seluruh dataset untuk satu kali pembaruan, sehingga setiap epoch sangat lambat pada dataset besar meskipun arah gradien lebih stabil.

21.

Peneliti melatih neural network pada dataset dengan banyak local minima dangkal. Ia menambahkan teknik yang mempercepat konvergensi dengan mengakumulasi komponen eksponensial dari gradien sebelumnya, sehingga pembaruan parameter saat ini dipengaruhi oleh arah gradien historis. Teknik yang digunakan adalah…

A. Learning rate decay
B. Gradient clipping
C. Weight decay
D. Momentum

Jawaban: D
Momentum mempertahankan vektor kecepatan yang mengakumulasi gradien masa lalu, membantu mempercepat optimasi pada arah yang konsisten dan meredam osilasi.

22.

Sebuah tim menggunakan optimizer yang menghitung rata-rata bergerak eksponensial dari gradien dan kuadrat gradien, kemudian menggunakan kedua estimasi tersebut untuk menyesuaikan learning rate secara adaptif per parameter. Optimizer yang dimaksud adalah…

A. AdaGrad
B. RMSProp
C. Adam
D. SGD

Jawaban: C
Adam menggabungkan konsep momentum (rata-rata bergerak gradien) dan RMSProp (rata-rata bergerak kuadrat gradien) sehingga menghasilkan learning rate adaptif yang efisien untuk setiap parameter.

23.

Ibu Dewi mengamati bahwa loss modelnya berhenti menurun setelah 30 epoch. Ia kemudian menerapkan strategi mengurangi learning rate sebesar 50% setiap 10 epoch berikutnya. Strategi ini bertujuan untuk…

A. Membantu konvergensi ke minimum yang lebih halus saat mendekati optimum
B. Memungkinkan model keluar dari saddle point dengan step besar
C. Mencegah overfitting dengan regularisasi implisit
D. Mengurangi varians gradien pada batch kecil

Jawaban: A
Penjadwalan learning rate membantu model melakukan penurunan gradien yang lebih presisi saat sudah mendekati titik optimum, sehingga dapat mencapai solusi yang lebih baik.

24.

Ketika melatih model klasifikasi gambar, seorang engineer melihat bahwa training accuracy mencapai 99% sementara validation accuracy hanya 82%. Ia memutuskan menambahkan penalti berupa kuadrat bobot pada fungsi loss. Teknik yang diterapkan adalah…

A. L2 regularization
B. L1 regularization
C. Dropout
D. Data augmentation

Jawaban: A
Regularisasi L2 menambahkan suku penalti proporsional terhadap kuadrat bobot ke fungsi loss, mendorong bobot bernilai kecil untuk mencegah model terlalu kompleks dan overfitting.

25.

Berbeda dengan L1 regularization yang dapat menghasilkan sparse weight, L2 regularization cenderung menghasilkan bobot yang…

A. Tepat nol pada banyak parameter
B. Bernilai negatif pada hidden layer pertama
C. Kecil namun tidak nol pada sebagian besar parameter
D. Seragam di seluruh lapisan

Jawaban: C
L2 regularization menghukum kuadrat bobot sehingga mendorong bobot mendekati nol tanpa membuatnya tepat nol, berbeda dari L1 yang dapat menghasilkan sparsitas.

26.

PT Visi Nusantara mengembangkan model deep learning dengan arsitektur 20 lapisan. Engineer mengamati bahwa neuron-neuron di lapisan tertentu menjadi sangat bergantung pada neuron lain, sehingga fitur yang dipelajari tidak independen. Teknik regularisasi yang paling tepat untuk mengatasi masalah ini adalah…

A. Dropout
B. Batch normalization
C. Early stopping
D. Weight decay

Jawaban: A
Dropout secara acak menonaktifkan neuron selama pelatihan, memaksa setiap neuron belajar fitur yang berguna secara independen tanpa terlalu bergantung pada kehadiran neuron spesifik lain.

27.

Seorang mahasiswa melatih model neural network dan memantau validation loss. Ia menghentikan pelatihan tepat saat validation loss mulai meningkat secara konsisten meskipun training loss terus menurun. Teknik yang ia terapkan berguna untuk…

A. Mencegah model menghafal data latih secara berlebihan
B. Menghasilkan sparse representation pada hidden layer
C. Mempercepat konvergensi dengan mengurangi epoch
D. Menyesuaikan arsitektur jaringan saat pelatihan berlangsung

Jawaban: A
Early stopping menghentikan pelatihan sebelum model mulai overfitting, yaitu saat performa pada data validasi memburuk sementara training loss terus membaik.

28.

Untuk memproses gambar 32×32 piksel pada CNN, Siti menggunakan filter berukuran 5×5 yang digeser dengan stride 1 tanpa padding. Operasi matematika yang terjadi di setiap posisi filter disebut…

A. Pooling
B. Normalization
C. Flattening
D. Konvolusi

Jawaban: D
Operasi konvolusi menggeser filter pada input dan menghitung dot product antara nilai filter dan patch lokal input untuk menghasilkan peta fitur.

29.

Pada arsitektur CNN, setelah melewati lapisan konvolusi pertama, gambar 28×28 menghasilkan 6 feature map berukuran 24×24. Feature map ini merepresentasikan…

A. 6 gambar berbeda yang diambil dari sudut berbeda
B. Keberadaan 6 jenis fitur berbeda pada berbagai posisi spasial
C. Klasifikasi gambar ke dalam 6 kelas berbeda
D. Dekomposisi gambar menjadi 6 saluran warna

Jawaban: B
Setiap feature map adalah hasil deteksi satu jenis fitur tertentu (misal tepi horizontal) pada berbagai lokasi spasial, dengan nilai aktivasi menunjukkan seberapa kuat fitur tersebut hadir.

30.

Setelah lapisan konvolusi, praktisi menambahkan operasi downsampling yang memilih nilai terbesar dalam window 2×2 dan mengurangi dimensi spasial menjadi setengahnya. Operasi ini bertujuan untuk…

A. Meningkatkan resolusi feature map
B. Menambahkan non-linearitas pada representasi
C. Memberikan invariansi terhadap translasi kecil dan mengurangi beban komputasi
D. Menghilangkan fitur yang tidak relevan secara permanen

Jawaban: C
Max pooling mereduksi ukuran spasial dengan mempertahankan fitur paling dominan, membuat representasi lebih ringkas dan memberikan toleransi terhadap pergeseran posisi objek.

31.

Wahyu membandingkan max pooling dan average pooling pada CNN untuk tugas klasifikasi tekstur halus. Ia membutuhkan operasi pooling yang mempertahankan informasi latar belakang secara lebih merata. Operasi yang lebih tepat untuk kasus ini adalah…

A. Average pooling karena merata-ratakan seluruh nilai dalam region
B. Max pooling karena mengurangi noise
C. Max pooling karena menonjolkan fitur paling signifikan
D. Average pooling karena menghasilkan aktivasi sparse

Jawaban: A
Average pooling menghitung rata-rata semua nilai dalam window, sehingga informasi latar yang lebih halus dan menyebar tetap dipertahankan, cocok untuk tekstur.

32.

Tim riset menghadapi masalah degradasi performa saat menambah lapisan CNN dari 30 menjadi 80 lapisan, di mana training error justru meningkat. Untuk mengatasi ini, mereka menggunakan arsitektur dengan koneksi yang memungkinkan sinyal langsung melompati satu atau beberapa lapisan. Arsitektur yang dimaksud adalah…

A. VGG
B. ResNet
C. AlexNet
D. LeNet

Jawaban: B
ResNet memperkenalkan residual connection yang memungkinkan gradient dan sinyal mengalir langsung melalui identity mapping, mengatasi masalah degradasi pada jaringan sangat dalam.

33.

PT Citra Nusa memiliki dataset hanya 2.000 gambar untuk tugas klasifikasi 50 kategori. Mereka memutuskan menggunakan model ResNet-50 yang telah dilatih pada ImageNet, lalu hanya melatih ulang fully connected layer terakhir pada dataset mereka. Pendekatan ini disebut…

A. Training from scratch
B. Transfer learning dengan feature extraction
C. Data augmentation
D. Ensemble learning

Jawaban: B
Feature extraction dalam transfer learning memanfaatkan representasi yang sudah dipelajari model pretrained sebagai feature extractor tetap, kemudian hanya melatih classifier baru sesuai dataset target.

34.

Setelah menggunakan feature extraction dari model pretrained, tim mengamati bahwa akurasi masih dapat ditingkatkan. Mereka memutuskan untuk melatih ulang tidak hanya classifier tetapi juga beberapa lapisan konvolusi terakhir dengan learning rate sangat kecil. Proses ini dikenal sebagai…

A. Knowledge distillation
B. Pruning
C. Fine-tuning
D. Quantization

Jawaban: C
Fine-tuning membuka kembali pelatihan pada lapisan tertentu dari model pretrained dengan learning rate kecil, sehingga representasi fitur dapat disesuaikan secara lebih spesifik terhadap dataset target.

35.

PT Andromeda memiliki 150 ribu gambar produk yang perlu diklasifikasi ke dalam 30 kategori, tetapi hanya memiliki dua GPU konsumen untuk pelatihan. Tim memutuskan menggunakan arsitektur yang sudah terbukti pada ImageNet tanpa melatih dari nol. Strategi ini paling tepat disebut…

A. neural architecture search
B. data augmentation
C. transfer learning
D. self-supervised learning

Jawaban: C
Menggunakan model yang sudah dilatih pada dataset besar sebagai titik awal untuk tugas baru dengan data terbatas merupakan definisi transfer learning.

36.

Setelah menerapkan transfer learning, engineer di PT Andromeda mengamati bahwa akurasi pada data edge case masih rendah. Ia memutuskan melatih ulang seluruh lapisan konvolusi terakhir bersama classifier dengan learning rate 1e-5, sementara lapisan awal dibiarkan beku. Proses ini dikenal sebagai…

A. feature extraction
B. weight initialization
C. fine-tuning
D. knowledge distillation

Jawaban: C
Melatih ulang sebagian atau seluruh lapisan model pretrained pada dataset target untuk menyesuaikan representasi fitur dengan tugas spesifik disebut fine-tuning.

37.

Sebuah startup mengembangkan aplikasi yang menerima unggahan foto makanan dan langsung memberikan label seperti 'gado-gado', 'rendang', atau 'soto' beserta estimasi kalori. Tugas utama yang dilakukan sistem ini pada tahap pertama adalah…

A. klasifikasi gambar
B. segmentasi semantik
C. deteksi objek
D. object tracking

Jawaban: A
Menetapkan label kelas tunggal pada gambar masukan berdasarkan fitur visual yang diekstraksi merupakan definisi klasifikasi gambar.

38.

Tim drone pertanian menggunakan model CNN untuk memproses video lahan sawah secara real-time. Model harus mendeteksi keberadaan dan posisi tepat hama wereng dalam setiap frame dengan kecepatan 30 fps. Algoritma yang membagi frame menjadi grid dan memprediksi bounding box dalam satu forward pass paling cocok untuk kebutuhan ini…

A. Faster R-CNN
B. YOLO
C. U-Net
D. Mask R-CNN

Jawaban: B
YOLO membagi gambar menjadi grid dan langsung memprediksi bounding box serta probabilitas kelas dalam satu forward pass, sehingga cocok untuk deteksi objek real-time.

39.

Klinik radiologi menggunakan model deep learning untuk mengidentifikasi area tumor pada hasil CT scan pasien. Model harus memberikan label 'tumor' atau 'non-tumor' pada setiap piksel gambar agar dokter mengetahui batas tumor secara presisi. Tugas yang dilakukan model ini adalah…

A. klasifikasi gambar
B. deteksi objek
C. segmentasi semantik
D. image captioning

Jawaban: C
Segmentasi semantik menetapkan label kelas pada setiap piksel gambar untuk memahami batas objek secara presisi pada level piksel.

40.

Meskipun sama-sama tugas computer vision, klasifikasi gambar dan deteksi objek memiliki perbedaan mendasar. Deteksi objek menghasilkan output yang tidak dimiliki oleh klasifikasi gambar murni, yaitu…

A. probabilitas kelas
B. bounding box
C. feature map
D. confidence score

Jawaban: B
Deteksi objek menghasilkan bounding box yang menunjukkan lokasi spasial objek, sementara klasifikasi gambar hanya menghasilkan label kelas tanpa informasi lokasi.

41.

Data time series harga saham harian memiliki karakteristik bahwa harga hari ini berkorelasi dengan harga beberapa hari sebelumnya. Arsitektur neural network yang secara inheren mempertahankan hidden state dari langkah waktu sebelumnya untuk menangkap ketergantungan temporal ini adalah…

A. Recurrent Neural Network
B. Fully Connected Network
C. Convolutional Neural Network
D. Graph Neural Network

Jawaban: A
RNN memiliki koneksi umpan balik yang mempertahankan hidden state, sehingga secara inheren cocok untuk memproses data dengan ketergantungan temporal.

42.

Budi melatih RNN pada data teks sepanjang 150 token. Selama pelatihan, ia mengamati bahwa model gagal menangkap hubungan antara kata di awal kalimat dan prediksi di akhir. Fenomena ini terjadi karena gradien menjadi sangat kecil saat dipropagasi mundur melalui banyak langkah waktu. Masalah ini dikenal sebagai…

A. exploding gradient
B. mode collapse
C. vanishing gradient problem
D. catastrophic forgetting

Jawaban: C
Vanishing gradient problem terjadi ketika gradien menjadi sangat kecil saat dipropagasi balik melalui banyak langkah waktu, sehingga menghambat pembelajaran ketergantungan jangka panjang pada RNN.

43.

Dalam memahami suatu kalimat, informasi dari kata sebelum dan sesudah sama-sama penting. Namun RNN standar hanya memproses sekuens dari satu arah. Untuk menangkap konteks dua arah, pendekatan yang membentangkan RNN menjadi jaringan feedforward sepanjang langkah waktu dan memungkinkan propagasi balik disebut…

A. truncated backpropagation
B. unrolling waktu
C. teacher forcing
D. scheduled sampling

Jawaban: B
Unrolling waktu adalah representasi RNN sebagai jaringan feedforward yang dibentang sepanjang langkah waktu untuk memungkinkan propagasi balik melalui waktu selama pelatihan.

44.

Arsitektur RNN dan CNN memiliki perbedaan fundamental dalam memproses data. Manakah pernyataan yang paling tepat membedakan keduanya…

A. RNN hanya untuk data teks, CNN hanya untuk gambar
B. RNN menggunakan parameter sharing, CNN tidak
C. RNN lebih cepat dilatih daripada CNN untuk semua jenis data
D. RNN memiliki koneksi umpan balik dan hidden state, CNN menggunakan filter konvolusi spasial

Jawaban: D
Perbedaan mendasar terletak pada mekanisme pemrosesan: RNN menggunakan koneksi umpan balik dan hidden state untuk data sekuensial, sedangkan CNN menggunakan filter konvolusi untuk data spasial.

45.

PT Prediksi Cuaca melatih model untuk memprediksi suhu 7 hari ke depan berdasarkan data suhu 30 hari terakhir. Tim menginginkan model yang dapat menangkap ketergantungan jangka panjang tanpa menderita vanishing gradient. Model yang paling tepat untuk kebutuhan ini adalah…

A. vanilla RNN
B. perceptron multilayer
C. CNN 1D
D. LSTM

Jawaban: D
LSTM menggunakan mekanisme gerbang untuk mengontrol aliran informasi sehingga dapat menangkap ketergantungan jangka panjang tanpa vanishing gradient, cocok untuk prediksi time series dengan horizon jauh.

46.

GRU menyederhanakan arsitektur LSTM dengan menggabungkan forget gate dan input gate menjadi satu gerbang. Gerbang hasil penggabungan ini disebut…

A. update gate
B. output gate
C. reset gate
D. memory gate

Jawaban: A
GRU menggabungkan forget gate dan input gate dari LSTM menjadi update gate, sehingga lebih efisien secara komputasi dengan tetap mempertahankan kemampuan menangkap ketergantungan jangka panjang.

47.

Seorang engineer membandingkan LSTM dan GRU untuk tugas klasifikasi teks dengan dataset besar. Ia mengamati bahwa GRU mencapai performa hampir setara LSTM tetapi dengan waktu pelatihan 20% lebih cepat. Alasan utama efisiensi ini adalah…

A. GRU memiliki lebih sedikit parameter karena struktur gerbang yang lebih sederhana
B. GRU tidak memiliki mekanisme gerbang
C. GRU menggunakan aktivasi linear
D. GRU tidak memproses hidden state

Jawaban: A
GRU memiliki lebih sedikit parameter dibandingkan LSTM karena menggabungkan forget dan input gate menjadi update gate, sehingga lebih efisien secara komputasi.

48.

Analis sentimen di platform e-commerce ingin model yang memahami konteks kata dari dua arah — sebelum dan sesudah — untuk setiap token dalam ulasan produk. Konfigurasi yang tepat adalah menggunakan…

A. unidirectional LSTM backward
B. stacked RNN
C. CNN dengan kernel lebar
D. bidirectional RNN

Jawaban: D
Bidirectional RNN memproses data sekuensial dari dua arah untuk menangkap konteks masa lalu dan masa depan pada setiap langkah waktu.

49.

Tim riset bahasa membangun sistem yang menerima kalimat bahasa Indonesia dan menghasilkan kalimat bahasa Inggris sebagai output. Arsitektur yang memetakan satu urutan input ke urutan output dengan panjang berbeda melalui encoder dan decoder disebut…

A. autoencoder
B. sequence-to-sequence model
C. Generative Adversarial Network
D. ResNet

Jawaban: B
Sequence-to-sequence model menggunakan arsitektur encoder-decoder untuk memetakan satu urutan input ke urutan output dengan panjang yang dapat berbeda, umum digunakan dalam terjemahan mesin.

50.

Klasifikasi teks dan sequence-to-sequence model sama-sama menggunakan arsitektur sekuensial, tetapi memiliki perbedaan utama. Perbedaan yang paling tepat adalah…

A. klasifikasi teks lebih lambat dilatih daripada sequence-to-sequence
B. klasifikasi teks menggunakan RNN, sequence-to-sequence menggunakan CNN
C. klasifikasi teks tidak memerlukan embedding, sequence-to-sequence memerlukan
D. klasifikasi teks menghasilkan satu label untuk input, sequence-to-sequence menghasilkan urutan output

Jawaban: D
Klasifikasi teks menghasilkan satu label untuk seluruh input, sedangkan sequence-to-sequence menghasilkan urutan output yang panjangnya dapat berbeda dari input, seperti pada terjemahan.

51.

PT Sentra Analitika menggunakan model deep learning untuk memprediksi skor kepuasan pelanggan berdasarkan ulasan teks. Mereka ingin model yang tidak hanya mengklasifikasikan sentimen, tetapi juga menghasilkan ringkasan poin keluhan utama dalam bentuk teks berbeda. Arsitektur yang paling sesuai untuk menghasilkan keluaran teks dari masukan teks dengan panjang berbeda adalah…

A. Sequence-to-sequence model
B. Fully connected network untuk regresi
C. Klasifikasi teks dengan LSTM
D. Prediksi time series univariat

Jawaban: A
Sequence-to-sequence model memetakan satu urutan input ke urutan output dengan panjang yang bisa berbeda, seperti pada kasus peringkasan atau terjemahan.

52.

Dalam mesin penerjemah, saat menghasilkan kata kelima dalam kalimat target, model perlu memberikan perhatian lebih pada kata kedua dan ketiga dalam kalimat sumber karena keduanya membawa informasi subjek dan predikat utama. Mekanisme yang memungkinkan model memberikan bobot berbeda pada setiap elemen input saat menghasilkan setiap elemen output adalah…

A. Layer normalization
B. Positional encoding
C. Multi-head attention
D. Attention mechanism

Jawaban: D
Attention mechanism memberi bobot berbeda pada setiap elemen input sesuai relevansinya terhadap elemen output yang sedang dihasilkan, sehingga model dapat fokus pada bagian input yang paling informatif.

53.

Sebuah tim NLP mengimplementasikan mekanisme yang menghitung representasi kata 'bank' dalam kalimat 'Saya menabung di bank' dengan memperhatikan semua kata lain dalam kalimat yang sama, termasuk 'menabung' dan 'Saya'. Mekanisme yang digunakan adalah…

A. Self-attention
B. Cross-attention antara encoder dan decoder
C. Scaled dot-product attention pada neural machine translation
D. Global average pooling

Jawaban: A
Self-attention menghitung representasi setiap elemen dalam sekuens dengan memperhatikan semua elemen lain dalam sekuens yang sama, menangkap hubungan internal antar token.

54.

Untuk menangkap berbagai jenis hubungan kontekstual seperti hubungan sintaksis, semantik, dan koreferensi secara simultan dalam satu lapisan, arsitektur Transformer menerapkan beberapa operasi attention yang berjalan paralel. Komponen yang dimaksud adalah…

A. Multi-head attention
B. Stacked encoder layers
C. Bidirectional attention
D. Feed-forward sublayer

Jawaban: A
Multi-head attention menjalankan beberapa operasi self-attention secara paralel dengan parameter berbeda, memungkinkan model menangkap berbagai jenis hubungan kontekstual secara bersamaan.

55.

Dalam mekanisme self-attention, matriks perhatian dihitung menggunakan query, key, dan value yang semuanya berasal dari input yang sama. Berbeda dengan itu, cross-attention menggunakan query dari satu sekuens dan key-value dari sekuens lain. Perbedaan utama ini menjadikan self-attention paling tepat untuk…

A. Menginisialisasi bobot embedding kata
B. Menghubungkan kalimat sumber dengan kalimat target
C. Menangkap ketergantungan antar token dalam satu kalimat
D. Menormalisasi distribusi perhatian antar lapisan

Jawaban: C
Self-attention menggunakan query, key, dan value dari sekuens yang sama, sehingga secara fundamental cocok untuk menangkap hubungan internal antar token dalam satu rangkaian.

56.

Arsitektur Transformer tidak menggunakan rekurensi atau konvolusi dalam pemrosesan utamanya. Konsekuensi dari ketiadaan struktur sekuensial inheren ini adalah Transformer membutuhkan positional encoding. Fungsi paling mendasar dari positional encoding adalah…

A. Menggantikan fungsi word embedding pada token input
B. Mereduksi dimensi embedding untuk efisiensi komputasi
C. Menormalkan distribusi perhatian di setiap head
D. Menyisipkan informasi posisi elemen ke dalam representasi input

Jawaban: D
Karena Transformer tidak memiliki struktur sekuensial inheren seperti RNN, positional encoding menyisipkan informasi posisi setiap token agar model dapat membedakan urutan elemen dalam sekuens.

57.

PT Nusa Bahasa mengembangkan sistem terjemahan mesin real-time. Tim memilih Transformer dibandingkan LSTM karena kemampuannya memproses seluruh sekuens secara paralel. Keuntungan utama arsitektur Transformer dibandingkan LSTM dalam konteks ini adalah…

A. Ukuran model yang selalu lebih kecil
B. Kemampuan menangkap ketergantungan jangka panjang tanpa vanishing gradient dan pelatihan lebih cepat
C. Tidak memerlukan data pelatihan yang besar
D. Representasi kata yang selalu lebih akurat

Jawaban: B
Transformer menggunakan self-attention yang memungkinkan setiap token berinteraksi langsung dengan semua token lain tanpa propagasi gradien melalui langkah waktu, mengatasi vanishing gradient dan memungkinkan paralelisasi penuh.

58.

Sebelum masuk ke lapisan self-attention, setiap token input diproyeksikan menjadi representasi vektor melalui word embedding. Namun Transformer juga menambahkan komponen lain pada embedding ini untuk memberikan informasi urutan. Komponen tersebut adalah…

A. Segment embedding untuk membedakan kalimat
B. Layer normalization yang menstabilkan distribusi
C. Positional encoding yang merepresentasikan posisi token
D. Attention mask untuk menutupi token padding

Jawaban: C
Positional encoding ditambahkan ke word embedding untuk memberikan informasi posisi setiap token, karena Transformer tidak memiliki struktur sekuensial inheren yang dapat menangkap urutan.

59.

Setelah setiap sublayer dalam Transformer (self-attention dan feed-forward), terdapat teknik normalisasi yang menormalkan input di setiap lapisan berdasarkan statistik fitur, bukan berdasarkan batch. Teknik ini adalah…

A. Batch normalization
B. Layer normalization
C. Dropout
D. Weight normalization

Jawaban: B
Layer normalization menghitung statistik normalisasi berdasarkan dimensi fitur untuk setiap sampel secara independen, berbeda dengan batch normalization yang menggunakan statistik batch, sehingga lebih cocok untuk model sekuensial dengan panjang batch bervariasi.

60.

Google mengembangkan model bahasa yang dilatih dengan masked language modeling, di mana sebagian token dalam input disembunyikan dan model harus memprediksinya berdasarkan konteks dua arah. Model pretrained yang dimaksud adalah…

A. GPT
B. Sequence-to-sequence model
C. Transformer decoder
D. BERT

Jawaban: D
BERT dilatih dengan masked language modeling yang memungkinkan model memanfaatkan konteks dari kedua arah secara simultan, berbeda dengan GPT yang bersifat autoregresif dan searah.

61.

Tim riset di PT Bahasa Nusa akan membangun model untuk klasifikasi sentimen ulasan produk berbahasa Indonesia dengan dataset hanya 5.000 contoh berlabel. Mereka menggunakan BERT multilingual yang sudah dilatih pada korpus besar dan hanya melatih ulang lapisan task-specific pada dataset sentimen. Proses ini disebut…

A. Pretraining ulang dari awal
B. Feature extraction dengan CNN
C. Fine-tuning BERT
D. Model distilasi pengetahuan

Jawaban: C
Fine-tuning BERT adalah proses menyesuaikan model BERT pretrained pada tugas spesifik dengan menambahkan lapisan task-specific dan melatih ulang pada dataset downstream, memanfaatkan pengetahuan linguistik yang sudah diperoleh selama pretraining.

62.

ChatGPT dan model generatif sejenis menghasilkan teks kata demi kata secara sekuensial, di mana setiap token baru diprediksi berdasarkan token-token sebelumnya. Arsitektur yang mendasari model generatif ini adalah Transformer decoder yang dilatih secara…

A. Autoregresif, memprediksi token berikutnya dalam sekuens
B. Bidirectional dengan masked language modeling
C. Contrastive, membandingkan pasangan positif dan negatif
D. Multimodal, menggabungkan teks dan gambar

Jawaban: A
GPT menggunakan arsitektur Transformer decoder yang dilatih secara autoregresif, memprediksi token berikutnya berdasarkan token-token sebelumnya, sehingga cocok untuk tugas generasi teks.

63.

Model BERT dan GPT memiliki arah konteks yang berbeda dalam memahami teks. Perbedaan mendasar ini memengaruhi kesesuaian keduanya untuk tugas tertentu. Manakah pernyataan yang paling tepat mengenai perbedaan ini…

A. BERT menggunakan Transformer decoder, sedangkan GPT menggunakan Transformer encoder
B. BERT memproses teks dua arah, sedangkan GPT memproses teks searah dari kiri ke kanan
C. BERT dilatih pada teks bahasa Inggris saja, sedangkan GPT bersifat multilingual
D. BERT tidak memerlukan fine-tuning, sedangkan GPT selalu memerlukan fine-tuning

Jawaban: B
BERT memanfaatkan konteks dua arah melalui masked language modeling, sementara GPT bersifat autoregresif dan hanya memproses teks searah dari kiri ke kanan, memprediksi token berikutnya.

64.

Sebuah sistem keamanan dilatih dengan autoencoder untuk merekonstruksi transaksi normal. Saat inferensi, transaksi penipuan yang sangat berbeda dari pola normal menghasilkan reconstruction error tinggi. Aplikasi ini memanfaatkan autoencoder untuk tugas…

A. Generasi data sintetis baru
B. Kompresi data untuk efisiensi penyimpanan
C. Klasifikasi multi-kelas transaksi keuangan
D. Deteksi anomali berdasarkan kesalahan rekonstruksi

Jawaban: D
Autoencoder yang dilatih hanya pada data normal akan menghasilkan reconstruction error rendah untuk data normal dan error tinggi untuk data anomali, sehingga efektif untuk deteksi anomali.

65.

Ketika melatih Variational Autoencoder (VAE), komponen stokastik pada node sampling di ruang laten menghalangi aliran gradien selama backpropagation. Teknik yang memisahkan komponen stokastik dari parameter deterministik agar gradien tetap dapat mengalir adalah…

A. Dropout pada lapisan encoder
B. Batch normalization pada decoder
C. Reparameterization trick
D. Residual connection pada bottleneck

Jawaban: C
Reparameterization trick memindahkan komponen stokastik sampling ke variabel noise terpisah sehingga gradien dapat mengalir melalui parameter deterministik (mean dan variansi) selama pelatihan VAE.

66.

Autoencoder standar dan Variational Autoencoder (VAE) belajar merepresentasikan data dalam ruang laten, tetapi dengan pendekatan berbeda. Perbedaan utama VAE dibandingkan autoencoder standar adalah…

A. VAE menggunakan lebih banyak lapisan pada encoder
B. VAE mempelajari distribusi probabilistik pada ruang laten, bukan representasi titik tunggal
C. VAE tidak memiliki decoder
D. VAE hanya dapat digunakan pada data gambar

Jawaban: B
VAE mempelajari parameter distribusi probabilistik (mean dan variansi) pada ruang laten, memungkinkan sampling dan generasi data baru, sedangkan autoencoder standar hanya memetakan input ke satu titik tetap di ruang laten.

67.

PT Kreatif Visual ingin menghasilkan wajah sintetis yang variatif dan realistis untuk aplikasi game. Tim memilih VAE karena kemampuannya menghasilkan sampel baru melalui sampling dari distribusi laten. Proses sampling dalam VAE dimungkinkan oleh…

A. Representasi ruang laten yang kontinu dan terstruktur melalui regularisasi KL divergence
B. Struktur encoder yang sangat dalam
C. Decoder yang dilatih secara adversarial
D. Penggunaan skip connection antara encoder dan decoder

Jawaban: A
VAE menggunakan regularisasi KL divergence untuk membentuk ruang laten yang kontinu dan terstruktur, sehingga setiap titik yang disampling dari distribusi laten dapat di-decode menjadi sampel yang valid dan variatif.

68.

Dalam pelatihan GAN, generator dan discriminator terlibat dalam permainan minimax dua pemain. Discriminator bertugas untuk…

A. menghasilkan sampel dari noise laten yang dapat mengecoh discriminator
B. meminimalkan probabilitas generator menghasilkan sampel yang mirip data asli
C. memaksimalkan probabilitas mengklasifikasikan sampel asli sebagai asli dan sampel palsu sebagai palsu
D. memaksimalkan reconstruction error antara input dan output

Jawaban: C
Discriminator adalah klasifikator biner yang bertujuan membedakan sampel asli dari sampel palsu buatan generator secara akurat.

69.

Tim riset PT Visual Nusa melatih GAN untuk menghasilkan gambar wajah. Setelah 500 epoch, mereka mengamati bahwa generator hanya menghasilkan tiga variasi wajah saja meskipun input noise berbeda-beda. Fenomena kegagalan pelatihan GAN ini disebut…

A. gradient explosion
B. vanishing gradient
C. overfitting
D. mode collapse

Jawaban: D
Mode collapse terjadi ketika generator menghasilkan variasi output yang sangat terbatas dan gagal menangkap seluruh keragaman distribusi data asli.

70.

Dalam arsitektur DCGAN, beberapa modifikasi dilakukan pada GAN standar untuk menstabilkan pelatihan. Salah satu modifikasi kunci pada generator DCGAN adalah…

A. mengganti pooling layer dengan convolutional layer berstride untuk upsampling
B. menggunakan fully connected layer sebagai lapisan pertama generator
C. menerapkan max pooling setelah setiap lapisan konvolusi
D. menggunakan fungsi aktivasi sigmoid di seluruh lapisan generator

Jawaban: A
DCGAN menggunakan transposed convolution dengan stride untuk upsampling secara learned, menggantikan pooling yang bersifat fixed.

71.

PT Animasi Kreatif menghadapi ketidakstabilan saat melatih GAN: loss generator dan discriminator berfluktuasi liar, dan gambar yang dihasilkan kadang realistis kadang tidak. Masalah ini paling tepat diatasi dengan…

A. mengurangi kapasitas generator agar lebih mudah dilatih
B. menerapkan teknik seperti gradient penalty atau spectral normalization pada discriminator
C. menghentikan pelatihan discriminator sama sekali setelah epoch tertentu
D. menggunakan learning rate yang jauh lebih besar pada generator

Jawaban: B
Gradient penalty (WGAN-GP) dan spectral normalization adalah teknik yang dirancang untuk menstabilkan pelatihan GAN dengan mengontrol Lipschitz constraint discriminator.

72.

Startup Kreativa menggunakan GAN untuk menambah variasi dataset gambar produk yang hanya berjumlah 500 sampel. Dengan menghasilkan sampel sintetis yang realistis, akurasi model klasifikasi pada data uji meningkat signifikan. Pendekatan ini merupakan contoh…

A. data augmentation menggunakan model generatif
B. transfer learning dari model pretrained
C. regularisasi dropout untuk mengurangi overfitting
D. feature extraction dengan CNN

Jawaban: A
Menggunakan model generatif untuk memperbesar dataset pelatihan dengan sampel sintetis baru termasuk dalam data augmentation berbasis generatif.

73.

Diffusion model menghasilkan gambar melalui proses yang berbeda dengan GAN. Berbeda dengan GAN yang langsung menghasilkan gambar dari noise, diffusion model…

A. mengompresi gambar ke ruang laten lalu mendekodekannya kembali
B. menggunakan arsitektur recurrent untuk menghasilkan gambar piksel demi piksel
C. menghasilkan gambar secara iteratif dengan membalikkan proses penambahan noise bertahap
D. melatih dua jaringan secara adversarial untuk menghasilkan gambar

Jawaban: C
Diffusion model bekerja dengan mempelajari denoising bertahap—membalikkan proses difusi yang menambahkan noise pada data secara bertahap.

74.

Konten deepfake yang dihasilkan AI, seperti video wajah seseorang ditumpangkan pada tubuh orang lain, menimbulkan masalah etika serius. Akar permasalahan etika ini paling mendasar terletak pada…

A. ketergantungan model pada dataset berlabel mahal
B. kecepatan pelatihan GAN yang terlalu lambat sehingga menghambat verifikasi
C. penggunaan arsitektur Transformer yang terlalu kompleks untuk dipahami
D. kemampuan model generatif menghasilkan konten manipulatif yang sulit dibedakan dari konten asli

Jawaban: D
Masalah etika utama deepfake bersumber dari realisme konten sintetis yang dapat menipu persepsi manusia dan berpotensi disalahgunakan untuk disinformasi.

75.

Model generatif dapat menghasilkan gambar resolusi tinggi yang tidak dapat dibedakan dari foto asli. Berdasarkan pemahaman tentang generative deep learning, model ini pada dasarnya mempelajari…

A. distribusi data pelatihan untuk menghasilkan sampel baru dari distribusi yang sama
B. fungsi pemetaan eksplisit dari piksel ke label kelas
C. representasi terkompresi data tanpa kemampuan menghasilkan sampel baru
D. aturan diskriminatif yang memisahkan dua kelas dalam data

Jawaban: A
Model generatif mempelajari distribusi probabilitas data latih, memungkinkannya menghasilkan sampel baru yang mengikuti pola distribusi tersebut.

76.

PT Data Sejahtera memiliki data tabular pelanggan dengan 25 fitur, termasuk variabel kategorikal 'kota' dengan 500 nilai unik. Tim menggunakan embedding untuk merepresentasikan variabel 'kota' dalam neural network. Keunggulan utama embedding dibandingkan one-hot encoding untuk kasus ini adalah…

A. menghasilkan representasi sparse yang mempercepat komputasi matriks
B. membutuhkan lebih banyak memori untuk menyimpan representasi setiap kota
C. menghasilkan representasi vektor dense berdimensi rendah yang menangkap kemiripan semantik antar kota
D. mengabaikan hubungan antar kategori sehingga lebih sederhana

Jawaban: C
Embedding memetakan kategori ke vektor dense berdimensi rendah yang dipelajari selama pelatihan, menangkap hubungan semantik dan menghindari kutukan dimensi dari one-hot encoding.

77.

Pada kompetisi data tabular, peserta sering mengamati bahwa XGBoost mengungguli neural network fully connected pada dataset dengan fitur numerik dan kategorikal terstruktur. Alasan utama fenomena ini adalah…

A. model berbasis pohon keputusan secara alami menangani fitur heterogen dan interaksi non-linier tanpa normalisasi ketat
B. neural network tidak dapat memproses variabel kategorikal sama sekali
C. XGBoost menggunakan backpropagation yang lebih efisien daripada neural network
D. neural network selalu membutuhkan lebih banyak data daripada model berbasis pohon

Jawaban: A
Model berbasis pohon unggul pada data tabular karena kemampuannya menangani fitur campuran, invarian terhadap skala, dan secara natural memodelkan interaksi non-linier.

78.

Ibu Ratna membangun model klasifikasi pada dataset tabular 10 ribu sampel dengan 80 fitur numerik dan 10 fitur kategorikal. Ia menggunakan arsitektur fully connected network. Untuk memproses fitur kategorikal sebelum masuk ke dense layer, pendekatan yang tepat adalah…

A. mengonversi fitur kategorikal menjadi satu fitur numerik ordinal
B. membuang semua fitur kategorikal karena neural network hanya menerima input numerik
C. menggunakan one-hot encoding untuk semua fitur kategorikal tanpa pengurangan dimensi
D. menerapkan embedding layer untuk setiap fitur kategorikal, lalu menggabungkan dengan fitur numerik

Jawaban: D
Embedding layer memproses fitur kategorikal menjadi representasi dense yang dipelajari, kemudian digabungkan dengan fitur numerik sebelum masuk lapisan fully connected.

79.

Seorang data scientist menyatakan bahwa deep learning pada data tabular sering kalah bersaing dengan gradient boosting. Namun deep learning dapat unggul ketika…

A. model perlu diinterpretasikan secara eksplisit fitur per fitur
B. dataset hanya terdiri dari beberapa ratus sampel dengan fitur sederhana
C. semua fitur telah melalui feature engineering manual yang optimal
D. data memiliki dimensi sangat tinggi dengan struktur laten kompleks yang sulit ditangkap model berbasis pohon

Jawaban: D
Deep learning unggul pada data dengan struktur kompleks dan dimensi tinggi di mana representasi hierarkis yang dipelajari dapat menangkap pola yang sulit dimodelkan pohon keputusan.

80.

Perusahaan media sosial menggunakan Graph Convolutional Network (GCN) untuk mempelajari representasi pengguna berdasarkan jaringan pertemanan. Dalam satu lapisan GCN, representasi seorang pengguna diperbarui dengan…

A. hanya menggunakan fitur pengguna itu sendiri tanpa informasi tetangga
B. mengagregasi fitur dari pengguna itu sendiri dan tetangga-tetangganya di graf
C. mengalikan fitur pengguna dengan matriks adjacency tanpa transformasi
D. menerapkan konvolusi 2D pada representasi matriks gambar profil pengguna

Jawaban: B
GCN memperbarui representasi node dengan menggabungkan fitur node itu sendiri dan fitur node tetangga melalui operasi agregasi berbobot pada graf.

81.

Tim bioinformatika memodelkan interaksi protein menggunakan Graph Neural Network. Mereka memilih GraphSAGE dibandingkan GCN karena graf protein mereka sangat besar dan padat. Keunggulan utama GraphSAGE dalam skenario ini adalah…

A. menggunakan full-batch training yang memproses seluruh graf sekaligus
B. melakukan sampling efisien dari tetangga sehingga skalabel pada graf besar
C. hanya memproses node dengan derajat tertinggi untuk efisiensi
D. mengabaikan fitur node dan hanya menggunakan struktur graf

Jawaban: B
GraphSAGE menggunakan sampling tetangga untuk menghasilkan minibatch yang efisien, memungkinkan pelatihan pada graf besar tanpa memproses seluruh adjacency matrix.

82.

Dalam kerangka message passing yang mendasari banyak GNN, setiap node melakukan dua langkah utama di setiap lapisan. Dua langkah tersebut adalah…

A. memecah graf menjadi subgraf dan melatih model terpisah pada masing-masing subgraf
B. menghitung loss dan melakukan backpropagation pada struktur graf
C. menerima pesan dari tetangga dan memperbarui representasi diri menggunakan fungsi agregasi
D. mengurutkan node berdasarkan derajat dan memproses secara sekuensial

Jawaban: C
Message passing terdiri dari langkah message (menerima informasi dari tetangga) dan update (memperbarui representasi node dengan agregasi informasi tersebut).

83.

CNN memproses data pada grid terstruktur seperti piksel gambar, sedangkan GNN memproses data pada graf dengan struktur tidak teratur. Perbedaan fundamental ini menyebabkan GNN menggunakan…

A. filter konvolusi tetap yang digeser secara sistematis pada struktur graf
B. agregasi berbasis lingkungan (neighborhood) alih-alih filter spasial tetap seperti pada CNN
C. operasi pooling pada seluruh node tanpa memperhatikan koneksi tepi
D. representasi yang sama persis untuk setiap node tanpa memperhatikan posisi

Jawaban: B
Tidak seperti grid terstruktur pada CNN, graf tidak memiliki struktur tetap sehingga GNN menggunakan agregasi dari tetangga yang berbeda-beda untuk setiap node.

84.

Dalam proyek sistem rekomendasi film, tim menggunakan dataset yang berisi poster film dan sinopsis teks. Mereka ingin model memahami hubungan semantik antara konten visual poster dan deskripsi teks dalam ruang representasi bersama, sehingga model dapat merekomendasikan film berdasarkan kemiripan multimodal. Arsitektur yang paling sesuai untuk mempelajari ruang embedding bersama antara gambar dan teks adalah…

A. BERT yang dilatih pada sinopsis film dengan masked language modeling
B. ResNet-50 yang dilatih pada klasifikasi poster film
C. CLIP yang dilatih dengan contrastive learning pada pasangan gambar-teks
D. Autoencoder yang merekonstruksi fitur gabungan poster dan sinopsis

Jawaban: C
CLIP dirancang khusus untuk menghubungkan gambar dan teks dalam ruang embedding bersama melalui contrastive learning, sehingga representasi gambar dan teks yang semantik mirip akan berdekatan dalam ruang tersebut.

85.

Startup Edutech membangun asisten pembelajaran yang dapat menjawab pertanyaan siswa tentang diagram dan teks dalam buku pelajaran. Model perlu memahami hubungan antara gambar diagram dan pertanyaan teks untuk menghasilkan jawaban akurat. Teknik mengintegrasikan representasi dari encoder gambar dan encoder teks untuk tugas ini disebut…

A. Transfer learning lintas domain
B. Sequence-to-sequence learning
C. Fusi data teks dan gambar
D. Data augmentation multimodal

Jawaban: C
Fusi data teks dan gambar adalah teknik menggabungkan representasi dari encoder teks dan encoder gambar untuk melakukan tugas yang membutuhkan pemahaman kedua modalitas, seperti visual question answering pada kasus ini.

86.

Tim riset membandingkan pendekatan unimodal dan multimodal untuk tugas klasifikasi sentimen. Model unimodal hanya menggunakan teks ulasan, sedangkan model multimodal menambahkan gambar produk. Manakah yang paling tepat menjadi keunggulan pendekatan multimodal dalam konteks ini…

A. Model multimodal dapat menangkap informasi komplementer yang tidak tersedia dalam teks saja, seperti ekspresi visual produk
B. Model multimodal selalu memiliki akurasi lebih tinggi tanpa memandang kualitas data gambar
C. Model multimodal tidak memerlukan preprocessing data karena dapat menangani semua format secara otomatis
D. Model multimodal menghilangkan kebutuhan akan label sentimen pada data pelatihan

Jawaban: A
Pendekatan multimodal mengintegrasikan informasi dari berbagai sumber; dalam kasus ini, gambar dapat memberikan informasi komplementer (misalnya kondisi produk) yang tidak tersampaikan dalam teks ulasan.

87.

Dalam mendesain model multimodal untuk asisten medis yang memproses gambar X-ray dan laporan teks dokter, tim mempertimbangkan dua strategi fusi: early fusion yang menggabungkan fitur mentah sebelum pemrosesan dalam, dan late fusion yang menggabungkan representasi tingkat tinggi setelah pemrosesan terpisah. Perbedaan utama antara kedua strategi ini terletak pada…

A. Early fusion menghasilkan akurasi lebih rendah pada semua kasus tanpa terkecuali
B. Early fusion hanya berlaku untuk data teks, sedangkan late fusion hanya untuk data gambar
C. Early fusion tidak memerlukan neural network, sedangkan late fusion selalu memerlukan Transformer
D. Early fusion menggabungkan data pada level input atau fitur awal, sedangkan late fusion menggabungkan pada level representasi atau keputusan akhir

Jawaban: D
Early fusion menggabungkan data mentah atau fitur awal sebelum diproses oleh model, sedangkan late fusion memproses tiap modalitas secara terpisah lalu menggabungkan representasi tingkat tinggi atau keputusan akhir dari masing-masing encoder.

88.

PT Mobil Cerdas mengembangkan sistem deteksi objek untuk kendaraan otonom. Model deep learning mereka berukuran 250 MB dengan presisi floating-point 32-bit, namun inferensi pada perangkat edge hanya mencapai 8 fps, di bawah kebutuhan minimal 30 fps. Teknik kompresi yang mengurangi presisi numerik bobot ke representasi lebih rendah tanpa mengubah arsitektur model adalah…

A. Knowledge distillation
B. Model pruning
C. Model quantization
D. Early stopping

Jawaban: C
Quantization mengurangi presisi numerik bobot (misalnya dari float32 ke int8) untuk mempercepat inferensi dan mengurangi ukuran model, cocok untuk deployment pada perangkat dengan sumber daya terbatas.

89.

Sebuah tim mengembangkan model di PyTorch tetapi klien membutuhkan model dalam format yang dapat dijalankan di TensorFlow Lite untuk perangkat Android. Format standar terbuka yang memungkinkan konversi model antar framework deep learning adalah…

A. JSON
B. Pickle
C. HDF5
D. ONNX

Jawaban: D
ONNX (Open Neural Network Exchange) adalah format standar terbuka yang dirancang untuk interoperabilitas antar framework deep learning, memungkinkan model dikonversi dan dideploy di berbagai platform.

90.

Perusahaan logistik mengembangkan model prediksi waktu pengiriman berbasis deep learning. Setelah deployment melalui REST API, tim perlu memantau apakah akurasi model menurun seiring waktu karena perubahan pola data. Praktik yang paling tepat untuk menjaga kualitas model di lingkungan produksi adalah…

A. Mengganti model dengan aturan bisnis manual setiap bulan tanpa melihat metrik performa
B. Menghentikan pemantauan setelah deployment karena model sudah dilatih dengan data lengkap
C. Monitoring performa model secara berkelanjutan dan melakukan pelatihan ulang jika terdeteksi penurunan akurasi
D. Menyimpan semua permintaan inferensi tanpa pernah mengevaluasi ulang prediksi

Jawaban: C
Model di lingkungan produksi dapat mengalami degradasi performa akibat data drift; pemantauan berkelanjutan memungkinkan deteksi dini dan pelatihan ulang untuk mempertahankan akurasi.

91.

PT Fintech Sejahtera mengembangkan model klasifikasi risiko kredit yang perlu melayani 1000 permintaan inferensi per detik dengan latensi di bawah 50 ms. Tim memutuskan menggunakan TensorFlow Lite dengan quantization int8 dibandingkan model PyTorch full precision. Kompromi utama dari pendekatan ini adalah…

A. Quantization hanya berlaku untuk model CNN dan tidak dapat diterapkan pada model klasifikasi tabular
B. Model menjadi lebih besar dan lebih lambat, tetapi akurasi meningkat signifikan
C. Proses deployment menjadi lebih kompleks tanpa peningkatan performa apapun
D. Kecepatan inferensi meningkat dan ukuran model mengecil, tetapi presisi numerik berkurang yang mungkin sedikit menurunkan akurasi

Jawaban: D
Quantization mengorbankan presisi numerik bobot untuk mendapatkan inferensi lebih cepat dan model lebih kecil; pada banyak kasus penurunan akurasi minimal, namun tetap merupakan trade-off yang harus dievaluasi.

92.

Bank Nusantara mengimplementasikan model deep learning untuk penilaian kelayakan kredit. Setelah beberapa bulan, tim audit menemukan bahwa model secara sistematis memberikan skor lebih rendah kepada pemohon dari daerah tertentu meskipun profil finansial mereka setara dengan daerah lain. Masalah etika AI yang paling tepat menggambarkan situasi ini adalah…

A. Bias dan ketidakadilan (fairness)
B. Kebocoran data pelanggan
C. Kurangnya transparansi arsitektur model
D. Pelanggaran regulasi penyimpanan data

Jawaban: A
Bias terjadi ketika model menghasilkan perlakuan tidak adil terhadap kelompok tertentu berdasarkan atribut sensitif seperti asal daerah, meskipun variabel finansial setara; ini merupakan isu fairness yang krusial dalam AI.

93.

Rumah sakit di beberapa kota berencana mengembangkan model diagnosa berbasis deep learning menggunakan data medis pasien dari masing-masing rumah sakit. Mereka khawatir tentang regulasi privasi yang melarang pengumpulan data pasien ke server pusat. Paradigma pelatihan yang memungkinkan setiap rumah sakit melatih model secara lokal dan hanya berbagi pembaruan model teragregasi adalah…

A. Federated learning
B. Centralized learning
C. Reinforcement learning
D. Curriculum learning

Jawaban: A
Federated learning melatih model secara terdistribusi di perangkat atau server lokal masing-masing, dan hanya pembaruan model (bukan data mentah) yang dikirim ke server pusat untuk agregasi, menjaga privasi data.

94.

Tim produk ingin memahami mengapa model deep learning mereka memprediksi pelanggan tertentu akan churn. Mereka membutuhkan metode yang dapat menjelaskan kontribusi setiap fitur input terhadap keputusan model. Seperangkat metode dan teknik untuk membuat keputusan model dapat dipahami manusia disebut…

A. Federated learning
B. Explainable AI (XAI)
C. Generative adversarial network
D. Neural architecture search

Jawaban: B
Explainable AI (XAI) mencakup berbagai metode seperti SHAP dan LIME yang bertujuan menginterpretasikan dan menjelaskan keputusan model machine learning agar dapat dipahami manusia.

95.

Platform media sosial menggunakan model deep learning untuk menyaring konten. Tim etika mengamati bahwa model lebih sering salah mengklasifikasi konten dalam bahasa daerah sebagai konten negatif dibandingkan konten dalam bahasa Indonesia baku. Setelah diselidiki, data pelatihan didominasi oleh konten bahasa Indonesia baku. Prinsip keadilan dalam AI yang dilanggar berkaitan dengan…

A. Keamanan yang melarang penggunaan data teks untuk pelatihan model
B. Privasi data yang mengharuskan penghapusan semua konten bahasa daerah
C. Transparansi yang mewajibkan publikasi kode sumber model ke publik
D. Fairness yang mensyaratkan model tidak menghasilkan diskriminasi terhadap kelompok bahasa tertentu akibat ketimpangan data pelatihan

Jawaban: D
Fairness dalam AI menuntut model tidak mendiskriminasi kelompok tertentu; ketimpangan representasi data pelatihan dapat menyebabkan model bias terhadap kelompok underrepresented seperti penutur bahasa daerah.

96.

Perusahaan teknologi besar baru-baru ini merilis model berskala sangat besar yang dilatih pada data teks dan gambar dalam jumlah masif menggunakan self-supervision. Model ini dapat diadaptasi ke berbagai tugas seperti penerjemahan, penjawaban pertanyaan, dan pembuatan gambar hanya dengan sedikit fine-tuning. Model semacam ini dalam tren riset deep learning disebut…

A. Foundation model
B. Decision tree ensemble
C. K-means clustering model
D. Linear regression model

Jawaban: A
Foundation model adalah model berskala besar yang dilatih pada data luas dengan self-supervision dan dapat diadaptasi ke berbagai tugas hilir tanpa pelatihan ulang penuh, menjadi paradigma dominan dalam riset AI terkini.

97.

Tim riset memiliki dataset 1 juta gambar tanpa label dan ingin melatih model untuk mempelajari representasi visual yang bermakna tanpa anotasi manual. Paradigma pelatihan yang memanfaatkan struktur internal data itu sendiri untuk menghasilkan sinyal pengawasan disebut…

A. Supervised learning
B. Self-supervised learning
C. Reinforcement learning
D. Active learning

Jawaban: B
Self-supervised learning menciptakan sinyal pengawasan dari struktur data itu sendiri (misalnya memprediksi bagian tersembunyi dari input) sehingga tidak memerlukan label manual, sangat berguna untuk memanfaatkan data tidak berlabel dalam jumlah besar.

98.

Startup AI ingin menemukan arsitektur neural network optimal untuk tugas klasifikasi gambar pada perangkat mobile dengan batasan latensi dan ukuran model yang ketat. Mereka tidak ingin mendesain arsitektur secara manual. Teknik otomatisasi yang menggunakan algoritma optimasi untuk mencari arsitektur terbaik dalam ruang pencarian yang telah ditentukan adalah…

A. Hyperparameter tuning manual
B. Neural architecture search (NAS)
C. Principal component analysis (PCA)
D. Gradient boosting

Jawaban: B
Neural Architecture Search (NAS) mengotomatiskan proses pencarian arsitektur neural network optimal dengan mengeksplorasi ruang arsitektur menggunakan algoritma seperti reinforcement learning atau evolutionary search.

99.

Peneliti di universitas membandingkan dua paradigma pelatihan untuk tugas klasifikasi gambar medis dengan dataset berlabel sangat terbatas. Paradigma pertama menggunakan label manual yang tersedia, sedangkan paradigma kedua memanfaatkan pretext task seperti memprediksi rotasi gambar untuk belajar representasi sebelum fine-tuning dengan label. Paradigma kedua termasuk dalam kategori…

A. Supervised learning yang sepenuhnya bergantung pada label manual
B. Self-supervised learning yang memanfaatkan pretext task untuk belajar representasi tanpa label
C. Unsupervised learning yang hanya mengelompokkan data tanpa mempelajari representasi
D. Reinforcement learning yang belajar melalui mekanisme reward dan punishment

Jawaban: B
Self-supervised learning menggunakan pretext task (seperti memprediksi rotasi) yang sinyal pengawasannya berasal dari data itu sendiri, memungkinkan pembelajaran representasi tanpa label manual sebelum fine-tuning pada tugas utama dengan sedikit label.

100.

Seorang insinyur ingin menerapkan teknik kompresi model untuk mengurangi latensi pada perangkat edge tanpa mengubah arsitektur model secara signifikan…

A. Menggunakan teknik distilasi pengetahuan untuk melatih model siswa yang lebih kecil dari model guru
B. Mengaplikasikan pruning terstruktur untuk menghilangkan bobot yang mendekati nol
C. Menerapkan kuantisasi pasca-pelatihan untuk mengurangi presisi numerik bobot
D. Mengonversi model ke format ONNX sebelum deployment ke lingkungan target

Jawaban: C
Kuantisasi pasca-pelatihan adalah teknik kompresi model yang mengurangi presisi numerik bobot (misalnya dari float32 ke int8) tanpa memerlukan perubahan arsitektur atau pelatihan ulang yang signifikan. Teknik ini sangat sesuai untuk deployment di perangkat edge karena secara langsung mengurangi ukuran model dan mempercepat inferensi. Distilasi pengetahuan memerlukan pelatihan model siswa yang lebih kecil, pruning terstruktur mengubah arsitektur dengan menghilangkan neuron/filter, dan konversi ONNX adalah langkah persiapan deployment, bukan teknik kompresi itu sendiri.

Banyak yang lancar di bagian CNN, tapi keteteran begitu masuk Attention Mechanism. Modul 5 itu jebakan. Konsep self-attention dan multi-head memang abstrak. Jangan cuma hafal arsitektur Transformer. Pahami kenapa positional encoding itu wajib.

Kalau UO minta modifikasi arsitektur, itu bukan hafalan. STDA4404 Deep Learning sering mencampur UTM yang teknis dengan UO yang konseptual. Regularisasi dan optimizer nyaris selalu muncul. Kalau udah pede, coba juga latihan soal Sistem Pendukung Keputusan yang nalarnya mirip. Terus asah intuisi, bukan cuma recall.

Soal UAS UT STDA4404 Deep Learning dan Kunci Jawaban

Soal UT STDA4404 Deep Learning

Baca juga

Soal UAS UT STSI4301 Sistem Pendukung Keputusan dan Kunci Jawaban

Soal UAS UT STDA4403 Kecerdasan Bisnis dan Kunci Jawaban

Soal UAS UT SPAR4207 Akuntansi Pariwisata dan Kunci Jawaban

Soal UAS UT PANG4213 Kimia Pangan dan Kunci Jawaban

Soalut.com

Soal UAS UT STDA4404 Deep Learning dan Kunci Jawaban

Soal UT STDA4404 Deep Learning

Baca juga

Soal UAS UT STSI4301 Sistem Pendukung Keputusan dan Kunci Jawaban

Soal UAS UT STDA4403 Kecerdasan Bisnis dan Kunci Jawaban

Soal UAS UT SPAR4207 Akuntansi Pariwisata dan Kunci Jawaban

Soal UAS UT PANG4213 Kimia Pangan dan Kunci Jawaban

Soalut.com

🔥 Post Terbaru