Soal UAS UT STBI4004 Buku Bioinformatika dan Kunci Jawaban

Tidur larut baca modul, eh besoknya malah bingung bedain alignment global sama lokal di Modul 3 STBI4004 Buku Bioinformatika. Dua konsep itu sering banget jadi jebakan di UAS karena algoritmanya mirip tapi dipakenya beda. Wajar kalau pusing. Soal UT di halaman ini fokus ke bagian yang paling sering salah dipahami mahasiswa.

Modul 2 tentang basis data protein dan Modul 6 tentang prediksi struktur protein itu dua topik paling rawan bikin nilai jeblok kalau cuma dihafal kulitnya. Bukan karena materinya susah, tapi karena butuh latihan praktik langsung, bukan sekadar teori. Cobain latihan soal Biologi ini dulu sebelum ujian. Biar paham pola soalnya.

Soal UAS UT di bawah ini nyerempet semua KB penting, dari format FASTA sampai analisis BLAST. Setiap soal ada kunci jawaban dan pembahasan, jadi kamu langsung tahu kenapa jawabannya itu. Kalau masih ada yang ragu, baca pelan-pelan dulu pembahasannya.

Soal UT STBI4004 Buku Bioinformatika

Bioinformatika merupakan ilmu yang menggabungkan biologi dengan bidang ilmu lain. Bidang ilmu apa yang paling mendasar dalam pengembangan bioinformatika?

A. Ilmu komputer dan matematika
B. Fisika dan kimia
C. Sosiologi dan ekonomi
D. Geografi dan sejarah

Jawaban: A
Bioinformatika menggabungkan biologi dengan ilmu komputer dan matematika untuk menganalisis data biologis.

Salah satu peran utama bioinformatika dalam sains modern adalah membantu dalam analisis data genomik. Manakah dari berikut ini yang merupakan contoh aplikasi bioinformatika dalam penelitian genomik?

A. Menganalisis struktur kristal protein menggunakan sinar-X
B. Menyelaraskan sekuens DNA untuk mengidentifikasi variasi genetik
C. Mengukur tekanan darah pada pasien hipertensi
D. Mengamati perilaku sel di bawah mikroskop

Jawaban: B
Penyelarasan sekuens DNA merupakan aplikasi bioinformatika yang umum digunakan untuk mengidentifikasi variasi genetik.

Sejarah perkembangan bioinformatika dimulai seiring dengan kemajuan teknologi. Peristiwa apa yang menjadi tonggak awal perkembangan bioinformatika?

A. Penemuan struktur DNA oleh Watson dan Crick
B. Perkembangan metode sekuensing DNA oleh Sanger
C. Pembuatan basis data sekuens pertama oleh Dayhoff
D. Penyelesaian Proyek Genom Manusia

Jawaban: C
Pembuatan basis data sekuens protein oleh Dayhoff pada tahun 1960-an dianggap sebagai awal perkembangan bioinformatika.

Bioinformatika memiliki hubungan erat dengan berbagai disiplin ilmu. Manakah dari berikut ini yang merupakan kontribusi utama ilmu komputer dalam bioinformatika?

A. Menyediakan teori evolusi molekuler
B. Mempelajari struktur tiga dimensi protein
C. Menganalisis jalur metabolisme sel
D. Mengembangkan algoritma untuk analisis data sekuens

Jawaban: D
Ilmu komputer berkontribusi dalam mengembangkan algoritma dan perangkat lunak untuk menganalisis data biologis yang besar.

Dogma sentral biologi molekuler menjelaskan aliran informasi genetik. Urutan yang benar dari dogma sentral adalah?

A. RNA -> DNA -> Protein
B. Protein -> RNA -> DNA
C. DNA -> RNA -> Protein
D. DNA -> Protein -> RNA

Jawaban: C
Dogma sentral menyatakan bahwa informasi genetik mengalir dari DNA menjadi RNA melalui transkripsi, kemudian RNA menjadi protein melalui translasi.

Mutasi genetik dapat menyebabkan perubahan pada sekuens DNA. Jika terjadi substitusi satu basa pada sekuens pengkode, jenis mutasi apakah yang tidak mengubah asam amino yang dikode?

A. Mutasi diam (silent mutation)
B. Mutasi missense
C. Mutasi nonsense
D. Mutasi frameshift

Jawaban: A
Mutasi diam terjadi ketika perubahan basa tidak mengubah asam amino karena redundansi kode genetik.

Struktur dan fungsi protein sangat dipengaruhi oleh urutan asam aminonya. Tingkatan struktur protein yang merupakan urutan linier asam amino disebut?

A. Struktur primer
B. Struktur sekunder
C. Struktur tersier
D. Struktur kuartener

Jawaban: A
Struktur primer protein adalah urutan linier asam amino yang dihubungkan oleh ikatan peptida.

Ekspresi gen diatur melalui berbagai mekanisme. Manakah dari berikut ini yang merupakan tahapan regulasi ekspresi gen pada tingkat transkripsi?

A. Pengikatan ribosom pada mRNA
B. Modifikasi pasca-translasi protein
C. Degradasi protein oleh proteasome
D. Pengikatan faktor transkripsi pada promotor

Jawaban: D
Regulasi transkripsi melibatkan pengikatan faktor transkripsi pada daerah promotor gen untuk mengontrol inisiasi transkripsi.

Data sekuens biologis sering disimpan dalam format tertentu. Format sekuens yang hanya berisi header dan sekuens dalam satu baris teks disebut?

A. Format FASTA
B. Format GenBank
C. Format GFF
D. Format PDB

Jawaban: A
Format FASTA adalah format sederhana yang terdiri dari satu baris header diawali dengan tanda > dan diikuti oleh sekuens.

10.

Sumber data publik dalam bioinformatika sangat penting untuk penelitian. Manakah dari berikut ini yang merupakan repositori utama untuk data sekuens nukleotida?

A. UniProt
B. GenBank
C. PDB
D. KEGG

Jawaban: B
GenBank adalah basis data sekuens nukleotida yang dikelola oleh NCBI dan merupakan salah satu repositori utama.

11.

Metadata dalam data biologis sangat penting. Mengapa metadata diperlukan dalam pengelolaan data sekuens?

A. Untuk mempercepat proses sekuensing
B. Untuk menghapus data yang tidak berguna
C. Untuk mengubah format data menjadi lebih kecil
D. Untuk memberikan konteks tentang asal-usul dan kualitas data

Jawaban: D
Metadata memberikan informasi konteks seperti spesies, jaringan, dan metode eksperimen yang penting untuk interpretasi data.

12.

Etika penggunaan data biologis perlu diperhatikan dalam bioinformatika. Manakah dari berikut ini yang merupakan pelanggaran etika dalam penggunaan data biologis?

A. Mengunduh data publik untuk penelitian non-komersial
B. Membagikan hasil analisis data dalam jurnal ilmiah
C. Mengidentifikasi individu dari data genomik tanpa izin
D. Menggunakan data anonim untuk pengembangan algoritma

Jawaban: C
Mengidentifikasi individu dari data genomik tanpa izin melanggar privasi dan etika dalam penelitian.

13.

Basis data biologis diklasifikasikan menjadi beberapa jenis. Basis data yang berisi data sekuens asli dari hasil eksperimen disebut?

A. Basis data komposit
B. Basis data sekunder
C. Basis data primer
D. Basis data fungsional

Jawaban: C
Basis data primer menyimpan data asli hasil eksperimen seperti sekuens DNA atau protein.

14.

GenBank, EMBL, dan DDBJ adalah tiga basis data sekuens nukleotida utama. Manakah dari pernyataan berikut yang benar tentang ketiganya?

A. Ketiganya menyimpan data yang berbeda dan tidak ada hubungan
B. Ketiganya saling bertukar data secara rutin melalui kolaborasi internasional
C. GenBank hanya menyimpan data manusia, EMBL untuk hewan, DDBJ untuk tumbuhan
D. EMBL adalah satu-satunya basis data yang dapat diakses secara gratis

Jawaban: B
GenBank, EMBL, dan DDBJ membentuk International Nucleotide Sequence Database Collaboration (INSDC) yang saling bertukar data setiap hari.

15.

UniProt adalah basis data protein yang komprehensif. Manakah dari berikut ini yang merupakan bagian dari UniProt yang berisi data protein yang sudah dianotasi secara manual?

A. TrEMBL
B. Ensembl
C. PDB
D. Swiss-Prot

Jawaban: D
Swiss-Prot adalah bagian dari UniProt yang berisi anotasi protein manual dan telah melalui proses review.

16.

TrEMBL merupakan bagian dari UniProt. Karakteristik utama dari TrEMBL adalah?

A. Berisi protein yang dianotasi secara manual
B. Berisi protein yang dianotasi secara otomatis
C. Berisi data struktur protein tiga dimensi
D. Berisi data interaksi protein-protein

Jawaban: B
TrEMBL berisi protein yang dianotasi secara otomatis dan belum melalui review manual.

17.

Protein Data Bank (PDB) adalah basis data utama untuk struktur protein. Jenis data apa yang umumnya disimpan dalam PDB?

A. Koordinat atom tiga dimensi protein
B. Data ekspresi gen
C. Sekuens DNA dan RNA
D. Jalur metabolisme

Jawaban: A
PDB menyimpan koordinat atom tiga dimensi dari protein dan asam nukleat yang ditentukan melalui metode eksperimental seperti kristalografi sinar-X dan NMR.

18.

Basis data yang menyimpan informasi struktur tiga dimensi protein disebut…

A. PDB
B. GenBank
C. UniProt
D. KEGG

Jawaban: A
PDB (Protein Data Bank) adalah basis data utama untuk struktur tiga dimensi protein.

19.

Fungsi utama dari basis data struktural seperti PDB adalah untuk menyediakan informasi tentang…

A. urutan nukleotida
B. koordinat atom dalam molekul
C. jalur metabolisme
D. ekspresi gen

Jawaban: B
PDB menyimpan koordinat atom dari struktur protein dan molekul biologis lainnya.

20.

Dari pilihan berikut, mana yang merupakan basis data genom yang menyediakan browser genom interaktif?

A. SwissProt
B. Reactome
C. ArrayExpress
D. Ensembl

Jawaban: D
Ensembl adalah basis data genom yang dilengkapi browser genom untuk visualisasi dan analisis.

21.

Dalam penelusuran data di NCBI, antarmuka yang digunakan untuk mencari berbagai basis data biologis secara terintegrasi adalah…

A. BLAST
B. PubMed
C. GenBank
D. Entrez

Jawaban: D
Entrez adalah antarmuka pencarian terintegrasi di NCBI yang mencakup banyak basis data.

22.

Format file yang umum digunakan untuk menyimpan data sekuens biologis dengan header yang diawali tanda > adalah…

A. GenBank
B. FASTA
C. PDB
D. GFF

Jawaban: B
Format FASTA menggunakan tanda > pada header untuk mengidentifikasi sekuens, diikuti data sekuens.

23.

Langkah pertama yang tepat saat mengunduh data sekuens dari basis data publik adalah…

A. membaca metadata untuk memahami konteks data
B. memvalidasi kualitas data
C. langsung menganalisis dengan BLAST
D. menyimpan dalam format JSON

Jawaban: A
Membaca metadata penting untuk memahami sumber, tanggal, dan deskripsi sekuens sebelum analisis lebih lanjut.

24.

Salah satu cara untuk memvalidasi kualitas data sekuens yang diunduh adalah dengan memeriksa…

A. jumlah karakter saja
B. warna font file
C. ada tidaknya karakter ambigu dan panjang sekuens
D. ukuran file dalam megabyte

Jawaban: C
Karakter ambigu seperti N dan panjang sekuens yang tidak wajar bisa menandakan masalah kualitas data.

25.

Dalam penyelarasan sekuens berpasangan, algoritma yang digunakan untuk penyelarasan global adalah…

A. Needleman-Wunsch
B. Smith-Waterman
C. BLAST
D. ClustalW

Jawaban: A
Needleman-Wunsch adalah algoritma untuk penyelarasan global yang menyelaraskan seluruh sekuens.

26.

Matriks substitusi yang umum digunakan dalam penyelarasan sekuens protein adalah…

A. PAM250
B. BLOSUM62
C. NUC44
D. MATCH

Jawaban: B
BLOSUM62 adalah matriks substitusi yang populer untuk penyelarasan sekuens protein.

27.

Dalam penyelarasan berpasangan lokal, algoritma yang sesuai adalah…

A. Needleman-Wunsch
B. Smith-Waterman
C. MUSCLE
D. ClustalW

Jawaban: B
Smith-Waterman adalah algoritma untuk penyelarasan lokal yang mencari daerah mirip terbaik.

28.

Sistem penilaian dalam penyelarasan sekuens memberikan skor untuk…

A. hanya kecocokan
B. hanya ketidakcocokan
C. hanya gap
D. kecocokan, ketidakcocokan, dan gap

Jawaban: D
Skoring mencakup nilai untuk kecocokan (match), ketidakcocokan (mismatch), dan pembukaan/ekstensi gap.

29.

Algoritma ClustalW digunakan untuk…

A. penyelarasan berganda
B. penyelarasan berpasangan
C. pencarian BLAST
D. prediksi struktur

Jawaban: A
ClustalW adalah algoritma populer untuk menyelaraskan banyak sekuens secara berganda.

30.

Dalam hasil BLAST, nilai E-value yang lebih kecil menunjukkan…

A. kesamaan yang kurang signifikan
B. panjang sekuens yang lebih pendek
C. kesamaan yang lebih signifikan secara statistik
D. jumlah gap yang lebih banyak

Jawaban: C
E-value rendah menandakan bahwa kesamaan yang diamati sangat tidak mungkin terjadi secara kebetulan.

31.

Fungsi dari BLAST adalah untuk…

A. menyelaraskan dua sekuens saja
B. memprediksi struktur protein
C. mencari sekuens homolog dalam basis data
D. menganalisis ekspresi gen

Jawaban: C
BLAST (Basic Local Alignment Search Tool) digunakan untuk mencari sekuens yang mirip dalam basis data.

32.

Bit score dalam hasil BLAST digunakan untuk…

A. mengukur kualitas penyelarasan secara normalisasi
B. mengukur panjang sekuens
C. menentukan jumlah gap
D. mengetahui jenis asam amino

Jawaban: A
Bit score adalah skor normalisasi yang memungkinkan perbandingan hasil BLAST antar basis data.

33.

Analisis frekuensi basa pada sekuens DNA dilakukan untuk…

A. menentukan struktur protein
B. mencari motif fungsional
C. menyelaraskan sekuens
D. mendeteksi variasi komposisi nukleotida

Jawaban: D
Frekuensi basa membantu mengidentifikasi variasi komposisi, seperti kandungan GC yang tinggi atau rendah.

34.

Prediksi ORF (Open Reading Frame) bertujuan untuk…

A. menghitung jarak evolusi
B. menentukan struktur sekunder RNA
C. menemukan daerah pengkode protein dalam sekuens
D. menganalisis interaksi protein

Jawaban: C
ORF adalah daerah sekuens yang berpotensi mengkode protein, dimulai dari kodon start hingga stop.

35.

Dalam analisis komposisi sekuens DNA, jika suatu sekuens memiliki kandungan GC sebesar 60%, berapakah kandungan AT dari sekuens tersebut?

A. 60%
B. 50%
C. 40%
D. 20%

Jawaban: C
Kandungan AT adalah pelengkap dari kandungan GC. Jika GC 60%, maka AT adalah 100% dikurangi 60% yaitu 40%.

36.

Metode yang digunakan untuk memprediksi Open Reading Frame (ORF) pada sekuens DNA biasanya didasarkan pada identifikasi kodon start dan kodon stop. Kodon start yang paling umum pada prokariot adalah?

A. TAA
B. TGA
C. TAG
D. ATG

Jawaban: D
Kodon start yang paling umum adalah ATG yang mengkode metionin, baik pada prokariot maupun eukariot.

37.

Dalam filogenetik molekuler, istilah yang merujuk pada kemiripan sekuens akibat nenek moyang yang sama adalah?

A. Homologi
B. Analogi
C. Paralelisme
D. Konvergensi

Jawaban: A
Homologi adalah kemiripan sekuens yang disebabkan oleh adanya nenek moyang yang sama, sedangkan analogi disebabkan oleh evolusi konvergen.

38.

Pohon filogenetik yang menunjukkan hubungan evolusi antar spesies berdasarkan data molekuler memiliki cabang yang disebut sebagai?

A. Node
B. Akar
C. Daun
D. Panjang cabang

Jawaban: A
Node pada pohon filogenetik mewakili titik percabangan yang menunjukkan nenek moyang bersama dari kelompok taksa.

39.

Model evolusi molekuler yang mengasumsikan bahwa laju substitusi nukleotida konstan sepanjang waktu disebut?

A. Model Jukes-Cantor
B. Model Kimura 2-parameter
C. Jam molekuler
D. Model Gamma

Jawaban: C
Jam molekuler adalah konsep yang menyatakan bahwa laju evolusi molekuler relatif konstan sepanjang waktu, sehingga digunakan untuk memperkirakan waktu divergensi.

40.

Hubungan antara jarak genetik dan waktu divergensi dalam evolusi molekuler umumnya bersifat?

A. Eksponensial
B. Proporsional langsung
C. Logaritmik
D. Tidak berhubungan

Jawaban: B
Jarak genetik biasanya meningkat sebanding dengan waktu divergensi, terutama dengan asumsi jam molekuler.

41.

Metode rekonstruksi pohon filogenetik yang menggunakan matriks jarak genetik dan menggabungkan taksa berdasarkan jarak terkecil secara bertahap adalah?

A. Maximum Parsimony
B. Neighbor-Joining
C. Maximum Likelihood
D. Bayesian Inference

Jawaban: B
Neighbor-Joining adalah metode jarak yang membangun pohon dengan menggabungkan taksa yang paling dekat secara berulang.

42.

Dalam Maximum Parsimony, pohon filogenetik terbaik dipilih berdasarkan?

A. Jarak genetik terkecil
B. Nilai likelihood tertinggi
C. Nilai bootstrap di atas 70%
D. Jumlah perubahan evolusi yang paling sedikit

Jawaban: D
Prinsip Maximum Parsimony memilih pohon yang meminimalkan jumlah perubahan evolusi yang diperlukan untuk menjelaskan data.

43.

Metode Maximum Likelihood dalam rekonstruksi pohon filogenetik menggunakan kriteria?

A. Probabilitas data diberikan pohon dan model evolusi
B. Jarak minimal antar sekuens
C. Jumlah karakter yang konsisten
D. Nilai identitas sekuens tertinggi

Jawaban: A
Maximum Likelihood mencari pohon yang memaksimalkan probabilitas observasi data sekuens di bawah model evolusi tertentu.

44.

Evaluasi kepercayaan cabang pohon filogenetik yang dihasilkan dengan metode resampling seperti bootstrap bertujuan untuk?

A. Mengukur dukungan statistik pada setiap cabang
B. Menghitung panjang cabang
C. Menentukan jumlah taksa
D. Memilih model evolusi terbaik

Jawaban: A
Bootstrap adalah teknik resampling untuk mengukur seberapa kuat data mendukung setiap cabang dalam pohon filogenetik.

45.

Perangkat lunak MEGA (Molecular Evolutionary Genetics Analysis) sering digunakan dalam analisis filogenetik. Fitur utama MEGA meliputi?

A. Hanya visualisasi pohon
B. Prediksi struktur protein
C. Rekonstruksi pohon dan analisis evolusi molekuler
D. Analisis ekspresi gen

Jawaban: C
MEGA menyediakan alat untuk rekonstruksi pohon filogenetik, analisis jarak genetik, dan berbagai uji evolusi molekuler.

46.

Dalam visualisasi pohon filogenetik, pohon yang menunjukkan panjang cabang proporsional terhadap jumlah perubahan evolusi disebut?

A. Pohon kladogram
B. Pohon fenogram
C. Pohon kronogram
D. Pohon filogram

Jawaban: D
Filogram adalah pohon filogenetik di mana panjang cabang mencerminkan jumlah perubahan evolusi atau jarak genetik.

47.

Aplikasi filogenetik dalam epidemiologi molekuler terutama digunakan untuk?

A. Memprediksi struktur protein virus
B. Melacak penyebaran dan asal-usul patogen
C. Menentukan urutan genom lengkap
D. Menganalisis ekspresi gen inang

Jawaban: B
Filogenetik molekuler membantu melacak jalur penularan dan asal-usul patogen dalam wabah penyakit.

48.

Proyek Genom Manusia (Human Genome Project) bertujuan untuk?

A. Mengidentifikasi semua protein manusia
B. Mengembangkan vaksin untuk semua penyakit
C. Memetakan dan mengurutkan seluruh genom manusia
D. Membuat database ekspresi gen

Jawaban: C
Human Genome Project bertujuan menentukan urutan lengkap DNA manusia dan memetakan semua gen.

49.

Teknologi sekuensing generasi berikutnya (NGS) memiliki keunggulan utama dibandingkan sekuensing Sanger yaitu?

A. Biaya lebih tinggi per basa
B. Akurasi 100%
C. Panjang baca yang lebih panjang
D. Kecepatan dan kapasitas throughput yang sangat tinggi

Jawaban: D
NGS memungkinkan sekuensing jutaan fragmen DNA secara paralel dalam waktu singkat, memberikan throughput tinggi dengan biaya per basa lebih rendah.

50.

Dalam perakitan genom de novo, langkah pertama yang dilakukan setelah sekuensing adalah?

A. Anotasi gen
B. Perakitan contig dari reads
C. Pemetaan ke genom referensi
D. Analisis SNP

Jawaban: B
Perakitan de novo dimulai dengan menggabungkan reads yang tumpang tindih menjadi contig, tanpa menggunakan genom referensi.

51.

Anotasi genom bertujuan untuk?

A. Mengidentifikasi letak gen dan elemen fungsional lainnya dalam genom
B. Menentukan urutan nukleotida genom
C. Membandingkan genom antar spesies
D. Menghitung ukuran genom

Jawaban: A
Anotasi genom adalah proses mengidentifikasi gen, promoter, dan elemen fungsional lainnya pada sekuens genom yang telah dirakit.

52.

Proyek Genom Manusia (Human Genome Project) selesai pada awal abad ke-21 dan menghasilkan peta lengkap genom manusia. Apa dampak utama dari selesainya proyek ini terhadap perkembangan bioinformatika?

A. Menurunnya minat pada analisis sekuens DNA
B. Memicu pengembangan alat dan basis data untuk mengelola data genom skala besar
C. Mengakhiri semua penelitian biologi molekuler
D. Membuat teknologi sekuensing menjadi usang

Jawaban: B
Data genom manusia yang sangat besar memicu kebutuhan alat bioinformatika untuk penyimpanan, analisis, dan interpretasi data, sehingga mendorong inovasi di bidang ini.

53.

Dalam genomik komparatif, istilah 'sinteni' mengacu pada konsep apa?

A. Konservasi urutan gen pada kromosom yang sama antar spesies
B. Perubahan jumlah kromosom dalam evolusi
C. Urutan basa yang identik antar spesies
D. Mutasi acak pada daerah nonkoding

Jawaban: A
Sinteni adalah kondisi di mana dua atau lebih gen berada pada kromosom yang sama pada spesies berbeda, menunjukkan konservasi selama evolusi.

54.

Gen ortolog dan paralog adalah istilah penting dalam genomik komparatif. Manakah pernyataan yang benar tentang gen ortolog?

A. Gen ortolog adalah gen homolog pada spesies berbeda yang berevolusi dari nenek moyang yang sama
B. Gen ortolog berasal dari duplikasi dalam satu spesies
C. Gen ortolog selalu memiliki fungsi yang berbeda
D. Gen ortolog hanya ditemukan pada prokariot

Jawaban: A
Ortolog adalah gen homolog pada spesies berbeda yang berasal dari spesiasi dan biasanya mempertahankan fungsi yang sama.

55.

Single Nucleotide Polymorphism (SNP) adalah variasi genetik yang sering dipelajari dalam genomik komparatif. Apa karakteristik utama dari SNP?

A. Duplikasi seluruh kromosom
B. Penghapusan segmen besar DNA
C. Penyisipan sekuens transposon
D. Perubahan pada satu pasangan basa DNA yang frekuensinya lebih dari 1% dalam populasi

Jawaban: D
SNP adalah variasi pada satu nukleotida yang terjadi dengan frekuensi minimal 1% dalam populasi, sering digunakan sebagai penanda genetik.

56.

Dalam genomik komparatif, identifikasi gen ortolog sering dilakukan untuk tujuan apa?

A. Menentukan usia fosil
B. Menciptakan spesies baru di laboratorium
C. Memprediksi fungsi gen berdasarkan spesies lain yang sudah diketahui
D. Menghapus gen yang tidak diinginkan

Jawaban: C
Ortolog cenderung memiliki fungsi yang sama, sehingga identifikasi ortolog memungkinkan transfer pengetahuan fungsional antar spesies.

57.

Metagenomik adalah cabang genomik yang mempelajari material genetik dari sampel lingkungan. Apa langkah pertama yang umum dilakukan dalam analisis metagenomik?

A. Menyelaraskan semua sekuens ke genom tunggal
B. Mengurutkan RNA dari sampel
C. Mengkloning setiap gen ke dalam vektor
D. Ekstraksi DNA total dari sampel lingkungan

Jawaban: D
Langkah awal metagenomik adalah mengekstraksi DNA total dari sampel lingkungan untuk memperoleh representasi semua mikroorganisme yang ada.

58.

Dalam genomik fungsional, transkriptomik digunakan untuk mempelajari apa?

A. Semua molekul RNA yang dihasilkan dari genom pada kondisi tertentu
B. Semua protein yang diekspresikan dalam sel
C. Semua interaksi protein-protein dalam sel
D. Struktur tiga dimensi kromosom

Jawaban: A
Transkriptomik menganalisis kumpulan transkrip RNA yang diekspresikan pada waktu dan kondisi tertentu, memberikan gambaran aktivitas gen.

59.

Integrasi data multi-omik menggabungkan data dari berbagai tingkat molekuler. Manakah contoh data yang termasuk dalam multi-omik?

A. Hanya data sekuens DNA
B. Hanya data fenotipe morfologi
C. Data genomik, transkriptomik, dan proteomik
D. Data cuaca dan iklim

Jawaban: C
Multi-omik mengintegrasikan data seperti genomik, transkriptomik, proteomik, dan metabolomik untuk pemahaman sistem biologis secara holistik.

60.

Salah satu aplikasi metagenomik adalah analisis komunitas mikroba. Alat bioinformatika apa yang sering digunakan untuk mengklasifikasikan sekuens berdasarkan taksonomi?

A. Google Maps
B. Microsoft Excel
C. Adobe Photoshop
D. BLAST terhadap basis data referensi seperti Greengenes atau SILVA

Jawaban: D
BLAST digunakan untuk membandingkan sekuens dengan basis data referensi seperti Greengenes atau SILVA guna mengidentifikasi taksonomi mikroba.

61.

Dalam prediksi struktur protein, struktur sekunder didefinisikan sebagai pola lokal yang teratur. Manakah contoh struktur sekunder yang umum?

A. Domain globular yang kompleks
B. Heliks alfa dan lembaran beta
C. Ikatan peptida antara asam amino
D. Urutan asam amino linier

Jawaban: B
Struktur sekunder meliputi heliks alfa dan lembaran beta yang terbentuk dari ikatan hidrogen antara atom-atom tulang punggung protein.

62.

Metode prediksi struktur tersier protein yang menggunakan template dari protein homolog dikenal dengan nama apa?

A. Ab initio modeling
B. Homology modeling atau comparative modeling
C. Threading tanpa template
D. Simulasi dinamika molekuler

Jawaban: B
Homology modeling memanfaatkan struktur protein homolog yang sudah diketahui sebagai template untuk memprediksi struktur target.

63.

Tingkatan struktur protein yang menggambarkan susunan rantai polipeptida ganda dan interaksi antar subunit disebut struktur apa?

A. Struktur kuartener
B. Struktur sekunder
C. Struktur tersier
D. Struktur primer

Jawaban: A
Struktur kuartener adalah tingkat organisasi protein yang melibatkan interaksi antara dua atau lebih rantai polipeptida (subunit).

64.

Metode eksperimental yang paling umum untuk menentukan struktur tiga dimensi protein pada resolusi atom adalah:

A. Kristalografi sinar-X atau NMR spektroskopi
B. Kromatografi cair
C. Mikroskop cahaya
D. Elektroforesis gel

Jawaban: A
Kristalografi sinar-X dan NMR (Nuclear Magnetic Resonance) spektroskopi adalah metode utama untuk menentukan struktur protein pada resolusi atom.

65.

Dalam prediksi fungsi protein berbasis sekuens, istilah 'domain' mengacu pada:

A. Seluruh urutan asam amino protein
B. Kode genetik yang mengkode protein
C. Bagian protein yang independen dan memiliki fungsi spesifik
D. Jenis lipid yang mengelilingi protein

Jawaban: C
Domain adalah unit struktural dan fungsional yang independen dalam protein, seringkali dilestarikan selama evolusi dan bertanggung jawab atas fungsi tertentu.

66.

Basis data interaksi protein-protein (PPI) yang menyediakan informasi jaringan interaksi eksperimental dan prediksi adalah:

A. GenBank
B. PDB
C. Ensembl
D. STRING

Jawaban: D
STRING adalah basis data yang mengintegrasikan interaksi protein-protein yang diketahui dan diprediksi, termasuk data eksperimental dan literatur.

67.

Situs aktif enzim dapat diprediksi melalui analisis sekuens. Alat bioinformatika apa yang sering digunakan untuk mengidentifikasi situs aktif berdasarkan konservasi sekuens?

A. BLAST
B. Photoshop
C. Clustal Omega dengan anotasi domain
D. Microsoft Word

Jawaban: C
Clustal Omega untuk penyelarasan berganda dapat membantu mengidentifikasi residu yang sangat terkonservasi, yang seringkali merupakan bagian dari situs aktif.

68.

Visualisasi struktur protein membantu memahami hubungan antara struktur dan fungsi. Perangkat lunak open source yang populer untuk visualisasi molekuler adalah:

A. Microsoft PowerPoint
B. PyMOL
C. Adobe Illustrator
D. Google Chrome

Jawaban: B
PyMOL adalah perangkat lunak visualisasi molekuler yang banyak digunakan untuk menampilkan struktur tiga dimensi protein dan molekul biologis lainnya.

69.

Metode docking molekuler yang memprediksi posisi dan orientasi ligan dengan mempertimbangkan fleksibilitas ligan dan reseptor secara bersamaan disebut sebagai…

A. rigid docking
B. flexible docking
C. soft docking
D. induced fit docking

Jawaban: B
Flexible docking memungkinkan perubahan konformasi pada ligan dan reseptor untuk simulasi yang lebih realistik. Metode ini lebih akurat daripada rigid docking yang menganggap kedua molekul kaku.

70.

Software visualisasi struktur protein yang sering digunakan untuk melihat interaksi antara protein dan ligan dalam analisis docking molekuler adalah…

A. PyMOL
B. AutoDock Vina
C. GROMACS
D. BLAST

Jawaban: A
PyMOL adalah perangkat lunak visualisasi molekuler yang populer untuk melihat struktur protein dan interaksi dengan ligan, mendukung analisis hasil docking. AutoDock Vina adalah program docking, GROMACS untuk simulasi dinamika molekuler, dan BLAST untuk pencarian homologi.

71.

Dalam prediksi struktur tersier protein, metode yang memanfaatkan template dari struktur protein homolog yang sudah diketahui disebut…

A. ab initio modeling
B. threading
C. homology modeling
D. molecular dynamics

Jawaban: C
Homology modeling adalah metode prediksi struktur protein yang menggunakan struktur protein homolog sebagai template. Ab initio modeling tidak menggunakan template, threading mencari lipatan protein berdasarkan kecocokan sekuens, sedangkan molecular dynamics adalah simulasi pergerakan atom.

72.

Basis data yang menyimpan informasi interaksi protein-protein yang telah tervalidasi secara eksperimental adalah…

A. STRING
B. PDB
C. GenBank
D. BioGRID

Jawaban: D
BioGRID adalah basis data interaksi protein-protein dan genetik yang bersumber dari literatur eksperimental. STRING juga menyimpan interaksi protein tetapi mencakup prediksi, PDB untuk struktur protein, GenBank untuk sekuens nukleotida.

73.

Teknologi yang digunakan untuk mengukur jumlah transkrip RNA dalam suatu sampel secara high-throughput dalam studi transkriptomik adalah…

A. PCR kuantitatif
B. RNA-Seq
C. northern blot
D. mikroarray DNA

Jawaban: B
RNA-Seq adalah teknologi sekuensing generasi berikutnya yang memungkinkan kuantifikasi transkrip RNA secara komprehensif dan high-throughput. PCR kuantitatif dan northern blot lebih spesifik untuk gen tertentu, mikroarray DNA juga high-throughput namun terbatas pada gen yang diketahui.

74.

Langkah pertama dalam analisis data RNA-Seq setelah memperoleh sekuens adalah…

A. kuantifikasi ekspresi gen
B. pemetaan reads ke genom referensi
C. quality control dan trimming
D. analisis ekspresi diferensial

Jawaban: C
Quality control dan trimming dilakukan pertama kali untuk memeriksa kualitas sekuens dan memotong basa berkualitas rendah atau adapter. Baru kemudian reads dipetakan ke genom, dilanjutkan kuantifikasi dan analisis diferensial.

75.

Proses pemetaan short reads hasil RNA-Seq ke genom referensi memerlukan perangkat lunak yang cepat dan akurat seperti…

A. BLAST
B. Bowtie2
C. ClustalW
D. MUSCLE

Jawaban: B
Bowtie2 dirancang khusus untuk pemetaan reads pendek ke genom referensi dengan cepat. BLAST digunakan untuk pencarian homologi sekuens, ClustalW dan MUSCLE untuk penyelarasan berganda.

76.

Dalam transkriptomik, jumlah reads yang dipetakan ke suatu gen digunakan untuk mengukur…

A. jumlah ekson gen tersebut
B. panjang gen tersebut
C. tingkat ekspresi gen tersebut
D. jumlah isoform gen tersebut

Jawaban: C
Jumlah reads yang dipetakan ke suatu gen sebanding dengan tingkat ekspresinya karena semakin banyak transkrip, semakin banyak reads yang dihasilkan. Ukuran gen dan jumlah ekson tidak langsung berkaitan dengan ekspresi.

77.

Metode statistik yang umum digunakan untuk analisis ekspresi diferensial pada data RNA-Seq adalah…

A. DESeq2
B. BLAST
C. BWA
D. FASTQC

Jawaban: A
DESeq2 adalah paket R yang dirancang khusus untuk analisis ekspresi diferensial dengan model negative binomial. BLAST untuk pencarian homologi, BWA untuk pemetaan reads, FASTQC untuk quality control.

78.

Normalisasi data ekspresi gen diperlukan dalam analisis ekspresi diferensial untuk mengatasi perbedaan…

A. urutan basa antar sampel
B. akurasi sekuensing antar sampel
C. kedalaman sekuensing antar sampel
D. jenis sel antar sampel

Jawaban: C
Normalisasi memperbaiki bias akibat perbedaan jumlah total reads antar sampel (kedalaman sekuensing). Dengan normalisasi, perbandingan ekspresi gen antar sampel menjadi valid. Urutan basa dan jenis sel tidak diperbaiki oleh normalisasi.

79.

Visualisasi volcano plot dalam analisis ekspresi diferensial menampilkan hubungan antara…

A. fold change dan p-value
B. panjang gen dan jumlah reads
C. posisi genom dan tingkat ekspresi
D. ukuran sampel dan varians

Jawaban: A
Volcano plot menunjukkan log2 fold change pada sumbu X dan -log10 p-value pada sumbu Y. Gen yang signifikan dan memiliki perubahan besar akan terlihat sebagai titik di bagian atas kiri/kanan plot.

80.

Jika suatu gen memiliki adjusted p-value 0,005 dan log2 fold change 3, maka gen tersebut dianggap…

A. tidak signifikan dan tidak terdeferensiasi
B. signifikan dan mengalami penurunan ekspresi
C. signifikan dan mengalami peningkatan ekspresi
D. tidak signifikan tetapi mengalami perubahan ekspresi

Jawaban: C
Nilai adjusted p-value kurang dari 0,05 menunjukkan signifikansi statistik. Log2 fold change positif 3 menunjukkan peningkatan ekspresi (upregulated) sebesar 2^3 = 8 kali lipat.

81.

Analisis GO enrichment digunakan untuk…

A. menemukan gen ortolog antar spesies
B. mengidentifikasi jalur metabolisme yang diregulasi
C. menentukan apakah sekumpulan gen terkait dengan fungsi biologis tertentu
D. memprediksi struktur protein dari sekuens

Jawaban: C
GO enrichment analysis menguji apakah gen-gen yang diekspresikan secara diferensial cenderung terkait dengan Gene Ontology tertentu, misalnya proses biologis, komponen seluler, atau fungsi molekuler.

82.

Analisis jalur (pathway analysis) dalam studi transkriptomik memanfaatkan basis data seperti…

A. KEGG
B. GenBank
C. PDB
D. UniProt

Jawaban: A
KEGG adalah basis data jalur metabolisme dan regulasi yang sering digunakan untuk menempatkan gen dalam konteks jalur biologis. GenBank untuk sekuens, PDB untuk struktur, UniProt untuk protein.

83.

Fungsi library Biopython yang digunakan untuk membaca file sekuens dalam format FASTA adalah…

A. SeqIO
B. Bio.Seq
C. Bio.BLAST
D. Bio.Align

Jawaban: A
SeqIO adalah modul dalam Biopython untuk membaca dan menulis file sekuens dalam berbagai format, termasuk FASTA. Bio.Seq berisi kelas Seq, Bio.BLAST untuk menjalankan BLAST, Bio.Align untuk alignment.

84.

Dalam Python, perintah untuk mencetak panjang sekuens yang disimpan dalam variabel 'seq' (bertipe string) adalah…

A. print(seq.length)
B. print(len(seq))
C. print(seq.size)
D. print(seq.count)

Jawaban: B
Fungsi len() dalam Python mengembalikan panjang string. seq.length, seq.size, seq.count bukan metode bawaan untuk string Python. Oleh karena itu, print(len(seq)) adalah cara yang benar.

85.

Dalam bahasa Python, untuk menyimpan urutan sekuens DNA 'ATCG' dan mengakses karakter ketiga, perintah yang tepat adalah:

A. ubah string menjadi list, lalu indeks [2]
B. buat variabel sekuens = 'ATCG', lalu cetak sekuens[3]
C. buat variabel sekuens = 'ATCG', lalu cetak sekuens[2]
D. buat variabel sekuens = [A,T,C,G], lalu indeks [2]

Jawaban: C
Python memulai indeks dari 0, sehingga karakter ketiga berada di indeks 2. String 'ATCG' dapat langsung diindeks tanpa diubah ke list.

86.

Alat baris perintah yang digunakan untuk memetakan sekuens RNA-Seq ke genom referensi adalah:

A. BLAST
B. HISAT2
C. Snakemake
D. Galaxy

Jawaban: B
HISAT2 adalah alat yang dirancang untuk memetakan reads RNA-Seq ke genom referensi secara cepat dan akurat.

87.

Dalam pipeline bioinformatika, fungsi dari alat Snakemake adalah:

A. memvisualisasikan data sekuens dalam bentuk grafik
B. menjalankan BLAST dengan parameter default
C. melakukan quality control pada data NGS
D. mengelola alur kerja dengan mendefinisikan aturan dan dependensi

Jawaban: D
Snakemake adalah sistem manajemen alur kerja yang memungkinkan pengguna mendefinisikan aturan untuk setiap langkah dan dependensinya secara otomatis.

88.

Suatu file BAM yang dihasilkan dari pemetaan reads perlu diurutkan (sorted) sebelum analisis lebih lanjut, karena:

A. mempercepat visualisasi data di genome browser
B. mengompres ukuran file menjadi lebih kecil
C. menghapus duplikat PCR secara otomatis
D. mengubah format file menjadi SAM

Jawaban: A
File BAM yang diurutkan berdasarkan posisi genom memungkinkan akses acak yang lebih efisien sehingga mempercepat visualisasi dan analisis seperti pemanggilan varian.

89.

Dalam pemrograman R menggunakan ggplot2, fungsi untuk membuat plot sebar (scatter plot) dari data ekspresi gen adalah:

A. geom_bar()
B. geom_line()
C. geom_point()
D. geom_histogram()

Jawaban: C
geom_point() digunakan untuk membuat scatter plot yang menampilkan titik-titik data pada sumbu x dan y, cocok untuk visualisasi data ekspresi gen.

90.

Laporan analisis bioinformatika yang reproducible sebaiknya menggunakan format berikut, kecuali:

A. Jupyter Notebook
B. dokumen Word hasil copy-paste terminal
C. R Markdown
D. skrip Python dengan komentar ekstensif

Jawaban: B
Dokumen Word hasil copy-paste terminal tidak menyertakan kode dan data mentah, sehingga tidak dapat direproduksi secara otomatis.

91.

Visualisasi heatmap dalam analisis transkriptomik berguna untuk:

A. menampilkan distribusi panjang reads
B. menunjukkan hubungan filogenetik antar spesies
C. memetakan interaksi protein-protein
D. menggambarkan pola ekspresi gen di berbagai kondisi

Jawaban: D
Heatmap menampilkan matriks nilai ekspresi gen dengan gradasi warna, sehingga pola ekspresi gen antar sampel atau kondisi dapat diamati secara visual.

92.

Bioinformatika membantu farmakogenomik dengan cara:

A. menganalisis varian genetik pasien untuk menentukan dosis obat yang tepat
B. memprediksi struktur tersier protein target
C. membuat pohon filogenetik bakteri patogen
D. memvisualisasikan jalur metabolisme sekunder

Jawaban: A
Farmakogenomik memanfaatkan data genetik individu untuk menyesuaikan terapi obat, dan bioinformatika berperan dalam mengidentifikasi dan menganalisis varian yang memengaruhi respons obat.

93.

Dalam identifikasi gen penyakit melalui genomik medis, langkah awal yang dilakukan adalah:

A. melakukan docking molekuler terhadap kandidat obat
B. menganalisis data RNA-Seq dari jaringan sehat
C. menghitung jarak genetik antar populasi
D. membandingkan sekuens genom pasien dengan genom referensi

Jawaban: D
Identifikasi gen penyakit dimulai dengan mendeteksi varian genetik pada pasien dengan membandingkan sekuens genomnya terhadap genom referensi.

94.

Pelacakan penyakit infeksi menggunakan bioinformatika sering dilakukan dengan analisis filogenetik untuk:

A. menemukan obat baru dari senyawa alami
B. memprediksi struktur protein envelope virus
C. menentukan asal usul dan jalur penyebaran patogen
D. mengelola basis data sekuens pasien

Jawaban: C
Analisis filogenetik membandingkan sekuens patogen dari berbagai lokasi dan waktu sehingga dapat merekonstruksi hubungan evolusi dan rute penyebarannya.

95.

Dalam pemuliaan tanaman berbasis molekuler, bioinformatika digunakan untuk:

A. mengidentifikasi marka genetik yang terkait sifat unggul
B. memprediksi cuaca jangka panjang
C. mengukur kadar air tanah di lahan pertanian
D. menghitung jumlah populasi hama secara manual

Jawaban: A
Bioinformatika membantu menganalisis data genom untuk menemukan marka SNP atau gen yang berkorelasi dengan sifat seperti ketahanan penyakit atau hasil panen tinggi.

96.

Metagenomik lingkungan diterapkan untuk:

A. mempelajari gen satu spesies bakteri murni
B. mengkloning gen tertentu ke vektor plasmid
C. memvisualisasikan struktur sel bakteri
D. menganalisis seluruh DNA dari sampel lingkungan secara langsung

Jawaban: D
Metagenomik mengekstrak dan mensekuensing DNA total dari sampel lingkungan (tanah, air) tanpa perlu mengkultur, sehingga dapat mengungkap keragaman mikroba secara komprehensif.

97.

Bioinformatika mendukung konservasi keanekaragaman hayati melalui:

A. pembangunan gedung laboratorium baru
B. penggunaan pestisida kimia secara massal
C. analisis DNA barcode untuk identifikasi spesies
D. penggundulan hutan untuk perkebunan sawit

Jawaban: C
DNA barcode menggunakan sekuens gen pendek untuk mengidentifikasi spesies secara akurat, membantu inventarisasi dan pemantauan keanekaragaman hayati.

98.

Penerapan machine learning dalam bioinformatika yang tepat adalah:

A. memprediksi fungsi protein berdasarkan sekuens menggunakan jaringan saraf tiruan
B. mengedit teks laporan secara manual
C. menulis ulang basis data GenBank
D. menyusun daftar pustaka dengan Microsoft Word

Jawaban: A
Machine learning seperti jaringan saraf tiruan dapat mempelajari pola dari data sekuens untuk memprediksi fungsi protein atau struktur sekunder secara otomatis.

99.

Single-cell sequencing memberikan keuntungan utama berupa:

A. data ekspresi gen rata-rata dari seluruh jaringan
B. informasi genetik dari satu sel individu sehingga mengungkap heterogenitas seluler
C. sekuens genom utuh dalam satu kali reaksi
D. visualisasi organel sel secara langsung

Jawaban: B
Single-cell sequencing memungkinkan analisis ekspresi gen pada level sel tunggal, mengungkap perbedaan antar sel yang tidak terlihat pada data massal.

100.

Bioinformatika dan biologi sintetis saling terkait dalam hal:

A. menggandakan DNA secara alami tanpa rekayasa
B. mendesain sirkuit genetik buatan dengan bantuan perangkat lunak simulasi
C. mengklasifikasikan spesies berdasarkan morfologi
D. mengukur suhu inkubator laboratorium

Jawaban: B
Biologi sintetis merekayasa sistem biologis baru, dan bioinformatika menyediakan alat untuk merancang serta mensimulasikan sirkuit genetik sebelum diimplementasikan.

Soal BLAST dan multiple sequence alignment di Modul 3 sering bikin pusing karena algoritmanya butuh logika berlapis. Padahal di UAS, soal kayak gitu yang paling sering muncul sebagai pembeda antara nilai B dan A. Banyak yang hafal cara pakai ClustalW, tapi pas disuruh jelasin matriks substitusi langsung blank. Kalau masih ragu sama jawabanmu, cobain dulu anotasi ulang dari sekuens yang paling sederhana.

Format UO di STBI4004 Buku Bioinformatika biasanya menyuruh kamu menelusuri data dari NCBI lalu menganalisis hasilnya, jadi paham alurnya lebih penting daripada hafalan. Ada banyak kumpulan soal UAS UT lain kalau kamu mau tambah latihan di modul yang masih terasa asing. Poin besar juga sering ada di prediksi struktur protein dan docking molekuler di Modul 6, jadi jangan dilewatkan begitu saja.

Soal UAS UT STBI4004 Buku Bioinformatika dan Kunci Jawaban

Soal UT STBI4004 Buku Bioinformatika

Baca juga

Soal UAS UT STTP4111 Mikrobiologi dan Sanitasi Pangan Beserta Kunci Jawaban

Soal UAS UT BIOL4415 Entomologi dan Kunci Jawaban

Soal UAS UT BIOL4413 Ekologi Hutan Tropis dan Kunci Jawaban

Soal UAS UT BIOL4420 Pencemaran Lingkungan dan Kunci Jawaban

Soal UAS UT STBI4004 Buku Bioinformatika dan Kunci Jawaban

Soal UT STBI4004 Buku Bioinformatika

Baca juga

Soal UAS UT STTP4111 Mikrobiologi dan Sanitasi Pangan Beserta Kunci Jawaban

Soal UAS UT BIOL4415 Entomologi dan Kunci Jawaban

Soal UAS UT BIOL4413 Ekologi Hutan Tropis dan Kunci Jawaban

Soal UAS UT BIOL4420 Pencemaran Lingkungan dan Kunci Jawaban

🔥 Post Terbaru