Tidur larut baca modul, eh besoknya malah bingung bedain alignment global sama lokal di Modul 3 STBI4004 Buku Bioinformatika. Dua konsep itu sering banget jadi jebakan di UAS karena algoritmanya mirip tapi dipakenya beda. Wajar kalau pusing. Soal UT di halaman ini fokus ke bagian yang paling sering salah dipahami mahasiswa.
Modul 2 tentang basis data protein dan Modul 6 tentang prediksi struktur protein itu dua topik paling rawan bikin nilai jeblok kalau cuma dihafal kulitnya. Bukan karena materinya susah, tapi karena butuh latihan praktik langsung, bukan sekadar teori. Cobain latihan soal Biologi ini dulu sebelum ujian. Biar paham pola soalnya.
Soal UAS UT di bawah ini nyerempet semua KB penting, dari format FASTA sampai analisis BLAST. Setiap soal ada kunci jawaban dan pembahasan, jadi kamu langsung tahu kenapa jawabannya itu. Kalau masih ada yang ragu, baca pelan-pelan dulu pembahasannya.
Soal UT STBI4004 Buku Bioinformatika
Bioinformatika merupakan ilmu yang menggabungkan biologi dengan bidang ilmu lain. Bidang ilmu apa yang paling mendasar dalam pengembangan bioinformatika?
Bioinformatika menggabungkan biologi dengan ilmu komputer dan matematika untuk menganalisis data biologis.
Salah satu peran utama bioinformatika dalam sains modern adalah membantu dalam analisis data genomik. Manakah dari berikut ini yang merupakan contoh aplikasi bioinformatika dalam penelitian genomik?
Penyelarasan sekuens DNA merupakan aplikasi bioinformatika yang umum digunakan untuk mengidentifikasi variasi genetik.
Sejarah perkembangan bioinformatika dimulai seiring dengan kemajuan teknologi. Peristiwa apa yang menjadi tonggak awal perkembangan bioinformatika?
Pembuatan basis data sekuens protein oleh Dayhoff pada tahun 1960-an dianggap sebagai awal perkembangan bioinformatika.
Bioinformatika memiliki hubungan erat dengan berbagai disiplin ilmu. Manakah dari berikut ini yang merupakan kontribusi utama ilmu komputer dalam bioinformatika?
Ilmu komputer berkontribusi dalam mengembangkan algoritma dan perangkat lunak untuk menganalisis data biologis yang besar.
Dogma sentral biologi molekuler menjelaskan aliran informasi genetik. Urutan yang benar dari dogma sentral adalah?
Dogma sentral menyatakan bahwa informasi genetik mengalir dari DNA menjadi RNA melalui transkripsi, kemudian RNA menjadi protein melalui translasi.
Mutasi genetik dapat menyebabkan perubahan pada sekuens DNA. Jika terjadi substitusi satu basa pada sekuens pengkode, jenis mutasi apakah yang tidak mengubah asam amino yang dikode?
Mutasi diam terjadi ketika perubahan basa tidak mengubah asam amino karena redundansi kode genetik.
Struktur dan fungsi protein sangat dipengaruhi oleh urutan asam aminonya. Tingkatan struktur protein yang merupakan urutan linier asam amino disebut?
Struktur primer protein adalah urutan linier asam amino yang dihubungkan oleh ikatan peptida.
Ekspresi gen diatur melalui berbagai mekanisme. Manakah dari berikut ini yang merupakan tahapan regulasi ekspresi gen pada tingkat transkripsi?
Regulasi transkripsi melibatkan pengikatan faktor transkripsi pada daerah promotor gen untuk mengontrol inisiasi transkripsi.
Data sekuens biologis sering disimpan dalam format tertentu. Format sekuens yang hanya berisi header dan sekuens dalam satu baris teks disebut?
Format FASTA adalah format sederhana yang terdiri dari satu baris header diawali dengan tanda > dan diikuti oleh sekuens.
Sumber data publik dalam bioinformatika sangat penting untuk penelitian. Manakah dari berikut ini yang merupakan repositori utama untuk data sekuens nukleotida?
GenBank adalah basis data sekuens nukleotida yang dikelola oleh NCBI dan merupakan salah satu repositori utama.
Metadata dalam data biologis sangat penting. Mengapa metadata diperlukan dalam pengelolaan data sekuens?
Metadata memberikan informasi konteks seperti spesies, jaringan, dan metode eksperimen yang penting untuk interpretasi data.
Etika penggunaan data biologis perlu diperhatikan dalam bioinformatika. Manakah dari berikut ini yang merupakan pelanggaran etika dalam penggunaan data biologis?
Mengidentifikasi individu dari data genomik tanpa izin melanggar privasi dan etika dalam penelitian.
Basis data biologis diklasifikasikan menjadi beberapa jenis. Basis data yang berisi data sekuens asli dari hasil eksperimen disebut?
Basis data primer menyimpan data asli hasil eksperimen seperti sekuens DNA atau protein.
GenBank, EMBL, dan DDBJ adalah tiga basis data sekuens nukleotida utama. Manakah dari pernyataan berikut yang benar tentang ketiganya?
GenBank, EMBL, dan DDBJ membentuk International Nucleotide Sequence Database Collaboration (INSDC) yang saling bertukar data setiap hari.
UniProt adalah basis data protein yang komprehensif. Manakah dari berikut ini yang merupakan bagian dari UniProt yang berisi data protein yang sudah dianotasi secara manual?
Swiss-Prot adalah bagian dari UniProt yang berisi anotasi protein manual dan telah melalui proses review.
TrEMBL merupakan bagian dari UniProt. Karakteristik utama dari TrEMBL adalah?
TrEMBL berisi protein yang dianotasi secara otomatis dan belum melalui review manual.
Protein Data Bank (PDB) adalah basis data utama untuk struktur protein. Jenis data apa yang umumnya disimpan dalam PDB?
PDB menyimpan koordinat atom tiga dimensi dari protein dan asam nukleat yang ditentukan melalui metode eksperimental seperti kristalografi sinar-X dan NMR.
Basis data yang menyimpan informasi struktur tiga dimensi protein disebut…
PDB (Protein Data Bank) adalah basis data utama untuk struktur tiga dimensi protein.
Fungsi utama dari basis data struktural seperti PDB adalah untuk menyediakan informasi tentang…
PDB menyimpan koordinat atom dari struktur protein dan molekul biologis lainnya.
Dari pilihan berikut, mana yang merupakan basis data genom yang menyediakan browser genom interaktif?
Ensembl adalah basis data genom yang dilengkapi browser genom untuk visualisasi dan analisis.
Dalam penelusuran data di NCBI, antarmuka yang digunakan untuk mencari berbagai basis data biologis secara terintegrasi adalah…
Entrez adalah antarmuka pencarian terintegrasi di NCBI yang mencakup banyak basis data.
Format file yang umum digunakan untuk menyimpan data sekuens biologis dengan header yang diawali tanda > adalah…
Format FASTA menggunakan tanda > pada header untuk mengidentifikasi sekuens, diikuti data sekuens.
Langkah pertama yang tepat saat mengunduh data sekuens dari basis data publik adalah…
Membaca metadata penting untuk memahami sumber, tanggal, dan deskripsi sekuens sebelum analisis lebih lanjut.
Salah satu cara untuk memvalidasi kualitas data sekuens yang diunduh adalah dengan memeriksa…
Karakter ambigu seperti N dan panjang sekuens yang tidak wajar bisa menandakan masalah kualitas data.
Dalam penyelarasan sekuens berpasangan, algoritma yang digunakan untuk penyelarasan global adalah…
Needleman-Wunsch adalah algoritma untuk penyelarasan global yang menyelaraskan seluruh sekuens.
Matriks substitusi yang umum digunakan dalam penyelarasan sekuens protein adalah…
BLOSUM62 adalah matriks substitusi yang populer untuk penyelarasan sekuens protein.
Dalam penyelarasan berpasangan lokal, algoritma yang sesuai adalah…
Smith-Waterman adalah algoritma untuk penyelarasan lokal yang mencari daerah mirip terbaik.
Sistem penilaian dalam penyelarasan sekuens memberikan skor untuk…
Skoring mencakup nilai untuk kecocokan (match), ketidakcocokan (mismatch), dan pembukaan/ekstensi gap.
Algoritma ClustalW digunakan untuk…
ClustalW adalah algoritma populer untuk menyelaraskan banyak sekuens secara berganda.
Dalam hasil BLAST, nilai E-value yang lebih kecil menunjukkan…
E-value rendah menandakan bahwa kesamaan yang diamati sangat tidak mungkin terjadi secara kebetulan.
Fungsi dari BLAST adalah untuk…
BLAST (Basic Local Alignment Search Tool) digunakan untuk mencari sekuens yang mirip dalam basis data.
Bit score dalam hasil BLAST digunakan untuk…
Bit score adalah skor normalisasi yang memungkinkan perbandingan hasil BLAST antar basis data.
Analisis frekuensi basa pada sekuens DNA dilakukan untuk…
Frekuensi basa membantu mengidentifikasi variasi komposisi, seperti kandungan GC yang tinggi atau rendah.
Prediksi ORF (Open Reading Frame) bertujuan untuk…
ORF adalah daerah sekuens yang berpotensi mengkode protein, dimulai dari kodon start hingga stop.
Dalam analisis komposisi sekuens DNA, jika suatu sekuens memiliki kandungan GC sebesar 60%, berapakah kandungan AT dari sekuens tersebut?
Kandungan AT adalah pelengkap dari kandungan GC. Jika GC 60%, maka AT adalah 100% dikurangi 60% yaitu 40%.
Metode yang digunakan untuk memprediksi Open Reading Frame (ORF) pada sekuens DNA biasanya didasarkan pada identifikasi kodon start dan kodon stop. Kodon start yang paling umum pada prokariot adalah?
Kodon start yang paling umum adalah ATG yang mengkode metionin, baik pada prokariot maupun eukariot.
Dalam filogenetik molekuler, istilah yang merujuk pada kemiripan sekuens akibat nenek moyang yang sama adalah?
Homologi adalah kemiripan sekuens yang disebabkan oleh adanya nenek moyang yang sama, sedangkan analogi disebabkan oleh evolusi konvergen.
Pohon filogenetik yang menunjukkan hubungan evolusi antar spesies berdasarkan data molekuler memiliki cabang yang disebut sebagai?
Node pada pohon filogenetik mewakili titik percabangan yang menunjukkan nenek moyang bersama dari kelompok taksa.
Model evolusi molekuler yang mengasumsikan bahwa laju substitusi nukleotida konstan sepanjang waktu disebut?
Jam molekuler adalah konsep yang menyatakan bahwa laju evolusi molekuler relatif konstan sepanjang waktu, sehingga digunakan untuk memperkirakan waktu divergensi.
Hubungan antara jarak genetik dan waktu divergensi dalam evolusi molekuler umumnya bersifat?
Jarak genetik biasanya meningkat sebanding dengan waktu divergensi, terutama dengan asumsi jam molekuler.
Metode rekonstruksi pohon filogenetik yang menggunakan matriks jarak genetik dan menggabungkan taksa berdasarkan jarak terkecil secara bertahap adalah?
Neighbor-Joining adalah metode jarak yang membangun pohon dengan menggabungkan taksa yang paling dekat secara berulang.
Dalam Maximum Parsimony, pohon filogenetik terbaik dipilih berdasarkan?
Prinsip Maximum Parsimony memilih pohon yang meminimalkan jumlah perubahan evolusi yang diperlukan untuk menjelaskan data.
Metode Maximum Likelihood dalam rekonstruksi pohon filogenetik menggunakan kriteria?
Maximum Likelihood mencari pohon yang memaksimalkan probabilitas observasi data sekuens di bawah model evolusi tertentu.
Evaluasi kepercayaan cabang pohon filogenetik yang dihasilkan dengan metode resampling seperti bootstrap bertujuan untuk?
Bootstrap adalah teknik resampling untuk mengukur seberapa kuat data mendukung setiap cabang dalam pohon filogenetik.
Perangkat lunak MEGA (Molecular Evolutionary Genetics Analysis) sering digunakan dalam analisis filogenetik. Fitur utama MEGA meliputi?
MEGA menyediakan alat untuk rekonstruksi pohon filogenetik, analisis jarak genetik, dan berbagai uji evolusi molekuler.
Dalam visualisasi pohon filogenetik, pohon yang menunjukkan panjang cabang proporsional terhadap jumlah perubahan evolusi disebut?
Filogram adalah pohon filogenetik di mana panjang cabang mencerminkan jumlah perubahan evolusi atau jarak genetik.
Aplikasi filogenetik dalam epidemiologi molekuler terutama digunakan untuk?
Filogenetik molekuler membantu melacak jalur penularan dan asal-usul patogen dalam wabah penyakit.
Proyek Genom Manusia (Human Genome Project) bertujuan untuk?
Human Genome Project bertujuan menentukan urutan lengkap DNA manusia dan memetakan semua gen.
Teknologi sekuensing generasi berikutnya (NGS) memiliki keunggulan utama dibandingkan sekuensing Sanger yaitu?
NGS memungkinkan sekuensing jutaan fragmen DNA secara paralel dalam waktu singkat, memberikan throughput tinggi dengan biaya per basa lebih rendah.
Dalam perakitan genom de novo, langkah pertama yang dilakukan setelah sekuensing adalah?
Perakitan de novo dimulai dengan menggabungkan reads yang tumpang tindih menjadi contig, tanpa menggunakan genom referensi.
Anotasi genom bertujuan untuk?
Anotasi genom adalah proses mengidentifikasi gen, promoter, dan elemen fungsional lainnya pada sekuens genom yang telah dirakit.
Proyek Genom Manusia (Human Genome Project) selesai pada awal abad ke-21 dan menghasilkan peta lengkap genom manusia. Apa dampak utama dari selesainya proyek ini terhadap perkembangan bioinformatika?
Data genom manusia yang sangat besar memicu kebutuhan alat bioinformatika untuk penyimpanan, analisis, dan interpretasi data, sehingga mendorong inovasi di bidang ini.
Dalam genomik komparatif, istilah 'sinteni' mengacu pada konsep apa?
Sinteni adalah kondisi di mana dua atau lebih gen berada pada kromosom yang sama pada spesies berbeda, menunjukkan konservasi selama evolusi.
Gen ortolog dan paralog adalah istilah penting dalam genomik komparatif. Manakah pernyataan yang benar tentang gen ortolog?
Ortolog adalah gen homolog pada spesies berbeda yang berasal dari spesiasi dan biasanya mempertahankan fungsi yang sama.
Single Nucleotide Polymorphism (SNP) adalah variasi genetik yang sering dipelajari dalam genomik komparatif. Apa karakteristik utama dari SNP?
SNP adalah variasi pada satu nukleotida yang terjadi dengan frekuensi minimal 1% dalam populasi, sering digunakan sebagai penanda genetik.
Dalam genomik komparatif, identifikasi gen ortolog sering dilakukan untuk tujuan apa?
Ortolog cenderung memiliki fungsi yang sama, sehingga identifikasi ortolog memungkinkan transfer pengetahuan fungsional antar spesies.
Metagenomik adalah cabang genomik yang mempelajari material genetik dari sampel lingkungan. Apa langkah pertama yang umum dilakukan dalam analisis metagenomik?
Langkah awal metagenomik adalah mengekstraksi DNA total dari sampel lingkungan untuk memperoleh representasi semua mikroorganisme yang ada.
Dalam genomik fungsional, transkriptomik digunakan untuk mempelajari apa?
Transkriptomik menganalisis kumpulan transkrip RNA yang diekspresikan pada waktu dan kondisi tertentu, memberikan gambaran aktivitas gen.
Integrasi data multi-omik menggabungkan data dari berbagai tingkat molekuler. Manakah contoh data yang termasuk dalam multi-omik?
Multi-omik mengintegrasikan data seperti genomik, transkriptomik, proteomik, dan metabolomik untuk pemahaman sistem biologis secara holistik.
Salah satu aplikasi metagenomik adalah analisis komunitas mikroba. Alat bioinformatika apa yang sering digunakan untuk mengklasifikasikan sekuens berdasarkan taksonomi?
BLAST digunakan untuk membandingkan sekuens dengan basis data referensi seperti Greengenes atau SILVA guna mengidentifikasi taksonomi mikroba.
Dalam prediksi struktur protein, struktur sekunder didefinisikan sebagai pola lokal yang teratur. Manakah contoh struktur sekunder yang umum?
Struktur sekunder meliputi heliks alfa dan lembaran beta yang terbentuk dari ikatan hidrogen antara atom-atom tulang punggung protein.
Metode prediksi struktur tersier protein yang menggunakan template dari protein homolog dikenal dengan nama apa?
Homology modeling memanfaatkan struktur protein homolog yang sudah diketahui sebagai template untuk memprediksi struktur target.
Tingkatan struktur protein yang menggambarkan susunan rantai polipeptida ganda dan interaksi antar subunit disebut struktur apa?
Struktur kuartener adalah tingkat organisasi protein yang melibatkan interaksi antara dua atau lebih rantai polipeptida (subunit).
Metode eksperimental yang paling umum untuk menentukan struktur tiga dimensi protein pada resolusi atom adalah:
Kristalografi sinar-X dan NMR (Nuclear Magnetic Resonance) spektroskopi adalah metode utama untuk menentukan struktur protein pada resolusi atom.
Dalam prediksi fungsi protein berbasis sekuens, istilah 'domain' mengacu pada:
Domain adalah unit struktural dan fungsional yang independen dalam protein, seringkali dilestarikan selama evolusi dan bertanggung jawab atas fungsi tertentu.
Basis data interaksi protein-protein (PPI) yang menyediakan informasi jaringan interaksi eksperimental dan prediksi adalah:
STRING adalah basis data yang mengintegrasikan interaksi protein-protein yang diketahui dan diprediksi, termasuk data eksperimental dan literatur.
Situs aktif enzim dapat diprediksi melalui analisis sekuens. Alat bioinformatika apa yang sering digunakan untuk mengidentifikasi situs aktif berdasarkan konservasi sekuens?
Clustal Omega untuk penyelarasan berganda dapat membantu mengidentifikasi residu yang sangat terkonservasi, yang seringkali merupakan bagian dari situs aktif.
Visualisasi struktur protein membantu memahami hubungan antara struktur dan fungsi. Perangkat lunak open source yang populer untuk visualisasi molekuler adalah:
PyMOL adalah perangkat lunak visualisasi molekuler yang banyak digunakan untuk menampilkan struktur tiga dimensi protein dan molekul biologis lainnya.
Metode docking molekuler yang memprediksi posisi dan orientasi ligan dengan mempertimbangkan fleksibilitas ligan dan reseptor secara bersamaan disebut sebagai…
Flexible docking memungkinkan perubahan konformasi pada ligan dan reseptor untuk simulasi yang lebih realistik. Metode ini lebih akurat daripada rigid docking yang menganggap kedua molekul kaku.
Software visualisasi struktur protein yang sering digunakan untuk melihat interaksi antara protein dan ligan dalam analisis docking molekuler adalah…
PyMOL adalah perangkat lunak visualisasi molekuler yang populer untuk melihat struktur protein dan interaksi dengan ligan, mendukung analisis hasil docking. AutoDock Vina adalah program docking, GROMACS untuk simulasi dinamika molekuler, dan BLAST untuk pencarian homologi.
Dalam prediksi struktur tersier protein, metode yang memanfaatkan template dari struktur protein homolog yang sudah diketahui disebut…
Homology modeling adalah metode prediksi struktur protein yang menggunakan struktur protein homolog sebagai template. Ab initio modeling tidak menggunakan template, threading mencari lipatan protein berdasarkan kecocokan sekuens, sedangkan molecular dynamics adalah simulasi pergerakan atom.
Basis data yang menyimpan informasi interaksi protein-protein yang telah tervalidasi secara eksperimental adalah…
BioGRID adalah basis data interaksi protein-protein dan genetik yang bersumber dari literatur eksperimental. STRING juga menyimpan interaksi protein tetapi mencakup prediksi, PDB untuk struktur protein, GenBank untuk sekuens nukleotida.
Teknologi yang digunakan untuk mengukur jumlah transkrip RNA dalam suatu sampel secara high-throughput dalam studi transkriptomik adalah…
RNA-Seq adalah teknologi sekuensing generasi berikutnya yang memungkinkan kuantifikasi transkrip RNA secara komprehensif dan high-throughput. PCR kuantitatif dan northern blot lebih spesifik untuk gen tertentu, mikroarray DNA juga high-throughput namun terbatas pada gen yang diketahui.
Langkah pertama dalam analisis data RNA-Seq setelah memperoleh sekuens adalah…
Quality control dan trimming dilakukan pertama kali untuk memeriksa kualitas sekuens dan memotong basa berkualitas rendah atau adapter. Baru kemudian reads dipetakan ke genom, dilanjutkan kuantifikasi dan analisis diferensial.
Proses pemetaan short reads hasil RNA-Seq ke genom referensi memerlukan perangkat lunak yang cepat dan akurat seperti…
Bowtie2 dirancang khusus untuk pemetaan reads pendek ke genom referensi dengan cepat. BLAST digunakan untuk pencarian homologi sekuens, ClustalW dan MUSCLE untuk penyelarasan berganda.
Dalam transkriptomik, jumlah reads yang dipetakan ke suatu gen digunakan untuk mengukur…
Jumlah reads yang dipetakan ke suatu gen sebanding dengan tingkat ekspresinya karena semakin banyak transkrip, semakin banyak reads yang dihasilkan. Ukuran gen dan jumlah ekson tidak langsung berkaitan dengan ekspresi.
Metode statistik yang umum digunakan untuk analisis ekspresi diferensial pada data RNA-Seq adalah…
DESeq2 adalah paket R yang dirancang khusus untuk analisis ekspresi diferensial dengan model negative binomial. BLAST untuk pencarian homologi, BWA untuk pemetaan reads, FASTQC untuk quality control.
Normalisasi data ekspresi gen diperlukan dalam analisis ekspresi diferensial untuk mengatasi perbedaan…
Normalisasi memperbaiki bias akibat perbedaan jumlah total reads antar sampel (kedalaman sekuensing). Dengan normalisasi, perbandingan ekspresi gen antar sampel menjadi valid. Urutan basa dan jenis sel tidak diperbaiki oleh normalisasi.
Visualisasi volcano plot dalam analisis ekspresi diferensial menampilkan hubungan antara…
Volcano plot menunjukkan log2 fold change pada sumbu X dan -log10 p-value pada sumbu Y. Gen yang signifikan dan memiliki perubahan besar akan terlihat sebagai titik di bagian atas kiri/kanan plot.
Jika suatu gen memiliki adjusted p-value 0,005 dan log2 fold change 3, maka gen tersebut dianggap…
Nilai adjusted p-value kurang dari 0,05 menunjukkan signifikansi statistik. Log2 fold change positif 3 menunjukkan peningkatan ekspresi (upregulated) sebesar 2^3 = 8 kali lipat.
Analisis GO enrichment digunakan untuk…
GO enrichment analysis menguji apakah gen-gen yang diekspresikan secara diferensial cenderung terkait dengan Gene Ontology tertentu, misalnya proses biologis, komponen seluler, atau fungsi molekuler.
Analisis jalur (pathway analysis) dalam studi transkriptomik memanfaatkan basis data seperti…
KEGG adalah basis data jalur metabolisme dan regulasi yang sering digunakan untuk menempatkan gen dalam konteks jalur biologis. GenBank untuk sekuens, PDB untuk struktur, UniProt untuk protein.
Fungsi library Biopython yang digunakan untuk membaca file sekuens dalam format FASTA adalah…
SeqIO adalah modul dalam Biopython untuk membaca dan menulis file sekuens dalam berbagai format, termasuk FASTA. Bio.Seq berisi kelas Seq, Bio.BLAST untuk menjalankan BLAST, Bio.Align untuk alignment.
Dalam Python, perintah untuk mencetak panjang sekuens yang disimpan dalam variabel 'seq' (bertipe string) adalah…
Fungsi len() dalam Python mengembalikan panjang string. seq.length, seq.size, seq.count bukan metode bawaan untuk string Python. Oleh karena itu, print(len(seq)) adalah cara yang benar.
Dalam bahasa Python, untuk menyimpan urutan sekuens DNA 'ATCG' dan mengakses karakter ketiga, perintah yang tepat adalah:
Python memulai indeks dari 0, sehingga karakter ketiga berada di indeks 2. String 'ATCG' dapat langsung diindeks tanpa diubah ke list.
Alat baris perintah yang digunakan untuk memetakan sekuens RNA-Seq ke genom referensi adalah:
HISAT2 adalah alat yang dirancang untuk memetakan reads RNA-Seq ke genom referensi secara cepat dan akurat.
Dalam pipeline bioinformatika, fungsi dari alat Snakemake adalah:
Snakemake adalah sistem manajemen alur kerja yang memungkinkan pengguna mendefinisikan aturan untuk setiap langkah dan dependensinya secara otomatis.
Suatu file BAM yang dihasilkan dari pemetaan reads perlu diurutkan (sorted) sebelum analisis lebih lanjut, karena:
File BAM yang diurutkan berdasarkan posisi genom memungkinkan akses acak yang lebih efisien sehingga mempercepat visualisasi dan analisis seperti pemanggilan varian.
Dalam pemrograman R menggunakan ggplot2, fungsi untuk membuat plot sebar (scatter plot) dari data ekspresi gen adalah:
geom_point() digunakan untuk membuat scatter plot yang menampilkan titik-titik data pada sumbu x dan y, cocok untuk visualisasi data ekspresi gen.
Laporan analisis bioinformatika yang reproducible sebaiknya menggunakan format berikut, kecuali:
Dokumen Word hasil copy-paste terminal tidak menyertakan kode dan data mentah, sehingga tidak dapat direproduksi secara otomatis.
Visualisasi heatmap dalam analisis transkriptomik berguna untuk:
Heatmap menampilkan matriks nilai ekspresi gen dengan gradasi warna, sehingga pola ekspresi gen antar sampel atau kondisi dapat diamati secara visual.
Bioinformatika membantu farmakogenomik dengan cara:
Farmakogenomik memanfaatkan data genetik individu untuk menyesuaikan terapi obat, dan bioinformatika berperan dalam mengidentifikasi dan menganalisis varian yang memengaruhi respons obat.
Dalam identifikasi gen penyakit melalui genomik medis, langkah awal yang dilakukan adalah:
Identifikasi gen penyakit dimulai dengan mendeteksi varian genetik pada pasien dengan membandingkan sekuens genomnya terhadap genom referensi.
Pelacakan penyakit infeksi menggunakan bioinformatika sering dilakukan dengan analisis filogenetik untuk:
Analisis filogenetik membandingkan sekuens patogen dari berbagai lokasi dan waktu sehingga dapat merekonstruksi hubungan evolusi dan rute penyebarannya.
Dalam pemuliaan tanaman berbasis molekuler, bioinformatika digunakan untuk:
Bioinformatika membantu menganalisis data genom untuk menemukan marka SNP atau gen yang berkorelasi dengan sifat seperti ketahanan penyakit atau hasil panen tinggi.
Metagenomik lingkungan diterapkan untuk:
Metagenomik mengekstrak dan mensekuensing DNA total dari sampel lingkungan (tanah, air) tanpa perlu mengkultur, sehingga dapat mengungkap keragaman mikroba secara komprehensif.
Bioinformatika mendukung konservasi keanekaragaman hayati melalui:
DNA barcode menggunakan sekuens gen pendek untuk mengidentifikasi spesies secara akurat, membantu inventarisasi dan pemantauan keanekaragaman hayati.
Penerapan machine learning dalam bioinformatika yang tepat adalah:
Machine learning seperti jaringan saraf tiruan dapat mempelajari pola dari data sekuens untuk memprediksi fungsi protein atau struktur sekunder secara otomatis.
Single-cell sequencing memberikan keuntungan utama berupa:
Single-cell sequencing memungkinkan analisis ekspresi gen pada level sel tunggal, mengungkap perbedaan antar sel yang tidak terlihat pada data massal.
Bioinformatika dan biologi sintetis saling terkait dalam hal:
Biologi sintetis merekayasa sistem biologis baru, dan bioinformatika menyediakan alat untuk merancang serta mensimulasikan sirkuit genetik sebelum diimplementasikan.
Soal BLAST dan multiple sequence alignment di Modul 3 sering bikin pusing karena algoritmanya butuh logika berlapis. Padahal di UAS, soal kayak gitu yang paling sering muncul sebagai pembeda antara nilai B dan A. Banyak yang hafal cara pakai ClustalW, tapi pas disuruh jelasin matriks substitusi langsung blank. Kalau masih ragu sama jawabanmu, cobain dulu anotasi ulang dari sekuens yang paling sederhana.
Format UO di STBI4004 Buku Bioinformatika biasanya menyuruh kamu menelusuri data dari NCBI lalu menganalisis hasilnya, jadi paham alurnya lebih penting daripada hafalan. Ada banyak kumpulan soal UAS UT lain kalau kamu mau tambah latihan di modul yang masih terasa asing. Poin besar juga sering ada di prediksi struktur protein dan docking molekuler di Modul 6, jadi jangan dilewatkan begitu saja.




