Banyak yang udah belajar regresi linear sederhana di Modul 1, eh pas latihan soal malah bingung bedain estimasi titik sama confidence interval SATS4312 Model Linear Terapan. Modul 1 dan Modul 2 tentang analisis residual sering bikin kepala pusing karena konsepnya saling sambung. Tenang, kamu nggak sendirian. Referensi soal UT di sini sengaja kami susun dari tiap kegiatan belajar biar kamu makin paham beda mana yang harus dihitung manual dan mana yang pakai output.
Soal UAS UT Sains Data ini fokus ke bagian yang paling sering keluar di ujian, termasuk inferensi simultan di Modul 3 dan regresi dengan variabel indikator di Modul 7. Dua modul itu kelihatannya terpisah, tapi logika pengujiannya nyambung banget. Jadi jangan dilewatin ya. Soal UAS UT di halaman ini ngebantu kamu ngelatih cara baca output regresi dengan pendekatan matriks dari Modul 4.
Soal UAS Universitas Terbuka untuk matkul ini mencakup dari transformasi data di KB 2 Modul 2 sampai multikolinearitas di Modul 8. Setiap soal di bawah lengkap dengan kunci jawaban dan pembahasan, bukan sekadar hasil akhir. Pembahasannya ngajak kamu ngikutin langkah demi langkah biar ngerti why di balik setiap perhitungan. Coba kerjakan sambil buka modul, hasilnya pasti beda.
Soal UT SATS4312 Model Linear Terapan
Dalam analisis regresi linear sederhana, variabel yang mempengaruhi variabel lain disebut sebagai variabel …
Dalam regresi linear sederhana, variabel yang mempengaruhi disebut variabel independen atau bebas, sedangkan variabel yang dipengaruhi disebut variabel dependen atau respons.
Jika dalam regresi linear sederhana diketahui koefisien regresi b0 = 5 dan b1 = 2, maka nilai dugaan Y untuk X = 3 adalah …
Persamaan regresi: Y = b0 + b1 X = 5 + 2(3) = 5 + 6 = 11.
Metode yang digunakan untuk menduga parameter regresi linear sederhana agar jumlah kuadrat residual minimum adalah …
Metode kuadrat terkecil meminimumkan jumlah kuadrat residual antara nilai observasi dan nilai dugaan.
Dalam persamaan regresi linear sederhana Y = b0 + b1 X, b1 disebut sebagai …
b1 adalah koefisien regresi yang menunjukkan perubahan Y akibat setiap perubahan satu satuan X.
Jika nilai koefisien korelasi antara X dan Y adalah 0,9, maka hubungan antara X dan Y bersifat …
Nilai 0,9 mendekati 1 menunjukkan hubungan positif yang kuat antara X dan Y.
Pada regresi linear sederhana, asumsi yang menyatakan bahwa varians error konstan untuk setiap nilai X disebut …
Homoskedastisitas adalah asumsi bahwa varians error sama untuk setiap nilai variabel bebas.
Dalam inferensi analisis regresi, interval kepercayaan 95% untuk koefisien regresi b1 menunjukkan bahwa …
Interval kepercayaan 95% berarti bahwa jika diulang pengambilan sampel, 95% dari interval yang dihasilkan akan mengandung nilai b1 populasi.
Uji t dalam regresi linear sederhana digunakan untuk menguji hipotesis …
Uji t menguji apakah koefisien regresi b1 berbeda signifikan dari 0, yaitu H0: b1 = 0.
Jika statistik uji t untuk b1 lebih besar dari nilai t tabel, maka keputusan yang tepat adalah …
Jika statistik uji t > t tabel, maka H0 ditolak, artinya variabel X berpengaruh signifikan terhadap Y.
Derajat bebas untuk galat dalam regresi linear sederhana dengan n observasi adalah …
Pada regresi linear sederhana, derajat bebas galat adalah n-2 karena ada dua parameter yang diduga (b0 dan b1).
Jika nilai p-value uji t untuk b1 adalah 0,03 dan taraf signifikansi alfa = 0,05, maka …
Karena p-value 0,03 < 0,05, maka H0 ditolak, artinya b1 signifikan secara statistik.
Interval kepercayaan untuk respons rata-rata pada X tertentu umumnya … dibandingkan interval prediksi untuk individu baru.
Interval kepercayaan untuk rata-rata lebih sempit karena kesalahan menduga rata-rata lebih kecil daripada memprediksi individu baru.
Residual dalam analisis regresi didefinisikan sebagai …
Residual adalah selisih antara nilai observasi dan nilai dugaan dari model regresi.
Uji F untuk kekurangsesuaian model digunakan untuk memeriksa apakah …
Uji F untuk kekurangsesuaian menguji apakah model regresi linear yang dipilih sesuai dengan data atau perlu model yang lebih kompleks.
Jika plot residual menunjukkan pola melengkung, maka kemungkinan asumsi yang dilanggar adalah …
Pola melengkung pada residual mengindikasikan hubungan non-linear, sehingga asumsi linearitas tidak terpenuhi.
Transformasi yang tepat jika varians residual meningkat seiring nilai Y dugaan adalah …
Jika varians tidak konstan, transformasi logaritma pada Y sering digunakan untuk menstabilkan varians.
Jika titik-titik pada plot residual membentuk pola corong melebar, maka asumsi yang dilanggar adalah …
Pola corong melebar menunjukkan varians residual tidak konstan atau heteroskedastisitas.
Dalam analisis residual untuk regresi linear sederhana, jika plot residual terhadap nilai prediksi menunjukkan pola menyebar secara acak di sekitar nol, maka hal ini mengindikasikan bahwa asumsi berikut terpenuhi, kecuali:
Plot residual yang menyebar acak di sekitar nol mengindikasikan homoskedastisitas, independensi, dan linearitas, tetapi tidak secara langsung mengindikasikan kenormalan residual yang dicek melalui histogram atau Q-Q plot.
Transformasi Box-Cox digunakan untuk mengatasi masalah apa dalam analisis regresi?
Transformasi Box-Cox bertujuan menstabilkan varians residual sehingga mengatasi heteroskedastisitas.
Jika data regresi menunjukkan hubungan nonlinear antara variabel bebas dan respons, transformasi yang tepat untuk variabel respons adalah:
Transformasi logaritma natural sering digunakan untuk meluruskan hubungan nonlinear, terutama saat varians respons meningkat seiring nilai prediktor.
Dalam transformasi variabel bebas untuk mengatasi nonlinearitas, metode yang paling umum adalah:
Transformasi logaritma pada variabel bebas dapat membantu meluruskan hubungan nonlinear.
Transformasi mana yang paling sesuai jika residual menunjukkan pola funnel (melebar) pada plot residual versus nilai prediksi?
Pola funnel menandakan heteroskedastisitas, dan transformasi akar kuadrat pada variabel respons sering menstabilkan varians.
Saat melakukan transformasi Box-Cox, parameter lambda dipilih untuk memaksimalkan:
Metode Box-Cox memilih lambda yang memaksimalkan log-likelihood dari model transformasi.
Transformasi logaritma pada variabel respons sangat berguna ketika data respons:
Transformasi log menggunakan logaritma natural hanya untuk variabel respons positif dan sering diterapkan pada data lognormal.
Dalam inferensi simultan regresi linear sederhana, interval Bonferroni digunakan untuk:
Interval Bonferroni memberikan interval kepercayaan simultan untuk beberapa parameter dengan mengontrol tingkat kesalahan keluarga.
Metode Scheffe dalam inferensi simultan digunakan ketika ingin menguji:
Metode Scheffe memungkinkan pengujian semua kontras linear parameter secara simultan.
Jika ingin membangun interval kepercayaan simultan untuk dua koefisien regresi dengan tingkat kepercayaan keluarga 95% menggunakan metode Bonferroni, tingkat kepercayaan individual yang digunakan adalah:
Untuk dua interval, tingkat kepercayaan individual = 1 – (0,05/2) = 0,975 atau 97,5%.
Interval kerja (working-hotelling) dalam regresi linear sederhana digunakan untuk:
Interval kerja (working-hotelling) memberikan pita kepercayaan simultan untuk mean respons di seluruh rentang X.
Perbedaan utama antara interval kepercayaan simultan Bonferroni dan Scheffe adalah:
Bonferroni cocok untuk sejumlah kecil kontras yang direncanakan, sedangkan Scheffe untuk semua kontras.
Dalam regresi linear sederhana, interval kepercayaan simultan untuk mean respons pada titik X0 tertentu diperoleh dengan metode:
Interval kerja (working-hotelling) menyediakan interval kepercayaan simultan untuk mean respons di semua nilai X termasuk X0.
Salah satu topik dalam analisis regresi adalah deteksi outlier. Metode yang umum digunakan untuk mengidentifikasi outlier adalah:
Jarak Cook mengukur pengaruh suatu observasi terhadap koefisien regresi dan umum digunakan untuk mendeteksi outlier berpengaruh.
Nilai leverage dalam regresi mengukur:
Leverage mengukur jarak suatu observasi dari rata-rata variabel bebas, dengan nilai tinggi menunjukkan observasi ekstrem dalam ruang prediktor.
Ketika residual studentized memiliki nilai absolut lebih besar dari 3, indikasi yang muncul adalah:
Residual studentized di atas 3 secara umum dianggap sebagai outlier karena melebihi rentang normal distribusi t.
Metode stepwise dalam pemilihan variabel termasuk dalam topik:
Pemilihan model regresi terbaik menggunakan metode stepwise termasuk dalam topik pemilihan model, bukan inferensi simultan.
Dalam model regresi linear sederhana, salah satu asumsi penting adalah bahwa variabel bebas X dan galat e tidak berkorelasi. Apa yang terjadi jika asumsi ini dilanggar?
Pelanggaran asumsi bahwa X dan e tidak berkorelasi menyebabkan penduga kuadrat terkecil bias dan tidak konsisten, karena variabel bebas tidak ortogonal terhadap galat.
Dalam regresi linear sederhana, jika dilakukan pengujian hipotesis untuk koefisien regresi secara simultan, maka statistik uji yang digunakan pada dasarnya akan setara dengan uji t untuk satu koefisien. Manakah pernyataan yang benar tentang inferensi simultan?
Pada regresi linear sederhana, uji F untuk signifikansi model sama dengan kuadrat dari uji t untuk koefisien regresi, sehingga keduanya setara.
Diketahui matriks A = [[2, 1], [3, 4]]. Berapakah hasil penjumlahan matriks A dengan matriks identitas 2×2?
Matriks identitas 2×2 adalah I = [[1, 0], [0, 1]]. Penjumlahan A + I = [[2+1, 1+0], [3+0, 4+1]] = [[3, 1], [3, 5]].
Diketahui matriks B = [[1, -2], [0, 3]]. Berapakah hasil perkalian matriks B dengan vektor kolom v = [2, 1]^T?
Perkalian B v = [[1*2 + (-2)*1], [0*2 + 3*1]] = [2 – 2, 0 + 3] = [0, 3]^T.
Matriks C = [[4, 2], [1, 3]]. Berapakah determinan dari matriks C?
Determinan matriks 2×2 dihitung sebagai ad – bc. Di sini a=4, b=2, c=1, d=3, sehingga det(C) = 4*3 – 2*1 = 12 – 2 = 10.
Jika matriks D = [[1, 2], [3, 4]], maka berapakah trace dari matriks D?
Trace matriks adalah jumlah elemen diagonal utama. Di sini, trace(D) = 1 + 4 = 5.
Diberikan matriks E = [[2, 1], [5, 3]]. Berapakah invers dari matriks E?
Invers matriks 2×2 adalah 1/det(E) * [[d, -b], [-c, a]]. det(E) = 2*3 – 1*5 = 6 – 5 = 1. Maka inversnya = [[3, -1], [-5, 2]].
Matriks F = [[1, 0, 2], [0, 3, 1], [2, 1, 0]]. Berapakah hasil dari perkalian matriks F dengan matriks identitas 3×3?
Perkalian matriks dengan matriks identitas menghasilkan matriks itu sendiri, karena matriks identitas adalah elemen netral dalam perkalian matriks.
Dalam model regresi linear sederhana dinyatakan dalam bentuk matriks sebagai Y = X * b + e, di mana Y adalah vektor respons. Berapakah dimensi dari vektor Y jika terdapat n observasi?
Dalam model regresi linear, Y adalah vektor kolom berukuran n x 1, karena setiap observasi menghasilkan satu nilai respons.
Diketahui model regresi linear sederhana Y = X * b + e dengan X = [[1, x1], [1, x2], [1, x3]] dan b = [b0, b1]^T. Berapakah produk matriks X * b?
Perkalian matriks X (3×2) dengan b (2×1) menghasilkan vektor kolom 3×1 dengan elemen b0 + b1*xi untuk setiap baris i.
Dalam regresi linear sederhana dalam bentuk matriks, penduga b = (X^T * X)^{-1} * X^T * Y. Jika X = [[1, 1], [1, 2], [1, 3]] dan Y = [2, 3, 5]^T, berapakah nilai dari X^T * X?
X^T adalah matriks 2×3. X^T * X = jumlah kuadrat dan cross product. Elemen (1,1) = 3, (1,2) = 1+2+3=6, (2,1)=6, (2,2)=1^2+2^2+3^2=1+4+9=14.
Dalam model regresi linear sederhana bentuk matriks, matriks H = X * (X^T * X)^{-1} * X^T disebut matriks topi. Berapakah trace dari matriks H jika X berisi 4 observasi dan 2 parameter?
Trace dari matriks topi H sama dengan jumlah parameter dalam model. Dalam regresi linear sederhana, ada 2 parameter (b0 dan b1), sehingga trace(H) = 2.
Pada model regresi linear sederhana dalam bentuk matriks, penduga varians galat s^2 dihitung dengan rumus s^2 = e^T * e / (n – p). Jika e = [1, -2, 1]^T, n=3, dan p=2, berapakah s^2?
e^T * e = 1^2 + (-2)^2 + 1^2 = 1 + 4 + 1 = 6. n – p = 3 – 2 = 1. Maka s^2 = 6 / 1 = 6.
Dalam regresi ganda, bentuk matriks modelnya adalah Y = X * b + e. Jika X adalah matriks desain berukuran n x k, berapakah ukuran vektor b?
Dalam regresi ganda, b adalah vektor parameter berukuran k x 1, di mana k adalah jumlah parameter (termasuk intersep).
Dalam regresi ganda, diinginkan untuk menguji hipotesis H0: b1 = b2 = 0. Uji hipotesis ini dapat dilakukan dengan uji F. Manakah pernyataan yang benar tentang uji F dalam konteks ini?
Uji F dalam regresi ganda digunakan untuk membandingkan model penuh dengan model reduksi (tanpa variabel yang diuji) untuk melihat apakah penambahan variabel signifikan.
Dalam regresi ganda, koefisien determinasi parsial mengukur kontribusi suatu variabel bebas terhadap variasi Y setelah memperhitungkan variabel lain. Jika dalam model dengan dua variabel bebas, koefisien determinasi parsial untuk X1 adalah 0.25, apa interpretasinya?
Koefisien determinasi parsial mengukur proporsi variasi Y yang dijelaskan oleh suatu variabel bebas setelah variabel bebas lain sudah dimasukkan dalam model.
Dalam regresi ganda, diketahui matriks X berukuran 10×3 termasuk intersep. Berapakah derajat bebas untuk sisaan (error) dalam model regresi ganda ini?
Derajat bebas untuk sisaan adalah n – k, di mana n adalah jumlah observasi dan k adalah jumlah parameter. Di sini n=10, k=3, sehingga derajat bebas = 10 – 3 = 7.
Dalam model regresi ganda Y = Xβ + ε, jika dirumuskan dalam bentuk matriks, penduga kuadrat terkecil dari β adalah:
Penduga kuadrat terkecil β diperoleh dengan menyelesaikan persamaan normal yang menghasilkan rumus b = (X'X)^{-1} X'Y.
Manakah berikut yang merupakan asumsi dasar model regresi ganda dalam bentuk matriks?
Salah satu asumsi regresi ganda adalah varian error konstan dan tidak berkorelasi, ditulis Var(ε) = σ^2 I.
Jika dalam regresi ganda dengan dua variabel bebas diperoleh matriks X berukuran n x 3, apa arti dari elemen baris pertama kolom pertama matriks X?
Dalam matriks X, kolom pertama biasanya diisi angka 1 untuk merepresentasikan intersep dalam model.
Uji F dalam regresi ganda digunakan untuk menguji hipotesis:
Uji F secara simultan menguji apakah semua koefisien regresi (kecuali intersep) bernilai nol.
Dalam uji parsial (uji t) pada regresi ganda, statistik uji untuk menguji β_j = 0 adalah:
Uji t parsial menggunakan rasio antara koefisien estimasi dengan galat bakunya, yaitu t = b_j / SE(b_j).
Koefisien determinasi R^2 pada regresi ganda memiliki rentang nilai:
Nilai R^2 berkisar dari 0 hingga 1, di mana 0 berarti tidak ada variasi respons yang dijelaskan dan 1 berarti semua variasi dijelaskan.
Koefisien determinasi parsial mengukur:
Koefisien determinasi parsial menunjukkan sumbangan unik suatu variabel bebas setelah mengontrol variabel lain.
Dalam regresi ganda, jika R^2 = 0,85, maka artinya:
R^2 mengukur proporsi variasi variabel respons yang dapat dijelaskan oleh variabel bebas dalam model.
Uji F parsial untuk menguji kontribusi tambahan satu variabel bebas menggunakan perbandingan:
Uji F parsial membandingkan jumlah kuadrat residual antara model tanpa variabel tersebut (reduksi) dan model dengan variabel tersebut (penuh).
Hipotesis dalam uji koefisien determinasi parsial adalah:
Koefisien determinasi parsial menguji signifikansi satu variabel bebas setelah variabel lain sudah masuk model.
Model regresi polinom derajat dua dengan satu variabel bebas ditulis sebagai:
Regresi polinom derajat dua memiliki suku linear dan kuadratik yaitu β_1 X dan β_2 X^2.
Jika data menunjukkan hubungan lengkung (curvilinear), model yang tepat adalah:
Hubungan lengkung dapat dimodelkan dengan regresi polinom yang memasukkan pangkat variabel bebas.
Pada regresi polinom dengan dua variabel bebas X1 dan X2, model derajat dua mencakup:
Model polinom derajat dua dengan dua variabel bebas meliputi suku linear, kuadratik, dan interaksi.
Salah satu keuntungan menggunakan polinom orthogonal adalah:
Polinom orthogonal membuat suku-suku polinom tidak berkorelasi sehingga mengurangi masalah multikolinearitas.
Jika respons optimal diinginkan sebagai titik maksimum atau minimum, maka digunakan:
Regresi polinom derajat dua dapat digunakan untuk menentukan titik optimal (maksimum atau minimum) dari respons.
Dalam polinom orthogonal, koefisien regresi dihitung dengan menggunakan:
Karena suku-suku orthogonal tidak berkorelasi, matriks X'X menjadi diagonal sehingga perhitungan koefisien lebih stabil.
Kondisi respons optimal dari regresi polinom derajat dua diperoleh dengan:
Titik optimal (maksimum atau minimum) didapat dari turunan pertama persamaan regresi polinom yang disamakan dengan nol.
Dalam regresi polinom, untuk menentukan kondisi respons optimal biasanya digunakan polinom orthogonal. Apa keuntungan utama penggunaan polinom orthogonal dalam analisis regresi?
Polinom orthogonal mengurangi korelasi antar suku polinom sehingga multikolinearitas dapat dihindari.
Dalam menentukan kondisi respons optimal pada regresi polinom, langkah pertama yang dilakukan adalah?
Respons optimal diperoleh dengan menurunkan fungsi regresi terhadap variabel bebas dan menyamakannya dengan nol.
Dalam regresi linear dengan variabel indikator, variabel indikator digunakan untuk?
Variabel indikator digunakan untuk merepresentasikan variabel kategorik dalam model regresi.
Jika suatu model regresi memiliki satu variabel indikator dengan dua kategori, maka berapa jumlah variabel indikator yang perlu dimasukkan ke dalam model?
Untuk variabel kategorik dengan dua kategori, cukup satu variabel indikator untuk membedakan kedua kategori.
Interpretasi koefisien regresi pada variabel indikator dalam model regresi linear adalah?
Koefisien variabel indikator menunjukkan perbedaan rata-rata respons antara kategori tersebut dengan kategori referensi.
Dalam uji signifikansi variabel indikator, hipotesis nol yang diuji adalah?
Hipotesis nol menguji apakah koefisien variabel indikator bernilai nol, artinya tidak ada perbedaan antar kategori.
Jika dalam model regresi terdapat tiga kategori, berapa variabel indikator yang harus dibuat?
Untuk tiga kategori, diperlukan dua variabel indikator karena satu kategori dijadikan referensi.
Model regresi dengan variabel respons indikator digunakan ketika?
Model ini digunakan ketika variabel respons hanya memiliki dua kemungkinan nilai, seperti ya atau tidak.
Dalam model regresi logistik, transformasi yang digunakan untuk menghubungkan variabel respons biner dengan prediktor adalah?
Fungsi logit digunakan untuk mentransformasi probabilitas menjadi skala linear.
Interpretasi odds ratio dalam regresi logistik untuk variabel indikator adalah?
Odds ratio menunjukkan seberapa besar kemungkinan terjadinya respons pada kategori indikator dibanding referensi.
Untuk menguji signifikansi keseluruhan model dalam regresi logistik, statistik uji yang digunakan adalah?
Uji G membandingkan model penuh dengan model tanpa variabel prediktor.
Dalam regresi logistik, metode estimasi parameter yang paling umum adalah?
Maximum likelihood digunakan karena variabel respons bersifat biner.
Multikolinearitas dalam regresi ganda dapat menyebabkan?
Multikolinearitas meningkatkan variansi koefisien, sehingga estimasi menjadi tidak stabil.
Salah satu cara mendeteksi multikolinearitas adalah dengan melihat?
VIF digunakan untuk mengukur seberapa besar multikolinearitas meningkatkan variansi koefisien.
Jika nilai VIF suatu variabel prediktor lebih besar dari 10, maka dapat disimpulkan?
VIF lebih dari 10 mengindikasikan multikolinearitas yang tinggi.
Salah satu solusi untuk mengatasi multikolinearitas adalah?
Menghilangkan variabel yang berkorelasi tinggi mengurangi multikolinearitas.
Dalam analisis regresi, kondisi multikolinearitas terjadi ketika terdapat hubungan linear yang kuat antara…
Multikolinearitas adalah kondisi ketika dua atau lebih variabel bebas dalam model regresi memiliki korelasi linear yang tinggi. Hal ini dapat menyebabkan estimasi koefisien regresi menjadi tidak stabil dan sulit diinterpretasi.
Salah satu metode untuk mendeteksi autokorelasi dalam regresi linear adalah dengan menggunakan statistik…
Uji Durbin-Watson adalah metode yang umum digunakan untuk mendeteksi adanya autokorelasi pada residual dalam analisis regresi. Statistik Durbin-Watson berkisar antara 0 sampai 4.
Dalam uji autokorelasi, jika nilai statistik Durbin-Watson mendekati 0, maka dapat disimpulkan bahwa terdapat autokorelasi…
Nilai Durbin-Watson mendekati 0 mengindikasikan adanya autokorelasi positif yang sempurna. Nilai mendekati 4 menunjukkan autokorelasi negatif sempurna, sedangkan nilai mendekati 2 menunjukkan tidak ada autokorelasi.
Autokorelasi paling sering terjadi pada data yang bersifat…
Autokorelasi adalah korelasi antara residual pada periode waktu yang berurutan, sehingga masalah ini paling sering muncul pada data time series (deret waktu) karena observasi diurutkan berdasarkan waktu.
Salah satu akibat dari adanya autokorelasi dalam model regresi adalah estimasi koefisien regresi menjadi…
Autokorelasi menyebabkan estimator Ordinary Least Squares (OLS) tetap tidak bias dan konsisten, tetapi tidak lagi efisien karena varians estimator menjadi lebih besar dari seharusnya, sehingga uji signifikansi menjadi tidak valid.
Jika dalam uji Durbin-Watson nilai d hitung lebih besar dari dU dan kurang dari 4 dikurangi dU, maka keputusan yang diambil adalah…
Daerah tidak ada autokorelasi dalam uji Durbin-Watson adalah ketika dU < d < 4-dU. Jika d berada dalam rentang tersebut, maka H0 yang menyatakan tidak ada autokorelasi gagal ditolak.
Metode yang digunakan untuk memilih model regresi terbaik dari semua kemungkinan kombinasi variabel bebas disebut…
Metode semua regresi yang mungkin (all possible regression) adalah prosedur yang mengevaluasi semua kombinasi variabel bebas yang mungkin untuk memilih model terbaik berdasarkan kriteria tertentu seperti R^2, R^2 yang disesuaikan, atau Cp Mallows.
Salah satu kriteria yang sering digunakan dalam metode semua regresi yang mungkin untuk membandingkan model dengan jumlah variabel berbeda adalah…
R^2 yang disesuaikan (adjusted R^2) memberikan penalti terhadap penambahan variabel bebas yang tidak signifikan, sehingga lebih adil untuk membandingkan model dengan jumlah variabel berbeda dibandingkan R^2 biasa.
Dalam metode semua regresi yang mungkin, kriteria Cp Mallows digunakan untuk menyeimbangkan antara…
Cp Mallows adalah kriteria yang menyeimbangkan antara bias dan varians model. Nilai Cp yang mendekati jumlah parameter (p) menunjukkan model dengan bias kecil dan varians yang terkendali.
Jika dalam semua regresi yang mungkin, model dengan 3 variabel bebas memiliki R^2 sebesar 0,85 dan R^2 yang disesuaikan sebesar 0,82, sedangkan model dengan 4 variabel bebas memiliki R^2 sebesar 0,86 dan R^2 yang disesuaikan sebesar 0,81, maka model yang lebih baik adalah…
R^2 yang disesuaikan memberikan penalti untuk variabel tambahan. Model dengan 3 variabel memiliki adjusted R^2 lebih tinggi (0,82) dibanding model dengan 4 variabel (0,81), sehingga model dengan 3 variabel lebih baik meskipun R^2 biasa lebih rendah.
Kriteria informasi Akaike (AIC) dan Bayesian (BIC) dalam semua regresi yang mungkin digunakan untuk memilih model dengan nilai…
Dalam pemilihan model, AIC dan BIC adalah kriteria yang lebih kecil lebih baik (smaller is better). Model dengan nilai AIC atau BIC terendah dianggap sebagai model terbaik karena menunjukkan keseimbangan antara goodness-of-fit dan kompleksitas model.
Dalam regresi stepwise, metode yang memulai model tanpa variabel bebas kemudian menambahkan variabel satu per satu berdasarkan signifikansinya disebut…
Forward selection adalah metode stepwise yang memulai dengan model tanpa variabel bebas (model null), kemudian menambahkan variabel satu per satu yang paling signifikan secara statistik hingga tidak ada lagi variabel signifikan yang tersisa.
Prosedur regresi stepwise yang menggabungkan forward selection dan backward elimination disebut…
Regresi stepwise standar adalah prosedur yang menggabungkan forward selection dan backward elimination. Pada setiap langkah, variabel baru ditambahkan (forward) jika signifikan, dan variabel yang sudah ada dievaluasi kembali untuk kemungkinan dihapus (backward) jika tidak lagi signifikan.
Kelemahan utama dari metode regresi stepwise adalah…
Regresi stepwise memiliki kelemahan dapat menghasilkan model yang overfitting (terlalu kompleks) atau underfitting (terlalu sederhana) karena proses seleksi variabel sangat bergantung pada urutan entry dan threshold signifikansi yang dipilih.
Dalam forward selection, kriteria yang sering digunakan untuk menentukan apakah suatu variabel layak ditambahkan ke model adalah berdasarkan nilai…
Dalam forward selection, variabel ditambahkan jika p-value dari uji signifikansi lebih kecil dari alpha yang ditentukan (misalnya 0,05). Hal ini menunjukkan bahwa variabel tersebut memberikan kontribusi signifikan terhadap model.
Jika dalam regresi stepwise dengan metode backward elimination, suatu variabel bebas dikeluarkan dari model karena tidak signifikan, maka variabel tersebut…
Dalam backward elimination murni, variabel yang telah dikeluarkan tidak dapat dimasukkan kembali ke dalam model. Berbeda dengan stepwise standar yang memungkinkan variabel yang dihapus kembali dimasukkan jika menjadi signifikan di langkah selanjutnya.
Biasanya di SATS4312, soal autokorelasi dan multikolinearitas itu jadi jebakan paling umum di UAS UTM. Rumitnya di matkul ini bukan cuma hitung matriks atau regresi ganda, tapi lebih ke pembacaan output dan interpretasi residual setelah transformasi. Kalau kamu bisa bedain kapan pakai stepwise dan kapan polynomial orthogonal, setengah jalan udah clear. Soal variabel indikator juga sering muncul tapi jarang dibahas detail di forum.
Dari pengalaman belajar mandiri di SATS4312 Model Linear Terapan, bagian analisis residual dan regresi polinom butuh latihan rutin lewat Soal UAS UT biar nggak kaget waktu ujian. Format UO biasanya narik dari beberapa modul sekaligus, misal menggabungkan regresi linear sederhana dalam bentuk matriks dengan uji F kekurangsesuaian model. Daripada baca ulang semua modul dari awal, coba langsung simulasi ngerjakan soal UO.




