1. Pendahuluan

Aplikasi ini dibuat menggunakan framework Shiny di R untuk melakukan analisis regresi linier terhadap dataset yang diunggah pengguna. Tujuannya adalah untuk membantu memprediksi nilai variabel target (Y) berdasarkan satu atau beberapa variabel independen (X).

1.1 Latar Belakang

Aplikasi web R Shiny ini dikembangkan untuk membantu analis data dalam melakukan analisis regresi terhadap dataset yang diunggah. Aplikasi ini bersifat generik dan dapat digunakan untuk berbagai jenis dataset dengan struktur kolom yang berbeda.

1.2 Tujuan

Tujuan dari aplikasi ini adalah: - Melakukan eksplorasi data awal (preview dan statistik deskriptif) - Menampilkan korelasi antar variabel numerik - Melakukan eksplorasi scatter plot interaktif - Melatih model regresi linier - Menyimpan dan memuat model - Memprediksi nilai baru dari data testing

2. Desain Aplikasi

Aplikasi terdiri dari dua bagian utama: - UI (User Interface): Menyediakan tampilan antarmuka pengguna. - Server: Mengelola logika backend, seperti pembacaan data, pelatihan model, visualisasi, dan prediksi.

2.1 Struktur Aplikasi

Aplikasi R Shiny ini terdiri dari 5 tab utama:

Tab 1: Data Preview

  • Fungsi: Menampilkan preview dataset dan ringkasan statistik
  • Komponen:
    • File input untuk upload dataset
    • Data table untuk preview data
    • Summary statistics table
    • Informasi dimensi dataset

Tab 2: Correlation Matrix

  • Fungsi: Menghitung dan menampilkan korelasi antar variabel numerik
  • Komponen:
    • Matriks korelasi dalam bentuk tabel
    • Heatmap korelasi menggunakan ggplot2
    • Filter untuk variabel numerik

Tab 3: Exploratory Analysis

  • Fungsi: Membuat scatter plot dari dua variabel yang dipilih user
  • Komponen:
    • Dropdown untuk memilih variabel X dan Y
    • Scatter plot dengan gradasi warna berdasarkan variabel target
    • Opsi untuk menambahkan garis regresi

Tab 4: Model Regresi

  • Fungsi: Membangun model regresi linier
  • Komponen:
    • Input untuk memilih variabel prediktor dan target
    • Ringkasan model (summary dan glance)
    • Plot Actual vs Predicted
    • Tombol untuk menyimpan model

Tab 5: Prediksi Data Baru

  • Fungsi: Memprediksi nilai Y dari dataset baru
  • Komponen:
    • Upload file testing data
    • Load model yang tersimpan
    • Hasil prediksi dalam bentuk tabel dan plot

2.2 Alur Kerja Aplikasi

Alur Kerja Aplikasi

3. Fungsionalitas Khusus

3.1 Generik untuk Berbagai Dataset

  • Aplikasi dapat membaca file CSV dengan struktur kolom yang berbeda
  • Otomatis mendeteksi tipe data (numerik, kategorikal)
  • Validasi input untuk memastikan kompatibilitas

3.2 Penyimpanan dan Pemuatan Model

  • Model dapat disimpan menggunakan saveRDS()
  • Model dapat dimuat kembali menggunakan readRDS()
  • Validasi model sebelum prediksi

3.3 Validasi Data

  • Pengecekan data kosong atau missing values
  • Validasi format input
  • Pesan error yang informatif

4. Dataset yang Digunakan

4.1 Dataset A: Prediksi Harga Rumah

Dataset buatan untuk prediksi harga rumah dengan variabel: - Luas_tanah: Luas tanah tempat rumah tersebut (meter persegi) - kamar_: Jumlah kamar pada rumah (1-5) -Jarak_dari_pusat_kota: jarak rumah dari pusat kota (Kilometer5) -harga`: Harga Rumah (rupiah) - variabel target

4.2 Dataset B: Prediksi Pemakaian Minyak Untuk Pemanas

Dataset untuk analisis pemakaian minya dengan variabel: - Avg_Age: usia pemakai (Tahun) - Heating_Oil: Jumlah banyaknya minyak pemanas(liter) - Home_size: Ukuran rumah pengguna (Satuan Ukuran rumah pada perumahan)

5. Library yang Digunakan

library(shiny)           # Untuk membuat aplikasi web interaktif
library(tidyverse)       # Untuk manipulasi data dan visualisasi
library(DT)              # Menampilkan tabel interaktif
library(ggplot2)         # Grafik visualisasi
library(corrplot)        # Visualisasi korelasi variabel
library(shinythemes)     # Tema tampilan aplikasi
library(broom)           # Ringkasan hasil model
library(readr)           # Membaca file CSV

6. Kesimpulan

Aplikasi R Shiny ini menyediakan solusi komprehensif untuk analisis regresi dengan fitur-fitur: - Interface yang user-friendly - Eksplorasi data yang mendalam - Model regresi yang dapat disimpan dan dimuat ulang - Prediksi data baru yang akurat - Validasi input yang robust

Aplikasi ini dapat digunakan untuk berbagai domain analisis data dan dapat dengan mudah disesuaikan untuk kebutuhan spesifik.


Cara Menjalankan Aplikasi

  1. Install packages yang diperlukan
  2. Simpan file app.R dalam folder project
  3. Siapkan dataset training dan testing dalam format CSV
  4. Jalankan aplikasi dengan shiny::runApp()
# Jalankan aplikasi
shiny::runApp()