BAB 2 : KONSEP DAN KARAKTERISTIK BIG DATA
A. DASAR TEORI
1. Konsep Dasar Big Data
Big Data bukan sekadar persoalan ukuran fisik data yang mencapai Terabyte (TB), melainkan sebuah entitas informasi yang menuntut ekosistem penanganan khusus. Metode basis data tradisional (seperti RDBMS) tidak lagi mampu menangkap, menyimpan, dan menganalisis aliran informasi ini dalam batas waktu yang ditoleransi oleh bisnis. Pemahaman konsep ini mencegah organisasi dari inefisiensi investasi infrastruktur yang tidak perlu.2. Karakteristik 5V dalam Big Data
Kerangka kerja Big Data berevolusi dari 3V menjadi 5 pilar utama (5V) yang bertindak sebagai parameter pengujian. Penguasaan 5V bertujuan melatih kemampuan diagnostik mahasiswa untuk Exploratory Data Analysis (EDA) serta mendukung pengambilan keputusan arsitektural yang efisien.3. Volume (Kapasitas)
Merujuk pada besaran fisik data digital. Penanganannya terbagi dalam dua kategori utama:• Kumpulan Data Kecil Terakumulasi: Data berukuran Kilobyte (KB) yang diproduksi massal dan terus-menerus, seperti teks media sosial dan sensor IoT.
• File Tunggal Raksasa: File berukuran luar biasa besar yang membutuhkan pendekatan High Performance Computing (HPC) dengan metode pemecahan data (chunking) agar tidak menyebabkan kegagalan sistem.
4. Velocity (Kecepatan)
Merujuk pada laju produksi, transmisi, dan pemrosesan data. Strategi pemrosesannya meliputi:- Real-time Processing: Pemrosesan instan (milidetik) untuk memonitor kondisi aktual, mutlak diperlukan untuk sistem kritis seperti Autonomous Car dan peringatan dini bencana (EWS).
• Batch Processing: Pemrosesan secara kolektif berdasar antrean atau interval waktu, cocok untuk analisis historis seperti laporan harian kasus COVID-19.
5. Variety (Keragaman)
Big Data dirancang untuk menangani variasi format secara inklusif: terstruktur (tabel), semi-terstruktur (XML/JSON), hingga tidak terstruktur (gambar, audio, teks bebas). Ekosistem ini berpegang pada prinsip keterbukaan (Openness), di mana data dari berbagai sumber dapat digabungkan (misalnya piksel gambar dengan angka sensor Smartwatch) selama kontennya dapat diekstraksi.6. Veracity (Integritas dan Kebenaran)
Menekankan pada akurasi, etika digital, dan kepatuhan prosedural dalam mengakses data. Data digital memiliki tiga kategori ketersediaan: • Terbuka (Open Data): Bebas digunakan (contoh: portal Satu Data Indonesia atau Kaggle).
• Izin (Permission-Based): Membutuhkan persetujuan formal atau API resmi.
• Rahasia (Confidential): Sangat privat dan dilindungi undang-undang (contoh: rekam medis).
7. Value (Nilai Guna)
Merupakan tujuan akhir analitik, di mana data diolah untuk menghasilkan manfaat nyata. Value mencakup:• Predictive Value: Pemanfaatan rekam jejak digital untuk memprediksi preferensi belanja (e- commerce) atau mengantisipasi risiko keamanan.
• Orchestrated Value: Nilai eksponensial yang muncul ketika berbagai data saling dihubungkan (seperti simfoni musik), memungkinkan terjadinya koneksi sosial atau pemberdayaan pasar UMKM.
8. Perluasan Konsep (Beyond 5V)
Untuk menangani kompleksitas modern, konsep Big Data diperluas dengan karakteristik tambahan:• Visualization: Menerjemahkan data menjadi antarmuka grafis (dashboard) yang mudah dicerna oleh pimpinan.
• Variability: Dinamika dan inkonsistensi arus serta makna data (misalnya sentimen kata yang berubah akibat konteks waktu).
• Volatility: Berkaitan dengan usia validitas data, yang menuntut organisasi memiliki kebijakan retensi (data retention policy) agar sistem tetap efisien.
LATIHAN & TUGAS : https://docs.google.com/document/d/14H3xZW6KGrnezAQ6Oy1Y9-Adcu9juED_/edit?usp=sharing&ouid=115763195417598919926&rtpof=true&sd=true
Komentar
Posting Komentar