Materi Ajar: Ukuran Pemusatan dan Penyebaran Data (Tunggal & Kelompok)
A. Ukuran Pemusatan Data (*Measures of Central Tendency*)
Data mentah yang dikumpulkan dari survei, sensor pabrik, atau hasil ujian siswa sering kali terlihat acak dan tidak teratur. Untuk memahami karakteristik sekelompok objek, kita memerlukan satu nilai representatif yang dapat menggambarkan pusat dari sebaran data tersebut. Nilai representatif inilah yang disebut sebagai Ukuran Pemusatan Data.
1. Mean (Rata-rata Hitung)
Mean adalah jumlah seluruh nilai data dibagi dengan banyak data. Nilai ini sangat sensitif terhadap perubahan setiap nilai individu di dalam kelompok data.
- Data Tunggal: Jika terdapat sampel data $x_1, x_2, \dots, x_N$, rata-rata sampel ($\bar{x}$) dirumuskan:
$$\bar{x} = \frac{\sum_{i=1}^{N} x_i}{N}$$
- Data Kelompok: Untuk data yang disajikan dalam bentuk tabel frekuensi berkelompok dengan titik tengah kelas interval $x_i$ dan frekuensi kelas $f_i$:
$$\bar{x} = \frac{\sum_{i=1}^{k} f_i \cdot x_i}{\sum_{i=1}^{k} f_i}$$
2. Median (Nilai Tengah)
Median adalah nilai tengah dari sekumpulan data yang telah diurutkan dari nilai terkecil hingga terbesar. Nilai ini sangat stabil karena tidak dipengaruhi oleh kemunculan data ekstrem (*outliers*).
- Data Tunggal: Jika jumlah data $N$ ganjil, median terletak pada data ke-$\frac{N+1}{2}$. Jika $N$ genap, median adalah rata-rata dari data ke-$\frac{N}{2}$ dan data ke-$(\frac{N}{2} + 1)$.
- Data Kelompok: Ditentukan dari kelas interval yang memuat kumulatif frekuensi mencapai setengah dari total sampel ($\frac{N}{2}$):
$$Me = L_k + \left(\frac{\frac{N}{2} - F}{f_k}\right) \cdot p$$
Di mana: $L_k$ adalah tepi bawah kelas median, $F$ adalah kumulatif frekuensi sebelum kelas median, $f_k$ adalah frekuensi kelas median, dan $p$ adalah panjang interval kelas.
3. Modus (Nilai Paling Sering Muncul)
Modus menyatakan nilai atau kategori yang memiliki frekuensi kemunculan tertinggi.
- Data Tunggal: Nilai yang memiliki jumlah frekuensi paling banyak.
- Data Kelompok: Dihitung dari kelas interval dengan frekuensi tertinggi ($f_o$):
$$Mo = L_o + \left(\frac{d_1}{d_1 + d_2}\right) \cdot p$$
Di mana: $L_o$ adalah tepi bawah kelas modus, $d_1$ adalah selisih frekuensi kelas modus dengan kelas sebelumnya ($f_o - f_{o-1}$), dan $d_2$ adalah selisih frekuensi kelas modus dengan kelas sesudahnya ($f_o - f_{o+1}$).
B. Ukuran Penyebaran Data (*Measures of Dispersion*)
Dua kelompok data bisa memiliki nilai rata-rata (*mean*) yang tepat sama, namun memiliki sebaran internal yang sangat jauh berbeda. Sebagai contoh, rata-rata nilai ujian dua kelas bisa sama-sama 75, namun di kelas pertama seluruh siswa mendapat nilai berkisar antara 70-80, sedangkan di kelas kedua nilainya tersebar ekstrem dari 40-100. Oleh karena itu, ukuran pemusatan harus dilengkapi dengan Ukuran Penyebaran Data untuk mengukur tingkat homogenitas data.
1. Simpangan Rata-rata (*Mean Deviation*)
Simpangan rata-rata menyatakan rata-rata dari selisih mutlak setiap nilai data terhadap rata-rata hitungnya:
- Data Tunggal:
$$SR = \frac{\sum_{i=1}^{N} |x_i - \bar{x}|}{N}$$
- Data Kelompok:
$$SR = \frac{\sum_{i=1}^{k} f_i \cdot |x_i - \bar{x}|}{\sum_{i=1}^{k} f_i}$$
2. Varians (*Variance*) dan Simpangan Baku (*Standard Deviation*)
Simpangan baku atau standar deviasi ($s$) menyatakan tingkat dispersi kuadratik sampel data terhadap rata-ratanya. Nilai simpangan baku yang semakin mendekati nol menunjukkan data yang semakin homogen.
- Data Tunggal:
$$s^2 = \frac{\sum_{i=1}^{N} (x_i - \bar{x})^2}{N - 1} \quad \text{dan} \quad s = \sqrt{\frac{\sum_{i=1}^{N} (x_i - \bar{x})^2}{N - 1}}$$
- Data Kelompok:
$$s^2 = \frac{\sum_{i=1}^{k} f_i \cdot (x_i - \bar{x})^2}{N - 1} \quad \text{dan} \quad s = \sqrt{\frac{\sum_{i=1}^{k} f_i \cdot (x_i - \bar{x})^2}{N - 1}}$$
💡 Teorema Chebyshev dan Aturan Empiris (68-95-99.7)
Dalam distribusi normal (simetris berbentuk lonceng), terdapat hubungan empiris mutlak antara simpangan baku dengan persentase sebaran populasi:
- Sekitar 68,2% data terletak di dalam interval $1$ simpangan baku dari rata-rata ($\bar{x} \pm s$).
- Sekitar 95,4% data terletak di dalam interval $2$ simpangan baku dari rata-rata ($\bar{x} \pm 2s$).
- Sekitar 99,7% data terletak di dalam interval $3$ simpangan baku dari rata-rata ($\bar{x} \pm 3s$).
Prinsip ini merupakan pilar utama dalam metode pengendalian mutu industri **Six Sigma** yang menargetkan kegagalan produksi tidak boleh lebih dari $3,4$ per sejuta unit produk.
C. Studi Kasus Kontekstual Bernilai HOTS (Higher-Order Thinking Skills)
Statistika deskriptif adalah metode evaluasi utama yang digunakan dalam sistem pengendalian kualitas industri manufaktur, kalibrasi alat-alat presisi, dan analisis kesenjangan upah sosial.
Studi Kasus 1: Quality Control (QC) Produksi Komponen Penerbangan Sipil
Deskripsi Skenario:
Sebuah pabrik komponen kedirgantaraan memproduksi pin engsel baja khusus dengan target diameter presisi $\mu = 20,00\text{ mm}$. Selama proses audit penjaminan kualitas (*Quality Assurance*), teknisi mengambil sampel acak sebanyak 10 pin dan mengukur diameternya secara presisi tinggi sebagai berikut (dalam milimeter):
$$\{20,02; \ 19,98; \ 20,01; \ 20,05; \ 19,97; \ 20,00; \ 19,99; \ 20,03; \ 19,95; \ 20,00\}$$
Batas toleransi kelayakan pin agar dapat dipasang pada pesawat adalah $\pm 0,05\text{ mm}$ dari target rata-rata ($\bar{x} \pm 2s$).
Lakukan analisis kuantitatif untuk membuktikan:
a. Nilai simpangan baku ($s$) dari diameter pin tersebut!
b. Selidiki apakah seluruh pin hasil produksi di atas layak digunakan di industri penerbangan!
Langkah 1: Menghitung Nilai Rata-rata ($\bar{x}$)
Jumlahkan kesepuluh sampel diameter pin, lalu bagi dengan banyak sampel ($N = 10$):
$$\sum x_i = 20,02 + 19,98 + 20,01 + 20,05 + 19,97 + 20,00 + 19,99 + 20,03 + 19,95 + 20,00 = 200,00\text{ mm}$$
$$\bar{x} = \frac{200,00}{10} = 20,00\text{ mm}$$
Rata-rata diameter sampel tepat berada pada nilai target $\mu = 20,00\text{ mm}$.
Langkah 2: Menghitung Nilai Varians ($s^2$) dan Simpangan Baku ($s$)
Gunakan rumus standar deviasi sampel ($N-1$ sebagai pembagi):
$$\sum (x_i - \bar{x})^2 = (0,02)^2 + (-0,02)^2 + (0,01)^2 + (0,05)^2 + (-0,03)^2 + (0)^2 + (-0,01)^2 + (0,03)^2 + (-0,05)^2 + (0)^2$$
$$\sum (x_i - \bar{x})^2 = 0,0004 + 0,0004 + 0,0001 + 0,0025 + 0,0009 + 0 + 0,0001 + 0,0009 + 0,0025 + 0 = 0,0078\text{ mm}^2$$
$$s^2 = \frac{\sum (x_i - \bar{x})^2}{N - 1} = \frac{0,0078}{9} \approx 0,000867\text{ mm}^2$$
$$s = \sqrt{0,000867} \approx 0,0294\text{ mm}$$
Langkah 3: Menentukan Batas Toleransi Kelayakan
Batas toleransi kelayakan yang ditentukan adalah $\bar{x} \pm 2s$:
$$\text{Batas Bawah} = 20,00 - 2(0,0294) = 20,00 - 0,0588 = 19,9412\text{ mm}$$
$$\text{Batas Atas} = 20,00 + 2(0,0294) = 20,00 + 0,0588 = 20,0588\text{ mm}$$
Keputusan Audit Kualitas: Dari hasil pengukuran sampel, seluruh nilai diameter pin (mulai dari nilai terkecil $19,95\text{ mm}$ hingga terbesar $20,05\text{ mm}$) berada dalam rentang toleransi kelayakan $19,9412\text{ mm}$ hingga $20,0588\text{ mm}$. Oleh karena itu, seluruh pin dalam batch produksi ini **dinyatakan lolos sensor kualitas** dan layak digunakan demi keselamatan penerbangan sipil.
D. Lembar Kerja HOTS Mandiri
Ujilah ketajaman penalaran analitis statistika, evaluasi ketimpangan upah, dan kalibrasi parameter numerik Anda dengan menyelesaikan tiga tantangan eksplorasi di bawah ini secara tuntas!
Panduan Analisis: Susun model aljabar dari data, formulasikan rata-rata gabungan atau pemetaan frekuensi yang tepat, analisis pengaruh kemunculan bias ekstrim pada struktur penyebaran data, dan berikan argumen fisis dari hasil perhitungan Anda!
-
Tantangan Kesenjangan Ekonomi - Analisis Gaji Karyawan Korporasi:
Sebuah perusahaan teknologi memiliki 98 staf biasa dengan rata-rata gaji bulanan $\text{Rp}10.000.000,00$ dan nilai tengah (median) gaji sebesar $\text{Rp}9.500.000,00$. Dalam laporan tahunan, CEO dan Wakil CEO perusahaan (2 orang) memutuskan untuk menaikkan gaji mereka sendiri secara ekstrem sehingga masing-masing menerima gaji bulanan sebesar $\text{Rp}500.000,00$.
Pertanyaan Evaluatif:
a. Hitunglah nilai rata-rata gaji bulanan seluruh personil perusahaan (100 orang) setelah kenaikan gaji kedua pimpinan tersebut!
b. Selidiki apakah nilai median gaji dari 100 personil perusahaan tersebut mengalami perubahan akibat kenaikan ekstrem upah pimpinan? Buktikan analisis Anda!
c. Berikan argumentasi kritis dari perspektif etika statistika, ukuran pemusatan manakah (mean atau median) yang lebih jujur dalam mempresentasikan kondisi kesejahteraan ekonomi karyawan perusahaan tersebut kepada publik!
-
Analisis Penyebaran Nilai Ujian Siswa dengan Koreksi Linier Sistematis:
Pada ujian matematika kelas XII, diperoleh rata-rata nilai matematika kelas tersebut adalah $\bar{x} = 55$ dengan simpangan baku $s = 12$. Karena nilai rata-rata dianggap terlalu rendah, guru memutuskan untuk melakukan transformasi perbaikan nilai menggunakan rumus linier: $y_i = 1,5x_i - 10$, di mana $x_i$ adalah nilai asli dan $y_i$ adalah nilai baru hasil perbaikan.
Pertanyaan Evaluatif:
a. Buktikan secara matematis rumus perubahan nilai rata-rata ($\bar{y}$) dan nilai simpangan baku baru ($s_y$) dari transformasi linier umum $y = ax + b$!
b. Hitunglah nilai rata-rata baru ($\bar{y}$) dan nilai simpangan baku baru ($s_y$) setelah seluruh nilai siswa dikoreksi!
c. Jika seorang siswa bernama Ahmad memiliki nilai asli $70$, selidiki apakah posisi relatif Ahmad (diukur dari standar skor $Z = \frac{x - \bar{x}}{s}$) bergeser naik, turun, atau tetap sama setelah kebijakan transformasi nilai tersebut diterapkan?
-
Tantangan Rekonstruksi Tabel Distribusi Frekuensi Kelompok yang Hilang:
Sebuah draf dokumen laporan statistik kecelakaan lalu lintas harian mengalami kerusakan sehingga sebagian data pada tabel frekuensi kelompok hilang. Data kelas interval yang tersisa adalah sebagai berikut:
| Interval Usia | Frekuensi ($f_i$) |
| 20 - 24 | 4 |
| 25 - 29 | $f_2$ (Hilang) |
| 30 - 34 | 14 |
| 35 - 39 | $f_4$ (Hilang) |
| 40 - 44 | 2 |
Petugas audit hanya mengingat bahwa total ukuran sampel ($N$) adalah tepat $40$ orang, dan nilai rata-rata hitung kelompok ($\bar{x}$) adalah sebesar $32$ tahun.
Pertanyaan Evaluatif:
a. Buatlah sistem persamaan linear dua variabel (SPLDV) dalam $f_2$ dan $f_4$ berdasarkan parameter yang diketahui di atas!
b. Tentukan nilai frekuensi yang hilang $f_2$ dan $f_4$ secara presisi!
c. Hitunglah nilai median kelompok ($Me$) dari tabel distribusi frekuensi yang telah direkonstruksi secara utuh tersebut!