Sebenarnya statistika itu sangat menarik untuk dipelajari, hanya saja kita harus tahu esensi dan maksud yang terkandung dalam statistik itu sendiri sehingga nantinya kita bisa menggunakan statistik sebagai alat untuk menunjang keilmuan kita. Secara umum statistik dibedakan menjadi dua, yaitu statistik deskriptif dan statistik inferensia. Statistik deskriptif berhubungan penyajian data secara lebih ringkas dan mudah dipahami. Sedangkan statistik inferensia adalah statistik yang digunakan untuk menduga suatu populasi dari sampel, biasanya menggunakan uji-uji statistik. Data yang dihasilkan bisa berupa data kuantitatif dan data kualitatif.
Adapun untuk pengumpulan dan penyajian data statistik dapat berupa Histogram, Diagram Dahan Da( Steam-and Leaf Plot), Box Plot. Dalam suatu ukuran dan pemusatan dan penyebaran data biasanya kita akan mencari Rerata Hitung dan Ukur (Mean), Median, Modus, Kuartil dan Persentil, Persebaran (Dispersi), Deviasi Standar, dan Koefisien Variasi. Koefisien variasi merupakan ukuran penyebaran relatif yang menunjukkan persentase standar deviasi suatu distribusi terhadap rata-ratanya.
Sebelumnya kita belajar tentang probabilitas ya..Jadi, probabilitas itu adalah ukuran suatu yang ga pasti (ketidakpastian). Probabilitas itu terbagi menjadi dua ya guys, ada probabilitas klasik (memiliki peluang yang sama) dan probabilitas subjektif (sifatnya berdasarkan penilaian seseorang). Dalam probabilitas kita juga mengenal istilah set, intersection, dan juga union. Aturan-aturan perhitungan probabilitas ada konsep permutasi, kombinasi, dan konsep lanjutan (The law of Total Probability/Hukum Probabilitas Total dan Teori Bayes).
Ada distribusi frekuensi dan distribusi probabilitas. Distribusi frekuensi adalah daftar frekuensi untuk seluruh output percobaan. Sedangkan distribusi probablitias adalah daftar probabilitas untuk seluruh output yang mungkin dapat menjadi hasil jika eksperimen dilakukan...Mungkin kalian tahu beberapa distribusi probabilitas ya..diantaranya distribusi Binomial, Poisson dan Distribusi Normal. Nah, yang paling sering digunakan adalah distribusi normal ya guys..Karakteristiknya pasti kalian sudah tahu ya, yups kurvanya berbentuk lonceng, rata-rata bersifat simetris, memiliki nilai median, mean dan modus yang sama, kedua ekornya asimtotik (tidak pernah menyentuh sumbu horizontal), dikenal dengan distribusi Gauss.
Perhitungan Peluang Distribusi Normal
Sekarang kita masuk ke penghitungan peluang atau probability dari distribusi normal ya..karena saya ga sempet masuk-masuk rumus sama gambar mungkin saya ringkas aja step-stepnya:
1. Tentukan dulu peluang P(X > atau <), disesuaikan sama soalnya
2. Hitung nilai Z, P(Z> atau <), disesuaikan dengan tanda X
3. Cari nilai Z tabel di tabel distribusi normal (Cek satuan kiri ke kanan, desimal atas ke bawah, kemudian titik temu di dalam tabel).
4. Setelah dapat nilainya sesuaikan lagi, apabila yang dicari > berarti 1- nilai peluang hasil.
Distribusi Sampling
Tentunya dalam mengestimasi populasi digunakan teknik sampling sehingga dapat diperoleh sampel yang bisa mewakili karakteristik dari populasinya. Terkait metode sampling yang digunakan seperti:
1. Simple Random Sampling (SRS) setiap unsur dalam populasi mempunya kesempatan yang sama pemilihan sampel dengan menggunakan tabel random,
2. Stratified Random Sample dengan mengelompokkan populasi menjadi strata-strata dan berdasarkan ukuran.
3. Cluster Random Sample, populasi dibagi dalam kelompok dan sampel dibentuk dari masing-masing kelompok. Tidak didasarkan pada ukuran, namun umumnya wilayah teritorial misalnya berdasarkan provinsi, dll. Perbedaan stratified dan cluster: Stratified digunakan dalam setiap kelompok memiliki variasi yang kecil namun memiliki variasi yang besar antar kelompok. Sedangkan cluster dalam setiap kelompok memiliki variasi yang besar namun memiliki variasi yang kecil antar kelompok.
4. Systematic Random Sample. Sampel diambil dari populasi dalam suatu interval tertentu, seperti waktu, ruang, dan urutan.
Statistik digunakan untuk menduga populasi atau parameter. Statistik berbeda-beda antar sampel dari populasi yang sama yaitu satu sampel mewakili satu statistik, sedangkan populasi mewakili banyak statistik. Distribusi sampling adalah distribusi probabilitas dengan statistik sampel sebagai variabel randomnya.
1. Distribusi sampling rata-rata adalah distribusi probabilitas dari semua rata-rata sampel dengan ukuran tertentu yang ditarik dari populasi. Kegunaannya adalah mengetahui besarnya probabilitas dari rata-rata sampel. Perlu kita ketahui perbedaan antara simbol-simbol untuk sampel dan populasi. Cara perhitungannya menggunakan rumus rata-rata kemudian dicari peluangnya dalam tabel distribusi normal. The central limit theorem, distribusi sampling rata-rata akan mendekati normal jika ukuran sampel cukup besar >+30, apapun bentuk distribusi populasinya. Distribusi sampling rata-rata akan normal jika distribusi populasi normal, berapapun ukuran sampelnya.
Jika ukuran sampel n ditambah, maka standar deviasi distribusi sampling akan makin kecil dan akhirnya distribusinya akan mengempis ketika n mendekati tak terhingga -> n lebih besar atau sama dengan 30 berdistribusi normal. Jangan lupa gunakan faktor koreksi jika N finite dan n <0,05%
2. Distribusi sampling proporsi, untuk mengetahui besarnya probabilitas dari proporsi sampel
3. Distribusi Sampling Selisih Rata-rata, untuk mengetahui besarnya probabilitas selisih rata-rata dari 2 sampel (bisa beda populasi atau sama)
4. Distribusi Sampling Selisih Proporsi, untuk mengetahui besarnya probabilitas selisih proporsi dari 2 sampel (bisa beda populasi atau sama)
Pendugaan Parameter
Pada distribusi sampling letak statistik sampel terhadap parameter populasi diketahui. Sedangkan pendugaan parameter digunakan untuk menentukan seberapa jauh suatu parameter populasi yang tidak diketahui dapat berada di sekitar statistik sampel. Pendugaan parameter termasuk statistik inferensia. Untuk melakukan pendugaan parameter, diperlukan pendugaan interval. Interval digunakan karena penduga titik kemungkinan akan berbeda dari parameter yang sesungguhnya. Interval ditentukan berdasarkan nilai statistik dan standar error statistik. Kepercayaan biasanya tidak 100%, pendugaan interval yang disertai keyakinan disebut dengan interval keyakinan (confidence interval estimate). Jenis-jenis pendugaan interval:
1. Pendugaan interval rata-rata populasi
2. Pendugaan interval proporsi populasi
3. Pendugaan interval selisih (dua) rata-rata populasi
4. Pendugaan interval selisih (dua) proporsi populasi
Pengujian Hipotesa
Pengujian Hipotesa adalah mengasumsikan nilai parameter dengan menggunakan sampel dari populasi kemudian kita menguji/memutuskan apakah nilai yang diasumsikan tersebut semestinya diterima atau ditolak. Dengan kata lain, pengujian hipotesa adalah untuk membuktikan suatu dugaan atau anggapan tentang parameter populasi yang tidak diketahui berdasarkan sampel yang diambil dari populasi tersebut. Langkah-langkah pengujian:
1. Menetapkan H0 dan H1
2. Menentukan nilai kritis atau daerah menolak H0
3. Menghitung nilai test statistik (statistik hitung)
4. Membuat keputusan secara statistik
Jenis Pengujian Hipotesa:
1. Pengujian rata-rata populasi dengan Standar Deviasi diketahui, dan tidak diketahui
2. Pengujian Proporsi Populasi
3. Pengujian Selisih (beda) rata-rata dua populasi : Dua sampel berpasangan, dua sampel bebas
4. Pengujian Selisih (beda) proporsi dua populasi
5. Pengujian kesamaan varians dua populasi: Distribusi F