Sabtu, 31 Juli 2021

Measure of Position dalam Statistika

 Measure of Position

dalam Statistika

Apa itu Measure of Position?

Measure of Position dapat didefinisikan sebagai suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada dataset.

a. Quartile

b. percentile

c. standard Score


Quartile (Kuartil)

Quartile adalah nilai yang membagi suatu dataset terurut menjadi empat bagian yang sama. 

Terdapat tiga nilai quartile, yaitu: Q1, Q2, dan Q3


Quartile: contoh





Interpretasi:

- Terdapat ¼ propinsi dengan jumlah pabrik 9 atau kurang

- Terdapat ½ propinsi dengan jumlah pabrik 16 atau kurang

- Terdapat ¾ propinsi dengan jumlah pabrik 33 atau kurang


Interquartile Range (IQR)

Interquartile Range (IQR) adalah measure of Variation (pengukuran keberagaman/sebaran data) dengan menselisihkan nilai quartile ketiga dan quartile pertama.


Deteksi Outlier dengan IQR

Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:

- Lebih kecil dari Q1-1.5(IQR) 

- Lebih besar dari Q3+1.5(IQR) 


Deteksi Outlier dengan IQR: contoh






Box and Whisker Plot (Box Plot)

Box and Whisker Plot: contoh






Percentile (Persentil)

Percentile adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama. 

Terdapat 99 nilai percentaile, yaitu: P1, P2, …, P99

- P25 menunjuk posisi yang sama dengan Q1

- P50 menunjuk posisi yang sama dengan Q2

- P75 menunjuk posisi yang sama dengan Q3 


Deteksi Outlier dengan Percentile

Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:

- Lebih kecil dari P5 

- Lebih besar dari P95 


Percentile (Persentil): contoh

Interpretasi:

Peserta dengan usia 30 tahun terbilang lebih tua bila dibandingkan dengan 36% peserta lain pada dataset ini.


Standard Score (z-score)

Standard Score (z-score) merepresentasikan nilai simpangan suatu entri data terhadap mean dari dataset yang diukur berdasarkan standard deviation.

Nilai z-score bisa negatif, positif, atau nol.


Deteksi Outlier dengan Standard Score (Z-Score)

Standard Score (z-score): contoh


Jumat, 30 Juli 2021

Measure of Variation dalam Statistika

 Measure of Variation

dalam Statistika


Apa itu Measure of Variation?

Measure of Variation dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.

a. Range

b. Variance

c. Standard

Deviation


Range (Jangkauan)

Range dari suatu dataset merupakan hasil perhitungan selisih antara nilai tertinggi dengan nilai terrendah pada dataset tersebut. 

Pengukuran nilai keberagaman dengan menggunakan range memiliki kelemahan di mana hanya menyertakan dua nilai saja dalam proses pengukuran.


Range: contoh



Variance (Variansi)

Variance dari suatu dataset merupakan hasil perhitungan rerata simpangan tiap entri data pada dataset terhadap nilai mean dari dataset tersebut. 


Variance: contoh


Standard Deviation (Simpangan Baku)

Kelemahan utama dari Variance adalah nilai yang dihasilkan tidak lagi memiliki satuan yang sama dengan entri data. Kelemahan ini dapat diatasi dengan Standard Deviation.



Standard Deviation: contoh



Coefficient of Variation

Standard Deviation dapat digunakan untuk membandingkan keberagaman/sebaran data antar dataset yang memiliki satuan pengukuran yang sama dengan nilai mean yang mirip.

Sedangkan untuk dataset yang memiliki satuan pengukuran yang berbeda atau nilai mean yang jauh berbeda, maka kita mesti menggunakan Coefficient of Variation.



Coefficient of Variation: contoh



Minggu, 25 Juli 2021

Measure of Central Tendency dalam Statistika

Nama : Fikih Yuhada Sena

Npm : 20312060

Apa itu Measure of Central Tendency?

Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.

a. Mean

Mean dari suatu dataset merupakan penjumlahan dari keseluruhan entri pada dataset dibagi dengan        banyaknya entri pada dataset tersebut. 

 b. Median

 Median dari suatu dataset merupakan nilai yang berada di tengah dengan mengacu pada nilai dataset     yang sudah terurut.

- Untuk dataset dengan jumlah entri ganjil, nilai median dapat diperoleh dari nilai yang tepat berada di tengah.

- Untuk dataset dengan jumlah entri genap, nilai median diperoleh dari rerata dua nilai yang berada di tengah.

c. Mode

Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.

- Suatu dataset dapat memiliki lebih dari satu mode (multi-modal).

-Suatu dataset juga bisa saja tidak memiliki mode, ketika frekuensi kemunculan dari tiap datanya  sama.

Kelebihan dan Kekurangan Mean

- Mean cukup bisa diandalkan karena mean memperhitungkan setiap entri dari dataset yang kita miliki.

- Mean sangat rentan terhadap outlier.

- Median bisa dijadikan alternatif bilamana terdapat outlier pada dataset.

Weighted Mean

Weighted Mean adalah nilai rerata dari suatu dataset di mana setiap entrinya memiliki bobot tertentu.



Mean of Grouped Data (Frequency Distribution)
Kita juga dapat melakukan estimasi nilai rerata dari suatu dataset yang sudah dikelompokkan ke dalam format distribusi frekuensi.


Bentuk Distribusi (1/2)



Bentuk Distribusi (2/2)
















Visualisasi Data dalam Statistika

Nama : Fikih Yuhada Sena

Npm : 20312060

Pengantar

Beberapa teknik visualisasi data yang akan dipelajari:

- Stem and Leaf Plot

- Dot Plot

- Pie Chart

- Bar Plot

- Scatter Plot

- Time Series Chart

- Visualisasi Data dengan Python


Stem and Leaf Plot [1/2]

=>

Stem and Leaf Plot [2/2]
  => 

Dot Plot


Pie Chart


Bar Plot



Scatter Plot


Time Series Chart

















Sabtu, 24 Juli 2021

Distribusi Frekuensi dalam Statistika

Nama : Fikih Yuhada Sena

Npm : 20312060

Distribusi Frekuensi dalam Statistika

Pengantar

● Beberapa karakteristik yang umum digunakan untuk mendeskripsikan data yang kita milikiadalah dengan mencari tahu titik tengah data (center), variasi/sebaran data(variability/spread), dan bentuk data (shape).

● Ini bisa dicapai bila data yang kita miliki dikelola dengan baik; salah satu cara yang palingmudah untuk mengelola data adalah dengan memanfaat distribusi frekuensi (frequencydistribution)


Distribusi Frekuensi (Frequency Distribution)

Definisi

● Distribusi frekuensi adalah bentuk pengelolaan data di mana data dikelompokkan ke dalambeberapa kelas (classes) berdasarkan interval tertentu.

● Jumlah kemunculan data untuk tiap kelas akan dihitung dan dikenal sebagai frekuensi darikelas.


Frequency Distribution: contoh

● Terdapat 6 classes

● Antar classes tidak ada overlap

● Setiap class memiliki:

    ○ Lower Class Limit: 1, 6, 11, 16, 21, 26

    ○ Upper Class Limit: 5, 10, 15, 20, 25, 30

    ○ Class Width: 5


Membuat Distribusi Frekuensi


Mengenal midpoint, relative frequency



Visualisasi Data: Histogram


Visualisasi Data: Frequency Polygon



Visualisasi Data: Ogive



Pengumpulan Data dalam Statistika

Nama : Fikih Yuhada Sena

Npm : 20312060

Pengumpulan Data dalam Statistika

Pengumpulan Data (Data Collection)

a. Census

Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan

b. Sampling

Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi yang diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik. Di sini sample yang baik adalah sample yang dapat merepresentasikan populasinya. Dibutuhkan teknik sampling yang tepat untuk mendapatkan sample yang representatif terhadap populasinya


Sampling Error

Karena sample merupakan sub bagian dari populasi, maka selisih atau perbedaan nilai antara data sample dan data populasi akan selalu ada. Perbedaan atau selisih nilai ini dikenal dengan istilah sampling error. Bahkan dengan teknik sampling sebaik apapun, sampling error ini tidak dapat dihindarkan.


Sampling: with/without Replacement

Sampling with replacement: Memungkinkan satu anggota populasi untuk terpilih lebih dari satu kali sebagai anggota sample. Sampling without replacement: Menjamin satu anggota populasi hanya dapat terpilih satu kali saja sebagai anggota sample


Teknik Sampling (Sampling Techniques)

Teknik sampling dalam bidang statistika:

● Simple Ramdom Sampling

● Stratified Sampling

● Cluster Sampling

● Systematic Sampling

● Convenience Sampling


Sampling Technique: Simple Random Sampling

Simple random sampling merupakan teknik pengumpulan data yang dilakukan secara acak di mana setiap anggota populasi memiliki peluang yang sama untuk dapat terpilih sebagai anggota sample.


Sampling Technique: Stratified Sampling

● Stratified sampling merupakan teknik pengumpulan data secara acak yang dilakukan dengan terlebih dahulu membagi anggota populasi ke dalam beberapa kelompok berdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin, tingkat pendapatan, etc). 

● Kelompok yang terbentuk ini biasa dikenal dengan istilah strata.

● Selanjutnya anggota dari tiap strata tersebut akan dipilih secara acak untuk dijadikan anggota sample. 

● Perlu diingat agar sampling yang dilakukan di tiap strata haruslah proporsional dengan proporsinya dalam populasi


Sampling Technique: Stratified Sampling (ilustrasi) 



Sampling Technique: Stratified Sampling (contoh) Dilakukan survey terhadap 100 orang mahasiswa baru terkait preferensi mereka dalam memilih menu makan siang. Dari populasi mahasiswa baru ini, dihasilkan dua buah strata berdasarkan jenis kelamin (pria dan wanita). Mengacu pada data penerimaan mahasiswa, didapati 3500 mahasiswa baru yang terdaftar dengan persentase jumlah mahasiswa pria dan wanita adalah 55%-45%. Oleh karenanya survey ini akan melibatkan 55 mahasiswa pria dan 45 mahasiswa wanita yang dipilih secara acak. 


Sampling Technique: Cluster Sampling

● Cluster sampling merupakan teknik pengumpulan data secara acak yang dilakukan dengan membagi anggota populasi ke dalam beberapa kelompok berdasarkan pengelompokkan yang sudah terbentuk (e.g., area geografis, kecamatan, kelurahan, etc). 

● Kelompok yang terbentuk ini biasa dikenal dengan istilah cluster.

● Selanjutnya anggota dari tiap cluster tersebut akan dipilih secara acak untuk dijadikan anggota sample. 

● Perlu diingat agar sampling yang dilakukan di tiap cluster haruslah proporsional dengan proporsinya dalam populasi


Sampling Technique: Cluster Sampling (ilustrasi)




Sampling Technique: Cluster Sampling (contoh)

Dilakukan pendataan jenis dan jumlah kendaraan bermotor yang dimiliki oleh tiap keluarga di wilayah Kecamatan Suka Jaya. Karena wilayah kecamatan ini terbagi ke dalam 7 kelurahan; maka pendataan dilakukan secara acak di tiap kelurahan dengan jumlah sample yang proporsional sesuai dengan persentase jumlah warga di tiap kelurahannya


Sampling Technique: Systematic Sampling

Systematic sampling merupakan teknik pengumpulan data berdasarkan interval tertentu. Teknik sampling ini terbilang cukup mudah untuk diterapkan. Hanya saja teknik ini tidak dapat diterapkan bila ditemui adanya pola yang sifatnya konsisten dan sistematis pada data kita.


Sampling Technique: Convenience Sampling

Convenience sampling merupakan teknik pengumpulan data yang bisa dibilang asal atau sembrono dan hanya berorientasi pada kemudahan. Ini merupakan teknik pengumpulan data yang buruk dan sangat rentan terhadap bias

Minggu, 18 Juli 2021

Desain Eksperimen dalam Statistika

 Nama    : Fikih Yuhada Sena

 NPM    : 20312060

  Desain Eksperimen dalam Statistika
Studi Observasi (Observational Study)

Seorang peneliti hanya
melakukan pengamatan terhadap subjek (e.g., pengukuran karakteristik) tanpa
melakukan tindakan apapun yang dapat mempengharuhi hasil pengamatan.
 

Studi Eksperimen (Experimental Study)

Seorang peneliti
menerapkan suatu treatment tertentu terhadap subjek sebelum melakukan
pengamatan untuk memahami efek dari treatment yang diberikan.
 

Observational Study: contoh

Sebuah penelitian dilakukan untuk mengamati laju kecepatan kendaraan yang melintas di Jalan Merdeka pada pukul 10 sampai dengan 12 malam. Pengukuran kecepatan kendaraan dilakukan dengan bantuan speed gun selama 90 hari.

Experimental Study: contoh
Sebuah penelitian dilakukan untuk mengamati efek dari pemberian suplemen vitamin D3 terhadap 140 pasien dengan tingkat anti-body rendah. Sebanyak 70 pasien menerima 4000 IU vitamin D3 perhari selama 1 tahun dan 70 pasien sisanya menerima placebo. Hasil pengamatan terhadap dua kelompok pasien ini lalu dibandingkan.
Desain Eksperimen (Experimental Design)

Kendali (Control)
Pengacakan (Randomisation)
Replikasi (Replication)
 

Experimental Design: Control (kendali)




 

Experimental Design: Control (kendali)

    ·         Kendali (control) dapat dilakukan dengan menerapkan:

o    Bliding

o    Double
Blinding

·        Blinding

o    Subjek
eksperimen tidak mengetahui apakah dirinya menerima treatment atau placebo.

·        Double Blinding

o    Baik
peneliti maupun subjek eksperimen tidak mengetahui apakah seorang subjek
menerima treatment atau placebo.

o    Dibutuhkan
pihak ketiga untuk mendistribusikan treatment dan placebo kepada subjek
eksperimen.

 Experimental Design: Randomisation (pengacakan)
   Penentuan subjek eksperimen ke dalam treatment group dan control group dilakukan secara acak (random).


Experimental Design: Randomisation (pengacakan)

 

Randomised Blocked Design: 

·        
Keseluruhan subjek eksperimen akan dikelompokkan
berdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin). 

·        
Subjek di tiap kelompok lalu dipilih secara acak
untuk dimasukkan dalam treatment group dan control group.


Experimental Design: Replication (replikasi)

Untuk meningkatkan validitas dari hasil eksperimen, dibutuhkan replikasi atau pengulangan eksperimen dengan kondisi serupa atau mirip. Replikasi melibatkan subjek eksperimen yang berbeda, dengan demikian replikasi juga akan memperbesar ukuran dari subjek eksperimen (sample size) yang juga dapat menunjang validitas dari hasil eksperimen.

Desain Eksperimen [contoh]

Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu produk permen karet yang dikembangkan untuk membantu seseorang yang ingin berhenti merokok. Sepuluh orang perokok berat dilibatkan sebagai subjek eksperimen. Lima orang di antaranya diberikan permen karet dan lima sisanya diberikan placebo. Setelah dua bulan berjalan, kesepuluh subjek eksperimen ini dievaluasi dan didapati kelima subjek penerima permen karet telah berhenti merokok. Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan apa yang terdapat pada desain eksperimen ini?

Desain Eksperimen [contoh]
Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu produk permen karet yang dikembangkan untuk membantu seseorang yang ingin berhenti merokok. Seribu orang perokok berat dilibatkan sebagai subjek eksperimen yang  dikelompokkan berdasarkan jenis kelamin. Kelompok wanita diberi permen karet dan kelompok pria diberi placebo. Setelah dua bulan berjalan, keseribu subjek eksperimen ini dievaluasi dan didapati adanya jumlah yang cukup signifikan dari kelompok penerima permen karet yang berhenti merokok. Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan apa yang terdapat pada desain eksperimen ini?

Tantangan dalam Experimental Study

·         Confounding/Lurking variable

o    Faktor
eksternal (dan tidak diperhitungkan sebelumnya) yang berpotensi memberikan
pengaruh terhadap hasil eksperimen.

·        
Placebo effect

o    Subjek
eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo
(treatment palsu).

·        
Hawthorne effect

o    Perubahan
perilaku dari subjek eksperimen setelah mengetahui bahwa dirinya terlibat dalam
eksperimen.

Rabu, 14 Juli 2021

Klasifikasi Data dalam Statistika

Nama : Fikih Yuhada Sena

Npm : 20312060

Klasifikasi Data dalam Statistika

Tipe Data

Data Kualitatif (Qualitative)

Data non numerik:

  • Atribut
  • Label

 

Data Kuantitatif (Quantitative)

Data numerik yang dihasilkan melalui:

  • Penghitungan
  • Pengukuran

Tipe Data: contoh

Menu
(Kualitatif)

Harga
(Kuantitatif)

Nasi Goreng

Rp 25,000

Nasi Pecel

Rp 30,000

Nasi Timbel

Rp 35,000

 

 

 

 

Skala pengukuran (Level of Measurements)

Terdapat 4 Skala pengukuran (Level of Measurements) dalam bidang statistika:

  1. Nominal
  2. Ordinal
  3. Interval
  4. Rasio (Ratio)

 

Skala Pengukuran Nominal

  • Berasosialisasi dengan tipe kualitatif
  • Berfokus pada pengelompokan atau pengkategorian data berdasarkan nama, label atau kualitas
  • Tidak dapat dikenakan operasi matematika
  • Contoh:

o   merk kendaraan bermotor

o   kota kelahiran

o   nama siswa, nama bulan, nama hari

o   nomor kendaraan bermotor, nomor induk siswa

 

Skala Pengukuran Ordinal

  • Berasosiasi dengan tipe dan kualitatif
  • Data dapat dikelompokkan
  • Data dapat disusun berdasarkan urutan, peringkat, atau ranking
  • Tidak dapat dikenakan operasi metematika
  • Contoh:

o   tingkat kepuasan pelanggan: sangat puas, puas, cukup, kecewa, sangat kecewa

o   temperatur udara: panas, sejuk, dingin

o   peringkat siswa di kelas

 

Skala Pengukuran Interval

  • Berasosiasi dengan tipe dan kualitatif
  • Data dapat dikelompokkan
  • Data dapat disusun berdasarkan urutan, peringkat, atau ranking
  • Dapat dikenakan operasi metematika untuk menghitung selisih nilai
  • Nilai numerik mempresentasikan posisi pada suatu skala ukur tertentu
  • Tidak memiliki nilai nol yang absolut (no inherent zero)
  • Tidak dapat dikenakan operasi matematika terkait perkalian
  • Contoh:

o   temperatur udara 32 derajad celsius

o   tahun 2020

 

Skala Pengukuran Rasio (Ratio)

  • Berasosiasi dengan tipe dan kuantitatif
  • Data dapat dikelompokkan
  • Data dapat disusun berdasarkan urutan, peringkat, atau ranking
  • Dapat dikenakan operasi metematika untuk menghitung selisih nilai
  • Memiliki nilai nol yang absolut (no inherent zero)
  • Dapat dikenakan operasi matematika terkait perkalian
  • Contoh:

o   usia anak 7 tahun

o   berat badan 65 kg

o   harga nasi goreng Rp 25,000

 

Skala Pengukuran: ringaksan

 

Pengelompokan Data

Pengukuran Data

Selisih Data

Pengkalian Data

Nominal

ü   

 

 

 

Ordinal

ü   

ü   

 

 

Interval

ü   

ü   

ü   

 

Rasio

ü   

ü   

ü   

ü   

 

 

 

 

 

 

           

 

  

 


Geometric Distribution & Poisson Distribution

 Geometric Distribution Geometric Distribution merupakan suatu discrete probability distribution yang memenuhi kriteria berikut:  Percobaan ...