7 days of WordPress plugins, themes & templates - for free!* Unlimited asset downloads! Start 7-Day Free Trial
Advertisement
  1. Code
  2. Python

Modul Matematis Dalam Python: Statistik

Scroll to top
Read Time: 5 mins
This post is part of a series called Mathematical Modules in Python.
Mathematical Modules in Python: Decimal and Fractions
Mathematical Modules in Python: Statistics

Indonesian (Bahasa Indonesia) translation by Yosef Andreas (you can also view the original English article)

Analisis statistik data membantu kita memahami informasi secara keseluruhan. Ini memiliki penerapan dalam banyak bidang seperti biostatistik dan analisis bisnis.

Alih-alih menelusuri melalui poin data individual, cukup sekali lihat nilai mean kolektif atau variansi dapat menampilkan tren dan fitur yang mungkin kita lewatkan dengan memeriksa semua data dalam format mentahnya. Itu juga membuat perbedaan antara dua set data jauh lebih mudah dan lebih bermakna.

Dengan mengingat kebutuhan ini, Python telah menyediakan kita dengan modul statistik.

Di dalam tutorial ini, kamu akan belajar tentang berbagai cara berbeda dalam menghitung rata-rata dan mengukur sebaran data. Kecuali dinyatakan lain, semua fungsi di dalam modul ini mendukung int, float, decimal, dan fraction berdasarkan serangkaian data sebagai input.

Menghitung Mean

Kamu dapat menggunakan fungsi mean(data) untuk menghitung beberapa data yang diberikan. Itu dihitung dengan membagi jumlah semua data berdasarkan angka titik data. Jika datanya kosong, sebuah StatisticsError akan ditampilkan. Berikut beberapa contoh:

Kamu mempelajari tentang banyak fungsi untuk menghasilkan angka acak di dalam tutorial terakhir kami. Mari gunakan mereka sekarang untuk menghasilkan data dan melihat apakah hasil mean akhir setara dengan apa yang ingin diharapkan

Dengan fungsi randint(), mean diharapkan mendekati titik tengah pada kedua ekstrim, dengan dengan distribusi segitiga ini, itu diharapkan mendekati terendah + tertinggi + modus / 3. Dengan demikian, mean dalam kasus pertama dan kedua harusnya 50 dan 60.33 secara berurutan, yang mendekati apa yang kita dapatkan sebenarnya.

Menghitung Modus

Mean merupakan indikator yang bagus terhadap rata-rata, namun beberapa nilai ekstrim dapat menghasilkan sebuah rata-rata yang jauh dari lokasi tengah sebenarnya. Di dalam beberapa kasus lebih disukai untuk menentukan data yang paling sering muncul di dalam sebuah rangkaian data. Fungsi mode() akan mengembalikan titik data yang paling umum dari angka berlainan juga data non-numeris. Ini adalah satu-satunya fungsi statistik yang dapat digunakan dengan data non-numeris.

Modus integer yang dibuat secara acak di dalam sebuah rangkaian dapat berupa salah satu angka tersebut dimana frekuensi kejadian tiap angka tidak dapat diprediksi. Tiga contoh di dalam potongan kode di atas membuktikan poin tersebut. Contoh terakhir menunjukkan kita bagaimana kita dapat menghitung modus data non-numeris.

Menghitung Median

Dengan bergantung pada modus untuk menghitung sebuah nilai tengah dapat membingungkan. Seperti yang baru kita lihat dalam bagian sebelumnya, itu akan selalu menjadi titik data paling populer, tidak peduli dengan semua nilai lainnya di dalam rangkaian data. Cara lainnya untuk menentukan lokasi tengah adalah dengan menggunakan fungsi median(). Itu akan mengembalikan nilai median data numerik yang diberikan dengan menghitung mean dari dua titik tengah jika perlu. Jika angka titik data ganjil, itu mengembalikan titik tengah. Jika jumlah titik datanya genap, itu mengembalikan rata-rata dua nilai median.

Permasalahan dengan fungsi median() adalah bahwa nilai akhir mungkin bukan berupa titik data aktual ketika angka titik datanya genap. Dalam kasus seperti itu, kamu dapat menggunakan entah median_low() atau median_high() untuk menghitung median. Dengan angka titik data yang genap, fungsi ini akan mengembalikan nilai yang lebih kecil dan lebih besar secara berurutan dari dua titik tengah.

Di dalam kasus tersebut, median rendah dan tinggi adalah 50 dan 52. Ini berarti bahwa tidak ada titik data dengan nilai 51 di dalam rangkaian data kita, namun fungsi median() tetap menghitung median menjadi 51.0.

Mengukur Sebaran Data

Dengan menentukan seberapa banyak titik data yang menyimpang dari nilai tipikal atau rata-rata set data sama pentingnya dengan menghitung nilai tengah atau rata-rata itu sendiri. Modul statistik memiliki empat fungsi yang berbeda untuk membantu kita menghitung sebaran data ini.

Kamu dapat menggunakan fungsi pvariance(data, mu=None) untuk menghitung variansi populasi sebuah rangkaian data.

Argumen kedua di dalam kasus ini opsional. Nilai mu, ketika disediakan, hendaklah setara dengan mean data yang diberikan. Mean dihitung secara otomatis jika nilainya tidak ditemukan. Fungsi ini berguna ketika kamu ingin menghitung variansi sebuah populasi menyeluruh. Jika datamu hanya sebuah sampel populasi, kamu dapat menggunakan fungsi variance(data, xBar=None) untuk menghitung variansi sampel. Di sini, xBar adalah mean sampel yang diberikan dan dihitung secara otomatis jika tidak disediakan.

Untuk menghitung definisi standar populasi dan penyimpangan standar sampel, kamu dapat menggunakan fungsi pstdev(data, mu=None) dan stdev(data, xBar=None) secara berurutan.

Sebagai bukti dari contoh di atas, variansi yang lebih kecil menyiratkan bahwa lebih banyak titik data yang lebih dekat pada nilai mean. Kamu juga dapat menghitung penyimpangan standar desimal dan fraksi.

Pemikiran Akhir

Di dalam tutorial terakhir seri ini, kita mempelajari tentang fungsi berbeda yang tersedia di dalam modul statistik. Kamu mungkin telah memperhatikan bahwa data yang diberikan kepada fungsi telah diurutkan dalam kebanyakan kasus, namun tidak harus seperti itu. Saya telah menggunakan daftar yang diurutkan di dalam tutorial ini karena mereka membuatnya lebih mudah untuk mengerti bagaimana nilai yang dikembalikan oleh fungsi yang berbeda terkait pada data input.

Advertisement
Did you find this post useful?
Want a weekly email summary?
Subscribe below and we’ll send you a weekly email summary of all new Code tutorials. Never miss out on learning about the next big thing.
Advertisement
Looking for something to help kick start your next project?
Envato Market has a range of items for sale to help get you started.