انحراف معیار و واریانس در یادگیری ماشین پایتون (Python Deviation Variance)

انحراف معیار یک عدد است که میزان گسترش مقادیر را توضیح می دهد انحراف معیار (Standard Deviation) شامل دو کلمه است، انحراف (Deviation) و معیار (Standard).

انحراف به معنی فاصله هر مقدار در مجموعه از مقدار میانگین (Mean) در پایتون است و معیار به این معنی است که این مقدار استاندارد است. پس انحراف به طور ساده تر یعنی مقدار پراکندگی مقادیر از میانگین (Mean) مجموعه.

انحراف معیار دارای دو اصطلاح است:

  1. انحراف معیار پایین (Low Standard Deviation)
  2. انحراف معیار بالا (High Standard Deviation)
بهزاد میرزازاده بهزاد میرزازاده

زمان مطالعه

3 دقیقه

بازدید

721

پرسش و پاسخ

0
انحراف معیار و واریانس در یادگیری ماشین پایتون (Python Deviation Variance)

انحراف معیار پایین به این معنی است که اکثر اعداد به مقدار Mean (میانگین) که در مقاله قبل آن را به طور کامل برای شما توضیح دادیم، نزدیک هستند. انحراف معیار بالا به این معنی است که مقادیر در محدوده وسیع تری پراکنده شده اند.

مثال: در این مثال ما سرعت 7 عدد خودرو را بررسی کرده ایم.

speed = [86,87,88,86,87,85,86]

انحراف معیار مقادیر بالا برابر مقدار زیر است.

0.9

به این معنی که مقادیر در محدوده 0.9 از مقدار میانگین که 86.4 است قرار دارند.

حال اجازه دهید انحراف معیار را در مقادیر پراکنده که همان انحراف معیار بالا است، بررسی کنیم.

speed = [32,111,138,28,59,77,97]

انحراف معیار مقادیر بالا برابر مقدار زیر است.

37.85

به این معنی که مقادیر در محدوده 37.85 از مقدار میانگین که 77.4 است قرار دارند.

همان گونه که می بینید انحراف معیار بالاتری را نسبت به مثال قبل نشان می دهد، در اصل دلیل این کار این است که مقادیر در محدوده وسیع تری پراکنده شده اند.

ماژول NumPy متدی برای محاسبه انحراف میار دارد که در ادامه به بررسی آن می پردازیم.

مثال: در این مثال برای پیدا کردن انحراف معیار از متد ()std در ماژول NumPy استفاده کرده ایم.

مثال برای انحراف معیار پایین:

import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)

محاسبه انحراف معیار در یادگیری ماشین (Machine Learning)

مثال برای انحراف معیار بالا:

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

محاسبه انحراف معیار در یادگیری ماشین (Machine Learning)

واریانس (Variance) در پایتون

واریانس عددی است که مقدار گستردگی مقادیر از میانگین (Mean) را نشان می دهد، شاید در ابتدا آن را با توجه به تعریف آن سخت در نظر بگیرید اما این چنین نیست و در ادامه با مثال هایی که برای شما آورده ام می بینید که چقدر ساده است.

در اصل اگر ریشه مربع واریانس را بگیرید، انحراف معیار به دست می آید یا برعکس اگر انحراف معیار را در خودش ضرب کنید، مقدار واریانس به دست می آید.

برای محاسبه واریانس باید طبق روش زیر پیش بروید.

مرحله اول:

(32+111+138+28+59+77+97) / 7 = 77.4

یعنی جمع کل مجموعه اعداد تقسیم بر تعداد اعضای مجموعه.

مرحله دوم:

برای هر مقدار تفاوت آن را با میانگین (Mean) پیدا کنید، مانند زیر:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

مرحله سوم:

همه مقادیر به دست آمده مرحله قبل (نتیجه تفاوت با میانگین) را جداگانه به توان دو می رسانیم (مقدار مربع آن را به دست می آوریم)، مانند زیر:

(-45.4)2 = 2061.16
 (33.6)2 = 1128.96
 (60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 =  338.56
(- 0.4)2 =    0.16
 (19.6)2 =  384.16

مرحله چهارم:

میانگین مقادیر به دست آمده از مرحله سوم، واریانس آن مجموعه است.

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

خوشبختانه ماژول NumPy برای محاسبه واریانس هم متدی دارد که در ادامه آن را بررسی می کنیم.

مثال: در این مثال برای پیدا کردن واریانس از متد ()var در ماژول NumPy استفاده کرده ایم.

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

محاسبه واریانس در یادگیری ماشین (Machine Learning)

انحراف معیار (Standard Deviation) در پایتون

همانطور که در بالا گفتیم، فرمول یافتن انحراف معیار، ریشه مربع واریانس است.

1432.25 = 37.85

یا می توانیم مانند مثال قبل از متد ()std در ماژول NumPy برای محاسبه انحراف معیار استفاده کنیم.

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

محاسبه انحراف معیار در یادگیری ماشین (Machine Learning)

نمادها (Symbols)

هر کدام از اصطلاحات بالا (انحراف معیار و واریانس) با یک نماد بخصوص نشان داده می شوند.

انحراف معیار (Standard Deviation) اغلب با نماد سیگما (Sigma) نشان داده می شود که به این شکل است: σ

واریانس (Variance) اغلب با نماد سیگما (Sigma) به توان 2 (مربع سیگما) نشان داده می شود که به این شکل است: σ²