انحراف معیار و واریانس در یادگیری ماشین (Machine Learning) پایتون

انحراف معیار و واریانس در یادگیری ماشین (Machine Learning) پایتون

زمان مطالعه

5 دقیقه

تعداد بازدید

138

تعداد پرسش ها

0

افزودن به لیست علاقه مندی ها


برچسب ها :


اشتراک گذاری این مطلب
سامان محمدپور
در مورد نویسنده : موفقیت بستگی به تلاش هر شخص داره، هممون ب همون اندازه که تلاش کردیم موفق شدیم.

انحراف معیار و واریانس در یادگیری ماشین (Machine Learning) پایتون

انحراف معیار و واریانس در یادگیری ماشین (Machine Learning) پایتون

زمان مطالعه

5 دقیقه

تعداد بازدید

138

تعداد پرسش ها

0

افزودن به لیست علاقه مندی ها


برچسب ها :


اشتراک گذاری این مطلب

انحراف معیار یک عدد است که میزان گسترش مقادیر را توضیح می دهد، بگذارید آن را ساده تر برای شما توضیح دهم.

انحراف معیار (Standard Deviation) شامل دو کلمه است، انحراف (Deviation) و معیار (Standard).

انحراف به معنی فاصله هر مقدار در مجموعه از مقدار میانگین (Mean) است و معیار به این معنی است که این مقدار استاندارد است.

پس انحراف به طور ساده تر یعنی مقدار پراکندگی مقادیر از میانگین (Mean) مجموعه.

انحراف معیار دارای دو اصطلاح است:

انحراف معیار پایین (Low Standard Deviation)

انحراف معیار بالا (High Standard Deviation)

انحراف معیار پایین به این معنی است که اکثر اعداد به مقدار Mean (میانگین) که در مقاله قبل آن را به طور کامل برای شما توضیح دادیم، نزدیک هستند.

انحراف معیار بالا به این معنی است که مقادیر در محدوده وسیع تری پراکنده شده اند.

مثال: در این مثال ما سرعت 7 عدد خودرو را بررسی کرده ایم.

 

speed = [86,87,88,86,87,85,86]

 

انحراف معیار مقادیر بالا برابر مقدار زیر است.

 

0.9

 

به این معنی که مقادیر در محدوده 0.9 از مقدار میانگین که 86.4 است قرار دارند.

حال اجازه دهید انحراف معیار را در مقادیر پراکنده که همان انحراف معیار بالا است، بررسی کنیم.

 

speed = [32,111,138,28,59,77,97]

 

انحراف معیار مقادیر بالا برابر مقدار زیر است.

 

37.85

 

به این معنی که مقادیر در محدوده 37.85 از مقدار میانگین که 77.4 است قرار دارند.

همان گونه که می بینید انحراف معیار بالاتری را نسبت به مثال قبل نشان می دهد، در اصل دلیل این کار این است که مقادیر در محدوده وسیع تری پراکنده شده اند.

ماژول NumPy متدی برای محاسبه انحراف میار دارد که در ادامه به بررسی آن می پردازیم.

مثال: در این مثال برای پیدا کردن انحراف معیار از متد ()std در ماژول NumPy استفاده کرده ایم.

مثال برای انحراف معیار پایین:

 

import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)

 

محاسبه انحراف معیار در یادگیری ماشین (Machine Learning)

 

مثال برای انحراف معیار بالا:

 

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

 

محاسبه انحراف معیار در یادگیری ماشین (Machine Learning)

 

واریانس (Variance)

واریانس عددی است که مقدار گستردگی مقادیر از میانگین (Mean) را نشان می دهد، شاید در ابتدا آن را با توجه به تعریف آن سخت در نظر بگیرید اما این چنین نیست و در ادامه با مثال هایی که برای شما آورده ام می بینید که چقدر ساده است.

در اصل اگر ریشه مربع واریانس را بگیرید، انحراف معیار به دست می آید یا برعکس اگر انحراف معیار را در خودش ضرب کنید، مقدار واریانس به دست می آید.

برای محاسبه واریانس باید طبق روش زیر پیش بروید.

مرحله اول:

 

(32+111+138+28+59+77+97) / 7 = 77.4

 

یعنی جمع کل مجموعه اعداد تقسیم بر تعداد اعضای مجموعه.

مرحله دوم:

برای هر مقدار تفاوت آن را با میانگین (Mean) پیدا کنید، مانند زیر:

 

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

 

مرحله سوم:

همه مقادیر به دست آمده مرحله قبل (نتیجه تفاوت با میانگین) را جداگانه به توان دو می رسانیم (مقدار مربع آن را به دست می آوریم)، مانند زیر:

 

(-45.4)2 = 2061.16
 (33.6)2 = 1128.96
 (60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 =  338.56
(- 0.4)2 =    0.16
 (19.6)2 =  384.16

 

مرحله چهارم:

میانگین مقادیر به دست آمده از مرحله سوم، واریانس آن مجموعه است.

 

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

 

خوشبختانه ماژول NumPy برای محاسبه واریانس هم متدی دارد که در ادامه آن را بررسی می کنیم.

مثال: در این مثال برای پیدا کردن واریانس از متد ()var در ماژول NumPy استفاده کرده ایم.

 

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

 

محاسبه واریانس در یادگیری ماشین (Machine Learning)

 

انحراف معیار (Standard Deviation)

همانطور که در بالا گفتیم، فرمول یافتن انحراف معیار، ریشه مربع واریانس است.

 

1432.25 = 37.85

 

یا می توانیم مانند مثال قبل از متد ()std در ماژول NumPy برای محاسبه انحراف معیار استفاده کنیم.

 

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

 

محاسبه انحراف معیار در یادگیری ماشین (Machine Learning)

 

نمادها (Symbols)

هر کدام از اصطلاحات بالا (انحراف معیار و واریانس) با یک نماد بخصوص نشان داده می شوند.

انحراف معیار (Standard Deviation) اغلب با نماد سیگما (Sigma) نشان داده می شود که به این شکل است: σ

واریانس (Variance) اغلب با نماد سیگما (Sigma) به توان 2 (مربع سیگما) نشان داده می شود که به این شکل است: σ²

خلاصه مقاله

انحراف معیار و واریانس مفاهیمی هستند که برای کار با یادگیری ماشین ضروری هستند و درک مفهوم آن ها بسیار مهم و حیاتی است.

انحراف معیار : مقدار پراکندگی مقادیر از میانگین مجموعه

واریانس : مقدار متوسط مربع اختلاف مقادیر از میانگین

خب در این مقاله با دو مفهوم بسیار مهم انحراف معیار و واریانس در یادگیری ماشین آشنا شدیم.

در مقاله بعدی به بحث مهم و حیاتی در یادگیری ماشین یعنی صدک ها (Percentiles) می پردازیم.

سامان محمدپور
در مورد نویسنده : موفقیت بستگی به تلاش هر شخص داره، هممون ب همون اندازه که تلاش کردیم موفق شدیم.

پرسش و پاسخ
0
دوره پیشنهادی
دوره پیشنهادی