ضریب همبستگی

ساخت وبلاگ

ضریب همبستگی اندازه گیری خاص است که قدرت رابطه خطی بین دو متغیر را در یک تجزیه و تحلیل همبستگی تعیین می کند. ضریب همان چیزی است که ما در یک گزارش همبستگی با R نماد می کنیم.

ضریب همبستگی چگونه استفاده می شود؟

برای دو متغیر ، فرمول فاصله هر DataPoint را از میانگین متغیر مقایسه می کند و از این استفاده می کند تا به ما بگوید که چگونه رابطه بین متغیرها می تواند با یک خط خیالی که از طریق داده ها ترسیم می شود ، باشد. منظور ما این است که وقتی می گوییم همبستگی ها به روابط خطی نگاه می کنند.

محدودیت هایی که باید در نظر بگیرید چیست؟

همبستگی فقط به دو متغیر مورد نظر نگاه می کند و به روابط فراتر از داده های دو متغیره بینش نمی دهد. این آزمایش در داده های موجود در داده ها تشخیص داده نمی شود (و بنابراین توسط آنها مورد استفاده قرار می گیرد) و نمی تواند روابط منحنی را به درستی تشخیص دهد.

انواع ضریب همبستگی

در این بخش ، ما روی همبستگی محصول پیرسون تمرکز می کنیم. این یکی از رایج ترین انواع اقدامات همبستگی است که در عمل استفاده می شود ، اما موارد دیگری نیز وجود دارد. یک نوع از نزدیک ، همبستگی Spearman است که از نظر استفاده مشابه است اما برای داده های رتبه بندی شده قابل اجرا است.

مقادیر ضریب همبستگی چیست؟

ضریب همبستگی R یک مقدار بدون واحد بی ن-1 و 1 است. اهمیت آماری با یک مقدار p نشان داده شده است. بنابراین ، همبستگی ها به طور معمول با دو عدد کلید نوشته می شوند: r = و p =.

  • هرچه R نزدیک تر به صفر باشد ، رابطه خطی ضعیف تر است.
  • مقادیر مثبت R نشانگر همبستگی مثبت است ، جایی که مقادیر هر دو متغیر تمایل به افزایش با هم دارند.
  • مقادیر منفی R نشانگر همبستگی منفی است ، جایی که مقادیر یک متغیر با کاهش مقادیر متغیر دیگر ، افزایش می یابد.
  • مقادیر 1 و-1 هر دو همبستگی "کامل" ، به ترتیب مثبت و منفی را نشان می دهند. دو متغیر کاملاً همبسته با یک نرخ ثابت با هم تغییر می کنند. ما می گوییم آنها یک رابطه خطی دارند. هنگامی که روی یک پراکندگی ترسیم شده ، تمام نقاط داده را می توان با یک خط مستقیم وصل کرد.
  • مقدار P به ما کمک می کند تا تعیین کنیم که آیا می توانیم به طور معناداری نتیجه بگیریم که ضریب همبستگی جمعیت بر اساس آنچه از نمونه مشاهده می کنیم با صفر متفاوت است.

مقدار p چیست؟

مقدار p اندازه گیری احتمال استفاده شده برای آزمایش فرضیه است. هدف آزمایش فرضیه تعیین این است که آیا شواهد کافی برای حمایت از یک فرضیه خاص در مورد داده های شما وجود دارد یا خیر. در واقع ، ما دو فرضیه را تدوین می کنیم: فرضیه تهی و فرضیه جایگزین. در مورد تجزیه و تحلیل همبستگی ، فرضیه تهی به طور معمول این است که رابطه مشاهده شده بین متغیرها نتیجه شانس خالص است (یعنی ضریب همبستگی واقعاً صفر است - هیچ رابطه خطی وجود ندارد). فرضیه جایگزین این است که همبستگی ای که اندازه گیری کرده ایم به طور قانونی در داده های ما وجود دارد (یعنی ضریب همبستگی با صفر متفاوت است).

مقدار P احتمال مشاهده ضریب همبستگی غیر صفر در داده های نمونه ما است که در واقع فرضیه تهی صحیح است. یک مقدار p پایین شما را به رد فرضیه تهی سوق می دهد. یک آستانه معمولی برای رد فرضیه تهی ، ارزش p 0. 05 است. یعنی اگر مقدار P کمتر از 0. 05 داشته باشید ، فرضیه تهی را به نفع فرضیه جایگزین رد می کنید-ضریب همبستگی با صفر متفاوت است.

چگونه می توانیم ضریب همبستگی را محاسبه کنیم؟

ضریب همبستگی نمونه را می توان با یک فرمول نشان داد:

بیایید نحوه محاسبه ضریب همبستگی را با استفاده از یک مثال با مجموعه ای کوچک از اعداد ساده محاسبه کنیم ، به طوری که پیروی از عملیات آسان است.

بیایید تصور کنیم که ما علاقه مندیم که آیا می توانیم انتظار داشته باشیم که در روزهای گرمتر فروش بستنی بیشتری در شهر خود داشته باشیم. فروشگاه های بستنی در بهار شروع به باز شدن می کنند. شاید مردم در روزهایی که در بیرون گرم است بستنی بیشتری بخرند. از طرف دیگر ، شاید مردم به سادگی بستنی را با سرعت ثابت خریداری کنند زیرا آنها آن را خیلی دوست دارند.

ما با جمع آوری داده ها به طور متوسط روزانه بستنی و بالاترین دمای روزانه ، به این سؤال پاسخ می دهیم. فروش بستنی و دما از این رو دو متغیر هستند که ما برای محاسبه ضریب همبستگی استفاده خواهیم کرد. بعضی اوقات داده هایی مانند این داده های دو متغیره نامیده می شوند ، زیرا هر مشاهده (یا به موقع که در آن فروش و دما را اندازه گیری کرده ایم) دارای دو قطعه اطلاعات است که می توانیم برای توصیف آن استفاده کنیم. به عبارت دیگر ، ما می پرسیم که آیا به نظر می رسد فروش بستنی و دما با هم حرکت می کند.

مانند گذشته ، یک روش مفید برای نگاه اول با یک پراکندگی است:

ما همچنین می توانیم این داده ها را در یک جدول جستجو کنیم ، که برای کمک به ما در پیگیری محاسبه ضریب برای هر DataPoint مفید است. هنگام صحبت در مورد داده های دو متغیره ، معمولی است که یک متغیر X و دیگری Y را صدا کنید (اینها همچنین به ما کمک می کند تا خودمان را در یک صفحه بصری مانند محورهای یک طرح قرار دهیم). بیایید بستنی فروش X و دمای y را صدا کنیم.

توجه کنید که هر DataPoint جفت شده است. به یاد داشته باشید ، ما واقعاً به موقع به نقاط فردی نگاه می کنیم و هر بار هم برای فروش و هم برای دما ارزش دارد.

بستنی فروش (X)دمای درجه فارنهایت (y)
370
675
980

1. با یافتن نمونه نمونه شروع کنید

اکنون که به داده های خود گرایش پیدا کرده ایم ، می توانیم با دو زیر محاسبه مهم از فرمول فوق شروع کنیم: میانگین نمونه و تفاوت بین هر پایگاه داده و این میانگین (در این مراحل ، می توانید بلوک های اولیه ساختاری استاندارد را مشاهده کنیدانحراف ).

نمونه های نمونه با نمادهای X̅ و Y̅ ، که گاهی اوقات "نوار X" و "Y نوار" نامیده می شوند ، نشان داده شده است. وسایل فروش بستنی (X̅) و دما (Y̅) به راحتی به شرح زیر محاسبه می شوند:

$ $ overline = [3 + 6 + 9] ÷ 3 = 6 $ $

$ $ overline = [70 + 75 + 80] ÷ 3 = 75 $ $

2. فاصله هر پایگاه داده را از میانگین آن محاسبه کنید

با میانگین دست برای هر یک از دو متغیر ما ، مرحله بعدی تفریق میانگین فروش بستنی (6) از هر یک از نقاط داده فروش ما است (xiدر فرمول) و میانگین دما (75) از هر یک از نقاط داده دمای ما (yiدر فرمول). توجه داشته باشید که این عمل گاهی اوقات منجر به تعداد منفی یا صفر می شود!

بستنی (X)دمای درجه فارنهایت (y)$ x_i- overline $$ y_i- Overline $
3 دلار70 دلار3 $ - 6 = -3 $70 $ - 75 = -5 $
6 دلار75 دلار$ 6 - 6 = 0 $75 $ - 75 = 0 $
9 دلار80 دلار9 $ - 6 = 3 $80 $ - 75 = 5 $

3. بالای معادله ضریب را تکمیل کنید

این قطعه از معادله جمع محصولات نامیده می شود. یک محصول شماره ای است که شما بعد از ضرب می کنید ، بنابراین این فرمول دقیقاً همان چیزی است که به نظر می رسد: تعداد اعدادی که شما ضرب می کنید.

ما مقادیر زوجی را از هر ردیف در دو ستون آخر در جدول بالا می گیریم ، آنها را ضرب می کنیم (به یاد داشته باشید که ضرب دو عدد منفی مثبت می شود!) و نتایج را جمع می کنیم:

خبرهای فارکس...
ما را در سایت خبرهای فارکس دنبال می کنید

برچسب : نویسنده : عفت السادات شجاعی بازدید : 79 تاريخ : سه شنبه 8 فروردين 1402 ساعت: 5:48