گروه آماری آمار برتر مرکز ارائه مشاوره و تجزیه و تحلیل آماری در ایران

۲ مطلب با کلمه‌ی کلیدی «اطلاعات آماری» ثبت شده است

تفاوت بین رگرسیون  خطی و همبستگی چیست؟

هنگام بررسی رابطه بین دو یا چند متغیر عددی، دانستن تفاوت بین همبستگی و رگرسیون مهم است. شباهت ها، تفاوت ها و مزایا، معایب این شاخص ها به همراه نمونه هایی از هر کدام را در ادامه مورد بحث قرار می‌دهیم.

همبستگی درجه و قدرت رابطه بین دو متغیر عددی X و Y را تعیین می کند و همیشه بین -1.0 و 1.0 قرار دارد. رگرسیون خطی ساده X را به Y از طریق معادله ای به شکل Y = a + bX مرتبط می کند.

اطلاعات بیشتر در مورد این دو شاخص آماری را می توانید در صفحه ی ارتباط بین متغیرها در وب سایت آمار برتر بدست آورید.

شباهت های کلیدی

هر دو درجه و قدرت رابطه بین دو متغیر عددی را تعیین می کنند.

وقتی همبستگی (r) منفی باشد، شیب رگرسیون (b) منفی خواهد بود.

وقتی همبستگی مثبت باشد، شیب رگرسیون مثبت خواهد بود.

همبستگی مجذور (r2 یا R2) در رگرسیون خطی ساده معنی خاصی دارد. این نسبت تغییرات در Y را نشان می دهد که توسط X توضیح داده شده است.

تفاوت های کلیدی

رگرسیون تلاش می کند تا مشخص کند که چگونه X باعث تغییر Y می شود و اگر X و Y جابجا شوند، نتایج تجزیه و تحلیل تغییر خواهد کرد. با همبستگی، متغیرهای X و Y قابل تعویض هستند.

رگرسیون فرض می‌کند که X ثابت و بدون خطا است مانند دوز یا تنظیمات دما. با همبستگی، X و Y معمولاً هر دو متغیر تصادفی هستند، مانند قد و وزن یا فشار خون و ضربان قلب.

گراف همبستگی

مزیت کلیدی همبستگی

همبستگی مقدار خلاصه تری از روابط بین متغیرها را نسبت به رگرسیون نشان می‌دهد.

گراف رگرسیون

مزیت کلیدی رگرسیون

رگرسیون تجزیه و تحلیل دقیق تری را ارائه می دهد که شامل یک معادله است که می تواند برای پیش بینی و بهینه سازی استفاده شود.

تفاوت بین رگرسیون و تحلیل همبستگی چیست؟

همبستگی و رگرسیون دو نوع تجزیه و تحلیل هستند که مبتنی بر توزیع چندین متغیر هستند. آنها برای توصیف نوع و درجه ارتباط بین دو متغیر کمی پیوسته مفید هستند. اگرچه این دو مفهوم ریاضی به طور همزمان مورد مطالعه قرار می گیرند، اما با توجه به توضیحات فوق مشخص می شود که بین همبستگی و رگرسیون تفاوت معناداری وجود دارد.

هنگامی که یک محقق می خواهد تعیین کند که آیا متغیرهای مورد بررسی با هم مرتبط هستند یا خیر، و اگر چنین است، رابطه آنها چقدر قوی است، از همبستگی استفاده می شود. ضریب همبستگی پیرسون اغلب به عنوان دقیق ترین اندازه گیری همبستگی در نظر گرفته می شود. در تحلیل رگرسیون، یک رابطه کاربردی بین دو متغیر به منظور تخمین رویدادهای آتی شکل می گیرد.

 

۱۶ بهمن ۰۰ ، ۱۲:۳۶ ۰ نظر موافقین ۰ مخالفین ۰
آمار برتر آمار برتر

توضیح توزیع پواسون به زبان ساده

در آمار، توزیع پواسون یک توزیع احتمالی است که برای نشان دادن دفعات احتمال وقوع یک رویداد در یک دوره مشخص استفاده می شود. توزیع پواسون اغلب برای درک رویدادهای مستقلی که در یک بازه زمانی معین با نرخ ثابتی رخ می دهند، استفاده می شود. این نام به افتخار ریاضیدان فرانسوی سیمئون دنیس پواسون گذاشته شده است.
توزیع پواسون یک تابع گسسته است، به این معنی که متغیر فقط می تواند مقادیر خاصی را در یک لیست بگیرد. به عبارت دیگر، متغیر نمی‌تواند همه مقادیر را در یک محدوده پیوسته بگیرد. برای توزیع پواسون (یک توزیع گسسته)، متغیر فقط می تواند مقادیر 0، 1، 2، 3 و ... را بدون کسر یا اعشار دریافت کند.

اطلاعات بیشتر: توزیع پواسون و توزیع دوجمله ای
 

درک توزیع پواسون
 

از توزیع پواسون می توان برای تخمین اینکه چقدر احتمال دارد چیزی "X" بار اتفاق بیفتد استفاده شود. برای مثال، اگر میانگین تعداد افرادی که در شب جمعه در یک رستوران از یک رستوران زنجیره‌ای چیزبرگر می‌خرند، 200 نفر باشد، توزیع پواسون می‌تواند به سؤالاتی مانند «احتمال اینکه بیش از 300 نفر این کار را انجام دهند چقدر است.» جواب بدهد. استفاده از توزیع پواسون بدین ترتیب مدیران را قادر می سازد تا سیستم های زمان بندی بهینه ای را معرفی کنند که مثلاً با یک توزیع نرمال کار نمی کنند.
 نمونه های مدرن استفاده از پواسون شامل تخمین تعداد تصادفات اتومبیل در یک شهر با اندازه معین است. در فیزیولوژی، این توزیع اغلب برای محاسبه فرکانس های احتمالی انواع مختلف ترشحات انتقال دهنده عصبی استفاده می شود.

 

فرمول پواسون
  فرمول توزیع پواسون

   e عدد اویلر است (e = 2.71828...)
     x تعداد وقوع است
     x! فاکتوریل x است
     λ برابر است با مقدار مورد انتظار (EV) از X زمانی که برابر با واریانس آن باشد
با توجه به داده هایی که از توزیع پواسون پیروی می کنند، به صورت گرافیکی به صورت زیر ظاهر می شود:

نمودار توزیع پواسون
در مثال نشان داده شده در نمودار بالا، فرض کنید برخی از فرآیندها دارای نرخ خطای 3٪ هستند. اگر فراتر از  100 آزمایش تصادفی فرض کنیم، توزیع پواسون احتمال دریافت تعداد معینی از خطاها را در یک دوره زمانی خاص، مانند یک روز منفرد، توصیف می‌کند.
 

زمان استفاده از توزیع پواسون در امور مالی
 

توزیع پواسون معمولاً برای مدل‌سازی داده‌های مالی در مواردی که آمار کوچک و اغلب صفر است استفاده می‌شود. به عنوان یک مثال در امور مالی، می توان از آن برای مدل سازی تعداد معاملاتی که یک سرمایه گذار معمولی در یک روز معین انجام می دهد استفاده کرد که می تواند 0 (اغلب) یا 1 یا 2 و غیره باشد.

به عنوان مثالی دیگر، می توان از این مدل برای پیش بینی تعداد شوک های بازار که در یک بازه زمانی معین، مثلاً در یک دهه، روی می دهد، استفاده کرد.

 

۲۵ دی ۰۰ ، ۱۳:۲۲ ۰ نظر موافقین ۰ مخالفین ۰
آمار برتر آمار برتر