رگرسیون و همبستگی

ساخت وبلاگ

توانایی درک رابطه بین عوامل مختلف برای سازمانها بسیار مهم است. به عنوان مثال ، درک رابطه بین هزینه های تبلیغاتی و فروش حاصل از آن تبلیغات یا بین سطح تولید و کل هزینه های تولید مفید خواهد بود. درک این روابط به سازمان ها اجازه می دهد تا پیش بینی های بهتری درباره فروش یا هزینه در آینده انجام دهند. این هنگام بودجه یا پیش بینی بسیار ارزشمند خواهد بود.

در این مقاله به بررسی چگونگی تجزیه و تحلیل روابط بین متغیرها با استفاده از روش "خط بهترین تناسب" و تجزیه و تحلیل رگرسیون می پردازیم ، و چگونه می توان قدرت این روابط را با استفاده از همبستگی اندازه گیری کرد.

رابطه بین متغیرها

در هر رابطه بین دو متغیر یک متغیر مستقل و یک متغیر وابسته وجود دارد ، اندازه حرکات در متغیر وابسته بسته به اندازه حرکات متغیر مستقل. مثلا؛هزینه کل یک فرآیند تولید به سطح فعالیت بستگی دارد.

داده های زیر را که توسط یک شرکت طی دو سال گذشته تولید شده است در نظر بگیرید.

این شرکت می خواهد رابطه بین سطح فعالیت و کل هزینه تولید را درک کند تا بتواند کل هزینه های تولید را پیش بینی کند.

خط بهترین تناسب

یکی از روش های درک رابطه بین متغیرها ، خط بهترین روش مناسب است. تمام داده های داده شده در یک نمودار ترسیم شده است. سطح فعالیت متغیر مستقل است (همانطور که در بالا توضیح داده شد) و در محور x (افقی) نشان داده شده است. کل هزینه تولید متغیر وابسته است و در محور Y (عمودی) نشان داده شده است.

پس از ترسیم تمام داده ها بر روی نمودار ، می توان خطی از بهترین تناسب را ترسیم کرد:

در این حالت برخی از نقاط در خط و برخی از آنها در بالا و پایین قرار دارند ، اما بیشتر آنها به خط نزدیک هستند که نشان می دهد بین سطح فعالیت و کل هزینه تولید رابطه وجود دارد.

این "خط بهترین تناسب" می تواند برای پیش بینی آنچه در سایر سطوح تولید اتفاق می افتد استفاده شود. برای سطح تولیدی که در محدوده سطوح قبلی قرار نمی گیرند ، می توان با خواندن مقدار از نمودار ، "خط بهترین تناسب" را پیش بینی کرد تا سطوح دیگر را پیش بینی کند.

این یک تکنیک ساده است ، اما محدودیت هایی دارد. نکته اصلی این است که "خط بهترین تناسب" از نقاط داده ترسیم شده تخمین زده می شود و خطوط مختلف ممکن است از همان مجموعه از نقاط داده تهیه شود. روشی که می تواند بر این ضعف غلبه کند ، تجزیه و تحلیل رگرسیون است.

تجزیه و تحلیل رگرسیون

تجزیه و تحلیل رگرسیون همچنین از داده های تاریخی استفاده می کند و خطی از بهترین تناسب را پیدا می کند ، اما این کار را از نظر آماری انجام می دهد و خط حاصل را قابل اطمینان تر می کند.

ما یک رابطه خطی (خط مستقیم) بین متغیرها و اینکه معادله یک خط مستقیم است فرض می کنیم:

y = a + bx

a عنصر ثابت است (جایی که خط از محور y عبور می کند)

B عنصر متغیر (شیب خط) و

x و y به متغیرهای x و y مربوط می شوند.

A و B با استفاده از فرمول های زیر محاسبه می شوند:

regress-analysis-update

این فرمول ها در برگه فرمول PM آورده شده است.

ساده ترین راه برای مقابله با این محاسبات این است که ابتدا یک جدول با ستون های X ، Y ، XY و X 2 تنظیم کنید.

(توجه: جدول همچنین حاوی ستونی برای Y 2 است. این مورد در محاسبه بعدی مورد نیاز است)

واحدها (000s) x هزینه کل (000 دلار) y

کل (∑)

285

4،265

168. 975

12،025

2،440،125

معادله خط رگرسیون (به شکل y = a + bx) می شود:

y = 208. 90 + 9. 1x

با استفاده از این معادله ، پیش بینی هزینه های کل در سطوح مختلف تولید آسان است ، به عنوان مثال برای سطح تولید 80،000 واحد ، تخمین هزینه کل خواهد بود:

208. 90 + (9. 1 x 80) = 936. 90 یا 936. 900 دلار.

این تخمین چقدر قابل اعتماد است به قدرت رابطه بین دو متغیر بستگی دارد. با تغییر در x چه مقدار از تغییر y را می توان توضیح داد؟

هرچه رابطه بین متغیرها قوی تر باشد ، می توان به معادله محاسبه شده اعتماد بیشتری کرد و پیش بینی ها بهتر می شدند.

اندازه گیری قدرت رابطه بین متغیرها همبستگی است.

همبستگی

گفته می شود که اگر مربوط به یکدیگر باشد ، دو متغیر با یکدیگر ارتباط دارند و اگر تغییر در یک تمایل به همراهی با تغییرات در دیگری باشد. همبستگی می تواند مثبت باشد (جایی که افزایش در یک متغیر در نتیجه در دیگری افزایش می یابد) یا منفی (که در آن افزایش در یک متغیر منجر به کاهش در دیگری می شود).

نمودار نشان داده شده در بخش "خط بهترین تناسب" در بالا همبستگی مثبت قوی را نشان می دهد. برخی از روابط دیگر در زیر نشان داده شده است:

این امکان وجود دارد که بین متغیرها هیچ ارتباطی وجود نداشته باشد. یک خط افقی مانند موارد زیر هیچ ارتباطی را نشان نمی دهد:

در جایی که یک شرکت بخواهد از داده های گذشته برای پیش بینی آینده استفاده کند ، همبستگی قوی تر می شود ، تخمین ها بهتر می شوند.

قدرت همبستگی بین متغیرها را می توان با ضریب همبستگی اندازه گیری کرد که می تواند با استفاده از فرمول زیر محاسبه شود:

r = 1 همبستگی خطی مثبت کامل را نشان می دهد

r = -1 همبستگی خطی منفی کامل را نشان می دهد

r = 0 هیچ همبستگی خطی را نشان نمی دهد

مقدار ضریب همبستگی باید بین 1 تا 1 باشد. هرچه مقدار نزدیکتر به 1 و-1 باشد ، همبستگی قوی تر است.

با استفاده از مثال قبلی برای محاسبه r:

R = 0. 965 که نشانگر همبستگی مثبت قوی است.

محاسبه بیشتر ضریب تعیین است که به عنوان R 2 محاسبه می شود.

ضریب تعیین ، نسبت تغییرات در Y (متغیر وابسته) را که می تواند با تغییرات در X (متغیر مستقل) توضیح داده شود ، می دهد. در این مثال ، r 2 = 0. 931 ، بنابراین 93. 1 ٪ از تغییرات در کل هزینه تولید با تغییر در سطح فعالیت قابل توضیح است. این بدان معنی است که 6. 9 ٪ از تغییرات باید به دلیل سایر عوامل باشد.

نتیجه

با استفاده از تجزیه و تحلیل رگرسیون و همبستگی برای پیش بینی های آینده باید مراقبت شود. محاسبات انجام شده فقط می تواند نشان دهد که رابطه بین عوامل وجود دارد ، نمی تواند رابطه را اثبات کند. این امکان وجود دارد که عوامل دیگری در تغییر در متغیرها وجود داشته باشد که ممکن است مورد توجه قرار نگرفته باشد.

همچنین ، مانند تجزیه و تحلیل سری زمانی ، که در یک مقاله جداگانه به آن پرداخته می شود ، تجزیه و تحلیل رگرسیون از مشاهدات گذشته برای تلاش برای پیش بینی آنچه در آینده اتفاق خواهد افتاد استفاده می کند. این فرض که آنچه در گذشته اتفاق افتاده است ، نشانگر خوبی از آنچه در آینده اتفاق خواهد افتاد یک فرض ساده گرایانه است. در دنیای واقعی ، تغییرات در محیط (تکنولوژیکی ، اجتماعی ، زیست محیطی ، سیاسی ، اقتصادی و غیره) همگی می توانند عدم اطمینان ایجاد کنند و پیش بینی هایی را که از مشاهدات گذشته غیر واقعی است ، ایجاد می کند.

نوشته شده توسط یکی از اعضای تیم مدیریت مدیریت عملکرد

پلتفرم های تجاری...
ما را در سایت پلتفرم های تجاری دنبال می کنید

برچسب : نویسنده : مریم کاویانی بازدید : 25 تاريخ : سه شنبه 24 مرداد 1402 ساعت: 12:43