گسترش اقدامات و مثال های داده ها |آمار گسترش چیست؟

ساخت وبلاگ

Nuriye بیش از 25 سال است که ریاضیات و آمار را آموزش می دهد. او عمدتاً با برخی از کلاسهای دبیرستان نمرات 9 تا 12 را تدریس می کرد. وی دارای مدرک لیسانس ریاضیات و مدرک کارشناسی ارشد آموزش و پرورش با تمرکز بر فناوری آموزشی است. او انواع کتابهای درسی ریاضی را همزمان کرد. او همچنین مواد یادگیری دیجیتالی را برای دانش آموزان و معلمان تهیه می کند.

گربه موضوعات مختلفی از جمله ارتباطات ، ریاضیات و فناوری را تدریس کرده است. CAT دارای مدرک کارشناسی ارشد در آموزش و پرورش است و هم اکنون در حال کار در دکتری خود است.

درک کنید که گسترش داده ها چیست و چگونه می توان گسترش داده ها را پیدا کرد. اقدامات مختلف گسترش و عمل را که محاسبه شده در آمار است ، کشف کنید. به روز شده: 02/13/2022

فهرست مطالب

گسترش داده ها چیست؟

مجموعه داده ها مجموعه ای از اطلاعات است. داده ها می توانند از نظرسنجی ها ، اندازه گیری ها ، مشاهدات و غیره باشند. وقتی داده ها فقط در حدود یک متغیر هستند ، به آن داده های یک متغیره گفته می شود. نمونه هایی از داده های تک متغیره می تواند نمرات SAT ، ارتفاعات یا حقوق باشد. هنگامی که مجموعه داده کوچک است ، درک داده ها ساده تر است. هنگامی که یک مجموعه داده بزرگ وجود دارد ، برای درک بهتر داده ها ، باید تجزیه و تحلیل انجام شود تا برخی از استنتاج ها از داده ها ترسیم شود.

مجموعه داده های تک متغیره را می توان به دو روش مختلف تجزیه و تحلیل کرد:

  1. مرکز داده خلاصه کل مجموعه است. میانگین و میانگین اقدامات نشان دهنده مرکز داده ها است. میانگین یک مجموعه داده با اضافه کردن تمام مقادیر موجود در مجموعه و تقسیم بر تعداد نقاط داده یافت می شود ، در حالی که وقتی مجموعه داده از حداقل به بزرگترین سفارش داده می شود ، میانگین ارزش متوسط است.
  2. گسترش داده ها (همچنین به عنوان تنوع ، نوسان ، پراکندگی و غیره شناخته می شود) اندازه گیری این است که داده ها از مرکز داده ها (میانگین یا میانه) تا چه حد متغیر است. دامنه ، دامنه بین قشر ، میانگین انحراف و انحراف استاندارد اقدامات گسترش داده ها است.

نحوه یافتن گسترش داده ها

گرایش مرکزی مرکز داده ها را توصیف می کند. در شکل 1 ، دو مجموعه داده X1 و X2 همان میانگین را دارند که 9 است. وقتی به گسترش داده ها نگاه می کنید ، با این حال ، کاملاً متفاوت است. در حالی که X1 دارای ده نقطه داده از 8 و یک 19 است ، X2 نسبتاً نسبتاً از 4 تا 14 پخش شده است. اگر این دو مجموعه فقط با استفاده از میانگین مقایسه می شدند ، می توان فرض کرد که آنها تقریباً یکسان هستند ، چه زمانیدر واقع آنها متفاوت هستند.

شکل 1 مجموعه داده های X1 و X2 میانگین یکسان دارند اما گسترش آنها بسیار متفاوت است

حقوق سالانه کارمندان شرکت A را که در زیر آورده شده است در نظر بگیرید:

20،000 دلار ، 20،000 دلار ، 20،000 دلار ، 20،000 دلار ، 400،000 دلار

میانگین این مجموعه داده 96000 دلار است ، به این معنی که میانگین حقوق سالانه در این شرکت 96،000 دلار است. این آشکارا گمراه کننده است.

شکل 2 اگر داده ها کم رنگ شده باشند ، گرایش های اصلی می تواند گمراه کننده باشد

اکنون شرکت B را دوباره در نظر بگیرید ، دوباره با 5 کارمند که حقوق آنها در زیر داده می شود:

10،000 دلار ، 11،000 دلار ، 50،000 دلار ، 50،500 دلار ، 50،600 دلار

میانه این مجموعه داده ها 50،000 دلار است ، اما بار دیگر می گوید حقوق متوسط در این شرکت 50،000 دلار در سال است گمراه کننده است.

هر دو اندازه ، میانگین و میانگین ، فقط مرکز داده ها را نشان می دهند و بنابراین می توانند منجر به نتیجه گیری گمراه کننده شوند. میانگین به ویژه به مقادیر شدید داده ها حساس است ، همانطور که در مورد شرکت A. مشاهده می شود.

دامنه

دامنه تفاوت بین حداکثر و حداقل مقدار مجموعه داده است.

مثال: حقوق سالانه شرکت A را در نظر بگیرید:

20،000 دلار ، 20،000 دلار ، 20،000 دلار ، 400،000 دلار

دامنه حقوق در این شرکت خواهد بوددامنه = 400000 دلار-20000 $ = 380000 دلار

دامنه بین قشر

مجموعه داده ها را می توان با تقسیم مجموعه داده ها به چهار زیر مجموعه مساوی ، به نام کوارتیل ها تجزیه و تحلیل کرد. میانه نشان دهنده وسط داده ها است ، و همچنین به آن کوارتیل دوم نیز گفته می شود.q_2، همانطور که داده ها را به دو قسمت مساوی تقسیم می کند.

محدوده بین قشر یا IQR توزیع نیمه میانی یک مجموعه داده است. این تفاوت بین کوارتیل سوم و اولین کوارتیل مجموعه داده است.

نمرات SAT 11 دانش آموز را در نظر بگیرید: 600 ، 720 ، 640 ، 450 ، 710 ، 640 ، 780 ، 550 ، 640 ، 730 ، 670.

برای پیدا کردن دامنه interquartile:

  • داده ها را از کوچکترین تا بزرگترین سازماندهی کنید: 450 ، 550 ، 600 ، 640 ، 640 ، 640 ، 670 ، 710 ، 720 ، 730،780
  • وجود داردn = 11نقاط داده ، بنابراینمیانه = frac = frac = 6، این بدان معنی است که شماره ششم در مجموعه میانه خواهد بود.q_2 = 640
  • برای یافتن اولین کوارتیل ، از آن استفاده کنیدq_1 = frac = frac = 3؛این بدان معنی است که شماره سوم اولین کوارتیل یا کوارتیل پایین استq_1 = 600
  • برای یافتن کوارتیل سوم ، از آن استفاده کنیدq_3 = 3 cdot frac = 3 cdot frac = 9؛این بدان معنی است که شماره نهم سومین کوارتیل استq_3 = 720
  • تفاوت بین کوارتیل سوم و کوارتیل اول را پیدا کنیدiqr = q_3-q_1 = 720-600 = 120

این بدان معنی است که نیمه میانی مجموعه داده ها دارای 120 است.

گسترش در مجموعه داده ها

تاباتا مدیر تئاتر جامعه محلی است. او در حال جمع آوری برگه های استماع برای نمایشنامه های فصل بعد است. او در حال تنظیم استماع برای دو نمایشنامه است. یکی به نام Wonky Willy: The Candy Maker ، یک موزیکال درباره یک سازنده آب نبات مرموز است که برای کودکان و والدین آنها مسابقه ای ایجاد می کند تا از کارخانه آب نبات اسرارآمیز خود دیدن کنند. برای این نمایشنامه ، Tabatha به بازیگران با بازیگران در دسته های مختلف سنی نیاز دارد. Tabatha سن متوسط نمایشنامه را می داند ، اما از آنجا که برخی از سنین بسیار متفاوت است ، او به روش بهتری برای شناسایی تغییرات در رده های سنی نیاز دارد.

Tabatha می تواند این کار را با نگاه به گسترش در مجموعه داده انجام دهد. گسترش داده ها اندازه گیری میزان تعداد تعداد داده ها از میانگین یا میانگین است. ما می توانیم با استفاده از روشهای مختلف که به عنوان اقدامات گسترش شناخته می شوند ، گسترش را به روشهای مختلفی محاسبه کنیم.

تاباتا سوابق قدیمی را از آخرین باری که تئاترش روی ویلی ویلی قرار داد ، بیرون می کشد. او تمام سنین بازیگران را برای ما نوشت: 12 ، 64 ، 11 ، 42 ، 9 ، 57 ، 13 ، 38 ، 12 ، 47 ، 43 ، 29 ، 36.

Tabatha می تواند به ما بگوید که میانگین این مجموعه داده تقریباً 31. 7 است و میانگین آن تقریباً 36 است. با این حال ، او نمی تواند تبلیغ کند که به بازیگران بین 32 تا 36 سال نیاز دارد - این نادرست خواهد بود. سه روش وجود دارد که Tabatha می تواند برای یافتن گسترش در داده های خود استفاده کند: دامنه ، دامنه بین Quartile و واریانس.

خطایی در تلاش برای بارگذاری این فیلم رخ داده است.

سعی کنید صفحه را تازه کنید یا با پشتیبانی مشتری تماس بگیرید.

برای ادامه تماشای باید یک حساب کاربری را به شما بپردازید

برای مشاهده این درس ثبت نام کنید

به عنوان یک عضو ، شما همچنین به بیش از 84000 درس در ریاضی ، انگلیسی ، علوم ، تاریخ و موارد دیگر دسترسی نامحدود خواهید داشت. به علاوه ، تست های تمرین ، آزمونها و مربیگری شخصی را دریافت کنید تا به شما در موفقیت کمک کند.

دسترسی نامحدودی به بیش از 84000 درس داشته باشید.

قبلاً ثبت نام کرده اید؟برای دسترسی به اینجا وارد شوید

منابع ایجاد شده توسط معلمان برای معلمان

من قطعاً مطالعه را به همکارانم توصیه می کنم. این مانند یک معلم است که یک گرز جادویی را تکان داده و کار را برای من انجام داده است. احساس می کنم این یک نجات است.

Jennifer B.

شما در حال چرخش هستید. ادامه کار خوب!

فقط ورود به سیستم. آیا هنوز تماشا می کنید؟

می خواهید بعداً دوباره این را تماشا کنید؟

وارد سیستم شوید یا ثبت نام کنید تا این درس را به یک دوره سفارشی اضافه کنید.

انحراف متوسط

میانگین انحراف یا میانگین انحراف مطلق ، میانگین تفاوتهای مطلق (انحراف) مقادیر داده از میانگین مجموعه داده است. همچنین می تواند به عنوان میانگین فاصله تا میانگین تعریف شود. برای اندازه نمونه n ، میانگین انحراف با استفاده از فرمول محاسبه می شود

n:تعداد مقادیر داده در مجموعه

x_i: مقادیر داده در مجموعه

نوار: میانگین مجموعه داده ها

دو مجموعه داده را در شکل 1 در نظر بگیرید

x1: 10 ، 8 ، 13 ، 9 ، 11 ، 14 ، 6 ، 4 ، 12 ، 7 ، 5 ؛ bar = 9

x2: 8 ، 8 ، 8 ، 8 ، 8 ، 8 ، 8 ، 19 ، 8 ، 8 ، 8 ؛ bar = 9

با استفاده از فرمول فوق ، می توان میانگین انحراف داده X2 را به شرح زیر محاسبه کرد:

میانگین انحراف مجموعه داده هاx17. 64 است ، همانطور که در شکل 3 در زیر مشاهده می شود. اگرچه هر دو مجموعه داده میانگین یکسان دارند ، اما میانگین انحراف از میانگین مجموعهx1بالاتر استاین بدان معنی است که نقاط داده های فردی در مجموعه داده X1 از میانگین نقاط داده در مجموعه داده X2 بیشتر از میانگین هستند.

شکل 3 MD مجموعه داده X2

انحراف معیار

اندازه گیری پراکندگی از میانگین انحراف استاندارد نامیده می شود. هنگامی که انحراف استاندارد کم است ، به این معنی است که مقادیر داده ها بیشتر در حدود میانگین هستند و وقتی انحراف استاندارد زیاد باشد ، به این معنی است که مقادیر داده از میانگین دور می شوند.

n:تعداد مقادیر داده در مجموعه

x_i: مقادیر داده در مجموعه

نوار: میانگین مجموعه داده ها

به طور خاص ، این ریشه مربع میانگین انحراف مربع از میانگین مجموعه داده است. هنگامی که انحراف استاندارد مربع است ، به آن واریانس مجموعه داده ها گفته می شود که میانگین انحراف مربع از میانگین است.

مجموعه داده ها را در نظر بگیریدx1: 10 ، 8 ، 13 ، 9 ، 11 ، 14 ، 6 ، 4 ، 12 ، 7 ، 5 ؛ bar = 9

بنابراین واریانس این مجموعه داده است( sqrt)^2 = 10

خلاصه درس

مجموعه داده ها برای کشف اطلاعات مورد تجزیه و تحلیل قرار می گیرند. در حالی که گرایشهای اصلی اطلاعاتی در مورد مرکز داده ها ارائه می دهد ، تجزیه و تحلیل گسترش داده ها می تواند نشان دهد که چگونه نقاط داده گسترش می یابد. دامنه تفاوت بین حداکثر و حداقل مقادیر مجموعه داده است. دامنه بین قشر یا IQR می گوید که چگونه داده ها در اطراف میانه پخش می شوند. IQR تفاوت بین کوارتیل سوم و اولین کوارتیل مجموعه داده ها است. میانگین انحراف و انحراف استاندارد ، اطلاعاتی در مورد چگونگی پخش داده ها در مورد میانگین به ما ارائه می دهد. میانگین انحراف میانگین انحراف مطلق از میانگین است. انحراف استاندارد ریشه مربع میانگین انحراف مربع از میانگین است ، در حالی که واریانس مربع انحراف استاندارد است.

دامنه

ساده ترین راه برای یافتن گسترش در یک مجموعه داده ، شناسایی دامنه است که این تفاوت بین بالاترین و کمترین مقادیر در یک مجموعه داده است. بیایید سنین را برای آخرین تولید از حداقل به بزرگترین: 9 ، 11 ، 12 ، 12 ، 13 ، 29 ، 36 ، 38 ، 42 ، 43 ، 47 ، 57 ، 64 ترتیب دهیم.

اکنون کمترین تعداد و بالاترین تعداد را کسب کرده و تفاوت را پیدا کنید: 64 - 9 = 55. در سنین مختلف برای این تولید گسترش 55 ساله وجود دارد. دامنه احتمالاً بهترین اندازه گیری برای این داده ها است. Tabatha می تواند تبلیغ کند که او به دنبال بازیگران بین 9 تا 64 سال برای این تولید است. بیایید به روش های دیگری که Tabatha می تواند گسترش داده های خود را پیدا کند ، نگاه کنیم.

دامنه بین قشر

دامنه interquartile مقداری است که تفاوت بین مقدار کوارتیل فوقانی و مقدار کوارتیل پایین تر است. برای این روش ما باید هر کوارتیل را در مجموعه داده ها پیدا کنیم. برای یافتن کوارتل ها ، این مراحل را دنبال کنید:

  1. داده ها را از حداقل به بزرگترین سفارش دهید.
  2. میانه مجموعه داده ها را پیدا کنید و مجموعه داده ها را به دو نیمه تقسیم کنید.
  3. میانه دو نیمه را پیدا کنید.

برای نگاهی عمیق تر به کوارتل ها ، درس ما را در مورد "کوارتیل ها و محدوده بین کوارتیل" بررسی کنید.

میانگین ما 36 است که دوتایی دو است. برای هر نیمی از مجموعه داده ها باید میانه را پیدا کنیم ، میانه برای کوارتیل (نیمه پایین مجموعه داده) 12 و میانگین برای کوارتیل سه (نیمه بالایی مجموعه داده) 45 است.

برای یافتن دامنه بین قشر ، به سادگی کوارتیل فوقانی را بگیرید و کوارتیل پایین را کم کنید: 45 - 12 = 33. دامنه بین قشر 33 است. این بدان معنی است که اکثر سنین موجود در این مجموعه داده ها در طی 33 سال از یکدیگر قرار دارند. در حالی که این اطلاعات ممکن است دامنه سنی خاصی را که به دنبالش است ، به تاباتا نکند ، ممکن است به او کمک کند تا انواع سنین مورد نظر خود را در این تولید درک کند.

واریانس

حال بیایید به واریانس این مجموعه داده نگاه کنیم. واریانس تا چه اندازه مجموعه ای از اعداد پخش شده است. برای یافتن واریانس ، این مراحل را دنبال کنید:

  1. میانگین مجموعه داده ها را پیدا کنید.
  2. هر عدد را از میانگین جدا کنید.
  3. نتیجه را مربع کنید.
  4. اعداد را به هم اضافه کنید.
  5. نتیجه را بر اساس تعداد کل اعداد در مجموعه داده تقسیم کنید.

برای یافتن واریانس در این مجموعه داده به نمودار زیر نگاهی بیندازید:

 

Example chart

ستون اول شامل تمام اعداد موجود در مجموعه داده است ، ستون دوم میانگین مجموعه داده را نشان می دهد. در ستون های بعدی ، ما نتایج ستون شماره دو را گرفته ایم و هر عدد را مربع کرده ایم. در ستون چهارم ، ما هر شماره را از ستون سه گرفته ایم و آنها را به هم اضافه کرده ایم و در ستون پنجم و پایا13. واریانس ما از این مجموعه داده 329. 72 است.

هنگامی که شما در حال تجزیه و تحلیل واریانس یک مجموعه داده هستید ، هر چه واریانس بزرگتر باشد ، گسترش بیشتر می شود. شماره 329. 72 به ما می گوید که داده ها گسترش زیادی دارند و تعداد آنها با میانگین بسیار متفاوت است. برای کسب اطلاعات بیشتر در مورد واریانس ، درس ما را در مورد "جمعیت و واریانس نمونه" بررسی کنید.

همچنین می توانید از انحراف استاندارد برای یافتن گسترش در یک مجموعه داده استفاده کنید. برای سادگی ، انحراف استاندارد ریشه مربع واریانس است. بنابراین ، انحراف استاندارد این مجموعه داده تقریباً 18. 15 است. برای دیدن این مفهوم به عمق ، "انحراف استاندارد و تغییر در میانگین" درس ما را بررسی کنید.

خلاصه درس

گسترش در داده ها اندازه گیری میزان تعداد اعداد موجود در یک مجموعه داده از میانگین یا میانگین است. گسترش در داده ها می تواند به ما نشان دهد که در مقادیر مجموعه داده ها چقدر تغییر می کند. برای شناسایی اینکه آیا مقادیر موجود در مجموعه داده نسبتاً نزدیک به هم نزدیک هستند یا از هم جدا شده اند ، مفید است. سه روش وجود دارد که می توانید برای پیدا کردن پخش در یک مجموعه داده استفاده کنید: دامنه ، دامنه interquartile و واریانس.

دامنه تفاوت بین بالاترین و کمترین مقادیر در یک مجموعه داده است. با گرفتن کمترین تعداد در مجموعه داده ها و بیشترین تعداد در مجموعه داده ها و تفریق آنها می توانید دامنه را پیدا کنید. اینگونه است که تاباتا دامنه سنی بازیگران مورد نیاز خود را برای بازی خود پیدا کرد.

همچنین می توانید با استفاده از محدوده interquartile ، گسترش در داده های مجموعه را پیدا کنید ، که مقداری است که تفاوت بین مقدار کوارتیل فوقانی و مقدار کوارتیل پایین تر است. برای این روش باید هر کوارتیل را در مجموعه داده ها پیدا کنید. برای یافتن کوارتل ها ، این مراحل را دنبال کنید:

  1. داده ها را از حداقل به بزرگترین سفارش دهید.
  2. میانه مجموعه داده ها را پیدا کنید و مجموعه داده ها را به دو نیمه تقسیم کنید.
  3. میانه دو نیمه را پیدا کنید.

همچنین می توانید از واریانس استفاده کنید ، که تا چه حد مجموعه ای از اعداد پخش شده است. برای یافتن واریانس ، این مراحل را دنبال کنید:

  1. میانگین مجموعه داده ها را پیدا کنید.
  2. هر عدد را از میانگین جدا کنید.
  3. نتیجه را مربع کنید.
  4. اعداد را به هم اضافه کنید.
  5. نتیجه را بر اساس تعداد کل اعداد در مجموعه داده تقسیم کنید.

هر یک از این روشها چیزی در مورد گسترش داده ها به ما می گوید. دامنه برای مجموعه های داده ای که به دنبال داده هایی هستید که واقعاً بسیار از هم و همه جانبه هستند ، بهترین است. محدوده interquartile برای زمانی که به گروهی از اعداد نگاه می کنید و مقایسه آنها با میانگین ، مانند نمرات آزمون یا داده های مبتنی بر عملکرد ، مانند نمرات بازی ، بهتر است. واریانس برای نشان دادن اینکه تعداد اعداد تا چه اندازه از یکدیگر با استفاده از یک مقدار واحد در مقایسه با میانگین پخش می شوند ، بهتر است. هرچه مقدار واریانس بزرگتر باشد ، اعداد دورتر از میانگین پخش می شوند.

نتایج یادگیری

بعد از این درس باید بتوانید:

  • توضیح دهید که گسترش در داده ها چیست و سه روش را برای شناسایی آن تعریف کنید
  • مراحل مربوط به یافتن دامنه و واریانس بین المللی را ذکر کنید
  • توصیف کنید چه زمانی بهتر است از محدوده ، دامنه بین قشر یا واریانس استفاده کنید

برای باز کردن این درس باید یک عضو مطالعه باشید. حساب خود را ایجاد کنید < SPAN> نتیجه را با تعداد کل اعداد موجود در مجموعه داده تقسیم کنید.

پلتفرم های تجاری...
ما را در سایت پلتفرم های تجاری دنبال می کنید

برچسب : نویسنده : مریم کاویانی بازدید : 44 تاريخ : شنبه 6 خرداد 1402 ساعت: 23:17