Nuriye بیش از 25 سال است که ریاضیات و آمار را آموزش می دهد. او عمدتاً با برخی از کلاسهای دبیرستان نمرات 9 تا 12 را تدریس می کرد. وی دارای مدرک لیسانس ریاضیات و مدرک کارشناسی ارشد آموزش و پرورش با تمرکز بر فناوری آموزشی است. او انواع کتابهای درسی ریاضی را همزمان کرد. او همچنین مواد یادگیری دیجیتالی را برای دانش آموزان و معلمان تهیه می کند.
گربه موضوعات مختلفی از جمله ارتباطات ، ریاضیات و فناوری را تدریس کرده است. CAT دارای مدرک کارشناسی ارشد در آموزش و پرورش است و هم اکنون در حال کار در دکتری خود است.
درک کنید که گسترش داده ها چیست و چگونه می توان گسترش داده ها را پیدا کرد. اقدامات مختلف گسترش و عمل را که محاسبه شده در آمار است ، کشف کنید. به روز شده: 02/13/2022
مجموعه داده ها مجموعه ای از اطلاعات است. داده ها می توانند از نظرسنجی ها ، اندازه گیری ها ، مشاهدات و غیره باشند. وقتی داده ها فقط در حدود یک متغیر هستند ، به آن داده های یک متغیره گفته می شود. نمونه هایی از داده های تک متغیره می تواند نمرات SAT ، ارتفاعات یا حقوق باشد. هنگامی که مجموعه داده کوچک است ، درک داده ها ساده تر است. هنگامی که یک مجموعه داده بزرگ وجود دارد ، برای درک بهتر داده ها ، باید تجزیه و تحلیل انجام شود تا برخی از استنتاج ها از داده ها ترسیم شود.
مجموعه داده های تک متغیره را می توان به دو روش مختلف تجزیه و تحلیل کرد:
گرایش مرکزی مرکز داده ها را توصیف می کند. در شکل 1 ، دو مجموعه داده X1 و X2 همان میانگین را دارند که 9 است. وقتی به گسترش داده ها نگاه می کنید ، با این حال ، کاملاً متفاوت است. در حالی که X1 دارای ده نقطه داده از 8 و یک 19 است ، X2 نسبتاً نسبتاً از 4 تا 14 پخش شده است. اگر این دو مجموعه فقط با استفاده از میانگین مقایسه می شدند ، می توان فرض کرد که آنها تقریباً یکسان هستند ، چه زمانیدر واقع آنها متفاوت هستند.
شکل 1 مجموعه داده های X1 و X2 میانگین یکسان دارند اما گسترش آنها بسیار متفاوت است
حقوق سالانه کارمندان شرکت A را که در زیر آورده شده است در نظر بگیرید:
20،000 دلار ، 20،000 دلار ، 20،000 دلار ، 20،000 دلار ، 400،000 دلار
میانگین این مجموعه داده 96000 دلار است ، به این معنی که میانگین حقوق سالانه در این شرکت 96،000 دلار است. این آشکارا گمراه کننده است.
شکل 2 اگر داده ها کم رنگ شده باشند ، گرایش های اصلی می تواند گمراه کننده باشد
اکنون شرکت B را دوباره در نظر بگیرید ، دوباره با 5 کارمند که حقوق آنها در زیر داده می شود:
10،000 دلار ، 11،000 دلار ، 50،000 دلار ، 50،500 دلار ، 50،600 دلار
میانه این مجموعه داده ها 50،000 دلار است ، اما بار دیگر می گوید حقوق متوسط در این شرکت 50،000 دلار در سال است گمراه کننده است.
هر دو اندازه ، میانگین و میانگین ، فقط مرکز داده ها را نشان می دهند و بنابراین می توانند منجر به نتیجه گیری گمراه کننده شوند. میانگین به ویژه به مقادیر شدید داده ها حساس است ، همانطور که در مورد شرکت A. مشاهده می شود.
دامنه تفاوت بین حداکثر و حداقل مقدار مجموعه داده است.
مثال: حقوق سالانه شرکت A را در نظر بگیرید:
20،000 دلار ، 20،000 دلار ، 20،000 دلار ، 400،000 دلار
دامنه حقوق در این شرکت خواهد بود
مجموعه داده ها را می توان با تقسیم مجموعه داده ها به چهار زیر مجموعه مساوی ، به نام کوارتیل ها تجزیه و تحلیل کرد. میانه نشان دهنده وسط داده ها است ، و همچنین به آن کوارتیل دوم نیز گفته می شود.
محدوده بین قشر یا IQR توزیع نیمه میانی یک مجموعه داده است. این تفاوت بین کوارتیل سوم و اولین کوارتیل مجموعه داده است.
نمرات SAT 11 دانش آموز را در نظر بگیرید: 600 ، 720 ، 640 ، 450 ، 710 ، 640 ، 780 ، 550 ، 640 ، 730 ، 670.
برای پیدا کردن دامنه interquartile:
این بدان معنی است که نیمه میانی مجموعه داده ها دارای 120 است.
تاباتا مدیر تئاتر جامعه محلی است. او در حال جمع آوری برگه های استماع برای نمایشنامه های فصل بعد است. او در حال تنظیم استماع برای دو نمایشنامه است. یکی به نام Wonky Willy: The Candy Maker ، یک موزیکال درباره یک سازنده آب نبات مرموز است که برای کودکان و والدین آنها مسابقه ای ایجاد می کند تا از کارخانه آب نبات اسرارآمیز خود دیدن کنند. برای این نمایشنامه ، Tabatha به بازیگران با بازیگران در دسته های مختلف سنی نیاز دارد. Tabatha سن متوسط نمایشنامه را می داند ، اما از آنجا که برخی از سنین بسیار متفاوت است ، او به روش بهتری برای شناسایی تغییرات در رده های سنی نیاز دارد.
Tabatha می تواند این کار را با نگاه به گسترش در مجموعه داده انجام دهد. گسترش داده ها اندازه گیری میزان تعداد تعداد داده ها از میانگین یا میانگین است. ما می توانیم با استفاده از روشهای مختلف که به عنوان اقدامات گسترش شناخته می شوند ، گسترش را به روشهای مختلفی محاسبه کنیم.
تاباتا سوابق قدیمی را از آخرین باری که تئاترش روی ویلی ویلی قرار داد ، بیرون می کشد. او تمام سنین بازیگران را برای ما نوشت: 12 ، 64 ، 11 ، 42 ، 9 ، 57 ، 13 ، 38 ، 12 ، 47 ، 43 ، 29 ، 36.
Tabatha می تواند به ما بگوید که میانگین این مجموعه داده تقریباً 31. 7 است و میانگین آن تقریباً 36 است. با این حال ، او نمی تواند تبلیغ کند که به بازیگران بین 32 تا 36 سال نیاز دارد - این نادرست خواهد بود. سه روش وجود دارد که Tabatha می تواند برای یافتن گسترش در داده های خود استفاده کند: دامنه ، دامنه بین Quartile و واریانس.
خطایی در تلاش برای بارگذاری این فیلم رخ داده است.
سعی کنید صفحه را تازه کنید یا با پشتیبانی مشتری تماس بگیرید.
به عنوان یک عضو ، شما همچنین به بیش از 84000 درس در ریاضی ، انگلیسی ، علوم ، تاریخ و موارد دیگر دسترسی نامحدود خواهید داشت. به علاوه ، تست های تمرین ، آزمونها و مربیگری شخصی را دریافت کنید تا به شما در موفقیت کمک کند.
دسترسی نامحدودی به بیش از 84000 درس داشته باشید.
من قطعاً مطالعه را به همکارانم توصیه می کنم. این مانند یک معلم است که یک گرز جادویی را تکان داده و کار را برای من انجام داده است. احساس می کنم این یک نجات است.
می خواهید بعداً دوباره این را تماشا کنید؟
وارد سیستم شوید یا ثبت نام کنید تا این درس را به یک دوره سفارشی اضافه کنید.
میانگین انحراف یا میانگین انحراف مطلق ، میانگین تفاوتهای مطلق (انحراف) مقادیر داده از میانگین مجموعه داده است. همچنین می تواند به عنوان میانگین فاصله تا میانگین تعریف شود. برای اندازه نمونه n ، میانگین انحراف با استفاده از فرمول محاسبه می شود
نوار: میانگین مجموعه داده ها
دو مجموعه داده را در شکل 1 در نظر بگیرید
با استفاده از فرمول فوق ، می توان میانگین انحراف داده X2 را به شرح زیر محاسبه کرد:
میانگین انحراف مجموعه داده ها
شکل 3 MD مجموعه داده X2
اندازه گیری پراکندگی از میانگین انحراف استاندارد نامیده می شود. هنگامی که انحراف استاندارد کم است ، به این معنی است که مقادیر داده ها بیشتر در حدود میانگین هستند و وقتی انحراف استاندارد زیاد باشد ، به این معنی است که مقادیر داده از میانگین دور می شوند.
نوار: میانگین مجموعه داده ها
به طور خاص ، این ریشه مربع میانگین انحراف مربع از میانگین مجموعه داده است. هنگامی که انحراف استاندارد مربع است ، به آن واریانس مجموعه داده ها گفته می شود که میانگین انحراف مربع از میانگین است.
مجموعه داده ها را در نظر بگیرید
بنابراین واریانس این مجموعه داده است
مجموعه داده ها برای کشف اطلاعات مورد تجزیه و تحلیل قرار می گیرند. در حالی که گرایشهای اصلی اطلاعاتی در مورد مرکز داده ها ارائه می دهد ، تجزیه و تحلیل گسترش داده ها می تواند نشان دهد که چگونه نقاط داده گسترش می یابد. دامنه تفاوت بین حداکثر و حداقل مقادیر مجموعه داده است. دامنه بین قشر یا IQR می گوید که چگونه داده ها در اطراف میانه پخش می شوند. IQR تفاوت بین کوارتیل سوم و اولین کوارتیل مجموعه داده ها است. میانگین انحراف و انحراف استاندارد ، اطلاعاتی در مورد چگونگی پخش داده ها در مورد میانگین به ما ارائه می دهد. میانگین انحراف میانگین انحراف مطلق از میانگین است. انحراف استاندارد ریشه مربع میانگین انحراف مربع از میانگین است ، در حالی که واریانس مربع انحراف استاندارد است.
ساده ترین راه برای یافتن گسترش در یک مجموعه داده ، شناسایی دامنه است که این تفاوت بین بالاترین و کمترین مقادیر در یک مجموعه داده است. بیایید سنین را برای آخرین تولید از حداقل به بزرگترین: 9 ، 11 ، 12 ، 12 ، 13 ، 29 ، 36 ، 38 ، 42 ، 43 ، 47 ، 57 ، 64 ترتیب دهیم.
اکنون کمترین تعداد و بالاترین تعداد را کسب کرده و تفاوت را پیدا کنید: 64 - 9 = 55. در سنین مختلف برای این تولید گسترش 55 ساله وجود دارد. دامنه احتمالاً بهترین اندازه گیری برای این داده ها است. Tabatha می تواند تبلیغ کند که او به دنبال بازیگران بین 9 تا 64 سال برای این تولید است. بیایید به روش های دیگری که Tabatha می تواند گسترش داده های خود را پیدا کند ، نگاه کنیم.
دامنه interquartile مقداری است که تفاوت بین مقدار کوارتیل فوقانی و مقدار کوارتیل پایین تر است. برای این روش ما باید هر کوارتیل را در مجموعه داده ها پیدا کنیم. برای یافتن کوارتل ها ، این مراحل را دنبال کنید:
برای نگاهی عمیق تر به کوارتل ها ، درس ما را در مورد "کوارتیل ها و محدوده بین کوارتیل" بررسی کنید.
میانگین ما 36 است که دوتایی دو است. برای هر نیمی از مجموعه داده ها باید میانه را پیدا کنیم ، میانه برای کوارتیل (نیمه پایین مجموعه داده) 12 و میانگین برای کوارتیل سه (نیمه بالایی مجموعه داده) 45 است.
برای یافتن دامنه بین قشر ، به سادگی کوارتیل فوقانی را بگیرید و کوارتیل پایین را کم کنید: 45 - 12 = 33. دامنه بین قشر 33 است. این بدان معنی است که اکثر سنین موجود در این مجموعه داده ها در طی 33 سال از یکدیگر قرار دارند. در حالی که این اطلاعات ممکن است دامنه سنی خاصی را که به دنبالش است ، به تاباتا نکند ، ممکن است به او کمک کند تا انواع سنین مورد نظر خود را در این تولید درک کند.
حال بیایید به واریانس این مجموعه داده نگاه کنیم. واریانس تا چه اندازه مجموعه ای از اعداد پخش شده است. برای یافتن واریانس ، این مراحل را دنبال کنید:
برای یافتن واریانس در این مجموعه داده به نمودار زیر نگاهی بیندازید:
ستون اول شامل تمام اعداد موجود در مجموعه داده است ، ستون دوم میانگین مجموعه داده را نشان می دهد. در ستون های بعدی ، ما نتایج ستون شماره دو را گرفته ایم و هر عدد را مربع کرده ایم. در ستون چهارم ، ما هر شماره را از ستون سه گرفته ایم و آنها را به هم اضافه کرده ایم و در ستون پنجم و پایا13. واریانس ما از این مجموعه داده 329. 72 است.
هنگامی که شما در حال تجزیه و تحلیل واریانس یک مجموعه داده هستید ، هر چه واریانس بزرگتر باشد ، گسترش بیشتر می شود. شماره 329. 72 به ما می گوید که داده ها گسترش زیادی دارند و تعداد آنها با میانگین بسیار متفاوت است. برای کسب اطلاعات بیشتر در مورد واریانس ، درس ما را در مورد "جمعیت و واریانس نمونه" بررسی کنید.
همچنین می توانید از انحراف استاندارد برای یافتن گسترش در یک مجموعه داده استفاده کنید. برای سادگی ، انحراف استاندارد ریشه مربع واریانس است. بنابراین ، انحراف استاندارد این مجموعه داده تقریباً 18. 15 است. برای دیدن این مفهوم به عمق ، "انحراف استاندارد و تغییر در میانگین" درس ما را بررسی کنید.
گسترش در داده ها اندازه گیری میزان تعداد اعداد موجود در یک مجموعه داده از میانگین یا میانگین است. گسترش در داده ها می تواند به ما نشان دهد که در مقادیر مجموعه داده ها چقدر تغییر می کند. برای شناسایی اینکه آیا مقادیر موجود در مجموعه داده نسبتاً نزدیک به هم نزدیک هستند یا از هم جدا شده اند ، مفید است. سه روش وجود دارد که می توانید برای پیدا کردن پخش در یک مجموعه داده استفاده کنید: دامنه ، دامنه interquartile و واریانس.
دامنه تفاوت بین بالاترین و کمترین مقادیر در یک مجموعه داده است. با گرفتن کمترین تعداد در مجموعه داده ها و بیشترین تعداد در مجموعه داده ها و تفریق آنها می توانید دامنه را پیدا کنید. اینگونه است که تاباتا دامنه سنی بازیگران مورد نیاز خود را برای بازی خود پیدا کرد.
همچنین می توانید با استفاده از محدوده interquartile ، گسترش در داده های مجموعه را پیدا کنید ، که مقداری است که تفاوت بین مقدار کوارتیل فوقانی و مقدار کوارتیل پایین تر است. برای این روش باید هر کوارتیل را در مجموعه داده ها پیدا کنید. برای یافتن کوارتل ها ، این مراحل را دنبال کنید:
همچنین می توانید از واریانس استفاده کنید ، که تا چه حد مجموعه ای از اعداد پخش شده است. برای یافتن واریانس ، این مراحل را دنبال کنید:
هر یک از این روشها چیزی در مورد گسترش داده ها به ما می گوید. دامنه برای مجموعه های داده ای که به دنبال داده هایی هستید که واقعاً بسیار از هم و همه جانبه هستند ، بهترین است. محدوده interquartile برای زمانی که به گروهی از اعداد نگاه می کنید و مقایسه آنها با میانگین ، مانند نمرات آزمون یا داده های مبتنی بر عملکرد ، مانند نمرات بازی ، بهتر است. واریانس برای نشان دادن اینکه تعداد اعداد تا چه اندازه از یکدیگر با استفاده از یک مقدار واحد در مقایسه با میانگین پخش می شوند ، بهتر است. هرچه مقدار واریانس بزرگتر باشد ، اعداد دورتر از میانگین پخش می شوند.
بعد از این درس باید بتوانید:
برای باز کردن این درس باید یک عضو مطالعه باشید. حساب خود را ایجاد کنید < SPAN> نتیجه را با تعداد کل اعداد موجود در مجموعه داده تقسیم کنید.
پلتفرم های تجاری...برچسب : نویسنده : مریم کاویانی بازدید : 44