Error Bar

قبلا راجع به نمودارهای جعبه ای یا همان Box plot صحبت شده بود. در این پست مختصری راجع به دیگر نمودار مهم تحلیلی به نام Error bar صحیت می کنیم.

این نوع نمودار، همانند نمودار جعبه ای می تواند برای مقایسه ی یک متغیر کمی در دو یا چند گروه مورد استفاده قرار بگیرد. در این نوع نمودار نقطه ی مرکزی همان میانگین متغیر کمی می باشد و ادامه ی نمودار از این نقطه به سمت بالا یا پایین می تواند یه اندازه دو انحراف معیار باشد (یا خطای استاندارد یا تعیین فاصله ی اطمینان خاص) که اگر نمودار توزیع نرمال را در نظر بگیریم در این صورت می تواند فاصله ی اطمینان 95% را برای مفدار میانگین مشخص کند.

نکته 1): با توجه به مورد بالا می توان گفت برای مقایسه ی یک متغیر کمی در چند گروه در صورتی که این متغیر توزیع نرمال داشته باشد بهتر است از نمودار error bar استفاده کنیم و در غیر این صورت بهتر است از نمودار جعبه ای استفاده شود.

نکته 2): با توجه به این که در error bar فاصله ی اطمینان 95% مشخص می شود، بر اساس همپوشانی این نمودارها، می توان از روی نمودار به وجود اختلاف معنی دارِ متغیر کمی، بین دو یا چند گروه موجود بر اساس متغیر کیفی پی برد

نکته 3): اگر بر اساس متعیر کمی دو گروه وجود داشته باشد و نمودار، در حال بررسیِ متعیر کمی در بین این دو گروه باشد به نوعی می توان گفت این نمودار بیان کننده ی تست Independent t test می باشد. و اگر بیش از دو گروه وجود داشته باشد نمودار بیان کننده ی تست Anova , post hoc می باشد.


نمودار جعبه ای

نمودار های جعبه ای (box plot) که نام دیگر آن ها (box and whisker به معنی جعبه و خطوط عمودی) می باشد می توانند اطلاعات سودمندی را در زمینه ی نحوه ی توزیع و پراکندگی و همچنین داده های دور از مرکز یک متغیر کمی به ما بدهند و همچنین می توانند توزیع یک متعیر کمی بر اساس متغیر های کیفی را نشان دهند. در نمودار های جعبه ای طول جعبه مهم است و عرض مفهومی ندارد.

وقتی از پایین به سمت بالا می رویم اولین مقدار در نمودار همان مقدار کمینه (Min) داده هاست بعد از آن به جعبه می رسیم که اولین مقدار، چارک (quartile) اول داده هاست یا همان صدک 25. بعد به خطی می رسیم در جعبه که میانه ی داده ها یا چارک دوم  یا صدک 50 را نشان می دهد این خط اگر در و سط جعبه باشد به این معناست که توزیع داده نرمال است بعد از آن به خط بالای جعبه می رسیم  که چارک سوم  یا صدک 75 را نشان می دهد. در نمودار جعبه ای به چارک اول ودوم پاشنه یا لولاهای توکی (tukey's Hings) می گویند.

داده هایی که بین دو چارک قرار می گیرند یعن طول جعبه، برابر با 50% داده ها هستند و به آن ها داده های بین چارکی می گویند (inter quartile range)  اگر خط وسط جعبه یعنی میانه به چارک اول نزدیک باشد یعنی داده ها توزیع نرمال ندارند و چولگی مثبت دارند و اگر به چارک سوم نزدیک باشد یعنی چولگی منفی دارند. خط آخر نیز مقدار بیشینه ی (max) داده ها می باشد پس به ترتیب از پایین به بالا داریم  مقدار کمینه، چارک اول، میانه یا چارک دوم، چارک سوم، مقدار بیشینه داده ها،

دقت داشته باشیم که خطوط به اندازه ی حد اکثر یک ونیم برابر طول جعبه پیش می روند اگر داده ای بین یک ونیم تا سه برابر طول جعبه باشد داده ی دور از مرکز (outlier) نامیده می شود و با علامت o خارج از قسمت اصلی نمودار نشان داده می شود. اگر داده ای حتی از 3 برابر طول جعبه  هم بیشتر باشد به آن داده ی بسیار دور از مرکز (extreme outlier) می گویند که با ستاره نشان داده می شود  در این دو حالت بهتر است دیتاهایی که وارد کرده ایم را مجددا چک کنیم که اشتباهی رخ نداده باشد. عدد کنار ستاره ما را در یافتن آن در spss کمک می کند.

دوستان اگه نظری دارند و یا مطلب ایرادی داره ممنون میشم راهنمایی کنید.