Bootstrap و Monte Carlo دو روش آماری در SPSS

در بعضی مطالعات حجم نمونه ای که روی آن کار شده است کم می باشد که می تواند به هر دلیل خاصی مثل شیوع کم بیماری باشد. در این شرایط آنالیز هایی که انجام می شود ممکن است مورد تایید داوران مجله نباشد. SPSS در این زمینه می تواند به ما کمک کند.

برای مثال وقتی به بررسی دو متغیر کیفی می پردازیم (که حداقل یکی از آنها بیشتر از دو حالت داشته باشد) می توان در همان منوی Cross tab گزینه ی Monte Carlo را فعال کرد و در خواست کرد تا آنالیز را با حجم نمونه ی 1000 یا 10000 یا .... تکرار کند

مشابه همین روش زمانی که بخواهیم یک متغیر کمی را در دو حالتِ یک متغیر کیفی بررسی کنیم، یعنی از تست  Independent  استفاده کنیم داریم که در آن قسمت باید سراغ گزینه bootstrap برویم و مشابه Monte Carlo  عمل کنیم

درخت تصمیم گیری برای انتخاب تست های آماری

انتخاب درست تست های آماری برای انجام درست مطالعات امری ضروری است که اکثرا به دست متخصصین آمار سپرده می شود. اما گاهی می توان با داشتن اطلاعاتی زمینه ای  با مراجعه به کتاب های آمار و یا منابع دیگر به تست صحیح رسید. یکی از این منابع سایت Microsiris می باشد که با پرسش هایی به صورت درختی شما را در انتخاب تست های آماری هدایت می کند

هر چند این راهنما کمی پیچیده می باشد اما به هر حال برای یادگیری هم شده، کار کردن با آن خالی از لطف نیست.

مبحث مهم Weight Cases در نرم افزار SPSS

یکی از قابلیت های شگفت انگیز نرم افزار SPSS اینه که میشه با وارد نمودن اطلاعات جدول یک مقاله (مثلا متغیر و فراوانی آن) و انجام اندکی تغییرات متوجه این موضوع شد که اطلاعات مقاله واقعیست یا دیتاسازی!

این موضوع در بحث داوری مقالات (Peer Review) خیلی به درد میخوره، درباره مقالات چاپ شده هم کاربرد داره، اگر نتایج مقاله ای غیر منطقی به نظر رسید، با انجام این کار میشه از صحت آنالیز انجام شده مطمئن شد و اگر اطلاعات صحت نداشت، با نوشتن مقاله ی "نامه ای به سردبیر (Letter to Editor)" و چاپ آن در همان مجله، آن را به اطلاع دیگران رساند. این فقط یکی از اهمیت های مبحث Wight Cases هست.

اگه به اهمیت Weight Cases پی بردید و خواهان یادگیری این مبحث بودید، می‌توانید در جلسه هفته ی بعد کارگاه آمار دکتر سپندی شرکت کنید. برای ثبت نام به این قسمت مراجعه کنید.

بر گرفته شده از کارگاه دکتر سپندی

با سلام، به طور خلاصه و مفید نکاتی از جلسات دکتر سپندی رو تو وبلاگ میذارم- فقط دوستان اگه اشکالی در مباحث باشه به علت کوتاهی و بی توجهی بنده است و انتظار دارم دوستان با نظراتشون موضوعات رو به بحث بگذارن...

شاخص های عددی برای داده های کمی بکار می رود و به دو شاخه تمایل به مرکز و پراکندگی تقسیم می شوند. شاخص های عددی که در شاخه تمایل به مرکز قرار می گیرند شامل میانگین و میانه و مد هستند و پراکندگی  مهمترین آن انحراف معیار می باشد.

از جمله فواید استفاده از میانگین این هست که ار تک تک دادها برای محاسبه آن استفاده می شود و از معایب آن این هست که اگر داده ی پرت (out layer) در میان دادها باشد بایاس ایجاد می شود.( یعنی تحت تاثیر این دادها قرار گرفته )

تفسیر میانه: داده ای که مقدار آن برای نیمی از افراد کمتر و برای نیمی از افراد بیشتر است وتحت تاثیر دادهای پرت قرار نمی گیرد.

وقتی شاخص مرکزی شما میانگین باشد ، شاخص پراکندگی شما انحراف معیار(SD) خواهد بود.

 اگر میانگین سن افراد شرکت کننده در مطالعه شما 30 کیلوگرم باشد و انحراف معیار 2 باشد تفسیر آن به این صورت هست که فاصله وزن هر فرد تا 30 کیلوگرم به طور متوسط 2 کیلوگرم هست یا بیشتر یا کمتر!

همراه ما باشید- ادامه دارد...

سلسله کارگاه های آمار و آشنایی با نرم افزارهای آماری

به اطلاع دانشجویان عزیز می‌رساند:

کمیته تحقیقات دانشجویی در راستای ارتقاء بنیه علمی دانشجویان، سلسله کارگاه‌های هفتگی  با موضوع آمار زیستی و آشنایی با نرم افزارهای آماری (SPSS, STATA) با تدریس جناب آقای دکتر سپندی برگزار می‌نماید.

* زمان: پنجشنبه هر هفته ساعت 8 صبح

جلسه اول پنج شنبه پنجم مهرماه 1392 ساعت 8 الی 12 با موضوع مقدمات آمار زیستی

* لازم به ذکر است شرکت در کارگاه برای سایر دانشجویانی که قادر به ثبت نام در تمام دوره نبوده‌اند آزاد است.

* شرکت در کارگاه برای دانشجویان دانشگاه علوم پزشکی بقیه ا... (عج) بدون هزینه می‌باشد.

جهت ثبت نام میتوانید بصورت اینترنتی ازطریق این لینک اقدام نموده، یا با شماره 81264354 تماس گرفته و یا مشخصات خود را به شماره 09376657018 پیامک نمائید.

برای مشاهده پوستر در سایز بزرگ کلیک نمایید

رگرسیون لجستیک

در رگرسیون لجستیک متغیر وابسته، متغیری دو حالته (Binary or Dichotomous)  می باشد.مثلا مرگ (وقوع مرگ درمقابل زندگی) و یا ابتلا به بیماری (سلامت در مقابل ابتلا به یک بیماری خاص).متغیر های مستقل نیز می توانند کمی و یا کیفی باشند.

چگونه یک معادله ی رگرسیون لجستیک نوشته می شود:

Y=a‑‑‑‑­1x1+a2x2+…akxk+b

که در آن x1 تا xk  متغیر های مستقل، y متغیر وابسته، a1 تاak ضریب رگرسیون(نشاندهنده ی اهمیت نسبی متغیر مستقل) می باشد در معادله رگرسیون خطی از آنجا که متغیر وابسته کمی است مشکلی درطرف معادله وجود ندارد اما در رگرسیون لجستیک سمت چپ معادله یعنی متغیر وابسته کیفی است و تنها دو حالت برای آن تعریف شده است که با سمت راست معادله که محدوده ی وسیعی را پوشش می دهد مطابقت ندارد و در نتیجه از نظر ریاضی صحیح نمی باشد.


ادامه نوشته

سایت تخصصی آمار و SPSS

یکی از سایت های بسیار جالب و جامع در خصوص آمار، سایت تخصصی آمار می باشد که دارای قسمت های مختلفی است. مثلا آموزش SPSS

ضمن اینکه می توانید در صورت تمایل کتاب های بسیار خوبی هم در زمینه آمار و ریاضیات از آن دانلود نمایید.

منبع خبر:http://www.nmsrc.ir