در این شماره از خبرنامه به خطاهای آماری شایع در مقالات علمی خواهیم پرداخت. با ما همراه باشید…
خطاهای آماری شایع در مقالات علمی:
بررسیهای مختلف نشان داده است که علیرغم گسترش وسیع علم آمار و ابزارهای مربوط به آن به منظور استفاده در پژوهشهای پزشکی، خطاهای فراوانی در بهکارگیری، تفسیر و ارائه نتایج حاصل از این ابزارها و روشها دیده میشود. این خطاها با وجود آن که در بسیاری از موارد با روشهای سادهای قابل پیشگیری هستند در بهترین و معتبرترین مجلات علمی نیز مشاهده میگردند و وضعیتی بسیار فراگیر و بالقوه خطرناک دارند.
در این بخش صرفاً به ذکر برخی از مهمترین و شایعترین این خطاها میپردازیم تا محققین و نویسندگان عزیز از تکرار چنین خطاهایی در کارهای خود اجتناب ورزند.
– استفاده از روشهای آزمون و تحلیل دادهها در جایی که پیش فرضهای لازم برای انجام آن آزمون برقرار نمیباشند. این پیشفرضها معمولاً متعدد بوده و متاسفانه گاهی از اوقات برخی و یا تمامی آنها مورد بیتوجهی قرار می گیرند. برخی از این موارد عبارتند از نوع متغیر، شکل توزیع آن، تعداد گروههای مورد مقایسه و وجود یا عدم وجود ارتباط بین دادههای مورد بررسی در گروههای مختلف؛
– تحلیل دادههای زوج بدون در نظر گرفتن زوج بودن آنها. در صورتی که دادههای مورد بررسی از نوع زوج باشد، بدین معنی که اندازهگیریها در مقاطع زمانی متفاوت بر روی یکسری از نمونهها و یا در یک مقطع زمانی بر روی دو سری از نمونههای همسان شده انجام شده باشند، و مانند گروههای مستقل از هم مورد تحلیل قرار گیرند توان آزمون مربوطه در شناسایی ارتباط بین آنها به شدت کاهش یافته و نتایجی کاملاً گمراه کننده به دنبال خواهد داشت؛
– تجزیه و تحلیل متغیرهای رتبهای بدون لحاظ نمودن رتبه هر یک طبقات متغیر. عدم توجه به رتبه هر یک از گروهها نسبت به سایرین موجب میگردد تا وجود ارتباط بین عامل مورد بررسی با رتبه هر یک از طبقات متغیر دیگر، به شکل روندی افزاینده یا کاهنده، مورد غفلت قرار گیرد؛
– انجام مشاهدات و تحلیلهای متعدد بر روی یک نمونه به شکل مستقل از هم. دادههایی که از یک نمونه به دست میآیند در اغلب موارد ارتباطی قوی با هم داشته و تاثیر به سزایی در بررسی آنها بین نمونههای مختلف دارند، نظیر ارتباط فشار خون هر فرد با نمایه توده بدنی و سطح کسترول تام سرم وی و نیز ارتباط دو عامل اخیر با یکدیگر. در صورتی که این ارتباط و نقش نمایه توده بدنی فرد و سطح کسترول تام سرم وی با فشار خون فرد در مقایسه فشار خون گروههای مختلف لحاظ نگردد موجب مخدوش شدن روابط بین متغیرها خواهد شد؛
– بهکارگیری آزمونهای متعدد و دوتایی به جای استفاده از آزمونی که تمامی گروهها را لحاظ نماید (نظیر تحلیل واریانس). در چنین مواردی به دلیل احتمال وجود خطا در هر بار آزمون، احتمال بروز خطا در آزمونهای متعدد به شدت افزایش مییابد؛
– انجام تحلیلهای درون گروهی و سپس مقایسه گروهها با استفاده از مقایسه P-valueها. یکی از محدودیتهای مهم P-value عدم امکان مقایسه آزمونهای مختلف براساس نتایج آنهاست که متاسفانه به شکلی نادرست در برخی موارد مورد استنتاج قرار میگیرد؛
– استفاده از آزمون همبستگی در مطالعه روشهای تشخیصی مختلف. بدیهی است که آزمونهای تشخیصی که بر روی یک گروه از نمونهها انجام میشوند نتایجی همجهت و وابسته داشته باشند، در حالی که این نتایج نسبت به هم اختلاف مطلق بسیاری داشته و همبستگی بین آنها نیز به لحاظ بالینی هیچ ارزشی ندارد؛
– بهکار بردن خطای معیار و یا فاصله اطمینان در بیان دادههای توصیفی. در بیان توصیفی دادهها از شاخصهای مرکزی نظیر میانگین، میانه و … و شاخصهای پراکندگی نظیر انحراف معیار، واریانس، محدوده و … استفاده میشود. در حالی که خطای معیار و یا فاصله اطمینان به منظور تحلیل یافتهها و برآورد بهکار میروند که بایستی در ارائه دادههای توصیفی از بیان آنها اجتناب نمود؛
– ارائه میانگین و یا میانه دادههای کمی بدون ارائه شاخص پراکندگی دادهها (نظیر انحراف معیار و یا محدوه و …). این امر موجب محدودیت بسیار فراوان در تفسیر مناسب یافتهها و مقایسه بین مطالعات مختلف میگردد؛
– استفاده از آنالیز رگرسیون خطی بدون آن که ارتباط بین متغیرها شکل خطی داشته باشد که در صورت وجود روابطی غیرخطی بین آنها موجب گمراهی محققین در یافتن ارتباط بین عوامل مختلف میشود؛
– تفسیر نتایج غیر معنیدار به عنوان نتیجه منفی بدون درنظر گرفتن توان مطالعه. عدم معنیداری نتیجه یک آزمون به معنی عدم وجود ارتباط نیست. در چنین مواردی محاسبه توان آزمون میباشد که بیانگر عدم وجود رابطه و یا عدم توانایی آزمون در رد آن خواهد بود.
به منظور آشنایی بیشتر با نقش آمار در نگارش علمی، می توانید به فصل ۲۰ از کتاب مبانی نگارش علمی – تالیف آقای دکتر رامین حشمت، گروه نگارش علمی (SWT)- موسسه فرزان مراجعه نمایید.