نحوهٔ تفسیر نتیجهٔ یک تست تشخیصی در افراد با رشته‌های مختلف: یک مطالعهٔ تجربی در اینستاگرام

0
98

نویسنده: احمد صوفی محمودی


مقدمه

در برنامهٔ درسی رشته‌های علوم پزشکی واحدهایی تحت عنوان آمار و روش تحقیق گنجانده شده است، با این حال بنا بر تجربه‌های پراکندهٔ نگارنده، دانشجویان این واحدها را جدی نمی‌گیرند و نسبت به مباحث آن بی‌میل هستند. هر چند که بیش‌تر تحقیقات علوم پزشکی کمّی و نیازمند گردآوری داده و تجزیه و تحلیل آن‌هاست و دانشجویان سه رشتهٔ پرمتقاضی علوم پزشکی، یعنی پزشکی و دندان‌پزشکی و داروسازی، در طی واحدهای مختلف رساله به تجزیه و تحلیل داده‌ها نیازمندند، اغلب آن‌ها این تجزیه و تحلیل را به افراد دیگری می‌سپارند و خود درگیر آن نمی‌شوند. این مسئله حتا در مورد پروژه‌های مربوط به واحدهای دوران تحصیل هم وجود دارد و تعداد کمی از دانشجویان خود را درگیر مسائل آماری می‌کنند. همین شاید موجب افت درک و استنباط آماری صاحبان حرفه‌های سلامت در طی زمان شود و اطلاعات آماری به‌خوبی تفسیر نشود (۱).

اهمیت این مسئله همواره مورد توجه نگارنده بوده و اگر دقیق‌تر به آن نگاه کنیم، می‌تواند مسئله‌ای نگران‌کننده باشد. اگر پزشکان آمارها را خوب تفسیر نکنند، چه اتفاقی می‌افتد؟ شاید کم‌ترین مشکل این باشد که به بیمار امید یا ناامیدی غیر واقعی داده شود. اگر یک سیاست‌مدار یا فرد تأثیرگذاری آمارها را خوب تفسیر نکند چه؟ در این صورت ابعاد قضیه وسیع‌تر نیز خواهد بود.

کاکرین مروری ساختارمند در این مورد منتشر کرده است (۲). در این مقالهٔ مروری روش‌های مختلف ارائهٔ نتایج آماری بررسی شده است و در آخر نتیجه این بوده که ارائهٔ آمار به‌صورت فراوانی بهتر از ارائهٔ آن به‌صورت درصد درک می‌شود. در مورد ارائهٔ نتایج کاهش خطر، کاهش خطر نسبی (Relative Risk Reduction) از کاهش خطر مطلق (Absolute Risk Reduction) و تعداد افراد لازم برای درمان (Number Needed to Treat) بهتر درک شده است. یکی از مقاله‌های باکیفیت که در این مرور ساختارمند گنجانده شده، مربوط به بررسی نحوهٔ تفسیر نتایج یک تست غربالگری توسط صاحبان حرفه‌های سلامت و بیماران و همراهان‌شان است. در این مطالعه، یک سؤال به دو صورت فراوانی و درصدی از متخصصان زنان و زایمان، ماماها، مادران باردار و همراهان آنان پرسیده شده است. دو صورت مختلف این سؤال در زیر آورده شده است:

صورت سؤال درصدی:

The serum test screens pregnant women for babies with Down’s syndrome. The test is a very good one, but not perfect. Roughly 1% of babies have Down’s syndrome. If the baby has Down’s syndrome, there is a 90% chance that the result will be positive. If the baby is unaffected, there is still a 1% chance that the result will be positive. A pregnant woman has been tested and the result is positive. What is the chance that her baby actually has Down’s syndrome? -……….%

صورت سؤال فراوانی:

The serum test screens pregnant women for babies with Down’s syndrome. The test is a very good one, but not perfect. Roughly 100 babies out of 10 000 have Down’s syndrome. Of these 100 babies with Down’s syndrome, 90 will have a positive test result. Of the remaining 9900 unaffected babies, 99 will still have a positive test result. How many pregnant women who have a positive result to the test actually have a baby with Down’s syndrome?………. out of…………

تصمیم گرفتم که این سؤال را در حساب شخصی اینستاگرام‌ام به‌صورت Story و با استفاده از Qunestion Sticker از دنبال‌کنندگانم بپرسم. صورت درصدی سؤال را که در پژوهش اصلی کم‌ترین میزان جواب را داشت، انتخاب کردم. استقبال غیر منتظره بود و چند نفر دیگر از دوستان هم این سؤال را به‌همین صورت در حساب‌های شخصی‌شان منتشر کردند. تصمیم گرفتم که با استفاده از اطلاعات جمع‌آوری‌شده، یک مطلب بنویسم. که همین مطلب حاضر است؛ در کم‌تر از ۲۴ ساعت.

روش‌ها

سؤال به‌صورت زیر ترجمه شد:

Story اول:

یک سؤال ساده:

حدود ۱ درصد بچه‌های متولدشده در یک جمعیت سندروم داون دارند. در یک آزمون غربالگری، اگر بچه واقعن سندروم داون داشته باشد، در ۹۰٪ مواقع آزمون غربالگری آن را تشخیص می‌دهد. در صورتی که بچه سندروم داون نداشته باشد، ۱٪ احتمال دارد که نتیجهٔ آزمونش مثبت شود.

Story دوم:

یک زن باردار این آزمون را داده است و نتیجهٔ آن مثبت شده. چقدر احتمال دارد که بچه‌اش سندروم داون داشته باشد؟

آیا شما می‌توانید این سؤال را حل کنید؟

اطلاعات از چهار حساب اینستاگرام شخصی جمع‌آوری شدند. یک نفر هم به‌صورت‌های مختلف حضوری یا از طریق شبکه‌های اجتماعی دیگر اطلاعات را جمع‌آوری کرد. اطلاعات جمع‌آوری‌شده شامل مقدار دقیق حساب‌شده، وضعیت تحصیلی (در حال تحصیل یا فارغ‌التحصیل دورهٔ کارشناسی یا دکترای حرفه‌ای) و رشتهٔ تحصیلی بود. برای جلوگیری از تکراری‌بودن نتایج، نام یا آدرس حساب افراد نیز بررسی شد.

پاسخ صحیح این سؤال ۴۷.۶٪ است. برای حل آن باید ارزش اخباری مثبت (Positive Predictive Value) محاسبه شود. مقالهٔ اصلی روش حل زیر را پیشنهاد داده است. لازم به ذکر است که روش دیگری نیز با استفاده از احتمال (P(Down|+)) وجود دارد.

If 10 000 pregnant women were tested, we would expect 100 (1% of 10 000) to have babies with Down’s syndrome
Of these 100 babies with Down’s syndrome, the test result would be positive for 90 (90% of 100) and negative for 10
Of the 9900 unaffected babies, 99 (1% of 9900) will also test positive, and 9801 will have a negative test result
So, out of the 10 000 pregnant women tested, we would expect to see 189 (90+99) positive test results. Only 90 of these actually have babies with Down’s syndrome, which is 47.6%
Therefore, 47.6% of pregnant women who have a positive result to the test would actually have a baby with Down’s syndrome

مطابق مقاله، پاسخ‌های بین ۴۵ تا ۵۰ به‌عنوان صحیح در نظر گرفته شدند.

نتایج با استفاده از نرم‌افزار R نسخهٔ ۳٫۴٫۴ با استفاده از RStudio نسخهٔ ۱٫۱٫۴۵۶ روی Microsoft Windows 10 تحلیل شدند. آزمون آماری مورد استفاده Chi Square انتخاب شد. کدهای مورد استفاده در پیوست قرار داده شده‌اند.

نتایج و بحث

۱۲۱ نفر به سؤال پاسخ دادند. از آن‌جایی که بسیاری از افراد ممکن است Storyها را به‌سادگی رد کنند و از چند و چون مطالب درون آن آگاهی لازم را کسب نکنند، Response Rate تعیین نشد. مشخصات شرکت‌کنندگان در جدول زیر خلاصه شده است.

رشتهٔ تحصیلی تعداد فارغ‌التحصیل‌ها تعداد افراد دانشجوها
پزشکی ۰ ۳۲
دندان‌پزشکی ۱۱ ۲۵
داروسازی ۰ ۳
پروتزهای دندانی ۲ ۱
بهداشت ۲ ۱
توانبخشی ۱ ۰
پرستاری ۰ ۱
فناوری اطلاعات سلامت ۱ ۰
مامایی ۱ ۱
مهندسی برق ۲ ۱۰
مهندسی کامپیوتر ۳ ۷
معماری ۲ ۱
بیوتکنولوژی ۰ ۱
شیمی ۱ ۱
مهندسی عمران ۱ ۱
اقتصاد ۱ ۰
مهندسی صنایع ۰ ۲
علوم آزمایشگاهی ۱ ۰
حقوق ۰ ۱
ریاضی ۰ ۱
فیزیک ۱ ۰
تربیت بدنی ۰ ۱
روان‌شناسی ۰ ۱

داده‌های جمع‌آوری‌شده را می‌توانید در آدرس https://doi.org/10.6084/m9.figshare.7152659 مشاهده و بارگذاری کنید.

در نمودار زیر میزان پاسخ درست و نادرست به‌تفکیک رشته و وضعیت تحصیل نشان داده شده است.

همانگونه که مشاهده می‌شود، در گروه دانشجویان پزشکی و دندان‌پزشکی ۱۸ نفر پاسخ نادرست را ارسال کرده‌اند، اما تعداد پاسخ‌های گروه دانشجویان پزشکی دو برابر دانشجویان دندان‌پزشکی است (۱۴ در مقابل ۷). از سه نفر دانشجوی داروسازی نیز هیچ‌کدام نتوانسته‌اند به سؤال پاسخ درست بدهند. نکتهٔ جالب توجه مقایسهٔ فارغ‌التحصیلان کارشناسی پروتزهای دندانی با فارغ‌التحصیلان دندان‌پزشکی است؛ از دو نفر فارغ‌التحصیل پروتزهای دندانی، هر دو نفر به سؤال پاسخ درست داده‌اند، در صورتی که از ۱۱ نفر فارغ‌التحصیل دندان‌پزشکی، تنها یک نفر پاسخ درست را ارسال کرده است.

برای بررسی معنی‌داری اختلاف‌ها از آزمون Chi Square استفاده شد. این آزمون برای بررسی اختلاف بین فارغ‌التحصیلان و دانشجویان و هم‌چنین اختلاف بین رشته‌های مختلف استفاده شد که در هیچ کدام از این موارد معنی‌دار نبود (p-value به‌ترتیب ۰.۰۵۳ و ۰.۲۱۳). این مسئله ممکن است به‌علت جامعهٔ آماری کم باشد.

در انتها باید ذکر شود که نتیجهٔ این تجزیه و تحلیل‌ها به‌علت اشکالاتی که در طراحی مطالعه وجود داشته، کیفیت بالایی ندارند، اما می‌توان از این مطالعه برای طراحی مطالعاتی با کیفیت بالاتر و در ابعاد وسیع‌تر استفاده کرد. همان طور که در نمودار دیده شد، وضعیت تفسیر آمار در بین صاحبان حرفه‌های مرتبط با سلامت (بالاخص داروسازی و دندان‌پزشکی) وضعیت مطلوبی ندارد و باید در این زمینه تحقیقات و تفکر بیش‌تری صورت گیرد. البته نتایج در مقایسه با مطالعهٔ اصلی بهتر است. در مطالعهٔ اصلی، تنها ۱ نفر از ۲۱ نفر متخصص زنان و زایمان، ۱ نفر از ۲۲ مادر باردار، ۳ نفر از ۲۰ نفر همراه و هیچ یک از ۲۲ ماما موفق به درست جواب‌دادن سؤال درصدی شده بودند. با این حال، بهبود این وضعیت در بین دانشجویان علوم پزشکی ضروری به نظر می‌رسد.

تشکر

از پوریا ایران‌پرور، هیمن رسولی، سروش صدر و ملیکا محمدی که در جمع‌آوری داده‌ها نقش مؤثری داشتند، بسیار متشکرم.

پیوست: کدهای R

library(tidyverse)
insta <- read.csv("PATH_TO_FILE.csv")

insta <- insta %>% mutate(TorF = ifelse(answer >= 45 & answer <= 50, T, F))

test.insta = insta %>% group_by(field, TorF, graduate.status) %>% summarize(count = n())

test.insta %>% ggplot(aes(x = TorF, y = count, fill = TorF)) + geom_bar(stat = "identity", position = "stack") + facet_wrap(graduate.status~field) + geom_text(aes(label = count, y = count), position = position_stack(vjust = 0.5), size = 3) + ylab("Count") + theme(axis.text.x = element_text(angle = 90, hjust = 1)) + xlab("True or False for Each Field") + ggtitle("Results of Responses to the PPV Question, by Each Field of Study") + scale_fill_discrete(name = "Graduation\nStatus", breaks = c("graduated", "under"), labels = c("Graduated", "Undergraduated"))

tb1 = table(insta$field, insta$TorF)
tb2 = table(insta$graduate.status, insta$TorF)
chisq.test(tb1)
chisq.test(tb2)

ارسال یک پاسخ

لطفا دیدگاه خود را وارد کنید!
لطفا نام خود را در اینجا وارد کنید

This site uses Akismet to reduce spam. Learn how your comment data is processed.