Abstract
Likelihood ratios (LRs) are used to characterize the efficiency of diagnostic tests. In this paper, we use the classical weighted least squares (CWLS) test procedure, which was originally used for testing the homogeneity of relative risks, for comparing the LRs of two or more binary diagnostic tests. We compare the performance of this method with the relative diagnostic likelihood ratio (rDLR) method and the diagnostic likelihood ratio regression (DLRReg) approach in terms of size and power, and we observe that the performances of CWLS and rDLR are the same when used to compare two diagnostic tests, while DLRReg method has higher type I error rates and powers. We also examine the performances of the CWLS and DLRReg methods for comparing three diagnostic tests in various sample size and prevalence combinations. On the basis of Monte Carlo simulations, we conclude that all of the tests are generally conservative and have low power, especially in settings of small sample size and low prevalence
چکیده
نسبت های درست نمایی (LR ها) برای مشخصه یابی آزمون های تشخیصی به کار می روند. در این مقاله، ما روش آزمون کمترین مربعات وزنی کلاسیکی (CWLS) را به کار می بریم که در اصل، برای بررسی همگنی خطرات نسبی، برای مقایسه LR های دو یا چند آزمون تشخیصی مضاعف به کار می رود. ما عملکرد این روش را با روش نسبت درست نمایی تشخیصی نسبی (rDLR) و روش رگرسیون نسبت درست نمایی تشخیصی (DLRReg) بر حسب اندازه و توان، مقایسه می کنیم و مشاهده می کنیم که عملکردهای CWLS و rDLR، زمانی که برای مقایسه دو آزمون تشخیصی به کار می روند، یکسان هستند در حالیکه روش DLRReg نرخ های خطای نوع 1 و توان های بالاتری دارد. ما عملکرد روش های CWLS و DLRReg را برای مقایسه سه آزمون تشخیصی در ترکیبات پخش و اندازه نمونه مختلف بررسی می کنیم. بر پایه شبیه سازی مونت کارلو، ما نتیجه می گیریم که همه آزمون ها ، به ویژه در شیوع کم و اندازه نمونه کوچک، عموماً ثابت هستند و توان کمی دارند.
1-مقدمه
در بسیاری از مطالعات بالینی ،محققان دو یا چند روش تشخیصی یا آزمون تشخیصی را مقایسه می کنند که برای نشان دادن حضور یا غیاب یک بیماری ویژه به کار می رود در موقعیتی که وضعیت بیماری درست نامشخص می باشد. یک مقایسه مرسوم از دو آزمون تشخیصی دوتایی رقابتی، مقایسه حساسیت ها و مشخصات هر آزمون را درنظر می گیرد خواه به طور مجزا یا بطور خلاصه [1]. چندین روش برای مقایسه حساسیت ها، مشخصات، مقدارهای پیشگویانه، ناحیه زیر منحنی های مشخصه عملگر دریافتی (ROC)، و اندیس های یودن آزمون ها، درهردوی طراحی های مطالعه جفت شده و جفت نشده پیشنهاد شده اند [2و3]. استفاده از نسبت های درست نمایی منفی و مثبت (LR ها) بجای حساسیت و ویژگی به عنوان سنجش های توانایی تشخیص برخی مزیت ها را داراست [4و5]. بیگراستف [6] بر بی فایدگی LR ها برای ارزیابی کردن توانایی های تشخیص نسبی آزمون ها تاکید کردند و استفاده از LR های منفی و مثبت را روی استفاده از حساسیت و ویژگی برای مقایسه آزمون دوتایی توصیه کردند. مقاله او همچنین یک رویکرد گرافیکی ساده برای مقایسه LR های دو یا تعداد بیشتری آزمون های تشخیصی را ارائه دادند. هرچند، این رویکرد قدری غیر استنتاجی بود و فاقد برخی جنبه های مهم از آزمون معناداری بود. سیمل و همکاران [7] بازه های اطمینان را برای LR های آزمون های دوتایی ارائه دادند و یک فرایند تخمین سایز ساده را برای مطالعات آزمون تشخیصی براساس بازه اطمینان LR مطلوب نشان دادند. لیزنرینگ و پپ [8] روش رگرسیون نسبت درست نمایی تشخیصی (DLRReg) را برای مقایسه LR های آزمون های تشخیصی در طرح های جفت شده \ غیرجفت و برای داده های خوشه ای پیشنهاد دادند. نوفونتس و کستیلو [9] اخیرا یک روش برای مقایسه LR های دو یا تعداد بیشتری آزمون های تشخیص دوتایی در طرح های جفتی پیشنهاد دادند. هرچند، مقایسه LR ها در داده های غیرجفت به طور گسترده در نوشتجات آماری مطالعه نشده است. طرح های غیرجفت در مطالعات بالینی مشترک می باشند، مخصوصا وقتی بعید است بیماران دارای بیش از یک آزمون تشخیصی برای برخی دلایل باشند (مثلاو محدودیت های زمانی، بررسی های اخلاقی، وغیره). پپ [2] تخمین های تجربی نسبت های درست نمایی تشخیصی نسبی (rDLR ها) را با استفاده از تئوری توزیع مجانبی در مورد ویژه وقتی داده ها غیر جفت و مستقل می باشند استنتاج شده اند...