پیش بینی نتایج آنژیو گرافی با استفاده از مدل رگرسیون لجستیک و دوجمله ای منفی با صفر انباشته

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه اپیدمیولوژی و آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی مشهد، مشهد، ایران

2 گروه آموزش بهداشت و ارتقای سلامت، دانشکده بهداشت، دانشگاه علوم پزشکی مشهد، مشهد، ایران

10.32598/JSMJ.21.4.2350

چکیده

زمینه و هدف آنژیوگرافی یک روش متداول در تشخیص درگیری عروق قلبی است. علاو هبر تهاجمی بودن این روش تشخیصی، برخی
بیماران به دلایلی همچون ترس، هزینه بالای تست و عد ماعتماد به تشخیص ضرورت آنژیوگرافی ازانجام این تست سرباز م یزنند. هدف
در این مطالعه، تعیین و مدلسازی عوامل مرتبط با مسدود شدن عروق قلبی جهت پیش آگاهی از نتایج آنژیوگرافی است.
روش بررسی در این مطالعه مقطع یتحلیلی، 1187 بیمار که به تشخیص پزشک معالج کاندید آنژیوشده و در طی سا لهای 1390 - 1391
برای انجام آنژیوگرافی به بیمارستان قائم مشهد مراجعه کرد هبودند، وارد شدند. اطلاعات جمعی تشناختی و متغیرهای سطو حلیپید،
قندخون و سابقه ابتلا به بیمار یهای زمین های جهت برازش در مدل آماری بررسی شدند. با کمک نر مافزار R 3.6.1 دو مدل رگرسیون
لجستیک و دوجمل های منفی با انباشتگی در صفر به داد هها برازش داده شدند و ازنظر صحت پی شبینی با یکدیگر مقایسه شدند.
یافت هها نتیجه آنژیوگرافی نشان داد ) 34 درصد( 404 بیمار تعداد صفر رگ مسدود دارند. در هر دو مدل مشاهده شد که شانس گرفتگی
عروق ب هطور معناداری در مردان و در افراد دیابتی بیشتر بود. همچنین با افزایش سن احتمال مثبت شدن نتیجه آنژیو افزایش م ییابد
P<0/05) ). سطح زیر منحنی راک )حساسیت، ویژگی( برای رگرسیون لجستیک و دو جمل ها یمنف یبا انباشتگی در صفر ب هترتیب برابر با
78/4 ) 70/4 ، 70/5 ( و 2/ 78 ) 4/ 71 ، 5/ 71 ( به دست آمده است.
نتیج هگیری متغیرهای سن، جنسیت و دیابت ب هعنوان عوامل اثرگذار بر نتایج آنژیوگرافی در دو مدل به دست آمدند. باتوج هبه نتایج تحقیق
و توان پی شبینی مد لها، اختلاف معناداری بین دو مدل مشاهده نشد. باتوج هبه ساد هتر بودن مدل رگرسیون لجستیک م یتوان از این
مدل ب هعنوان یک مدل پیشگوی یکننده در تعیین ضرورت انجام آنژیوگرافی استفاده کرد.

تازه های تحقیق

Fatemeh Rezaei Sharif (PubMed)(Google Scholar)

Azadeh Saki(PubMed)(Google Scholar)

کلیدواژه‌ها

موضوعات


Introduction 
Cardiovascular diseases are one of the most common causes of death in the world, which has forced health authorities in different countries to make large-scale plans for education, prevention and treatment in this field. Cardiovascular disease was the leading cause of death in 2019, accounted for 32.2% of all deaths in the world. In Iran, this disease is reported to be the most common cause of death in adults. Coronary artery disease (CAD) is caused by the formation of atherosclerotic plaque in the vessel lumen. There are different methods to diagnose the severity of CAD, among which angiography is the most common method; however, this method is expensive and invasive, and is associated with complications such as heart attack, stroke, and death. About one-third of patients undergoing angiography do not have arterial occlusion; hence, having a tool to predict a negative result in angiography or identifying its predictive factors is very important. Appropriate statistical models can be used for making this tool and classifying patients into low-risk and high-risk groups. The main purpose of classification and modeling in biostatistics is to make predictions based on evidence, variables, and data. The result of an angiography is reported as positive or negative or based on the number of involved arteries by the radiologist. Therefore, the appropriate model for these types of response is the Poisson regression model or negative binomial (NB) model.  This study aims to compare these two models as appropriate tools for predicting the result of angiography.

​​​​​​​Methods
The data was collected from a cross-sectional study conducted during 2011-2012. The study population consists of all patients referred to Ghaem Hospital in Mashhad, Iran for angiography. The required sample size to determine the effective factors was 964, at a confidence level of 95% and considering a test power of 90%. By taking into account a 20% sample drop, the sample size increased to 1187. In the present study, the response variable of the angiography was analyzed at two conditions. The first condition was based on considering the number of involved arteries which in our sample is between 0 and 3. The second condition was based on the number of blocked blood vessels; if there was at least one blocked vessel, the result was positive and if no vessel was blocked, the result was negative. Therefore, two different models of zero-inflated NB and logistic regression corresponding to each mode of the response variable were used.
In this study, the number of involved vessels had right-skewed distribution and lots of zeros. Therefore, a model that can explain this over-dispersion is necessary. Hence, the zero-inflated NB model was used to explain this over-dispersion and zero-inflation. In this model, using the latent variable approach, the zeros were considered as the result of two latent processes; hence a hurdle model is used. For binary response of angiography, logistic regression model was used. This model assumed that the relations between probability of positive result and covariates are S-shape and used the logit link function of expected probability to fit the regression model.

Results
Out of 1187 examined cases, 404(34%) had negative angiography; 211(17.8%), 216(18.2%), and 356(30%) patients had one, two, and three involved vessels, respectively. Table 1.

 

Shows the result of zero-inflated NB model. As can be seen, age and gender factors are in the logistic part of the model due to their significant effects on zero-inflation of response.
The results of logistic regression analysis for the result of angiography are shown in Table 2.

 

Age, gender, diabetes, and smoking had significant role (P<0.05). The P of hs-CRP was 0.050, indicating weak evidence about its significance role in prediction.

Conclusion
According to the results of this study, no significant difference was observed between the two zero-inflated NB and regression models in predicting the result of angiography. The predictive power of logistic regression model was slightly higher. Due to the simplicity of the logistic regression model, it can be used as a predictive model in determining the necessity of performing angiography. This model has 70% accuracy in predicting the result of angiography. Using this model, it is possible to calculate the risk of positive angiography, and if the risk is less than 50%, angiography should be postponed until the symptoms improve and the results of other diagnostic tests such as exercise and EEG tests become negative. Age, gender, smoking and diabetes were significant predictors of the angiography outcome.

Ethical Considerations
Compliance with ethical guidelines
This study was approved by the ethics committee of Mashhad University of Medical Sciences (Code: IR.MUMS.REC.1395.95).

Funding
This study was extracted from the master thesis of  Fatemeh RezaeiSharif approved by the Faculty of Health, Mashhad University of Medical Sciences.

Authors contributions
Investigation: Azadeh Saki; Data analysis and initial draft preparation: Fatemeh RezaeiSharif; Data collection: Ali Taghipour and Mohammad Tajfard.

Conflicts of interest
The authors declared no conflict of interest.

Acknowledgements
The authors would like to thank all the patients participated in the study for their cooperation.

 

مقدمه
بیماری‌های قلبی‌عروقی ازجمله بیماری‌های مزمن و یکی از شایع‌ترین علل مرگ‌ومیر و عوامل تهدیدکننده‌ حیات در سراسر جهان هستند [1]، به‌طوری که مسئولان بهداشتی درکشورهای مختلف را وادار به برنامه‌ریزی‌های کلان جهت آموزش، پیشگیری و درمان در این زمینه کرده است [2]. براساس آمار ارائه‌شده از سوی انجمن قلب آمریکا بیماری‌های قلبی‌عروقی سالانه سبب مرگ‌ومیر 17/3 میلیون از 54 میلیون نفر (31/5 درصد) کل مرگ‌ومیر جهان می‌شوند [3]. درایران نیز این بیماری شایع‌ترین عامل مرگ ومیر در افراد بالغ شناخته شده است [4]. براساس گزارش سازمان بهداشت جهانی، ایران با بیش از 9000 مورد به ازای هر 100000 نفر، یکی از کشورهایی است که بالاترین میزان بیماری عروق کرونر در جهان را داشته است [5]. 
براساس پژوهش‌های انجام‌شده ریسک فاکتورهای مؤثر بر بیماری عروق‌کرونر قلب شامل سن، جنس، دیابت، سابقه خانوادگی مثبت، چاقی، فشارخون بالا، هیپرلیپیدمی و مصرف دخانیات می‌باشند [6, 7, 8]. بیماری عروق کرونر به‌علت رسوب پلاک آترواسکروز در دیواره عروق ایجاد می‌شود. طی زمان این پلاک گسترش می‌یابد و باعث تنگی رگ و کاهش جریان خون بافت میوکارد می‌شود [9]. روش‌های تشخیصی متفاوتی جهت تعیین و شدت بیماری عروق کرونر وجود دارد که آنژیوگرافی معتبرترین روش جهت تشخیص این بیماری‌ها است [10]. بااین‌حال این روش گران و تهاجمی بوده و با ریسک‌هایی چون مرگ، سکته قلبی و سکته مغزی همراه است [11]. بنابراین شناسایی افرادی که نتیجه آنژیوگرافی آن‌ها منفی است و تعیین عواملی که مؤثر بر نتیجه آنژیوگرافی هستند، بسیار حائز اهمیت است. 
می‌توان از روش‌های آماری مناسب جهت شناسایی این‌گونه افراد استفاده کرد. هدف عمده طبقه‌بندی و مدل‌سازی در علم آمار، پیش‌بینی براساس شواهد و متغیرها و داده‌های موجود از یک موضوع خاص است. این امر توسط روش‌های آماری مانند رگرسیون خطی، رگرسیون لجستیک، تحلیل ممیزی، سری زمانی، رگرسیون درختی، شبکه عصبی و سایر روش‌ها انجام می‌شود. در نظرگرفتن یک توزیع پیش‌فرض مانند توزیع نرمال برای متغیر پاسخ، خطی بودن رابطه میان متغیرهای پیشگو با متغیر پاسخ، یکسان بودن واریانس خطاها ازجمله محدودیت‌های بعضی از روش‌های کلاسیک هستند که هنگام استفاده‌ عملی از آن‌ها اگر داده‌های واقعی شرایط مفروض را نداشته باشند، امکان‌پذیر نبوده یا با خطای قابل توجه همراه است [12].
آنژیوگرافی، درصد گرفتگی هریک از عروق قلبی را تعیین می‌کند، اما پاسخ تعیین نهایی به‌صورت مثبت/منفی براساس همین درصد ارائه می‌شود. درنهایت تعداد عروق درگیر که می‌تواند بین صفر ( منفی) تا 5 رگ باشد، توسط پزشک گزارش می‌شود [13] که یک متغیر پاسخ از نوع شمارشی محسوب می‌شود. بنابراین مدل مناسب جهت ارتباط سنجی مدل رگرسیون پواسن یا دوجمله‌ای منفی می‌باشد.
 در بسیاری از تحقیقات علمی نیز ترجیح داده می‌شود داده‌های شمارشی را به‌صورت دوحالته دسته‌بندی و تحلیل کنند. در این صورت روش رگرسیون لجستیک که در آن متغیر پاسخ به دو حالت (گرفتگی دارد/ندارد) دسته‌بندی می‌شود، ازآنجایی‌که فرضیات زیادی لازم ندارد و همچنین به‌دلیل قابلیت انعطاف و برآورد نسبت بخت، برای بیان میزان تأثیر هر متغیر مستقل در مدل، کاربرد زیادی در مطالعات پزشکی دارد. هدف این مطالعه پیش‌بینی نتایج منفی آنژیوگرافی و مدل‌بندی عوامل خطرساز بیماری‌های قلبی‌عروقی با استفاده از مدل‌های رگرسیون لجستیک و دو جمله‌ای منفی‌با انباشتگی‌درصفر است. به همین دلیل ابتدا هریک از این دو مدل را به داده‌ها برازش داده و سپس نتایج با یکدیگر مقایسه شدند.

روش بررسی
 داده‌های پژوهش حاضر از یک مطالعه مقطعی که بین سال‌های 1390-1391 در مشهد جمع‌آوری شده، به دست آمده است. بیماران مراجعه‌کننده به بیمارستان قائم مشهد برای انجام آنژیوگرافی، جامعه مورد مطالعه ما را تشکیل می‌دادند. حداقل حجم نمونه مورد نیاز جهت تعیین عوامل مؤثر برنتیجه آنژیوگرافی با سطح اطمینان 95 درصد و توان آزمون90 درصد، 964 به دست آمد. حداقل حجم نمونه مورد نیاز با سطح اطمینان 95 درصد و توان آزمون 90 درصد، 964 به دست آمد. با احتساب 20 درصد نرخ ریزش برای جلوگیری از کاهش توان مطالعه در مواجه با داده‌های گمشده احتمالی حجم نهایی نمونه 1187 در نظر گرفته شد. این تعداد بیمار به روش نمونه‌گیری خوشه‌ای چند مرحله‌ای انتخاب شدند، نمونه‌گیری آسان انتخاب شدند. 
بیماران قلبی‌عروقی که ضرورت آنژیوگرافی برای آن‌ها توسط متخصص قلب تأیید شده بود، سن بیش از 18 سال بود و موافق شرکت در مطالعه بودند، به‌عنوان نمونه موردبررسی قرار گرفتند. ابزار مورد استفاده برای اندازه‌گیری متغیرهای موجود در این پژوهش دو چک‌لیست (پرونده پزشکی بیماران و نتایج آزمایشگاهی) که شامل اطلاعات جمعیت‌شناختی، شاخص توده ‌بدنی، قندخون ناشتا، فشارخون، چربی‌خون، سی‌راکتیو پروتئین، نتایج آنژیوگرافی، تعداد رگ مسدود، میزان مصرف سیگار، بیماری دیابت و سابقه خانوادگی است، توسط بیماران تکمیل شد. پس از تکمیل چک‌لیست‌ها و ورود اطلاعات به نرم‌افزار، تجزیه‌وتحلیل با استفاده از دستور glm و پکیج‌های Pscl و Proc در نرم‌افزار R3.6.1 صورت گرفت.

روش آماری
 در مطالعه حاضر متغیر پاسخ نتیجه آنژیوگرافی به دو صورت مورد تحلیل قرار گرفت:
 صورت اول: تعداد عروق درگیر که در نمونه ما بین صفر تا 3  رگ درگیر گزارش شده بود.
صورت دوم: داشتن رگ گرفته، بدین مفهوم که اگر فردی حداقل یک رگ گرفته داشته باشد، نتیجه مثبت و اگر هیچ رگ درگیری نداشته باشد، نتیجه منفی خواهد شد. بنابراین از دو مدل متفاوت رگرسیون دو جمله‌ای منفی و رگرسیون لجستیک متناظر با هر فرم از متغیر پاسخ استفاده شده است.

 رگرسیون دو جمله‌ای منفی
 به منظور مدل‌بندی عوامل مرتبط با تعداد رگ مسدود و باتوجه‌به ماهیت شمارشی بودن آن، از مدل‌های رگرسیون شمارشی استفاده شد. متداول‌ترین مدل شمارشی رگرسیون پواسن است. توزیع پواسن دارای ویژگی خاص یکسان بودن میانگین و واریانس است که در داده‌های واقعی ممکن است این ویژگی برقرار نباشد. در این مطالعه واریانس توزیع تعداد رگ مسدود بیشتر از میانگین آن به دست آمد که به‌اصطلاح به آن بیش‌پراکنش گفته می‌شود. راه‌های جایگزینی برای حل مشکل بیش پراکنش داده‌ها ارائه شده است که ازجمله متداول‌ترین آن‌ها می‌توان رگرسیون دو جمله‌ای‌منفی را نام برد. واریانس توزیع دو جمله‌ای‌منفی بیشتر از میانگین آن است و همین امر آن را در تبیین بیش‌پراکنش داده‌ها مناسب‌تر جلوه می‌دهد. اگرچه این رگرسیون در توضیح بیش‌پراکنش در بیشتر حوزه‌ها موفق عمل کرده است، بااین‌حال هنگامی که داده‌ها انباشتگی یا تورم در یک یا چند مقدارمتغیر داشته باشند، دچار مشکل می‌شوند. در این مطالعه توزیع تعداد عروق درگیر دارای خصوصیات توزیع چوله به راست و تعداد صفر بیش از حد انتظار است. ازاین‌رو مدلی که بتواند وجود این انباشتگی در صفر را تبیین کند، سودمند خواهد بود. رگرسیون متورم در صفر راه حلی مناسب برای تبیین بیش‌پراکنش و انباشتگی در صفر فراهم کرده است و در بسیاری از حوزه‌ها شامل مراقبت‌های بهداشتی [1415]، همه‌گیرشناسی، حوادث ترافیکی و زیست‌شناسی کارایی خود را نشان داده است. مدل رگرسیون دو جمله‌ای منفی با انباشتگی در صفر با استفاده از رویکرد متغیر پنهان، صفرهای موجود در داده‌ها را حاصل از دو فرایند پنهان در نظر می‌گیرد و به‌صورت فرمول شماره 1 به مدل‌بندی اقدام می‌کند.




در فرمول شماره 1، μ میانگین توزیع پواسن یا توزیع دو جمله‌ای منفی می‌تواند در نظر گرفته شود. اگر داده‌ها حاصل از دو فرایند پنهان درنظر گرفته شود، μ احتمال عضویت در فرایندی است که تنها صفر تولید می‌کند. این بدین معنی است که برخی افراد در معرض مسدود بودن رگ قرار ندارند و درنتیجه با احتمال 1، نتیجه آنژیوگرافی آن‌ها منفی است. به این صفرها، صفرهای ساختاری گفته می‌شود. احتمال عضویت در فرایند دیگری که دیگر مقادیر متغیر پاسخ ازجمله تعداد صفر رگ مسدود را تولید می‌کند، برابر با 1- است. در این فرایند، مقدار صفر هم برای نتیجه آنژیوگرافی محتمل است، اما افراد در معرض خطرگرفتگی عروق هستند و درنتیجه احتمال اینکه در آینده تعداد عروق مسدودشده آن‌ها بیشتر از صفر باشد، وجود دارد. در رگرسیون متورم صفر می‌توان با استفاده از رگرسیون لجستیک به مدل‌بندی مسدود بودن رگ (1-) نیز اقدام کرد. بنابراین در تفسیر ضرایب قسمت شمارشی (پواسن یا دوجمله‌ای منفی) باید خواننده را آگاه کرد که استنباط در ارتباط با افراد در معرض مسدود بودن رگ می‌باشد و نه همه نمونه.

 رگرسیون لجستیک
 این مدل یکی از ابزارهای آماری است که برای مدل‌سازی و تحلیل داده‌ها استفاده می‌شود. این مدل زمانی مورد استفاده قرار می‌گیرد که متغیر پاسخ به‌صورت دوسطحی باشد. صورت کلی این مدل در فرمول شماره 2 قابل مشاهده است:

 

در فرمول شماره 2، x نشانگرمتغیر پیشگو، β ضریب برآوردشده برای متغیر پیشگو مربوطه است که با استفاده از روش ماکزیمم درست نمایی برآورد می‌شوند و α عرض از مبدا مدل می‌باشد. π نشان‌دهنده احتمال ابتلا به بیماری یا عدم بیماری است. در این مطالعه این احتمال به این صورت تعریف می‌شود که اگر فردی هیچ رگ مسدود‌شده‌ای نداشته باشد، این احتمال مقدار صفر و در غیر این صورت مقدار 1 را می‌گیرد.
در ابتدا به منظور دستیابی به یک دید کلی از مشاهدات از آمار توصیفی ساده استفاده شد. نرمال بودن متغیرهای کمی با آزمون کولموگروف اسمیرنف بررسی شد. ابتدا از مدل‌های رگرسیون لجستیک و دوجمله‌ای ‌منفی با انباشتگی در صفر به منظور شناسایی عوامل تعیین‌کننده و ارزیابی دقت مدل در تشخیص نتیجه منفی آنژیوگرافی استفاده شد. درنهایت این دو مدل با استفاده از نتایج به‌دست‌آمده از منحنی راک (حساسیت، ویژگی، دقت و سطح زیر منحنی راک) مقایسه شدند. معناداری متغیرها در سطح 0/05 آزمون شد. 

یافته‌ها
از 1187 نمونه مورد بررسی،404 (0/34) بیماران آنژیو منفی، 783 (0/66) بیماران آنژیو مثبت،211 (17/8) بیماران 1 ‌رگ درگیر، 216 (18/2) بیماران 2 رگ درگیر و 356 (30) بیماران 3 رگ درگیرداشتند. از این تعداد 577 (48/6) نفر زن و 610 (51/4) نفر مرد در مطالعه حضور داشتند. میانگین سنی افراد مورد مطالعه 11/15±57/11 بود. شاخص توده بدنی و مصرف سیگار افراد مورد مطالعه دارای میانگین و انحراف‌معیار به‌ترتیب 5/18±27/04 و 2/56±3/48 بودند (جدول شماره 1).

 

همان‌طورکه در جدول شماره 1 مشاهده می‌شود، نتیجه منفی آنژیوگرافی در رده سنی 40-60 سال، زنان، افراد غیر دیابتی، افراد بدون سابقه فشارخون، افراد بدون سابقه بیماری قلبی و افراد بدون سابقه خانوادگی بیماری قلبی نسبت به سایر حالت‌های متغیرها بیشتر است. در این مطالعه دو مدل رگرسیونی برای داده‌ها مورد مقایسه قرار گرفتند. 
جداول شماره 2 و 3 به‌ترتیب ضرایب مدل رگرسیون لجستیک و ضرایب مدل رگرسیون دوجمله‌ای منفی با انباشتگی درصفر و همچنین مقادیر احتمال معناداری این ضرایب را نشان می‌دهند.

 

همان‌طورکه در جدول شماره 2 مشاهده می‌شود، باتوجه‌به مقدار احتمال متغیرهایی که توسط مدل رگرسیون لجستیک به‌عنوان تعیین‌کننده نتیجه آنژیوگرافی شناخته شدند، شامل سن، جنس و دیابت هستند. تفسیر ضرایب متغیرهای ‌معنادار مدل رگرسیون لجستیک به این صورت است که به‌ازای یک واحد افزایش در سن لگاریتم بخت نتیجه مثبت آنژیوگرافی نسبت به نتیجه منفی آن 0/44 افزایش می‌یابد. در رابطه با جنسیت بیمار، لگاریتم بخت نتیجه مثبت آنژیوگرافی نسبت به نتیجه منفی آن در مردان به میزان 1/47 افزایش می‌یابد. همچنین لگاریتم بخت نتیجه مثبت آنژیوگرافی نسبت به نتیجه منفی آن در یک فرد دیابتی به غیر دیابتی 1/53 افزایش می‌یابد. متغیرهای نمایه توده بدنی، سابقه فشارخون، سابقه بیماری قلبی، سابقه بیماری قلبی خانوادگی و سطوح لیپید پروفایل با مقدار احتمال بیش از 0/05 در مدل معنادار نبودند. باتوجه‌به ستون مقدار احتمال جدول شماره 3، متغیرهایی که توسط مدل رگرسیون دوجمله‌ای منفی با انباشتگی درصفر به‌عنوان متغیرهای تأثیرگذار بر تعداد عروق کرونر مسدودشده شناخته شدند، تنها سن، جنس و دیابت بودند. تفسیر ضرایب در قسمت لوجیت مدل دوجمله‌ای منفی با انباشتگی در صفر همانند رگرسیون لجستیک می‌باشد. سایر متغیرها در این مدل تأثیری بر تعداد عروق مسدودشده نداشتند. در این مطالعه مقدار حساسیت و ویژگی برای مدل‌های رگرسیون لجستیک و دوجمله‌ای منفی با انباشتگی درصفر به‌ترتیب برابر با 70/70،5/4 و 71/71،5/4 به دست آمد. 

بحث
 هدف این مطالعه یافتن مدل مناسبی جهت پیش‌بینی آنژیو منفی براساس عوامل خطری که اندازه‌گیری آن‌ها به راحتی قابل انجام باشد، بود. باتوجه‌به ساختار داده‌ها، دو مدل آماری رگرسیون لجستیک و رگرسیون دوجمله‌ای‌منفی با انباشتگی در صفر مناسب به نظر می‌رسیدند . نتایج حاصل از برازش مدل رگرسیون لجستیک در این مطالعه این مطلب را نشان داد که تنها متغیر‌های سن، جنس، دیابت با نتیجه آنژیوگرافی در ارتباط است. نتایج حاصل از برازش مدل رگرسیون دوجمله‌ای منفی با انباشتگی‌درصفر نیز نشان‌دهنده این مطلب بود. باتوجه‌به مقادیر موجود در جدول شماره 4 و مقادیر حساسیت، ویژگی و سطح زیر منحنی‌های راک رسم‌شده حاصل از برازش دو مدل (تصویر شماره 1)، می‌توان گفت که مدل رگرسیون دوجمله‌ای منفی با انباشتگی درصفر در پیش‌بینی نتایج منفی آنژیوگرافی (پیش‌بینی افرادی که هیچ رگ درگیری ندارند) از قدرت بیشتری برخوردار است.

 

باتوجه‌به اینکه آنژیوگرافی تست طلائی برای تشخیص گرفتگی عروق نمی‌باشد و نتیجه واقعی پس از انجام جراحی قلب مشخص می‌شود. اگر نتایج عمل قلب باز برای افرادی که نتیجه تست آن‌ها مثبت شده است، دردسترس می‌بود، می‌توانستیم از خطای آنژیوگرافی جلوگیری کنیم. بنابراین عدم دسترسی به نتایج عمل قلب باز می‌تواند به‌عنوان یک محدودیت اجرای طرح محسوب شود. 
در مطالعه‌ای که روت انجام داده است، متغیرهای سن، جنس و دیابت معنا‌دار شده است که با مطالعه ما هم‌خوانی دارد [16]. در مطالعه بیدل، متغیر‌های سن ، جنس معنادارشده‌اند که با مطالعه ما هم‌خوانی دارد [10]. در مطالعات گفته‌شده متغیرهای چربی و فشارخون نیز دارای ارتباط معنا‌داری با نتیجه آنژیوگرافی هستند، اما در نتایج به‌دست‌آمده از مطالعه ما این دو متغیر معنا‌دار نشده‌اند که دلیل این امر می‌تواند مصرف قرص برای کنترل این دو متغیرتوسط بیماران تحت مطالعه باشد. متغیرهایی که در مطالعه حسینی معنا‌دار شده‌اند، مشابه متغیرهای معنا‌دارشده در مطالعه ما هستند، با این تفاوت که در مطالعه ما فشار خون معنا‌دار نشده است که عکس نتیجه مطالعه حسینی است [17].
 مطالعات زیادی در ارتباط با عوامل پیش‌بینی‌کننده گرفتگی عروق قلب با کمک مدل رگرسیون لجستیک انجام شده است، اما مطالعه‌ای در ارتباط با گرفتگی عروق قلب با استفاده از مدل رگرسیون دو جمله‌ای منفی با انباشتگی در صفر یافت نشد. در مطالعه‌ای که رفیعی و همکاران انجام داده‌اند، از این مدل برای تحلیل مدت اقامت مادران در بیمارستان استفاده کرده‌اند، برای مقایسه مدل‌ها نیز از آماره انحراف استفاده شد و درنهایت نتایج نشان داد که این مدل با کمترین مقدارآماره انحراف مناسب‌ترین مدل است [18]. 
رودباری و شو نیز به‌ترتیب برای مدل‌بندی داده‌های آموزشی [19] و مدل‌بندی تأثیر قیمت سیگار بر رفتارسیگاری افراد از این مدل استفاده کرده‌اند که این مدل در مقایسه با مدل‌های دیگر استفاده‌شده در مطالعه نتیجه بهتری داشت [20]. در مطالعه‌ای که  شیما حقانی برای مقایسه مدل شبکه عصبی با مدل‌های رگرسیونی  شمارشی در پیش‌بینی تعداد دفعات اهدای خون انجام داده، مدل عصبی نتایج بهتری داشته است [21]. درمطالعه‌ای که گدتی انجام داده است، به مقایسه مدل‌های مورد بررسی در این پژوهش با داده‌های عوارض دارویی پرداخته شده است. نتایج حاصل از این مقایسه برتری مدل رگرسیون دو جمله‌ای منفی با انباشتگی در صفر را در مقایسه با رگرسیون لجستیک با معیار اطلاع بیزی-شوارتز نشان می‌دهد [22]. مطالعه‌ای که به مقایسه مدل‌های مورد بررسی دراین پژوهش با داده‌های آنژیوگرافی قلب بپردازد، یافت نشد. 

نتیجه‌گیری
متغیرهای سن، جنسیت و دیابت به‌عنوان عوامل اثرگذار بر نتیجه آنژیوگرافی در دو مدل به دست آمدند. باتوجه‌به نتایج تحقیق و توان پیش‌بینی مدل‌ها، اختلاف معناداری بین دو مدل مشاهده نشد؛ باتوجه‌به ساده‌تر بودن مدل رگرسیون لجستیک می‌توان از این مدل به‌عنوان یک مدل پیش‌گویی‌کننده در تعیین ضرورت انجام آنژیوگرافی استفاده کرد. این مدل تا 70 درصد قابلیت پیش‌بینی نتیجه آنژیوگرافی را دارا می‌باشد. با استفاده از این مدل می‌توان ریسک مثبت شدن آنژیوگرافی را برای افراد محاسبه کرد و درصورتی که این ریسک کمتر از 50 درصد باشد، آنزیوگرافی به تعویق می‌افتد تا در صورت بهبود علائم و منفی شدن تست‌های تشخیصی دیگر مانند تست ورزش و نوار قلب از انجام آن صرف‌نظر کرد. براساس یافته‌های این پژوهش می‌توان گفت که افرادی که در رده سنی 50-60 سال هستند، مردان و افراد دیابتی، بیشتر در معرض خطر بیماری عروق کرونر قلب قرار دارند.

 ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
این مقاله با کد اخلاق 1395.95 .IR.MUMS.REC در دانشگاه علوم پزشکی مشهد تأیید شده است. 

حامی مالی
این مقاله بخشی از پایان‌نامه کارشناسی ارشد قاطمه رضایی شریف با نظارت آزاده ساکی در رشته اپیدمولوژی و آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی مشهد است. 

مشارکت نویسندگان
تحقیق و بررسی: آزاده ساکی؛ تجزیه‌وتحلیل آماری و نگارش پیش‌نویس: فاطمه رضایی‌شریف؛ مطالعه اولیه و جمع‌آوری داده‌ها: علی تقی‌پور و محمد تاج‌فرد.

تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.
تشکر و قدردانی
نویسندگان از همه بیماران شرکت‌کننده در مطالعه تشکر می‌کنند.

 

References

  1. Reamy BV, Williams PM, Kuckel DP. Prevention of cardiovascular disease. Prim Care. 2018; 45(1):25-44. [DOI:10.1016/j.pop.2017.11.003] [PMID]
  2. Concannon TW, Nelson J, Goetz J, Griffith JL. A percutaneous coronary intervention lab in every hospital? Circ Cardiovasc Qual Outcomes. 2012; 5(1):14-20. [DOI:10.1161/CIRCOUTCOMES.111.963868] [PMID] [PMCID]
  3. Sacks FM, Lichtenstein AH, Wu JH, Appel LJ, Creager MA, Kris-Etherton PM, et al. Dietary fats and cardiovascular disease: A presidential advisory from the American Heart Association. Circulation. 2017; 136(3):e1-23. [DOI:10.1161/CIR.0000000000000510] [PMID]
  4. Yaghoobzadeh A, Soleimani MA, Allen KA, Chan YH, Herth KA. Relationship between spiritual well-being and hope in patients with cardiovascular disease. J Relig Health. 2018; 57(3):938-50. [DOI:10.1007/s10943-017-0467-0] [PMID]
  5. Sarrafzadegan N, Mohammmadifard N. Cardiovascular disease in Iran in the last 40 years: Prevalence, mortality, morbidity, challenges and strategies for cardiovascular prevention. Arch Iran Med. 2019; 22(4):204-10. [PMID]
  6. Behzad C, Zakeri S, Vafaey H. [Anevaluation of the risk factors of coronary artery disease in patients undergoing coronary artery bypass graft surgery in Babol (Persian)]. J Babol Univ Med Sci. 2019; 21(1):6-10. [doi:10.22088/jbums.21.1.6]
  7. Hajar R. Risk factors for coronary artery disease: Historical perspectives. Heart Views. 2017; 18(3):109-14. [DOI:10.4103/HEARTVIEWS.HEARTVIEWS_106_17] [PMID] [PMCID]
  8. Mousavinasab N, Yazdani Cherat J, Bagheri B, Bakhti F-s, Bakhti Z. [Identifying the risk factors for cardiovascular disease in individuals aged above 35 years using logistic regression model (Persian)]. J Mazandaran Univ Med Sci. 2017; 26(144):50-6. [Link]
  9. Ebrahimi M, Kazemi-Bajestani S, Ghayour-Mobarhan M, Ferns G. The status of coronary artery disease and its risk factors in Iran: A review. Iran Red Crescent Med J. 2011; 13(9):610-23. [DOI:10.5812/kowsar.20741804.2286] [PMID] [PMCID]
  10. Bidel Z, Hemmati R, Naserifar R, Nazarzadeh M, Del Pishe A. [Evaluatingthe associations between some cardiovascular risk factors and coronary artery obstruction based on angiographic findings (Persian)]. Sci J Ilam Univ Med Sci. 2014; 22(1):147-54. [Link]
  11. Mahmoudi I, Askari Moghadam R, Moazzam M, Sadeghian S. [Prediction model for coronary artery disease using neural networks and feature selection based on classification and regression tree (Persian)]. J Shahrekord Univ Med Sci. 2013; 15(5):47-56. [Link]
  12. Sedehi M, Mehrabi Y, Kazemnejad A, Hadaegh F. [Comparison of artificial neural network, logistic regression and discriminant analysis methods in prediction of metabolic syndrome (Persian)]. Iran J Endocrinol Metab. 2010; 11(6):638-731. [Link]
  13. van Diemen P, Schumacher S, Driessen R, Bom M, Stuijfzand W, Everaars H, et al. Coronary computed tomography angiography and [15O] H2O positron emission tomography perfusion imaging for the assessment of coronary artery disease. Neth Heart J. 2020; 28(S 1):57-65. [DOI:10.1007/s12471-020-01445-7] [PMID] [PMCID]
  14. Hu M-C, Pavlicova M, Nunes EV. Zero-inflated and hurdle models of count data with extra zeros: examples from an HIV-risk reduction intervention trial. Am J Drug Alcohol Abuse. 2011; 37(5):367-75. [DOI:10.3109/00952990.2011.597280] [PMID] [PMCID]
  15. Birjandi M, Salehi-Marzijarani M, Ayatollahi SMT, Rashidi H, Hosseinzadeh A. [Comparisonof several count regression models on modeling decayed missed filled teeth dental index in dentistry (Persian)]. J Sabzevar Univ Med Sci. 2016; 23(3):468-77. [DOI:10.21859/sums-2303468]
  16. Rott D, Benhorin J, Keren A, Baras M, Leibowitz D, Banai S. Prediction of coronary artery disease severity in patients referred for coronary angiography. Clin Cardiol. 2005; 28(6):288-92. [DOI:10.1002/clc.4960280607] [PMID] [PMCID]
  17. Hosseini SA, Abdollahi AA, Behnampour N, Salehi A. [Relationship between number of involved coronary artery with some risk factors by angiography (Persian)]. J Payavard Salamat. 2013; 6(5):383-91. [Link]
  18. Rafiei M, Ayatollahi MT, Behboudian J. [Zero-inflated negative binomial modeling, efficiency for analysis of length of maternity hospitalization (Persian)]. y 2005; 6(4):47-58. [Link]
  19. Roudbari M, Salehi M. [The poisson and negative binomial regression models with zero-inflated count: An application to educational data (Persian)]. Razi J Med Sci. 2014; 21(119):18-24. [Link]
  20. Sheu Ml, Hu Tw, Keeler TE, Ong M, Sung HY. The effect of a major cigarette price change on smoking behavior in California: A zero-inflated negative binomial model. Health Econ. 2004; 13(8):781-91. [DOI:10.1002/hec.849] [PMID]
  21. Haghani S, Sedahi M, Kheiri S. [Comparison of artificial neural network model with count data regression models for prediction of blood donation (Persian)]. Razi J Med Sci. 2015; 22(131):63-70. [Link]
  22. Guddattu V, Rao A, Rajkannan T. Comparison between count regression and binary logistic regression models in the analysis of adverse drug reaction data. ProbStat Forum. 2015; 8:140-7. [Link]
  1. References

    1. Reamy BV, Williams PM, Kuckel DP. Prevention of cardiovascular disease. Prim Care. 2018; 45(1):25-44. [DOI:10.1016/j.pop.2017.11.003] [PMID]
    2. Concannon TW, Nelson J, Goetz J, Griffith JL. A percutaneous coronary intervention lab in every hospital? Circ Cardiovasc Qual Outcomes. 2012; 5(1):14-20. [DOI:10.1161/CIRCOUTCOMES.111.963868] [PMID] [PMCID]
    3. Sacks FM, Lichtenstein AH, Wu JH, Appel LJ, Creager MA, Kris-Etherton PM, et al. Dietary fats and cardiovascular disease: A presidential advisory from the American Heart Association. Circulation. 2017; 136(3):e1-23. [DOI:10.1161/CIR.0000000000000510] [PMID]
    4. Yaghoobzadeh A, Soleimani MA, Allen KA, Chan YH, Herth KA. Relationship between spiritual well-being and hope in patients with cardiovascular disease. J Relig Health. 2018; 57(3):938-50. [DOI:10.1007/s10943-017-0467-0] [PMID]
    5. Sarrafzadegan N, Mohammmadifard N. Cardiovascular disease in Iran in the last 40 years: Prevalence, mortality, morbidity, challenges and strategies for cardiovascular prevention. Arch Iran Med. 2019; 22(4):204-10. [PMID]
    6. Behzad C, Zakeri S, Vafaey H. [Anevaluation of the risk factors of coronary artery disease in patients undergoing coronary artery bypass graft surgery in Babol (Persian)]. J Babol Univ Med Sci. 2019; 21(1):6-10. [doi:10.22088/jbums.21.1.6]
    7. Hajar R. Risk factors for coronary artery disease: Historical perspectives. Heart Views. 2017; 18(3):109-14. [DOI:10.4103/HEARTVIEWS.HEARTVIEWS_106_17] [PMID] [PMCID]
    8. Mousavinasab N, Yazdani Cherat J, Bagheri B, Bakhti F-s, Bakhti Z. [Identifying the risk factors for cardiovascular disease in individuals aged above 35 years using logistic regression model (Persian)]. J Mazandaran Univ Med Sci. 2017; 26(144):50-6. [Link]
    9. Ebrahimi M, Kazemi-Bajestani S, Ghayour-Mobarhan M, Ferns G. The status of coronary artery disease and its risk factors in Iran: A review. Iran Red Crescent Med J. 2011; 13(9):610-23. [DOI:10.5812/kowsar.20741804.2286] [PMID] [PMCID]
    10. Bidel Z, Hemmati R, Naserifar R, Nazarzadeh M, Del Pishe A. [Evaluatingthe associations between some cardiovascular risk factors and coronary artery obstruction based on angiographic findings (Persian)]. Sci J Ilam Univ Med Sci. 2014; 22(1):147-54. [Link]
    11. Mahmoudi I, Askari Moghadam R, Moazzam M, Sadeghian S. [Prediction model for coronary artery disease using neural networks and feature selection based on classification and regression tree (Persian)]. J Shahrekord Univ Med Sci. 2013; 15(5):47-56. [Link]
    12. Sedehi M, Mehrabi Y, Kazemnejad A, Hadaegh F. [Comparison of artificial neural network, logistic regression and discriminant analysis methods in prediction of metabolic syndrome (Persian)]. Iran J Endocrinol Metab. 2010; 11(6):638-731. [Link]
    13. van Diemen P, Schumacher S, Driessen R, Bom M, Stuijfzand W, Everaars H, et al. Coronary computed tomography angiography and [15O] H2O positron emission tomography perfusion imaging for the assessment of coronary artery disease. Neth Heart J. 2020; 28(S 1):57-65. [DOI:10.1007/s12471-020-01445-7] [PMID] [PMCID]
    14. Hu M-C, Pavlicova M, Nunes EV. Zero-inflated and hurdle models of count data with extra zeros: examples from an HIV-risk reduction intervention trial. Am J Drug Alcohol Abuse. 2011; 37(5):367-75. [DOI:10.3109/00952990.2011.597280] [PMID] [PMCID]
    15. Birjandi M, Salehi-Marzijarani M, Ayatollahi SMT, Rashidi H, Hosseinzadeh A. [Comparisonof several count regression models on modeling decayed missed filled teeth dental index in dentistry (Persian)]. J Sabzevar Univ Med Sci. 2016; 23(3):468-77. [DOI:10.21859/sums-2303468]
    16. Rott D, Benhorin J, Keren A, Baras M, Leibowitz D, Banai S. Prediction of coronary artery disease severity in patients referred for coronary angiography. Clin Cardiol. 2005; 28(6):288-92. [DOI:10.1002/clc.4960280607] [PMID] [PMCID]
    17. Hosseini SA, Abdollahi AA, Behnampour N, Salehi A. [Relationship between number of involved coronary artery with some risk factors by angiography (Persian)]. J Payavard Salamat. 2013; 6(5):383-91. [Link]
    18. Rafiei M, Ayatollahi MT, Behboudian J. [Zero-inflated negative binomial modeling, efficiency for analysis of length of maternity hospitalization (Persian)]. y 2005; 6(4):47-58. [Link]
    19. Roudbari M, Salehi M. [The poisson and negative binomial regression models with zero-inflated count: An application to educational data (Persian)]. Razi J Med Sci. 2014; 21(119):18-24. [Link]
    20. Sheu Ml, Hu Tw, Keeler TE, Ong M, Sung HY. The effect of a major cigarette price change on smoking behavior in California: A zero-inflated negative binomial model. Health Econ. 2004; 13(8):781-91. [DOI:10.1002/hec.849] [PMID]
    21. Haghani S, Sedahi M, Kheiri S. [Comparison of artificial neural network model with count data regression models for prediction of blood donation (Persian)]. Razi J Med Sci. 2015; 22(131):63-70. [Link]
    22. Guddattu V, Rao A, Rajkannan T. Comparison between count regression and binary logistic regression models in the analysis of adverse drug reaction data. ProbStat Forum. 2015; 8:140-7. [Link]