نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه مهندسی کامپیوتر، دانشکده روانشناسی، واحد مبارکه، دانشگاه آزاد اسلامی، اصفهان، ایران
2 گروه مهندسی کامپیوتر، دانشکده روانشناسی، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران
چکیده
تازه های تحقیق
(Google Scholar)(Pubmed)SalmanTaghooni
(Google Scholar)(PubMed)Mohammadreza Ramezanpour
کلیدواژهها
موضوعات
Introduction
Prostate cancer is the main cause of death in men in developed countries such that in 2018, more than 9% of cancer deaths were related to this type. In the last decade, the diagnosis of this cancer is made by the prostate-specific antigen test, which has reduced the incidence of malignant prostate and the related death rate. However, in this method, it is not possible to measure the severity of the disease; as a result, physicians have to use more intensive treatments to ensure the treatment of the disease, which can cause subsequent problems in patients. To solve these problems, the magnetic resonance imaging (MRI) technique have been used to diagnose prostate cancer. By providing an image of the tumor condition in patients, this technique enables the diagnosis of the disease severity. However, interpreting multiparametric MRI images to identify prostate cancer can be challenging. To accurately interpret these images, one should first identify the tumor region in the images and then determine the presence of the disease and its severity based on characteristics such as the tumor size and its condition. Since this process requires high accuracy in measurement and diagnosis, and the possible errors of human factors can have a significant impact on the diagnosis result, the use of artificial intelligence and machine learning processes can facilitate and increase the accuracy of disease diagnosis. The aim of this study is to develop an automated system capable of accurately diagnosing prostate cancer from MRI images.
Methods
In this applied-descriptive study, a four-step method was used to diagnose prostate cancer using MRI images. In the first step, the effect of noise was reduced by using discrete two-dimensional wavelet analysis and histogram equalization. In the second step, the black-hole optimization algorithm was used to segment the image based on the multi-level thresholding technique to break down the pre-processed image into a set of regions that can be used to determine whether a person is healthy or suffers from prostate cancer. The black-hole optimization algorithm can be used to determine the optimal thresholds for image segmentation. Each solution in this algorithm specifies the image segmentation thresholds. In this way, the suspicious regions of the tumor are identified on the image. In the third step, the characteristics of each target region were extracted. The set of features describing each target region in the proposed method are the gray-level co-occurrence matrix features, the shape-related features (gravity center and the deviation angle), and morphological characteristics. In the last step, the technique of aggregation and a combination of classification algorithms were used to diagnose prostate cancer. In prediction models based on aggregation, several classification algorithms based on machine learning processes are used simultaneously, and the process of training and testing (using the same data) are done for these models. Finally, by voting for the outputs of these algorithms, the final output was determined. The purpose of the aggregation technique is to reduce the error in detecting the target parameter (presence of tumor) compared to when each learning algorithm is used separately. To evaluate the effectiveness of the proposed method in prostate cancer diagnosis, the ProstateX database and MATLAB software, version 2016 were used. The tests run on a desktop computer with Windows 10, 64-bit operating system, Intel i7 processor (3.2 GHz), and RAM 16 GB. The effectiveness of the proposed method was evaluated in terms of accuracy, sensitivity, specificity, and precision, and its performance was compared with other learning algorithms.
Results
Based on the obtained results, the proposed method achieved a higher diagnosis accuracy than the other learning algorithms. These results confirm that by using ensemble learning algorithms, the accuracy of prostate cancer diagnosis by MRI images can be increased by at least 1.5% compared to other learning algorithms. The proposed method can diagnose prostate cancer through MRI images with an accuracy of 99%.
Conclusion
In this paper, a new method to diagnose prostate cancer by MRI images was presented. In the proposed method, a combination of image processing techniques, optimization method, and machine learning algorithms were used to achieve this goal. The proposed ensemble method used the combination of image processing, optimization, andmachine learning techniques to diagnose prostate cancer. The proposed method has an accuracy of 99% in diagnosing prostate cancer.
Ethical Considerations
Compliance with ethical guidelines
In this study, no experiments on human or animal samples were conducted. Therefore, no ethical considerations were needed.
Funding
The paper was extracted from the master's thesis of the first author, funded by Islamic Azad University of Mobarakeh Branch.
Authors contributions
Software, original draft preparation: Salman Taghouni; Conceptualization, methodology, writing, review & editing: Mohammadreza Ramezanpour; investigation, project administration, visualization: Reihaneh Khorsand.
Conflicts of interest
The authors declared no conflict of interest.
مقدمه
سرطان پروستات عامل اصلی مرگومیر مردان در کشورهای توسعهیافته محسوب میشود، بهطوریکه در سال 2018، بیش از 9 درصد مرگومیر ناشی از سرطان مربوط به این بیماری بوده است [1]. به همین دلیل، در دهه اخیر تشخیص این سرطان ازطریق تست آنتیژن ویژه پروستات صورت میگیرد و این روش موجب کاهش میزان بروز پروستات بدخیم و مرگومیر ناشی از آن شده است. بااینحال، در این شیوه تشخیص نمیتوان شدت ریسک بیماری را شناسایی کرد و درنتیجه پزشکان ناگزیر به استفاده از برخوردهای درمانی شدیدتری برای اطمینان از درمان بیماری خواهند بود که این ویژگی خود میتواند موجب بروز مشکلات بعدی در مراقبت از بیمار شود.
برای رفع این مشکلات، در سالهای اخیر از تصاویرMRI چندپارامتری جهت تشخیص سرطان پروستات استفاده شده است. این تکنیک با ارائه یک نمای بصری از وضعیت تومور در بیماران، امکان تشخیص شدت بیماری در افراد را فراهم میکند، اما باوجوداین، تفسیر تصاویر MRI چندپارامتری بهمنظور شناسایی سرطان پروستات خود میتواند چالشبرانگیز باشد. بهمنظور تفسیر دقیق این تصاویر، باید ابتدا ناحیه تومور را در تصاویر بهصورت دقیق شناسایی کرد و سپس براساس خصوصیاتی مانند حجم توده و وضعیت آن، وجود بیماری و شدت آن را مشخص کرد. ازآنجاییکه این فرایند نیاز به دقت بالایی در اندازهگیری و تشخیص دارد و خطاهای احتمالی عوامل انسانی میتواند تأثیر قابلتوجهی بر نتیجه تشخیص داشته باشد، استفاده از فرایندهای هوش مصنوعی و یادگیری ماشین میتواند موجب سهولت و افزایش دقت تشخیص بیماری در افراد شود.
تاکنون روشهای مختلفی برای تشخیص سرطان پروستات با استفاده از این تکنیکها ارائه شده است. در مطالعهای یک روش غیرتهاجمی برای پیشبینی سرطان پروستات ارائه شده است [2]. در این روش، باتوجهبه میزان شدت سیگنال، ابتدا عمل قطعهبندی ضایعه در تصاویر اصلی DCE-MRI انجام شد و 1029 ویژگی رادیولوژی عددی بهطور خودکار از هر ضایعه محاسبه میشود. برای کاهش ابعاد ویژگی از روش آستانه واریانس، روش k-best استفاده شد. پس از کاهش ابعاد ویژگیها، از 5 روش یادگیری ماشین برای تشخیص سرطان پروستات استفاده شده است. در مطالعهای دیگر از تکنیکهای قطعهبندی و یادگیری ماشین بهمنظور تعیین خوشخیم یا بدخیم بودن توده سرطانی پروستات استفاده شده است [3]. در این روش، ابتدا ناحیه توده در تصویر ورودی و براساس آستانه تعیینشده توسط کاربر شناسایی شد و سپس ویژگیهای این توده براساس خصوصیات شدت نور، شکل، بافت و ضرایب موجک توصیف میشود. درنهایت از شبکه عصبی بهمنظور طبقهبندی ویژگیها و تعیین نوع توده استفاده خواهد شد.
در مطالعهای از شبکه عصبی کانولوشن بهمنظور تشخیص ناحیه سرطان پروستات در تصاویر MRI استفاده شده است [4]. این روش از شبکه عصبی LeNet برای تشخیص ناحیه ضایعه استفاده میکند. روش ارائهشده در مطالعهای دیگر [5]، الگوریتم GrowCut بود که بهمنظور قطعهبندی تصاویر MRI استفاده شده است و همچنین از الگوریتم زرنیک بهمنظور استخراج ویژگیهای ناحیه هدف بهره میگیرد. پس از استخراج ویژگیها، این روش از ترکیب 3 مدل یادگیر (ماشین بردار پشتیبان، شبکه عصبی مصنوعی و K نزدیکترین همسایه) برای طبقهبندی ویژگیها و تشخیص سرطان پروستات استفاده میکند. روش ارائهشده در تحقیقی دیگر [6] نیز یک روش تجمیعی بهمنظور تشخیص سرطان پروستات است که در آن از معیار همبستگی بهمنظور انتخاب ویژگیهای بهینه داده استفاده میشود. مدل تجمیعی بهکاررفته در این روش، مجموعهای از درختهای تصمیم است که براساس پارامترهای مختلف شکل گرفتهاند.
باتوجهبه توضیحات یادشده، مسئله تشخیص خودکار سرطان پروستات ازطریق تصاویر MRI چندپارامتری را میتوان به دو زیرمسئله تجزیه کرد: 1. شناسایی دقیق ناحیه هدف در تصویر؛ 2. استخراج ویژگیهای ناحیه هدف و تشخیص بیماری در فرد.
واضح است که مسئله اول را میتوان ازطریق تکنیکهای قطعهبندی تصویر و مسئله دوم را ازطریق تکنیکهای یادگیری ماشین حل کرد. در این مقاله یک روش جدید بهمنظور تشخیص سرطان پروستات ازطریق تصاویر MRI ارائه شده که در آن بهمنظور شناسایی ناحیه تومور در تصاویر MRI از الگوریتم بهینهسازی سیاهچاله [7] و تکنیک آستانه چندسطحی استفاده شده است. سادگی ساختار، همگرایی سریع و عدم نیاز به تعیین پارامترهای متعدد، دلایلی هستند که موجب انتخاب این الگوریتم بهینهسازی در روش پیشنهادی شدهاند. همچنین بهمنظور تشخیص سرطان پروستات، از تکنیک تجمیع و ترکیب چندین الگوریتم یادگیری ماشین استفاده شده است. با بهکارگیری تکنیکهای ترکیبی، مانند تکنیک تجمیع میتوان عملکرد الگوریتمهای پیشبینی را بهبود بخشید.
در بخش دوم، روش پیشنهادی برای تشخیص سرطان پروستات ارائه شده است. در بخش سوم، نتایج حاصل از پیادهسازی و ارزیابی روش پیشنهادی ارائه شده است. در بخش چهارم نیز نتایج حاصل مورد بحث قرار گرفته است. درانتها، پیشنهاداتی برای ادامه تحقیقات در این راستا ارائه شده است.
روش بررسی
در این بخش، به تشریح روش پیشنهادی جهت تشخیص سرطان پروستات ازطریق پردازش تصاویر MRI میپردازیم. روش پیشنهادی را میتوان به این صورت خلاصه کرد: 1. پیشپردازش؛ 2. قطعهبندی تصویر و شناسایی نواحی هدف؛ 3. استخراج ویژگی نواحی هدف؛ 4. طبقهبندی مبتنی بر تکنیک تجمیع.
مراحل روش پیشنهادی بهصورت یک دیاگرام در تصویر شماره 1نمایش داده شده است.
مطابق دیاگرام نمایش دادهشده در تصویر شماره 1، روش پیشنهادی، عمل تشخیص سرطان پروستات ازطریق پردازش تصاویر MRI را در طی 2 فاز آموزش و آزمون انجام میدهد. توالی مراحل فاز آموزش بهصورت خط مشکی ممتد و توالی مراحل آزمون بهصورت خطچین قرمز نمایش داده شده است. در ادامه به تشریح جزئیات هریک از گامهای روش پیشنهادی خواهیم پرداخت.
پیشپردازش تصویر
روش پیشنهادی با حذف نویز تصاویر ورودی ازطریق تجزیه گسسته موجک دوبعدی آغاز میشود. در روش پیشنهادی، از تابع موجک هار استفاده شده است. تابع موجک هار سادهترین نوع تابع موجک بوده و بهعنوان اولین نوع تابع موجک شناخته میشود. این تابع گسسته بوده و رفتاری مشابه با توابع پلهای دارد. با داشتن ورودی t، تابع موجک مادر برای مدل هار را میتوان بهصورت فرمول شماره 1 تعریف کرد [8].
تابع موجک تحت تأثیر فیلتر گذر از باند بوده و گذر در هر سطح موجب نصف شدن پهنای باند آن میشود. این مشکل موجب عدم پوشش تمام طیف خواهد شد، چراکه برای پوشش تمام طیف به بینهایت سطح نیاز خواهیم داشت. برای حل این مشکل از تابع مقیاسگذاری (تابع پدر) استفاده شده است. این تابع با فیلتر کردن پایینترین سطح تبدیل از پوشش تمام طیف اطمینان حاصل میکند [8]. در روش پیشنهادی از تجزیه گسسته موجک بدون اتلاف استفاده میکنیم. بدینمنظور ابتدا هر رکورد پایگاه داده را در سطح چهارم و با استفاده از تابع هار تجزیه میکنیم تا لایههای تجزیه تصویر حاصل شود. سپس عملیات بازسازی داده بهوسیله تبدیل معکوس موجک انجام خواهد شد تا دادههای نویززداییشده حاصل شوند.
در ادامه گام پیشپردازش، تصویر بهدستآمده ازطریق تکنیکهای هیستوگرام و Unsharp ( ماسک افزایش کنتراست) بهبود داده میشود. استفاده از تکنیکهای بهبود کنتراست میتواند در افزایش دقت تشخیص ناحیه هدف بسیار مؤثر باشد. چراکه اغلب تصاویر ثبتشده ممکن است دارای شرایط کنتراست نامناسبی بوده و درنتیجه ایجاد تمایز بین ناحیه توده و نواحی موجود در تصویر دشوار خواهد بود. بهبود شرایط روشنایی تصویر میتواند در کاهش احتمال خطای تشخیص مؤر باشد. بدینمنظور، از الگوریتم تعدیل هیستوگرام استفاده میشود [9]. ازآنجاییکه جزئیات محاسباتی الگوریتم تعدیل هیستوگرام بهصورت مفصل مورد بحث قرار گرفته است [9]؛ بنابراین از پرداختن به جزئیات بیشتر این الگوریتم صرفنظر میکنیم. در انتهای گام پیشپردازش، با استفاده از عملیات تکنیک افزایش کنتراست بر روی تصویر صورت میپذیرد [10]. هدف این عملیات، بهبود قابلیت تشخیص لبههای توده در تصویر است؛ چراکه بهکارگیری تجزیه گسسته موجک دوبعدی میتواند موجب کاهش تفکیکپذیری لبههای نواحی تصویر شود و درنتیجه استفاده از این عملیات میتواند احتمال خطا در شناسایی نواحی هدف را کاهش دهد. تصویر نتیجه بهعنوان ورودی مرحله بعدی مورد استفاده قرار خواهد گرفت.
قطعهبندی تصویر و شناسایی نواحی هدف
پس از نرمالسازی تصاویر، از الگوریتم بهینهسازی سیاهچاله بهمنظور قطعهبندی تصاویر و استخراج نواحی هدف برای تشخیص سرطان پروستات استفاده میشود. هدف این مرحله از روش پیشنهادی، تجزیه تصویر پیشپردازششده به مجموعهای از نواحی است که ازطریق آنها بتوان سالم بودن یا ابتلای فرد به سرطان پروستات را تشخیص داد. در الگوریتم قطعهبندی پیشنهادی از تکنیک آستانه چندسطحی برای تجزیه تصویر به نواحی تشکیلدهنده آن استفاده میشود. بنابراین، هدف الگوریتم بهینهسازی سیاهچاله را میتوان تعیین آستانههای بهینه برای قطعهبندی تصویر دانست. به بیانی دیگر، آستانههای قطعهبندی تصویر همان متغیرهای بهینهسازی بوده و هر راهحل در الگوریتم بهینهسازی سیاهچاله مشخصکننده آستانههای قطعهبندی تصویر است. روند محاسباتی الگوریتم بهینهسازی سیاهچاله در مطالعهای تشریح شده است [7] و با فرض آشنایی خواننده با این الگوریتم بهینهسازی، در ادامه این بخش به تشریح تابع برازندگی و ساختار بردار پاسخ بهکاررفته در الگوریتم بهینهسازی سیاهچاله برای قطعهبندی تصویر میپردازیم.
تابع برازندگی
کلیدیترین بخش در یک الگوریتم بهینهسازی، تابع برازش آن است. یک تابع برازش میزان ارزش یک پاسخ را توصیف میکند. درنتیجه با استفاده از تابع برازش میتوان تعیین کرد که هرکدام پیکسلهای تصویر برای کدام ناحیهها مناسبتر بوده و کدام پاسخ یافتهشده توسط الگوریتم جستوجو بهینه است. اگر هدف الگوریتم جستوجو اختصاص دادن x پیکسل تصویر به K ناحیه باشد، بنابراین یک پاسخ بهصورت {f1, f2, ... fx} نمایش داده میشود. که در مجموعه A هر عضو مانند fi مشخصکننده ناحیه پیکسل iام تصویر است fi. بهمنظور ناحیهبندی تصویر در روش پیشنهادی از تکنیک آستانهسازی چندسطحی استفاده میشود. در این روش، از چندین آستانه برای تعیین تعلق هر پیکسل تصویر به هر ناحیه استفاده میشود. با استفاده از M آستانه میتوان تعلق پیکسلهای تصویر به نواحی را بهصورت فرمول شماره 2 تعیین کرد.
در فرمول مذکور X تصویر ورودی جهت ناحیهبندی است. همچنین مقادیر ti نشاندهنده مقادیر آستانه برای تعیین نواحی تصویر و I(x,y) بیانگر شدن روشنایی پیکسل واقع در موقعیت (x,y) است. بنابراین با داشتن M آستانه میتوان تصویر ورودی را به M ناحیه قطعهبندی کرد. به بیانی دیگر، تعداد متغیرهای بهینهسازی در الگوریتم بهینهسازی سیاهچاله برابر با تعداد آستانههای هدف است. در روش پیشنهادی هر پاسخ ممکن در الگوریتم بهینهسازی، مقادیر مختلف برای آستانهها را در نظر گرفته و سپس با استفاده از معیار آنتروپی Tsallis برازش پاسخ را محاسبه میکند (فرمول شماره 3) [11].
در رابطه پیشگفت، pi در بازه صفر تا 1 بوده و مشخصکننده قرار گرفتن وضعیت مدل در حالت i است. در یک تصویر با سیستم رنگ خاکستری، این پارامتر نشاندهنده تعداد سطوح روشنایی تصویر است.
ساختار بردار راهحل و جمعیت اولیه
پارامترهایی که باید بهینه شوند، مقادیر آستانه چندسطحی برای قطعهبندی تصویر MRI هستند. بنابراین طول هر بردار راهحل برابر با تعداد مقادیر آستانه است. هریک از پارامترهای بهینهسازی یادشده میتوانند پاسخ بهینه را بهصورت یک عدد حقیقی در بازه تعیین کنند. در روش پیشنهادی، جمعیت اولیه الگوریتم بهینهسازی بهصورت تصادفی مقداردهی میشود. همچنین تعداد نواحی برابر با مقدار تجربی 10 در نظر گرفته میشود. بدینترتیب، با استفاده از الگوریتم بهینهسازی سیاهچاله، تصویر ورودی به 10 ناحیه تجزیه میشود و هر ناحیه دارای پیوستگی بهعنوان یک ناحیه هدف در نظر گرفته میشود. در مرحله بعدی روش پیشنهادی، خصوصیات نواحی هدف استخراج خواهد شد.
استخراج ویژگی نواحی هدف
سومین مرحله در روش پیشنهادی، استخراج ویژگیهای نواحی هدف شناساییشده در گام قبل است. بدینمنظور، ابتدا محدودههای شناساییشده بهعنوان نواحی هدف از تصویر استخراجشده و سپس ویژگیهای توصیفکننده هر ناحیه بهصورت مجزا استخراج خواهند شد. مجموعه ویژگیهای توصیفکننده هر ناحیه هدف در روش پیشنهادی عبارتاند از: ویژگیهای ماتریس هم-رخداد سطح خاکستری ناحیه؛ ویژگیهای مرتبط با شکل ناحیه، شامل مرکز ثقل و زاویه انحراف شکل؛ ویژگیهای مورفولوژیکی ناحیه.
در ادامه، نحوه توصیف هریک از این ویژگیها برای نواحی هدف تشریح خواهد شد.
استخراج ویژگیهای ماتریس همرویداد برای سطح خاکستری نواحی هدف
GLCM، یک روش آماری برای بررسی بافت براساس رابطه مکانی پیکسلهاست. GLCM نشاندهنده نحوه وقوع روشنایی در پیکسلهای تصویر بوده و ارتباط بین جفت پیکسلهای تصویر در فواصل مختلف نسبت به هم را توصیف میکند. بهمنظور شکلگیری GLCMهای چندگانه، مجموعهای از فواصل بین جفت پیکسلها مورد استفاده قرار میگیرد و به ازای هر فاصله تعریفشده، یک ماتریس GLCM شکل میگیرد. در روش پیشنهادی، 4 جهت (0، 45، 90، 135) درجه که هرجهت شامل 4 فاصله مختلف است برای شکلگیری ماتریسهای GLCM مورد استفاده قرار گرفته است. بدین ترتیب، 16 ماتریس GLCM با ابعاد 8×8 براساس فواصل تعریفشده شکل خواهد گرفت و این ماتریسها بهمنظور استخراج ویژگی مورداستفاده قرار میگیرند. ویژگیهای استخراجشده از هر ماتریس GLCM بهصورت زیر است:
کنتراست: این ویژگی، تغییرات روشنایی بین هر پیکسل و همسایه آن در فواصل مختلف را ازطریق ماتریس GLCM اندازهگیری میکند و با استفاده از فرمول شماره 4 محاسبه میشود [12].
همبستگی: این ویژگی نشان میدهد روشنایی یک پیکسل چقدر به همسایگانش در تصویر همبسته است و ازطریق فرمول شماره 5 محاسبه میشود [12].
همگنی: این ویژگی، نزدیکی ماتریس GLCM به GLCM قطری را نشان میدهد و با استفاده از فرمول شماره 6 محاسبه میشود [12].
باتوجهبه تعداد ماتریسهای GLCM استخراجشده برای هر ناحیه هدف، هر دسته از ویژگیهای مذکور بهصورت برداری با طول 16 توصیف خواهد شد که نشاندهنده مقدار آن ویژگی به ازای فواصل مختلف است. بدینترتیب، ویژگیهای GLCM استخراجشده برای توصیف هر ناحیه هدف برابر با 48 خواهد بود. در کنار این ویژگیها، 2 ویژگی آماری تعداد و میانگین مساحت نقاط مربوط ناحیه توده، بهعنوان خصوصیات توصیفکننده ناحیه هدف به کار خواهند رفت. درنتیجه، ناحیه هدف با استفاده از 50 ویژگی GLCM توصیف خواهد شد.
استخراج ویژگیهای شکل در ناحیه هدف
ویژگیهای مرتبط با شکل، دومین دسته ویژگیهای بهکاررفته در روش پیشنهادی برای توصیف نواحی هدف بوده و شامل 2 دسته ویژگی «مرکز ثقل» و «زاویه انحراف شکل» است. ویژگی مرکز ثقل بهصورت یک خصوصیت دوتایی نرمالسازی توصیف خواهد شد که مرکز ناحیه هدف را مشخص میکند. این نقطه بهصورت (x ̅,y ̅ ) نشان داده میشود. برای یافتن مختصاتx̄ مرکز ثقل یک شکل، اساساً شکل را به تعداد زیادی از مناطق بسیار کوچک و با عرض یک پیکسل تقسیم میکنیم و مختصات x میانگین این مناطق را پیدا خواهیم کرد. با انجام این کار، P مستطیل با ارتفاعهای متغیر و عرض 1 پیکسل حاصل خواهد شد که در آن، P نشاندهنده عرض کلی ناحیه است. بهطور خاص، انتگرال ناحیه مستطیل شکل یکپارچه را در امتداد محور x گرفته و سپس نتیجه انتگرال را بر مساحت کل تقسیم میکنیم تا مختصات متوسطx̄ برای مرکز ثقل را پیدا کنیم. بهصورت مشابه میتوان همین فرایند را در بُعد عمودی شکل تکرار کرد تا مختصات مرکز ثقل نیز محاسبه شود. دومین ویژگی بهکاررفته برای توصیف ناحیه هدف، زاویه انحراف ناحیه است. این ویژگی بهصورت یک مقدار عددی در بازه (90، -90) درجه توصیف میشود. درواقع، این ویژگی توصیفکننده زاویه انحراف بیضی احاطهکننده ناحیه نسبت به افق (زاویه صفر درجه) است.
استخراج ویژگیهای مورفولوژیکی در ناحیه هدف
آخرین دسته ویژگی بهکاررفته بهمنظور توصیف خصوصیات ناحیه هدف، ویژگیهای مورفولوژیکی هستند که مجموعه خصوصیات ساختاری ناحیه را ارائه میدهند. مجموعه ویژگیهای مورفولوژیکی بهکاررفته در روش پیشنهادی عبارتاند از: مساحت نرمالسازیشده ناحیه؛ محیط نرمالسازیشده ناحیه؛ طول قطر اصلی بیضی همجهت با ناحیه؛ طول قطر فرعی بیضی همجهت با ناحیه؛ ضریب استواری نرمالسازیشده ناحیه؛ قطر معادل نرمالسازی شده ناحیه.
تمامی ویژگیهای مورفولوژیکی مذکور، بهصورت مقادیر نرمالسازیشده در بازه (0، 1) توصیف خواهند شد. پس از استخراج این مجموعه از ویژگیها، تمامی ویژگیهای توصیفکننده ناحیه (ویژگیهای GLCM، شکل و مورفولوژیک) در قالب یک بردار با هم ترکیب شده تا در آخرین مرحله روش پیشنهادی، بهعنوان ورودی مدل تجمیعی مورد استفاده قرار گیرند و با استفاده از این مجموعهویژگیها عمل طبقهبندی برای هر ناحیه هدف صورت گیرد.
طبقهبندی مبتنی بر تکنیک تجمیع
در آخرین مرحله روش پیشنهادی از تکینک تجمیع و ترکیب الگوریتمهای طبقهبندی بهمنظور تشخیص سرطان پروستات استفاده میشود. در مدلهای پیشبینی مبتنی بر تجمیع، چندین الگوریتم طبقهبندی مبتنی بر یادگیری ماشین بهصورت همزمان مورد استفاده قرار گرفته و فرایند آموزش و آزمون (براساس دادههای یکسان) برای این مدلها انجام خواهد شد. درنهایت با رأیگیری از نتایج خروجی این الگوریتمها، خروجی نهایی سیستم تعیین خواهد شد. هدف از تکنیک تجمیع، کاهش خطا در تشخیص پارامتر هدف (وجود بیماری) نسبت به حالتی است که هریک از الگوریتمهای یادگیر بهصورت مجزا استفاده شوند. الگوریتمهای مورداستفاده برای طبقهبندی ویژگیهای هر ناحیه کاندید در روش پیشنهادی عبارتاند از: شبکه عصبی مصنوعی؛ ماشین بردار پشتیبان؛ درخت تصمیم و رگرسیون.
شبکه عصبی بهکاررفته در مدل تجمیعی پیشنهادی، یک شبکه پروسپترون با یک لایه مخفی است. لایه مخفی این شبکه، دارای 7 نرون بوده و تابع انتقال آن از نوع سیگموید لگاریتمی تعیین شده است. همچنین تعداد نرونهای لایه ورودی برابر با تعداد ویژگیهای استخراجشده برای هر ناحیه هدف (P) تعیین شده و تعداد نرونهای لایه خروجی برابر با تعداد دستههای خروجی یعنی 2 میباشد. ساختار این شبکه در تصویر شماره 2 نمایش داده شده است.
همچنین ماشین بردار پشتیبان بهکاررفته در روش پیشنهادی، از تابع هسته خطی برای طبقهبندی ویژگیها استفاده میکند. ویژگیهای استخراجشده از هر ناحیه کاندید بهعنوان ورودی 3 مدل طبقهبندی ذکرشده مورد استفاده قرار گرفته و این مدلهای یادگیر، ناحیه هدف را در یکی از دستههای سالم یا مبتلا به سرطان پروستات قرار میدهند. درنهایت، اگر حداقل یکی از ناحیههای هدف استخراجشده از تصویر ورودی در دسته مبتلا به سرطان پروستات قرار گیرد، آنگاه آن نمونه مبتلا به سرطان خواهد بود.
یافتهها
بهمنظور ارزیابی کارایی روش پیشنهادی در تشخیص سرطان پروستات از پایگاه داده ProstateX در جدول شماره 1 استفاده شده است.
این پایگاه داده، شامل 200 تصویر MRI متعلق به 141 بیمار در مقاطع زمانی مختلف است. همچنین نمونههای این پایگاه داده ازنظر ابتلا به سرطان پروستات و شدت پیشرفت بیماری از هم تفکیک شدهاند. تمامی تصاویر MRI مورداستفاده در این پایگاه داده بهوسیله یک دستگاه تصویربرداری MRI یکسان در بازه زمانی سالهای 2008 تا 2010 تهیه شده است. در فرایند تهیه نمونههای پایگاه داده و برچسبگذاری آنها، ابتلای هر بیمار پس از تصویربرداری MRI ازطریق عمل بیوپسی مشخص شده است. خلاصه مشخصات پایگاه داده ProstateX در جدول شماره 1 آورده شده است.
بهمنظور پیادهسازی روش پیشنهادی در این تحقیق، از نرمافزار متلب نسخه 2016 استفاده شده است. آزمایشات بر روی یک سیستم کامپیوتر رومیزی با سیستم عامل ویندوز 10 نسخه 64 بیتی اجرا شده است. این سیستم به یک پردازنده intel i7 با توان پردازشی 3/2 گیگاهرتز و 16 گیگابایت حافظه اصلی مجهز بوده است. باتوجهبه ابعاد بالای تصاویر ورودی و بهمنظور افزایش سرعت پردازش نمونهها، ابعاد تصاویر پایگاه داده با استفاده از تکنیک نمونهگیری به 0/5 ابعاد تصاویر اولیه کاهش یافت. در این روش تغییر ابعاد، مقدار هر پیکسل در تصویر جدید ازطریق محاسبه میانگین 2 پیکسل همسایه متناظر با آن در تصویر اصلی محاسبه میشود. در آزمایش عملکرد روش پیشنهادی، از تکنیک ارزیابی متقاطع با 10 بار تکرار استفاده شده است.
بهمنظور ارزیابی عملکرد روش پیشنهادی در تشخیص سرطان پروستات، از معیارهای دقت، حساسیت، ویژگی و درستی استفاده شده است. بدینمنظور، ابتدا مدل یادگیر تجمیعی در روش پیشنهادی با استفاده از نمونههای آموزشی شکل گرفته و سپس خروجی مدل آموزش دادهشده برای نمونههای آزمون تعیین میشود. با انجام این کار برای هر تصویر مورد آزمون ممکن است یکی از شرایط زیر رخ دهد:
مثبت صحیح: خروجی مدل تجمیعی برای حداقل یکی از نواحی هدف استخراجشده از یک نمونه سرطانی، ابتلا به سرطان باشد.
منفی کاذب: خروجی مدل تجمیعی برای تمامی نواحی هدف استخراجشده از یک نمونه سرطانی، سالم بودن فرد را نشان دهد.
منفی صحیح: خروجی مدل تجمیعی برای تمامی نواحی هدف استخراجشده از یک نمونه سالم، عدم ابتلا به سرطان را نشان دهد.
مثبت کاذب: خروجی مدل تجمیعی برای حداقل یکی از نواحی هدف استخراجشده از یک نمونه سالم، ابتلا به سرطان باشد.
با در اختیار داشتن مقادیر مذکور میتوان معیارهای ارزیابی کارایی را به این صورت توصیف کرد: معیار حساسیت برای اندازهگیری نسبت کل نمونههای دسته مثبتی (افراد مبتلا به سرطان پروستات) است که بهطور صحیح تشخیص داده شدهاند و بهصورت فرمول شماره 7 محاسبه میشود [13].
معیار ویژگی برای اندازهگیری کارایی مدل تشخیص در دستهبندی صحیح نمونههای دسته منفی (افراد سالم) به کار میرود. این معیار بهصورت فرمول شماره 8 محاسبه میشود [14].
معیار دقت به توانایی کلی مدل تشخیص در دستهبندی صحیح تمامی نمونهها (سالم یا مبتلا به سرطان پروستات) اشاره داشته و بهصورت فرمول شماره 9 قابلمحاسبه است.
درنهایت، معیار درستی که نشاندهنده نرخ صحت خروجیهای مثبت الگوریتم تشخیص است را میتوان بهصورت فرمول شماره 10 محاسبه کرد.
در تصویر شماره 3، یک تصویر نمونه پایگاه داده و فرایندهای پردازشی صورتگرفته روی آن برای قطعهبندی و استخراج نواحی هدف نمایش داده شده است.
در تصویر شماره 4 نتایج مربوط به تشخیص صحیح (دقت تشخیص سرطان پروستات) الگوریتم پیشنهادی به ازای هر تکرار آزمون نمایش داده شده است.
همچنین کارایی سیستم تجمیعی پیشنهادی در این آزمایش (و سایر نتایج ارائهشده در این بخش) با مدلهای یادگیر بهکاررفته در آن مقایسه شده است.
نتایج نمایش داده شده در تصویر شماره 4، درصد تشخیص صحیح الگوریتم پیشنهادی و سایر مدلهای یادگیر را برای هریک از 10 بار تکرار آزمایش نمایش میدهد. همانطور که این نمودارها نمایش داده شده است، استفاده از روش پیشنهادی میتواند موجب بهبود دقت تشخیص سرطان پروستات نسبت به سایر حالات مقایسهشده شود. نتایج این آزمایش نشان میدهد که در حالت استفاده از روش پیشنهادی، کمترین دقت تشخیص صحیح سرطان پروستات در تصاویر مورد آزمون برابر با 95 درصد، بیشترین دقت تشخیص صحیح برابر با 100 درصد و میانگین تشخیص صحیح برابر با 99 درصد است. براساس این نتایج، میانگین دقت روش پیشنهادی نسبت به سایر مدلهای یادگیر بهوضوح بیشتر است. در تصویر شماره 5، میانگین دقت تشخیص روش پیشنهادی با سایر الگوریتمهای یادگیر مقایسه شده است.
براساس نتایج ارائهشده در تصویر شماره 5، روش پیشنهادی میتواند به میانگین دقت تشخیص بالاتری نسبت به تمامی الگوریتمهای یادگیر بهکاررفته در آن دست یابد. این نتایج تأیید میکند که با بهکارگیری یادگیری تجمیعی میتوان دقت تشخیص سرطان پروستات در افراد را به میزان حداقل 1/5 درصد (با توجه به تصویر شماره 5) نسبت به سایر مدلهای یادگیری افزایش داد. روش پیشنهادی علاوهبر میانگین دقت بالاتر دارای مقادیر بیشتری و نزدیک به هم برای کرانهای تغییرات دقت در طی تکرارهای مختلف است. تصویر شماره 4 نشان میدهد روش پیشنهادی در تمامی تکرارهای آزمایشات صورتگرفته میتواند سالم بودن فرد یا ابتلای وی به سرطان پروستات را با دقت حداقل 95 درصد تشخیص دهد.
تصویر شماره 6 ماتریس درهمریختگی حاصل از تشخیص سرطان پروستات توسط مدل پیشنهادی را نمایش میدهد.
در این ماتریس درهمریختگی، هر تصویر مورد آزمون در هر تکرار بهعنوان یک نمونه آزمایش در نظر گرفته شده است. این نتایج نشان میدهد که روش پیشنهادی در تشخیص سلامت افراد یا ابتلای آنها به سرطان پروستات ازطریق تصاویر MRI بهصورت میانگین دارای دقت 99 درصد بوده است و تنها در طبقهبندی 2 نمونه از تصاویر پایگاه داده دارای خطا بوده است.
بحث
در جدول شماره 2، کارایی روش پیشنهادی با سایر روشهای تشخیص سرطان پروستات مقایسه شده است.
تمامی روشهای مورد مقایسه در جدول شماره 2، از دادههای یکسانی با روش پیشنهادی برای تشخیص سرطان پروستات افراد استفاده کردهاند. همانطور که نتایج این جدول نشان میدهند، روش پیشنهادی هم ازنظر درصد تشخیص صحیح و هم ازنظر معیارهای حساسیت، ویژگی و درستی دارای عملکرد بهتری نسبت الگوریتمهای مقایسه شده است. این نتایج نشان میدهند که روش پیشنهادی میتواند بهعنوان یک ابزار کارآمد در تشخیص سرطان پروستات به کار رفته و در کاربردهای دنیای واقعی مورد استفاده قرار گیرد.
نتیجهگیری
در این مقاله یک روش جدید بهمنظور تشخیص سرطان پروستات ازطریق پردازش تصاویر MRI ارائه شد. در روش پیشنهادی از ترکیب تکنیکهای پردازش تصویر، بهینهسازی و یادگیری ماشین برای دستیابی به این هدف استفاده شد. در روش پیشنهادی از الگوریتم بهینهسازی سیاهچاله بهمنظور ناحیهبندی تصویر ورودی مبتنی بر تکنیک آستانههای چندسطحی استفاده شده است. با انجام این کار، ناحیههای مشکوک به تومور در تصویر شناسایی میشوند. همچنین بهمنظور توصیف خصوصیات هر ناحیه هدف، از ویژگیهای بافت، شکل و شدت روشنایی استفاده شده است. راهکار پیشنهادی از ترکیب 3 الگوریتم شبکه عصبی، درخت تصمیم و رگرسیون و ماشین بردار پشتیبان بهمنظور تشخیص سرطان پروستات استفاده میکند. بهمنظور ارزیابی عملکرد روش پیشنهادی در تشخیص سرطان پروستات از معیارهای دقت، حساسیت و ویژگی استفاده شده است. نتایج حاصل از آزمایشات تأیید کرد که با استفاده از روش پیشنهادی میتوان دقت تشخیص سرطان پروستات ازطریق تصاویر MRI را به میزان حداقل 1/5 درصد افزایش داد و عمل تشخیص را با دقت میانگین 99 درصد انجام داد.
در کارهای آینده میتوان با تغییر الگوریتمهای یادگیر بهکاررفته در مدل تجمیعی پیشنهادی سعی در بهبود دقت آن داشت. همچنین استفاده از تصاویر MRI درزمینه بیوپسی پروستات و فالواپهای درمانی میتواند موضوع تحقیقات آینده باشد.
ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
بهدلیل استفاده از دیتابیسهای جهانی که از اینترنت گرفته شده است و در سایتهای اینترنت وجود دارد؛ همچنین روی اطلاعات افراد خاصی کار نشده است، بنابراین نیاز به کد اخلاق نیست.
حامی مالی
مقاله حاصل پایاننامه کارشناسی ارشد نویسنده اول است که با حمایت دانشگاه آزاد اسلامی واحد مبارکه انجام شده است.
مشارکت نویسندگان
نرمافزار- نگارش- تهیه پیشنویس اصلی: سلمان طاقونی؛ مفهومسازی، روششناسی، نگارش و نقد و ویرایش: محمدرضا رمضانپور؛ نظارت، مدیریت پروژه و بصریسازی: ریحانه خورسند.
تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.
References
References