International Science and Technology Journal

Home < Articles < Article Details

Image Processing with Deep Learning for Medical Images: A Comprehensive Study with a Novel Preprocessing Algorithm

الملخص
أصبح التعلم العميق تقنية تحويلية في مجال تحليل الصور الطبية، حيث يوفر أدوات قوية لتشخيص الأمراض، وتجزئة الصور (Segmentation)، وتخطيط العلاج. تستعرض هذه الورقة دراسة شاملة حول استخدام التعلم العميق في الصور الطبية، مع تركيز خاص على خوارزمية تعلم آلي جديدة للمعالجة المسبقة تعمل على تعزيز الأداء العام للنماذج. نقدم في هذا البحث خوارزمية المعالجة المسبقة التكيفية متعددة المقاييس للصور الطبية (AMSMIPA)، وهي عبارة عن مسار عمل (Pipeline) قوي يدمج تقنيات إزالة الضجيج، وتحسين التباين متعدد الأنماط، والتنعيم المحافظ على الحواف، وذلك لتوحيد وتحسين جودة الصور الطبية المستمدة من وسائط تصوير متعددة. لقد قمنا بتقييم فعالية منهجيتنا على مجموعتي بيانات واسعتي النطاق: مجموعة بيانات Stanford AIMI CheXpert Plus ومعيار .MedSegBenchكما قمنا بتنفيذ وتدريب خمس مودلات حديثة للتعلم العميق، وهي: شبكة عصبية (CNN) مخصصة من تصميمنا، وشبكات ResNet، وDenseNet، ومحول الرؤية (ViT)، وشبكة U-Net. وتثبت نتائجنا أن خوارزمية المعالجة المسبقة التي طورناها قد عززت أداء النماذج بشكل كبير في جميع البنى الهندسية المستخدمة. وعند استخدام نموذج محول الرؤية (ViT) مقترناً بمعالجة AMSMIPA المسبقة، حقق النموذج أعلى أداء بنسبة دقة بلغت 92.1%، ومقياس F1-score كلي قدره 0.921، ومنطقة تحت المنحنى (ROC-AUC) بلغت 0.994. توفر هذه الدراسة تحليلاً دقيقاً لتقنيات التعلم العميق في معالجة الصور الطبية، وتسلط الضوء على الدور الحاسم للمعالجة المسبقة المتقدمة في تحقيق نتائج رائدة (State-of-the-art). كما تم إتاحة جميع الأكواد البرمجية ومجموعات البيانات والنتائج للجمهور لتشجيع المزيد من البحث والتطوير في هذا المجال................. الكلمات المفتاحية:................ تحليل الصور الطبية، التعلم العميق، خوارزميات المعالجة المسبقة، محول الرؤية (ViT)، شبكة U-Net.
Abstract
Deep learning has become a transformational technology in the field of medical image analysis, offering powerful tools for diagnosis of disease, segmentation, and planning treatment. This paper outlines a comprehensive study on the use of deep learning on medical images, with a specific focus on a new preprocessing machine learning algorithm that enhances overall model performance. We introduce the Adaptive Multi-Scale Medical Image Preprocessing Algorithm (AMSMIPA), a robust pipeline that adapts denoising, multi-modal contrast-enhancement, and edge-preserving smoothing to standardize and improve the quality of medical images from multiple modalities. We evaluate our method's effectiveness on two large-scale datasets: the Stanford AIMI CheXpert Plus dataset and the MedSegBench benchmark. We implement and train five state-of-the-art deep learning architectures: our own custom convolutional neural network (CNN), ResNet, DenseNet, a Vision Transformer (ViT), and U-Net. Our results demonstrate our preprocessing algorithm greatly enhances model performance to be significantly higher with all architectures. When used in combination with our AMSMIPA preprocessing, the Vision Transformer (ViT) model achieved the highest performance at 92.1% accuracy, a macro F1-score of 0.921, and a ROC-AUC of 0.994. This study provides a thorough analysis of deep learning techniques for medical image processing and highlights the critical role of advanced preprocessing in achieving state-of-the-art results. All code, datasets, and results are made publicly available to encourage further research and development in this field. .............................. Keywords:.......................... Medical image analysis, Deep learning, Preprocessing algorithms, Vision Transformer (ViT), U-Net