International Science and Technology Journal
Published by
Under supervision of
Open Access Journal
ISSN: 2519-9854 (Online)
ISSN: 2519-9846 (Print)
A peer-reviewed and open access journal concerned with publishing researches and studies in the field of applied sciences and engineering
Enhanced Landmines Recognition with Deep Learning Models Using Generative AI Image Augmentation
Researcher(s): | |
Institution: | Faculty of Information Technology, University of Tripoli |
Field: | علوم الحاسوب و النظم الخبيرة وتقنية المعلومات |
Published in: | 32nd volume - April 2023 |
الملخص
الحفاظ على الدقة العالية في التعرف على الألغام الأرضية هو هدف أساسي لضمان سلامة العاملين على نزع الألغام. يحتاج أولئك الذين يشاركون في عمليات نزع الألغام إلى أن يكونوا على علم بالنوع الفعلي والحالة الحقيقية للمخلفات غير المنفجرة التي سيتعاملون معها. لذلك، فإن تعريف هذه العناصر القاتلة بشكل سريع ودقيق هو مهمة حاسمة في مناطق الخطر الناجمة عن المتفجرات. تم تجربة نماذج التعلم العميق في تعريف الألغام الأرضية، وقد أظهرت نماذج التعلم العميق نتائج مثيرة للإعجاب. ومع ذلك، فإن نقص مجموعات البيانات الحقلية الواقعية يعوق كفاءة تدريب النموذج بشمل كاف. أدى تدهور وتلف هياكل الألغام الأرضية إلى وجود مخاوف كبيرة لسلامة العاملين على نزعها. تم تحديد التآكل كسبب كبير للتدهور والتلف، مما يجعل أفراد نزع الألغام يشعرون بالارتباك مع مواد أخرى مشابهة للمخلفات المتفجرة. ولذا، يقترح هذا البحث طريقة تحسين مجموعات بيانات الألغام الأرضية بناءً على أدوات الذكاء الاصطناعي التوليدية التي تستخدم لإنتاج صور أكثر واقعية لمجموعة معززة لبيانات الألغام. تستند العملية المقترحة على مولد الصور OpenAI Dall-E كأداة لزيادة بيانات الألغام الأرضية، ونموذج التعلم العميق MobileNetV2 يستخدم كأداة للتعرف على الألغام. الهدف هو التنبؤ بفعالية بسلوك التآكل للألغام ذات الهياكل المعدنية. يمكن للنظام محاكاة التآكل استنادًا إلى مجموعة البيانات التي تم جمعها من مصادر إنترنت مختلفة. بناءً على التجارب المقارنة، يظهر هذا النظام أداءً متميزاً ويفوق النموذج الأساسي. وبالتالي، يمكن أن تكون الطريقة المقترحة في هذه الدراسة أداة واعدة للمساعدة في بناء وكلاء التعلم العميق التي توظف في تطبيقات الهواتف المحمولة المفيدة للتعرف على الألغام الأرضية والمخلفات غير المنفجرة.
الكلمات الدالة: الألغام الأرضية، الذكاء الاصطناعي التوليدي، التعلم العميق، زيادة مجموعة البيانات
Abstract
Maintaining the high accuracy of landmines recognition is an essential objective for deminres safety. Those who are involved in mine actions need to be informed about the true type, and the current condition, of the unexploded ordinance they will be dealing with. Therefore, timely and accurate definition of such lethal items is a crucial task in explosives hazard areas. Deep Learning models have been experimented in landmines recognition, and have shown impressive result. However, the lack of field realistic data sets disrupts adequate model training efficiency. The deterioration and damage of landmine structures have caused huge safety concerns. Corrosion has been identified as a big reason for the deterioration and damage, which causes demining members confused with other materials. Hence, this paper proposes a landmine data sets enrichment method based on Generative Artificial Intelligence tools that are used to produce more realistic images for an augmented landmines data set. The proposed process is based on OpenAI Dall-E image generator as the landmine data augmentation tool, and MobileNetV2 deep learning model as the landmine recognition tool. The goal is to effectively predict the corrosion behavior of steel structured landmines. The system can simulate corrosion based on the dataset collected from different internet resources. Based on comparative experiments, this system demonstrates outstanding performance and outperforms the baseline model. Thus, the method proposed in this study can be a promising tool to assist in building DL agents deployed in mobile applications useful for landmines and UXOs identification.