International Science and Technology Journal

Home < Articles < Article Details

تقييم أداء ودقة نماذج التصحيح والتصنيف اللغوي ثنائية اللغة (عربي–إنجليزي) على بيئات CPU وGPU باستخدام التنفيذ التسلسلي والمتوازي

الملخص
تتناول هذه الورقة البحثية تطوير نظام متكامل لمعالجة النصوص العربية والإنجليزية بالاعتماد على تقنيات معالجة اللغة الطبيعية (NLP) والنماذج اللغوية العميقة، بهدف تصحيح الأخطاء النحوية والإملائية، واستعادة علامات الترقيم، وإزالة التكرار غير الضروري، مع الحفاظ على المعنى الأصلي للنص. كما يتضمن النظام وحدة لتصنيف النصوص إلى فئتين هي: الطبية، القانونية باستخدام نموذج تصنيف متعدد اللغات. هدفت الدراسة إلى تقييم النظام من جانبين رئيسيين: جودة التصحيح اللغوي، وأداء الاستدلال الحاسوبي في بيئتي المعالجة المركزية (CPU) والمعالجة الرسومية GPU باستخدام CUDA، مع مقارنة أسلوبي التنفيذ التسلسلي والمتوازي. وقد أُجريت التجارب على مجموعات نصية عربية وإنجليزية بأحجام مختلفة، وتم تقييم جودة المخرجات باستخدام مؤشري BLEU و.GLEU أظهرت النتائج تفوق النظام المقترح على النظام المرجعي، خاصة في النصوص العربية، حيث بلغ متوسط BLEU (0.7454) وGLEU (0.7529)، بينما بلغت القيم للنصوص الإنجليزية (0.8143) و(0.8214) على التوالي. كما بينت النتائج أن المعالجة المتوازية أسهمت في تقليل زمن التنفيذ بصورة ملحوظة في بيئتي CPU وGPU، مع أفضل أداء عند استخدام أحجام دفعات متوسطة تراوحت بين 64 و128. وأثبتت الدراسة كذلك ثبات النتائج بين التنفيذ التسلسلي والمتوازي بنسبة تطابق بلغت 100.% تشير النتائج إلى أن النظام المقترح يوفر حلاً فعالًا يجمع بين جودة التصحيح وسرعة التنفيذ، مما يجعله مناسبًا لتطبيقات لتدقيق اللغوي، وتحليل النصوص، ومعالجة البيانات كبيرة الحجم............... الكلمات المفتاحية:.............. معالجة اللغة الطبيعية، تصحيح النصوص، التصنيف النصي، المعالجة المتوازية، المعالج المركزي، معالج الرسوميات، BLEU، .GLEU
Abstract
This research paper presents an integrated system for processing Arabic and English texts using Natural Language Processing (NLP) techniques and deep language models. The system is designed to correct grammatical and spelling errors, restore punctuation, remove unnecessary repetition, and preserve the original meaning of the text. It also includes a multilingual text classification module that categorizes texts into six major domains: medical, legal, academic, news, entertainment, and social. The study aimed to evaluate the proposed system from two main perspectives: linguistic correction quality and inference performance under two computing environments, Central Processing Unit (CPU) and Graphics Processing Unit (GPU with CUDA), while comparing sequential and parallel execution modes. Experiments were conducted on Arabic and English text datasets of different sizes, and output quality was measured using BLEU and GLEU metrics. The results showed that the proposed system outperformed the baseline approach, especially for Arabic texts, achieving average BLEU and GLEU scores of 0.7454 and 0.7529, respectively. For English texts, the system achieved 0.8143 BLEU and 0.8214 GLEU. In addition, parallel processing significantly reduced execution time in both CPU and GPU environments, with the best performance obtained using medium batch sizes between 64 and 128. The study also confirmed full consistency between sequential and parallel outputs, with a 100% matching rate. These findings indicate that the proposed system provides an effective solution that combines high correction quality with efficient execution speed, making it suitable for proofreading, text analytics, and large-scale text processing applications............... Keywords:............. Natural Language Processing, Text Correction, Text Classification, Parallel Processing, CPU, GPU, BLEU, GLEU.