Home < Articles < Article Details
Analyzing the Efficiency of a Data Mining Dataset in Weka Implementing an Automotive Dataset
Researcher(s): | |
Institution: | Faculty of Art and Science Bader-Libya, University of El- Zintan - Libya |
Field: | Computer science, expert systems and information technology |
Published in: | 37th volume - July 2025 |
الملخص
يُعَدّ قطاع تصنيع السيارات من أبرز المحاور في تطوير صناعة المركبات. تتناول هذه الورقة البحثية تطبيقًا مقترحًا لتنقيب البيانات موجهًا لصناعة السيارات، حيث تم اختباره اعتمادًا على مجموعة بيانات مستخرجة من مستودع تعلم الآلة بجامعة كاليفورنيا، إيرفين. الهدف الرئيس من هذا البحث هو بناء مصنّف أكثر دقة وموثوقية لتصنيف الكائنات في المستقبل.التصنيف يُمثل إحدى أهم تقنيات تنقيب البيانات، وهو أسلوب تعلم تحت الإشراف يهدف إلى إسناد الكائن إلى إحدى الفئات المحددة مسبقًا وفقًا لخصائصه. في هذه الدراسة، استُخدمت قاعدة بيانات تضم 7 سمات و1,728 حالة. جرت مقارنة أداء خوارزمية بسيطة للتصنيف) شجرة القرار J48 وخوارزمية (MONK مع نتائج مبنية على معايير مختلفة باستخدام أداة WEKA (Waikato Environment for Knowledge Analysis) الخاصة بتنقيب البيانات. وأظهرت النتائج مقارنة بين ثلاث خوارزميات لتحديد الأكثر كفاءة والأقل عرضة للخطأ.إن الخصائص الفيزيائية للسيارة مثل: موقع المحرك، السعر، عدد الأبواب، الشوط، واستهلاك الوقود في المدينة، تُعَدّ عوامل أساسية تؤثر على أداء المركبة. ومن ثَمّ، فإن تطوير نظام تصنيف من هذا النوع، رغم تعقيده، يُمثل ضرورة في صناعة السيارات. يمكن لتقنيات تعلم الآلة أن تُسهم في دمج أنظمة حاسوبية للتنبؤ بجودة المركبات وتحسين كفاءة الأداء. تم تدريب نماذج التصنيف على 214 مجموعة بيانات، مع تقييم النتائج عبر أسلوب التحقق المتقاطع (10-fold cross-validation)، ومن ثم تمت المقارنة بين النتائج.................
الكلمات المفتاحية:...............تنقيب البيانات، تقنيات تعلم الآلة، J48، أشجار القرار، صناعة السيارات، WEKA
Abstract
The Car manufacturing sector represents a major focus in the development of the automotive industry. In this research paper, a proposed data mining application for the automotive manufacturing sector is explained and tested. The dataset was retrieved from the machine learning repository at the University of California, Irvine. This research paper aims to create a more reliable classifier for future object classification. Classification is an important technique in data mining. It is a supervised learning process that involves classifying an object into one of the predefined classes based on its attributes. In this paper, we use a large database containing 7 attributes and 1,728 instances. We compare the results of a simple classification technique (using the J48 decision tree inference algorithm and MONK) with results based on different parameters using WEKA (Waikato Environment Knowledge Analysis), a data mining tool. The results of the experiment show a comparison between three algorithms to see which is the best and least error-prone algorithm. The physical characteristics of a car viz . Engine location ,price, how many doors, stroke, city fuel consumption, and other factors determine a vehicle's performance. Therefore, developing such a classification, although a huge undertaking, is absolutely essential in the car industry. Machine learning techniques can help integrate computer-based systems to predict vehicle quality and improve system efficiency. Classification models were trained using 214 datasets. The predicted values of the classifiers were evaluated using 10-fold cross-validation, and the results were compared.................
Keywords:............... Data mining, Machine learning techniques, J48, decision trees, Car market, WEKA classification.