Department of Computer Science

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 5 of 6
  • Item
    Developing Neural Network Models for Forecasting Sorghum Production in the Rain-fed Sector of Gedarif State - Sudan
    (University of Khartoum, ) Isam Ahmed Basheir Ahmed ; Adil Mohamed Elkhidir ; Computer Science
    Sorghum is the main cereal crop in the Sudanese food basket. Most of Sorghum in Sudan is produced under the rain-fed agricultural sector. In the absence of reliable forecasting models, the country will continue to suffer from serious gaps in Sorghum production for food security. There is a lack of research of implementing neural networks in Sudan for forecasting. The study aims to fill in some of the research gaps in forecasting of Sorghum production in Sudan using neural networks. In this study, Artificial Neural Network (ANN) architectures are developed, investigated, and tested for forecasting Sorghum yield for the selected study area in Gedarif state. Rainfall data is provided by Meteorological Authority, Satellite images are collected from (Famine Early Warning System (FEWS) website, and Sorghum yield is provided by Ministry of Agriculture – Gedarif state. The study has developed and analyzed 32 models of neural networks to predict the production of Sorghum yield (as output data) by using the seasonal rainfall data and satellite images vegetation indices (as input data). The accuracy of each model was investigated for different input patterns. Multi-Layer Perceptron (MLP) and Radial Basis Function (RBF) networks have been adopted to develop Sorghum yield forecasting models. MLP has been implemented for developing 18 models using rainfall data as input data with different monthly, dekadal and cumulative rainfall patterns, respectively. Also 12 models have been developed using satellite images vegetation indices as input data to forecast Sorghum yield (as output data) (6 models using iv MLP and 6 models using 6 RBF). Both MLP and RBF are used to develop an early Sorghum yield forecasting models using cumulative monthly rainfall data and dekadal rainfall data. In the early Sorghum yield forecasting model there is two-phase training method using RBF in the first phase and MLP in the second phase. In the first phase, RBF has been used for training to forecast September and October cumulative monthly rainfalls using June, July and August cumulative monthly rainfall data. In the second phase, the forecasted cumulative monthly rainfall of September and October together with cumulative monthly rainfall data of June, July and August (five months) have been used as input data for the neural network model to forecast sorghum yield, using MLP for developing the model. The above-mentioned procedure has also been implemented using dekadal rainfall data. The correlation coefficient R-square has been used to evaluate the performance of the developed Artificial Neural Network (ANN) models, by comparing actual Sorghum yield data with forecasted Sorghum yield. The study concluded that the best model with highest value of R-square occurs when using Satellite images vegetation indices for months (July, August and September) as input data implementing MLP. If Satellite images vegetation indices data is not available the best two models that can be adopted are those models with either input data of monthly rainfall of (June, July, August and September) or cumulative rainfall of (June, July, August, September and October). Also, an early forecasting model, using two-phase training procedure, has been developed to enhance Sorghum yield forecasting using dekadal rainfall of June, July and August as input data, which is the best model compared to that using cumulative monthly rainfall of June, July and August. In addition the study has developed an algorithm to convert RGB satellite images into vegetation indices for the study area الذرة هو المحصول الرئيس من الحبوب في سلة الأغذية السودانية. وينتج معظم الذرة في السودان في قطاع الزراعة المطرية وفي غياب نماذج التنبؤ الموثوق بها، سيظل البلد يعاني من ثغرات في تقدير إنتاج الذرة لغرض الأمن الغذائى. هناك نقص في البحوث المتعلقة باستخدام الشبكات في السودان للتنبؤ. وتهدف هذه الدراسة إلى سد Artificial Neural Network (ANN) العصبية ). فيANN بعض الفجوات البحثية في التنبؤ بإنتاج الذرة في السودان باستخدام الشبكات العصبية ( هذه الدراسة تم تصميم معماريات الشبكة العصبية الاصطناعية و تحليلها واختبارها للتنبؤ (ANN) بإنتاجية محصول الذرة لمنطقة الدراسة في ولاية القضارف. تم الحصول على بيانات الأمطار من مصلحة الارصاد الجوية و صور الأقمار الصناعية من الموقع الاليكترونى للإنذار المبكر للمجاعات بينما تم الحصول على بيانات إنتاجية الذرة من وزارة الزراعة ولاية القضارف. وقد قامت الدراسة بتصميم وتحليل نموذجا من الشبكات العصبية للتنبؤ بإنتاج محصول الذرة 32 )كبيانات مخرجات( باستخدام بيانات هطول الأمطار الموسمية ومؤشرات الغطاء النباتي لصور الأقمار الصناعية. وتم إعتماد شبكات متعددة الطبقات و شبكة أساس شعاعي Multi-Layer Perceptron - (MLP) لتصميم نماذج التنبؤ بإنتاج الذرة Radial Basis Function (RBF) ) من MLP( .وقد تم تطبيق أجل تصميم نموذجا باستخدام بيانات هطول الأمطار كبيانات إدخال مع أنماط مختلفة من الأمطار 18 ) على التوالي dekadal الشهرية والشهرية والتراكمية و الديكادية ( .كما تم تصميم نموذجا 12 باستخدام مؤشرات الغطاء النباتي لصور الأقمار الصناعية ) كبيانات إدخال) للتنبؤ بإنتاجية الذرة )). وتستخدم كل من RBF نماذج باستخدام ( 6) و MLP نماذج باستخدام ( 6)(كبيانات مخرجات) و(MLP) لتصميم نموذجين للتنبؤ بإنتاج الذرة في وقت مبكر باستخدام بيانات هطول (RBF) ) (وهى تجميع الامطار لمدة Dekadal الأمطارالتراكمية الشهرية وبيانات هطول الأمطار الديكادية ( عشرة ايام أى ثلاثة ديكادات لكل شهر). وفي نموذج التنبؤ بإنتاج الذرة في مرحلة مبكرة توجد طريقة ) و RBF تدريب على مرحلتين باستخدام النتائج القائمة في المرحلة الأولى ( في المرحلة (MLP) الثانية .في المرحلة الأولى تم استخدام لتدريب الشبكة العصبية للتنبؤ بالأمطار التراكمية (RBF) لشهري سبتمبر وأكتوبر باستخدام بيانات هطول الأمطار الشهرية التراكمية لشهور يونيو يوليو و أغسطس . و في المرحلة الثانية تم استخدام هطول الأمطار التراكمي الشهري المتوقعة لشهرى سبتمبر vi وأكتوبر مع البيانات التراكمية الشهرية للأمطار في يونيو ويوليو وأغسطس) خمسة أشهر) كبيانات ) للتنبؤ بإنتاج الذرة باستخدام ANN إدخال لنموذج الشبكة العصبية ( لتصميم النموذج. كما (MLP) تم تنفيذ الطريقة المذكوره أعلاه باستخدام بيانات هطول الامطار الديكادية .وقد استخدم معامل الارتباط (R ) عن طريق مقارنة بيانات ANN( -) لتقييم أداء نماذج الشبكة العصبية الاصطناعية Square الذرة الحقيقية مع محصول الذرة المتوقع. توصلت الدراسة الى أن أفضل نموذج يعطى أعلى قيمة ل يحدث عند استخدام مؤشرات الغطاء النباتي لصور الأقمار الصناعية لشهور يوليو R-Square ). و إذا لم تتوفر بيانات صور الغطاء MLP( وأغسطس وسبتمبر) كبيانات إدخال) عند استخدام شبكة النباتي للقمر الصناعي، فإن أفضل نموذجين يمكن اعتمادهما هما النموذجان اللذان يتضمنان بيانات أغسطس وسبتمبر) أو هطول الأمطار التراكمية ، إدخال هطول الأمطار الشهرية لشهور (يونيو ،يوليو لشهور (يونيو ،يوليو ،أغسطس ،سبتمبر و اكتوبر). كما تم تصميم نموذج للتنبؤ المبكر باستخدام طريقة تدريب الشبكة العصبية على مرحلتين لتعزيز تنبؤات إنتاجية محصول الذرة باستخدام هطول الأمطار التراكمية في شهور(يونيو ،يوليو وأغسطس كبيانات إدخال) و الذى يعتبر أفضل نموذج مقارنة مع النموذج الذى يستخدم هطول الأمطار التراكمية لشهور( يونيو، يوليو وأغسطس.( إضافة إلى ذلك فقد تم تصميم خوارزمية لتحويل صور الأقمار الاصطناعية الملونة لمناطق إنتاج الذرة إلى مؤشرات للغطاء النباتى فى منطقة الدراسة
  • Item
    Arabic Multilevel Part of Speech Tagging Using Lexicon Driven Morphotactics and Viterbi
    (University of Khartoum, ) Majdy Mohamed Eltayeb Eltahir ; Mohamed ELAffendi ; Computer Science
    The main purpose of this study is to provide a reliable morphological analysis and tagging framework that improves the Arabic Language tokenization process and resolve the inherent ambiguity in this process. The motivation is to facilitate building higher level Arabic Text Mining and other types of NLP applications such as parsers, spelling correctors, topic mining, text summarization and similar applications.The work started with a deep investigation and a literature survey regarding current approaches and techniques used for Arabic and other languages. Based on the survey, it has been decided to adopt a statistical computational linguistic approach with emphasis on corpus linguistics.The first step was to build a small corpus consisting of two components: one for training and the other for testing. The main advantage of corpus linguistics is that ambiguity can easily be dealt with and resolved using proven algorithms and n-gram statistics. A simple morphological analyzer has then been used to train the system with the intervention of human linguistic experts. The general idea is that algorithm would perform the basic analysis providing all major alternatives for a given word. The human expert would then select the proper analysis and dismiss all other alternatives. As expected, this phase took some time to complete.In the second phase, the trained corpus component has been used to bootstrap the upper level Viterbi algorithm to yield more detailed ranked analysis. Viterbi is a Hidden Markov Algorithm that uses a scoring process to rank all possible solutions for a given word and selects a winner. The testing component has been used to evaluate the precision and accuracy of the results. As will be seen form the text, the accuracy has been very high and in many cases higher than 90%.The achievements of the thesis may be summarized as follows: • A small corpus has been built using Arabic text from the web and other resources. The size of this corpus is 490161 words. It covers a wide range of topics. • The SWAM morphological analyzer and tagger has been implemented and used to perform the tagging process. • Based on a survey of current tag sets, we adopted a pattern oriented approach to tag the corpus. A comprehensive hierarchical tag set based on morphological patterns has been built and verified. • Based on the training data, the alogrithm has been used to compute unigram and bigram probabilities at the morpheme and word levels to capture the context and resolve all types of ambiguities. • To utilize the above statistics in resolving ambiguities and improving accuracy, the algorithm has been equipped with two new components: A Viterbi (HMM) component and a Bayes component. • Due to the fact that the input text is not vowelized, and the morphological patterns used in the training set are not vowelized, the system provides non-vowelized solution (tag) at the lower level. To resolve this problem, Viterbi has been used to produce the correct vowelized pattern (tag) for a given word. This step means that inner-word vowelization is a side effect of the tagging process. لغرض الرئيسي من هذه الدراسة هو توفير إطار عمل موثوق للتحليل الصرفي والترقيم (التوصيف) للكلمات العربية ليحسن عملية إيجاد مكونات الكلمة وتوصيفها (صرفيا ونحويا) في اللغة العربية ويحل الغموض الكامن في هذه العملية. الدافع هو تسهيل بناء المستوى الأعلى لتنقيب النص العربي وأنواع أخرى من تطبيقات معالجة اللغات الطبيعية (NLP) مثل المعربات، المصححات الإملائية والتنقيب في المواضيع، تلخيص النص وتطبيقات مماثلة.بدأ العمل بتحقيق عميق في الدارسات السابقة المتعلقة بالطرق والتقنيات المستخدمة حالياً لمعالجة اللغة العربية وغيرها من اللغات. وإستنادا إلى هذه الدراسة، فقد تقرر اعتماد الطرق الإحصائية الحاسوبية اللغوية مع التركيز على الذخائر اللغوية.وكانت الخطوة الأولى بناء ذخيرة لغوية صغيرة تتألف من مكونين هما : واحد للتدريب والآخر للاختبارات. والميزة الرئيسية للذخيرة اللغوية هي أن حالة الغموض يمكن بسهولة التعامل معها وحلها باستخدام خوارزميات جديدة أثبتت جدواها في هذا المجال مع إحصاءات ان غرام (n-gram). وبعد ذلك تم استخدام محلل صرفي بسيط لتدريب النظام مع تدخل الخبراء اللغويين من البشر. الفكرة العامة هي أن الخوارزمية من شأنها في التحليل الأساسي توفير جميع الخيارات الرئيسية لكلمة معينة. إن الخبير اللغوي يحدد التحليل السليم ويسقط كل البدائل الأخرى. وقد اخذت هذه المرحلةلإكمالها بعض الوقت كما هو متوقع. في المرحلة الثانية، تم استخدام مكون التدريب من الذخيرة لتهيئة خوارزمية فيتربى لإنتاج تحليل أكثر تفصيلا. فيتربى هي خوارزمية ماركوف الخفية التي تستخدم عملية التهديف(scoring) لترتيب جميع الحلول الممكنة لكلمة معينة وتحديد الحل الأنسب لها.وقد استخدم مكون الاختبار من الذخيرة لتقييم شمولية ودقة النتائج ففي اختبار الخوارزمية الأولى على مستوى ال morpheme)) الجزء من الكلمة كانت النتيجة في المتوسط 99% تم إتباع العملية المذكورة أعلاه باختبار الخوارزمية على مستوى الكلمة وكانت النتيجة في المتوسط 90٪. ويمكن تلخيص إنجازات الأطروحة على النحو التالي: • تم بناء ذخيرة لغوية صغيرة باستخدام نصوص عربية من شبكة الإنترنت وغيرها من الموارد. حجم هذه الذخيرة هو 490161 كلمة تغطي مجموعة واسعة من المواضيع. • تم بناء المحلل الصرفي والموصف للغة العربية (صرفيا ونحويا) وإستخدم لتنفيذ عملية الترقيم. • بناء على دراسة قوائم المرقمات (Tag sets) الحالية ، تم اعتماد نهج الترقيم الموجه بالوزن. وقد تم بناءهرميلقائمة مرقمات شاملة استنادا إلى الاوزان الصرفية وتم التحقق منها. • مكون التدريب في الذخيرة اللغوية تم فيه التدريب يدويا من خلال مساعدة من خبراء اللغة العربيةاستنادا إلى بيانات التدريب، تم حساب إحتمالات ال (unigram) وال bigram)) على الصعيدين الجزء من الكلمة (Morpheme) و الكلمةللاستفادة منها في حل الغموض وتحسين الدقة باستخدام آليتين جديدتين (Bayes component)و (Viterbi component). • ونظراً لأن النص المدخل يكون غير مضبوط بالشكل والأوزان الصرفية المستخدمة في مجموعة التدريب غير مضبوطة بالشكل ، النظاميوفر حل غير مضبوط بالشكل على المستوى الأدنى. لحل هذه المشكلة استخدمت خوارزمية فيتربي لإنتاج وزن مضبوط بالشكل ملقب للكلمة وهذا يعني أنضبطالشكل الداخلي للكلمة هو أحد الآثار الجانبية لعملية الترقيم
  • Item
    An Artificial Neural Network Speech Verification System for Virtual Classroom Accessing
    (University of Khartoum, 2016-05-04) Mahgoub Hassan Hammad Mohamed ; Moawia Elfaki Yahia ; Department of Computer Sciences
    Virtual classrooms in Universities use the " user name and password " system to allow access . The vulnerability of this system is represented in the possible accessibility of non authorized persons to the Learning Management Systems and access all activities provided. Thus, courses teachers might be deceived. This affects the credibility of the final grades and students’ assessment. This study aims at designing and developing an electronic system that depends on a Speech Verification System to access the learning management system, as a complement to the current system based on username and password. The system proposed avoids this gap as it will be possible to check the students' identity and the authorized users by verifying the Audio Fingerprint through certain phrases the person records. The program, then , verifies the student's voice through matching algorithm developed by the researcher. To achieve the main objective, this study uses empirical scientific methods by improving the rate of learning based on back propagation algorithm ( BP ) in artificial neural networks ( ANN ). The results shows that the percentages of matching to the recorded sounds were 94.8% in ordinary circumstances and 98.5% in an equipped studio. The study recommends the use of the system in all virtual learning centers. In addition, the biometrics can be developed and utilized for academic authentication purposes. The study suggests further studies for special cases caused by changes as a result of disease الدخول لنظام الفصول الافتراضية بالجامعات يعتمد أساساً على تقنية ) اسم المستخدم و كلمة المرور ( وهذه التقنية تمثل ضعف للنظام الحالي المستخدم في الوصول المحتمل للأشخاص غير المخول لهم بالدخول لنظام إدارة التعلم و التمتع بجميع الخدمات الأكاديمية المتاحة من خلال الاستفادة من نظام الاختبارات والواجبات والمشاركة في المنتديات والمناقشات في وجود ثغرة أمنية بالتالي يحدث خداع لأستاذ المقرر الدراسي و هذا يؤثر على مصداقية الدرجات النهائية وتقييم الطلاب. تهدف هذه الدراسة إلى تصميم وتطوير نظام الكتروني يعتمد على بصمة الصوت للوصول إلى نظام إدارة التعلم من قبل الطلاب ، كعنصر مكمل للنظام الحالي القائم على اسم المستخدم وكلمة المرور . النظام المقترح من قبل الدراسة يعمل على تجنب تلك الفجوة حيث يصبح من الممكن التحقق من هوية الطلاب والمستخدمين المصرح لهم بالدخول من خلال التحقق من بصمة الصوت وذلك من خلال تسجيل بعض العبارات التي يتم تخزينها داخل البرنامج ، بعد ذلك يتم التحقق من بصمة صوت الطالب من خلال المطابقة للنظام الذي تم تصميمه من قبل الباحث. لتحقيق الهدف الرئيسي لهذه الدراسة استخدم الأسلوب العلمي التجريبي عن طريق تحسين نسبة التعلم في خوارزمية الانتشار الخلفي ) BP ( في الشبكات العصبية الاصطناعية ) ANN .) 8٪ في الظروف العادية .. أظهرت الدراسة أن نسبة المطابقة للأصوات المسجلة كانت 9 و 89.9 % في أستوديو مجهز ، توصي الدراسة باستخدام هذا النظام في جميع مراكز التعلم الافتراضية بالإضافة إلى ذلك فإن الدراسة أثبتت أن القياسات الحيوية يمكن تطويرها والاستفادة منها لأغراض التوثيق الأكاديمية ، كما توصى الدراسة بضرورة التوسع في مجال دراسة الحالات الخاصة بالتغييرات الصحية التي تطرأ على المستخدمين كحالات المرض والحالات النفسية و تقدم العمر
  • Item
    Arabic Phonemes Recognition Using Techniques of Neural Networks
    (University of Khartoum, 2015-04-23) Manal Mohd. El.Obaid ; Sami Alsharif Iman Abuel Maly Moawia Alfakih ; Mathematical Sciences
    The main theme of this research is the recognition of Arabic phonemes using techniques of artificial neural networks, as most of the researches on speech recognition (SR) are based on Hidden Markov Models (HMM). The technique in this research can be divided into three major steps: firstly the preprocessing in which the original speech is transformed into digital form. Two methods for preprocessing have been applied, FIR filter and Normalization. Secondly, the global features of the Arabic speech are then extracted using Cepstral coefficients, with frame size of 512 samples, 170 overlapping, and hamming window. Finally, recognition of Arabic speech using supervised learning method with three types of Neural Networks having completely different strategies is presented. These networks are Multi Layer Perceptron Neural Network MLP, based on Feed Forward Backprobagation. Recurrent Neural Networks which represented with Elman network and finally Kohonen Self Organized Feature Maps with Learning Vector Quantizing network. A comparison between these networks is held. The results of recognition have reached 96.3% for most of the 34 phonemes using Backprobagation Neural Network, using Elman Network it has reached 93.2% and 68% by Learning Vector Quantizing Neural Network. The database used in this research is KAPD (King AbdulAziz Phonetics Database), and the algorithms were written in MATLAB. According to the obtained results, we can confirm that A.N.N can compete the HMM as Arabic language recognizer, which is the main contribution of this thesis.
  • Item
    Arithmetic Operations On Multiple Byte Integers
    (University of Khartoum, 2015-04-20) Ishraga Mustafa Awad Allam ; ; Computer Science
    Big integers are very essential in many applications. Cryptography is one of these applications. In this study, the objective is to create a multiple byte integer type, with its arithmetic operations defined. The operations are: addition, subtraction, multiplication, division and modular exponentiation are overloaded, to work on this multiple byte integer type. The creation of the multiple byte integer is done by using doubly linked lists, a well known technique in data structure. The reason is that doubly linked lists enable us to create integer of unlimited size. That is, you do not have to pre-specify the size of the arrays storing these integers. This is done by dynamically allocating the memory to store the digits constructing the integers. The operations on these integers are defined using the simple and straight forward techniques, learnt in school. The results obtained are satisfactory and reliable. The type could be extended to help define multiple byte floating point numbers. In this work, an improvement has been made to the work of BH Flowers.