University of Khartoum

The Linguistic dimension in Information Sciences: An applied study to use indexing languages in the work of search engines

The Linguistic dimension in Information Sciences: An applied study to use indexing languages in the work of search engines

Show simple item record

dc.contributor.advisor Abu baker El siddiq Osman en_US
dc.contributor.author Sabri Elhaj Elmubarak, Elamin
dc.date.accessioned 2015-05-31T07:17:37Z
dc.date.available 2015-05-31T07:17:37Z
dc.date.issued 2015-05-31
dc.date.submitted 2007
dc.identifier.uri http://khartoumspace.uofk.edu/handle/123456789/11503
dc.description 311page
dc.description.abstract Along with increasing use of international databases, cross-cultural indexing is becoming more common and tools like multilingual thesaurus are urgently needed. This study concentrates on cultural and linguistic problems in multilingual thesaurus. Very little attention has been paid to this topic in Arabic research and the need for this kind of study has grown rapidly. This study has proved that all the engines tested had ranking schemes that were not well documented, being based on how many times search words were mentioned, whether or not they appeared early in the document, whether or not they appeared close together, and how many search terms were matched. I did not find the ranking schemes very useful, as relevant and irrelevant pages frequently had the same scores. It is found that aggregating meaning is possible on the Internet because there are many easily accessible semantic objects to be harvested. Analysis of the aggregations can suggest patterns of high likelihood that permit applications to recommend, adapt, profile, forecast and so on. It has been proved that the terminology and thesaurus construction standards and guidebooks provide very little details and consideration about equivalence. It has been indicated that Google may index billions of Web pages, but it will never exhaust the store of meaning of the Web. The reason is that Google\\\\\\\'s aggregation strategy is only one of many different strategies that could be applied to the semantic objects in public Web space. It has been found that web search engines do not conspire to suppress controversy, but their strategies do lead to organizationally dominated search results depriving searchers of a richer experience and, sometimes, of essential decision–making information. These experiments suggest that bias exists, in one form or another, on the Web and should, in turn, force thinking about content on the Web in a more controversial light English Abstract المستخلص باللغة العربية مع إزدياد إستخدام قواعد البيانات العالمية , إصبح التكشيف الثقافي المشترك أكثر شيوعاً مع الحاجة الماسة للمكانز متعددة اللغات . هذه الدراسة تركز علي المشاكل اللغوية في المكانز التي يستند عليها عمل محركات البحث علي الشبكة الدولية للمعلومات , وهذا الموضوع لم يحظي بإهتمام في البحوث العربية مع إزدياد الحاجة لمثل هذه الدراسات . تركز الدراسة علي نقل مصطلحات التكشيف الانجليزية اللغة الي اللغة العربية علي مستوي المصطلح التكشيفي والمفهومي . وتقوم الدراسة علي منظورين : اللغوي والسيسيولوجي وهما منظورين يهدفان للاستيعاب الواسع لهذه الظاهرة في الاطار العام لعلم المعلومات . ولقد أثبتت الدراسة أن كافة محركات البحث التي تم إختبارها تتمتع بمخططات هرمية لم توثق بصورة جيدة إستناداً إلي عدد مرات ذكر كلمات البحث بغض النظر عن ما إذا كانت قد ظهرت مبكراً في الوثيقة او ما ذكرت مؤخراً , بجانب عدد مرات تطابق مصطلحات البحث . هذا ولم يجد الباحث أن المخططات الهرمية ذات جدوي نظراً لان الصفحات ذات الصلة وغير ذات الصلة قد حظيت بتكرار . كما وجد الباحث أن المعني الكلي يعتبر ممكناً في محركات البحث علي الانترنت وذلك بسبب وجود مؤشرات دلالية تسهل الوصول الي المعني , بالاضافة إلي أن التحليل الكلي يمكن ان يقدم أنماطاً كبيرة التشابه تتيح تطبيقات تساهم في التوصية والتكيف والتبنؤ وبجانب ذلك أثبتت الدراسة ان مصطلحات ومعايير بناء المكانز بجانب الادلة لا تقدم تفصيلات تذكر حول التطابق . هذا وقد ثبت أنه علي الرغم من أن محرك البحث ( قوقل ) قد يكشف بلايين الصفحات علي شبكة الانترنت الا ان ذلك لم ‘ينهك المخزون الدلالي للشبكة وثبت ذلك بان الاستراتيجية الكلية لمحرك البحث (قوقل) ‘يعد‘ واحد فقط من إستراتيجيات كثيرة يمكن تطبيقها علي الاهداف الدلالية في مساحات الشبكة العامة .بجانب ذلك توصلت الدراسة إلي أن محركات البحث في الشبكة لا تضع حداً للجدل المحتدم بجانب أن أستراتيجياتها لا تؤدي إلي نتائج بحث منظمة ومنضبطة وهي بذلك تحرم الباحثين من معلومات صنع القرار الاساسية . هذا وقد أثبتت هذه الدارسة وجود تحيز بشكل او بأخر علي الشبكة وبالتالي ينبغي ان تجبر علي التفكير بشأن المحتوي في الشبكة ولكن في ضوء أكثر جدلية en_US
dc.publisher uofk en_US
dc.subject The Linguistic dimension in Information Sciences: An applied study to use indexing languages in the work of search engines en_US
dc.title The Linguistic dimension in Information Sciences: An applied study to use indexing languages in the work of search engines en_US
dc.type Thesis en_US
dc.Degree M.Sc en_US
dc.Faculty Arts en_US
dc.contributor.faculty Library and Information Sciences en_US

Files in this item

Files Size Format View

This item appears in the following Collection(s)

Show simple item record

Share

Search DSpace


Browse

My Account