الاثنين، 12 مارس، 2012

المحاضرة الثالثة (د/السيد خضر )


المحاضرة الثالثة
حوسبة اللغة والترجمة الآلية
بسم الله الرحمن الرحيم
الحوسبة العربية (تعريب الحاسبات(

 
حوسبة اللغة والترجمة الآلية
حوسبة اللغة  - المصطلح
n       اللسانيات الحسابية Computational Linguistics
n       الحوسبة العربية Arabic Computing
n       يدور المصطلح حول الاستفادة من معالجة اللغة العربية بالحاسب الآلي
n       معالجة اللغة العربية بالحاسب الآلي
n       Natural Arabic Processing
من تطبيقات معالجة اللغة العربية بالحاسب
n       نظم الحوسبة الذكية
n       واجهات مستخدم باللغة الطبيعية لقواعد البيانات
n       التعليم بمساعدة الحاسوب
 
n       البحث في الإنترنت واسترجاع البيانات
n       الترجمة الآلية من العربية وإليها
n       إجابة الأسئلة باللغة الطبيعية
من تطبيقات معالجة اللغة العربية بالحاسب
n       برامج التدقيق الإملائي
n       برامج التدقيق النحوي
n       برامج استرجاع جذر الكلمة
n       نطق الأصوات والتعرف عليها بواسطة الحاسوب
n       تحويل النص العربي المكتوب إلى منطوق
n       تحويل النص العربي المسموع إلى مكتوب
n       التعرف الضوئي على الحروف العربية المكتوبة
n       Optical Character recognition




خطوات معالجة اللغات الطبيعية
n       الصرف (Morphology): كيف تبنى الكلمات من مكونات أصغر؟ معرفة جذر الكلمة ووزنها والسوابق واللواحق. تكاتبا.
n       التركيب (Syntax): كيف ترتبط الكلمات ببعضها لتكون جملة صحيحة وما دور كل كلمة في التركيب؟
n       الدلالة (Semantics): معاني الكلمات وكيف تشارك هذه المعاني في معنى الجملة.
خطوات معالجة اللغات الطبيعية
n       القصد (Pragmatics): كيفية استخدام الجمل في المواضع المختلفة وما المقصود من الجملة؟
n       الخطاب (Discourse): ما تأثير الجمل السابقة مباشرة على فهم الجملة التالية؟

المعجم
          المعجم: بنك مفردات يضم كلمات اللغة وصفاتها اللغوية
          هناك العديد من المعاجم الإلكترونية المجانية بلغات غير العربية
          من أشهرها ووردنت WordNet والتي هي قاعدة بيانات لمفردات اللغة الإنجليزية
          هل نبني معجما عربيا؟

الترجمة الآلية
n       ترجمة نص من لغة معينة إلى لغة أخرى باستخدام التقنيات المعلوماتية المتقدمة بما في ذلك الحاسبات وبرامج وطرق الذكاء الاصطناعي
n       هدف الترجمة الآلية الحصول على النص المترجم بآلية كاملة دون تدخل بشري بجودة عالية





لمحة تاريخية
n       في بداية القرن السابع عشر اقترح تكوين القواميس الميكانيكية
n       نشر أول مثال وحلم لنظام الترجمة الميكانيكية في منتصف القرن السابع عشر
n       في عام 1933م سجلت براءتا اختراع مستقلتان في كل من فرنسا وروسيا عن فكرة الترجمة الميكانيكية
n       صمم العالم الأمريكي من أصل فرنسي جورج أرتسوني أداة محكمة على شريط ورقي مقوى يستعمل لإيجاد مكافئ ومماثل لأي كلمة في اللغة الأخرى. وظهر النموذج المبدئي عام 1937م
n       نوقش استعمال الحاسب الآلي لخدمة الترجمة من قبل علماء بريطانيين عام 1949م باعتماد طريقة البطاقات المثقوبة لإنتاج الكلمات الخامة لترجمة الملخصات العلمية
n       أظهرت الحروب العالمية الحاجة للترجمة الآلية الفورية. عقد اول مؤتمر حول الترجمة الآلية عام 1952م
n       أول مشروع للترجمة الآلية في جامعة جورج تاون بالتعاون مع شركة IBM 1954م
n       تم تجربة المشروع بواسطة عينات مختارة من 49 جملة روسية لترجمتها إلى اللغة الإنجليزية؛ وبواسطة مفردات محدودة مكونة من 250 كلمة و 6 قواعد فقط
n       تعاونت القوات الجوية الأمريكية مع شركة IBM لبناء نظام متكامل للترجمة الآلية بين اللغة الفرنسية والإنجليزية
n       عام 1966م توصلت اللجنة الاستشارية للمعالجة الآلية للغات الحية في أمريكيا في إلى أن الترجمة الآلية بطيئة جداً وأقل دقة ومكلفة بمقدار الضعفين من الترجمة البشرية وبالتالي فليست هناك فائدة مجدية أو متوقعة من الترجمة الآلية
n       كندا تستعمل اللغتين الإنجليزية والفرنسية مما جعل الترجمة الآلية مهمة جداً لها
n       الإتحاد الاقتصادي الأوربي يتطلب ترجمة المستندات العلمية والتقنية بين اللغات الأوروبية
n       بين 1970 و 1980م ظهرت العديد من الأنظمة للترجمة الآلية اعتمدت في أغلبها على خبرات جامعة جورج تاون في هذا المجال
n       من هذه الأنظمة التي تترجم بين اللغات آلياً كانت بين الإنجليزية والفرنسية والإنجليزية والإيطالية والإنجليزية والألمانية وغيرها
n       في أوائل 1980م ظهرت تقنية وعلم الذكاء الاصطناعي فرفع من مستوى الترجمة الآلية ووضعها في منحى جديد
n       أول ما ظهرت في جامعة أمريكية، واستخدمتها في أوائل مشاريع الترجمة الآلية شركة هولندية (فيليبس)
n       انتشر استخدامها بشكل كبير في شركات الحواسيب اليابانية وأدى إلى ظهور نظام الترجمة الآلية اليابانية بين  اليابانية والإنجليزية بواسطة جامعة كيوتو
ماذا عن العربية؟
n       ظهرت شركات محدودة في هذا المجال من أبرزها شركة صخر
n       هجرة العقول العربية إلى الشركات والدول الأجنبية والعمل معها
n       زاد الاهتمام باللغة العربية بعد الأحداث العالمية الأخيرة
مراحل الترجمة
n       الترجمة البشرية: تتم الترجمة كاملة عن طريق المترجم البشري
n       مساعدة المترجم: تتم الترجمة عن طريق المترجم البشري. ويساعد نظام الترجمة الآلية المترجم بما يمكن أن يطلق عليه قاموس آلي
n       التحرير قبل الترجمة: تتم الترجمة الآلية لجمل بسيطة التراكيب ومحددة المعاني، وعند خروج بعض الجمل عن إطار نظام الترجمة الآلية، يطلب من المستخدم إعادة صياغة تلك الجمل
n       التحرير بعد الترجمة: تحتاج الجمل المنتجة بنظام الترجمة الآلية إلى تصحيح وإعادة صياغة كتابتها
n       الترجمة الآلية: يقوم نظام الترجمة الآلية بترجمة النص من اللغة الإنجليزية إلى العربية دون مساعدة، وهذا هو الهدف النهائي للترجمة الآلية
هل هو حلم؟
n       وضع كتاب باللغة الإنجليزية حول موضوع معين في آلة ما، ثم الحصول بعد وقت قصير (ساعات) على ترجمة للكتاب باللغة العربية
n       تصوير الكتاب المراد ترجمته
n       تحويل الصور إلى حروف وتخزينها في ذاكرة للحاسوب
n       ترجمة النص إلى العربية بواسطة الحاسوب
n       طباعة النص

معالم الترجمة الآلية من الانجليزية الى العربية
n       التحليل الصرفي: تقوم وحدة التحليل الصرفي بتحديد مفردات الكلمات من حيث كونها اسم او فعل او حرف والزوائد (السوابق واللواحق والمتضمنات) على كل منها
n       التحليل التركيبي: تقوم هذه الوحدة بتحديد مواقع مفردات الكلمات من حيث كونها فاعل أو مفعول به او صفة او حال .. الخ، هذا بالنسبة للاسم. وبالنسبة للفعل فيتم تحديد زمنه وتصريفه .. الخ.
n       التحليل الدلالي: يتم بناء تمثيل لدلالات كلمات النص وارتباطها ببعض باستخدام قواعد المعرفة التي تحتوي على التمثيل الدلالي لمفردات اللغة الانجليزية
n       خوارزمية النقل: وتقوم بنقل التمثيل الدلالي باللغة الإنجليزية إلى التمثيل الدلالي باللغة العربية. وتتم الاستعانة بمعجم خاص ثنائي اللغة وبقواعد المعرفة الإنجليزية والعربية المحددة في النظام للحصول على تمثيل للمعاني باللغة العربية
n       بناء الجمل: وبعد الحصول على تمثيلٍ للمعاني باللغة العربية تتم عملية إنشاء الجمل.
n        المعجم ثنائي اللغة: يحتاج تصميم المعجم ثنائي اللغة إلى عناية خاصة لبنائه وتحديد عناصر مدخلاته. ومن الضروري أن يصمم المعجم بطريقة تجعله يتقبل البيانات ثم يخزنها آلياً بالشكل المناسب والتراكيب المناسبة. ولا شك أن مرونة استخدام المعجم وطريقة تخزين البيانات ووسائل استرجاعها له أثر كبير في تقويم النظام وخاصة أننا نتوقع معجماً ضخماً. ويمكن الاستفادة من تجارب سابقة تمت في هذا المجال
n       الذكاء الاصطناعي ونظم الخبرة: تستخدم أدوات وأساليب الذكاء الاصطناعي في تصميم وبناء نظام الترجمة، ومن ثم يمكن الاستفادة من أدوات نظم الخبرة لذلك
n       من المستحسن إضافة وحدة مراجعة آلية بعد انتهاء ترجمة النص وذلك للتخلص من الغموض الذي قد يظهر أحياناً لسبب أو لآخر
 

ليست هناك تعليقات:

إرسال تعليق