هناك أسلوب في تحليل الكتب والخطب والأدب يقوم على دراسة عدد الكلمات المذكورة في نص ما، والحصول على نتائج من هذه الدراسة الكمية، وذلك بناء على قوائم معينة لمعاني هذه الكلمات.
على سبيل المثال؛ هناك برامج كمبيوتر تقوم من خلالها بتحميل نصوص كاتب معين أو خطب رئيس دولة لتستنتج من خلالها أن الكاتب محافظ أو ليبرالي، أو أن الكاتب مناصر لحقوق المرأة أو العمال أو مضاد لها، وذلك لأن علماء اللغة أوجدوا “قاموسا” للكلمات والجمل التي إذا تكررت أكثر من الكلمات المضادة لها في حديث شخص ما، فهذا يعني أن هذا الشخص له ميول في اتجاه معين.
هذا الأسلوب هو جزء من اتجاه علمي لتحليل التاريخ والثقافة والأدب بناء على معايير كمية تبحث عن مؤشرات من هذا النوع لمعرفة قيمة شيء ما خلال حقبة زمنية معينة، وهذه البرامج والأدوات موجودة فقط باللغات الإنجليزية والفرنسية والألمانية ولا وجود لها باللغة العربية بكل أسف.
Google في تجاوب منها مع هذا الاهتمام العلمي والذي يتزايد عبر السنين قامت بتطوير أداة علمية تقوم بتحليل سريع لحوالي 5.2 مليون كتابا تتضمن أكثر من 500 مليار كلمة، ويتراوح تاريخ نشرها بين عام 1500م وحتى يومنا هذا، بحيث تعطيك عددا لا حد له من النتائج عن الثقافة الإنسانية من خلال تلك الكتب.
لو ذهبت لهذا الموقع فستجد هذه الأداة والتي يمكن استخدامها ببساطة، وتعطيك نتائج عن تكرر استخدام كلمات معينة حسب السنة التي نشر فيها الكتاب.
ضع مثلا كلمة عربي ومسلم لتجد أن كلمة عربي كانت مستخدمة بشكل أكبر بكثير من كلمة مسلم في الثقافة الغربية وذلك حتى الخمسينات الميلادية حيث ازداد استخدام كلمة مسلم عن كلمة عربي، ولكنه من الملاحظ تماما من الرسم البياني الذي يزودك إياه الموقع أن الاهتمام بالمسلمين والعرب تزايد بشكل غير مسبوق تاريخيا في السنوات العشر الأخيرة.
هذه نتيجة بديهية طبعا، ولكن أحببت من خلال هذا المثال المبسط أن أشرح كيفية استخدام هذه الأداة في مجال التحليل الثقافي واللغوي.
إطلاق هذه الأدوات وقواعد المعلومات المرتبطة بها _ والذي استهلك أربعة سنوات من العمل المتواصل _ أحدث ضجة في الأوساط الأكاديمية الغربية، كل في مجاله، وذلك لما تعطيه من نافذة على فهم وتحليل الثقافة الإنسانية، وقد أعلنت جامعة هارفارد الأمريكية أنها ستنشر عدة دراسات خلال الأسابيع القادمة تشرح أثر هذه الأدوات على فهم الثقافة واللغة والاتصال وتدفق المعلومات عبر القرون الخمس الأخيرة، بل إن هذه الدراسة جاءت تحت اسم علم جديد اسمه ممزوج من كلمتي اقتصاد وثقافة Culturomics.
ولكن المشروع الحقيقي هو ما قامت به Google عبر السنوات عديدة رغم التكاليف الطائلة ورغم الضجة السلبية حول الموضوع _ بسبب مسائل حقوق النشر _ من عملية مسح ضوئي لملايين الكتب الموجودة في المكتبات حول العالم _ والتي لا يوجد لها نسخة إلكترونية، الأمر الذي سيمثل طفرة في حفظ الثقافة الإنسانية وإتاحتها للاستفادة العامة للبشرية، ويمكن واضحا ملامسة الإنجاز الذي حققته Google عندما ترى أن الأداة المذكورة موجودة باللغات الإنجليزية والفرنسية والأسبانية والصينية والألمانية والروسية، كما أن Google أعلنت أنها قامت حتى الآن بمسح 11% من الكتب في تاريخ الإنسانية والتي تضم حوالي 2 تريليون كلمة.
بالنسبة للثقافة العربية، فإن أحد التحديات الهامة أنه حتى لا يوجد لدينا برامج مسح ضوئي تستطيع قراءة النص العربي المطبوع وتحويله إلى نص إلكتروني قابل للبحث والتعديل بنسبة محدودة من الأخطاء.
هناك طبعا برامج من هذه النوع منتجة بطريقة تجارية تتناسب مع حجم السوق العربي المتواضع، ولكنها تنتج نصوصا بنسبة عالية من الأخطاء، لا يمكن الاعتماد عليها وتتطلب تدخلا بشريا في تعديل النصوص، وهذا ما يجعل مثل هذه المشاريع غير قابلة للتنفيذ حاليا، هذا فضلا على أنه لا يوجد أصلا قواعد للمعلومات في العالم العربي حتى للكتب المتوفرة بنسخ إلكترونية لدى دور النشر والمؤلفين، كما لا توجد قاعدة معلومات واحدة لرسائل الماجستير والدكتوراه.
الواقع العربي أليم من حيث الاهتمام الثقافي على مختلف المستويات، ولكن من يدري قد تأتي Google إلى منطقتنا، وتقوم بتطوير برامج المسح الضوئي حتى تنفذ مشاريعها العملاقة، تماما كما حصل في حالة برامج التعرف على الصوت وتحويله إلى نص، والذي قامت شركات أمريكية بتطويره للغة العربية حتى تستطيع أجهزة الأمن والاستخبارات الغربية من التجسس على المكالمات الهاتفية العربية ضمن حملة الحرب على الإرهاب، وإن كانت هذه البرامج ما زالت حبيسة “أدراجهم” ..!!
* نشر المقال في جريدة الاقتصادية السعودية