د. محمد سامي الحجي
باحث في مؤسسات علمية عربية وعالمية، ومدرس علم الحواسيب في عدد من الجامعات، (بريطانيا)
تنتشر تطبيقات تعلم الآلة (Machine Learning ML) في أيامنا هذه على نطاق واسع وتشغُل موقعاً مهماً في مجالات الأعمال المختلفة والصناعة والبحوث. وتعتمد هذه التطبيقات على نماذج الشبكات العصبية neural networks بهدف مساعدة الأنظمة الحاسوبية على تحسين أدائها باستمرار. أما خوارزميات تعلم الآلة فتبنى بالاعتماد على نماذج رياضياتية وعينات من البيانات تسمى “بيانات التدريب”، بهدف أن تتخذ قرارات دون أن تتم برمجتها خصيصًا لاتخاذ تلك القرارات بل “تتعلمها” لاحقا بسبب الاستخدام المتتابع.
انطلاقة عصبية
يعود بدايات تعلم الآلة إلى محاولات متواضعة لفهم آلية التعلم عند الإنسان ودور الجهاز العصبي في ذلك، ومحاولة نمذجة بنية هذا الجهاز والتفاعل بين عناصره، ثم الانطلاق من ذلك لجعل الآلة تتصرف بصورة مماثلة.
في عام 1943 كتب وارن ماكولتش Warren McCulloch المتخصص في فيزيولوجيا الأعصاب و وولتر بيتز Walter Pitts المتخصص في الرياضيات بحثا عن آلية عمل العصبونات، وصمما نموذجا لها باستخدام دارة كهربائية. وألف دونالد هيب Donald Hebb في عام 1949 كتابا طرح فيه نظرياته عن خلايا الدماغ وإثارة العصبونات والتفاعل والتواصل بينها. وظهرت نتيجةً لتلك الأبحاث أفكار الشبكات العصبية الاصطناعية. أما كتطبيقات حاسوبية عملية فيعتبر بعض الباحثين أن ظهورها بدأ مع برنامج لعبة الداما checkers في خمسينات القرن الماضي.
برنامج لعبة الداما
طور آرثر صمويل Arthur Samuel أول نسخة من هذا البرنامج مع شركة IBM عام 1952، وهو برنامج يمكنه التعلم خلال استخدامه، وبناءً على ذلك صاغ صمويل مصطلح “تعلم الآلة”.
تعتمد فكرة البرنامج على حساب فرص اللاعب وخصمه بالفوز عند كل مرحلة من اللعب واختيار الحركة التالية وفق مبدأ: لو حدثت أسوأ الحالات (حسب ما قد يلعب الخصم) فإننا نريد أن تكون الخسائر أقل ما يمكن. تطورت هذه الفكرة لاحقا إلى الخوارزمية المعروفة Minimax algorithm. ويعتمد البرنامج أيضا على تسجيل أوضاع اللعبة التي حصلت خلال أي استخدام لهذا البرنامج ليستفيد من ذلك في الاستخدامات التالية.
البيرسيبترون The Perceptron
صمم فرانك روزنبلات Frank Rosenblatt عام 1958 في مختبر كورنيل للطيران ما أسماه البيرسيبترون وهو ما شكّلَ بداية الشبكات العصبية الاصطناعية. يُعْرف البيرسيبترون حاليا كخوارزمية، لكن في البداية كان القصد تصميم آلة قابلة للتعلم واتخاذ قرارات. وتم تصنيع الآلة Mark 1 perceptron خصيصاً لبرمجيات البيرسيبترون، وكان هدفها التعرف على الصور وتمييزها، لكنها لم تشهد النجاح المأمول. وأدى فشل هذه الآلة وما ولده ذلك من إحباط إلى تأخير عمليات التطوير والاستثمار في بحوث الشبكات العصبية لسنوات عديدة.
خوارزمية الجوار الأقرب The Nearest Neighbor Algorithm
ظهرت هذه الخوارزمية عام 1967 وكانت منطلق خوارزميات تمييز النماذج pattern recognition. استعملت هذه الخوارزمية في مسائل إيجاد أفضل أو أقصر المسارات، مثل المسألة المشهورة عن أفضل خطة لمسار البائع الجوال، وهي تعطي حلا جيدا لكنه ليس بالضرورة أفضل الحلول. تعتمد فكرة الخوارزمية على الانتقال من المدينة التي فيها البائع إلى أقرب مدينة لم يمر عليها بعد، ثم نعيد تطبيق هذا المبدأ حتى يمر البائع على كل المدن.
فترة التجديد
بعد أن خبت جذوة الآمال المتعلقة بفعالية وفوائد تعلم الآلة لمدة قصيرة عاد الاهتمام بجدية بهذا المجال مع أفكار جديدة، مثل تعدد الطبقات في الشبكات العصبية، وعدم اقتصار الاعتماد على التغذية نحو الأمام Feedforward neural networks (تتدفق المعلومات من طبقة الدخل نحو الطبقات الأخرى حتى طبقة إصدار النتائج) بل أيضاً على النشر رجوعاً Backpropagation، حيث تتم إعادة معلومات عن النتائج، كالأخطاء مثلا، رجوعاً إلى الطبقات السابقة لتحسين الأداء.
ومن التطبيقات العملية التي شاعات في تلك الفترة تطوير طلبة في جامعة ستانفورد عام 1979 عربة يمكنها تجنب العوائق التي تواجهها خلال تجوالها.
نضوج الأفكار
في الثمانايان والتسعينات اكتمل نضوج الأفكار التي ظهرت في أواخر السبعينات مثل النشر رجوعاً، وظهرت عدة تطبيقات لها، كما ظهرت في عام 1982 الشبكات العصبية المتكررة Recurrent neural network (RNN) في أعمال جون هوبفيلد John Hopfield، ثم ديفيد روميلهارت David Rumelhart عام 1986. وبناءً على ذلك طور كل من سيب هوتشريتر Sepp Hochreiter ويورغان شميدهبر Jürgen Schmidhuber في عام 1997 شبكات Long short-term memory (LSTM) التي أسهمت في زيادة مستوى دقة النتائج في مجالات متعددة، وكان لها دور جوهري في زيادة فعالية خوارزميات التعرف على الكلام Speech recognition.
وطورت في تلك الفترة أيضا برمجيات كثيرة مثل البرنامج NetTalk عام 1985 الذي يتعلم لفظ الكلمات بنفس طريقة تعلم الأطفال، وبرنامج لعبة الطاولة Backgammon الذي طوره جيرالد تيسورو Gerald Tesauro عام 1992 وكان يضاهي أفضل اللاعبين البشر. وفي عام 1997 تمكن حاسوب IBM Deep Blue من هزيمة بطل العالم في الشطرنج غاري كاسباروف الذي يعتبره الكثيرون أفضل لاعب شطرنج في تاريخ اللعبة.
تطبيقات واعدة
مع بداية القرن الحالي أصبحت قدرات وفوائد تعلم الآلة جليةً للشركات المختلفة، وزادت نسب الاستثمار في هذا المجال، وظهرت تطبيقات تطوي على إمكانات فائقة.
وفي عام 2009 طُورت ImageNet، وهي قاعدة بيانات بصرية عن العالم الحقيقي. والفكرة جاءت من في-في لي Fei-Fei Li في جامعة ستانفورد التي رأت أن أفضل خوارزميات تعلم الآلة لن تعمل بشكل جيد إذا لم تتوفر المعطيات التي تمثل العالم الحقيقي. وفعلا فقد كانت قاعدة البيانات هذه حافزاً جوهرياً لازدهار الذكاء الاصطناعي.
وفي عام 2012 طور فريق من غوغل The Google Brain team شبكة عصبية اصطناعية يمكنها أن تتعلم الكيفية التي تتعرف بها على القطط في صور مأخوذة كشرائح متتالية من فيديوهات يوتيوب YouTube.
وتمكن الباحثون في شركة فيسبوك Facebook عام 2014 من تحقيق إنجاز مهم، وهو نظام التعرف على الوجوه DeepFace الذي يتمتع بدقة نسبتها97.35 % في تمييز الوجوه، وبتحسن نسبته 27 % عن الأنظمة السابقة.
وبعد تغلب الآلة على الإنسان في لعبة الشطرنج في نهاية القرن الماضي، تغلبت عليه عام 2011 في لعبة المعلومات العامة التلفزيونية Jeopardy، وذلك بالاعتماد على منظومة من تعلم الآلة ومعالجة اللغات الطبيعية وتقنيات استرجاع المعلومات Information retrieval techniques. وفي عام 2016 تغلب نظام طورته شركة غوغل وأسمته Google’s AlphaGo على لاعبين محترفين للعبة Go. وتم تحسين هذا النظام عام 2017 تحت اسم AlphaZero ليلعب الشطرنج وألعابا أخرى.
ومع تطور الاعتماد على الحوسبة السحابية Cloud Computing قدمت غوغل عام 2017 محرك تعلم الآلة السحابي Cloud Machine Learning Engine لمن يرغب في إنشاء شبكات عصبية وليس لديه مقومات هذه الشبكات، وذلك تشجيعا لمزيد من الاختراعات والأبحاث في هذا المجال.
أما في أيامنا هذه، فإن وسائل الإعلام تتحفنا كل يوم بأخبار عن تطبيقات ومشروعات جديدة مدهشة، من برمجيات الترجمة المحَسّنة وأنظمة المساعدة على الهواتف النقالة أو المساعدة في عموم الحياة اليومية وأنظمة خدمة المستهلك، إلى السيارات ذاتية القيادة والتسويق الرقمي، وعدد كبير من التطبيقات الطبية.
وعلى الرغم من التطورات الهائلة في مجال تعلم الآلة والذكاء الاصطناعي فإن بعض الباحثين يرون أن التطور الحقيقي في تعلم الآلة يأتي عندما تصبح الآلة قادرة على التعلم وحدها وليس نتيجة تدريبها من البشر؛ أي عندما تصبح قادرة بناءً على مجموعة عرَضية من العينات (ليست مختارة بعناية من قبل إنسان) على أن تميز تشابهات ونماذج patterns تربط بين عناصر معينة من هذه العينات، ومن ثم تتمكن الآلة وحدها من التعرف على الواقع المحيط وتصنيف ما يحيط بها كمجموعات متمايزة.