تطبيقات الاستشعار عن بعد

دور ريادي لتعلم الآلة والبيانات الضخمة

د. حسين عزيز صالح
أستاذ في المعهد العالي للبحوث والدراسات الزلزالية، جامعة دمشق، ومدير سابق للهيئة العليا للبحث العلمي (سورية)

تؤدي علوم الأرض وإدارة الموارد الطبيعية دوراً حيوياً في تطوير التنمية الشاملة ولاسيما في البلدان النامية التي تمتلك بيانات قليلة عن الغطاء الأرضي الذي يُعد مُتغيِّراً أساسياً يؤثر في البيئات البشرية والمادية لدول العالم كافةً. ويتضمن هذا الغطاء معلومات مهمة عن خصائص البيئات الطبيعية لسطح الأرض، مثل التنوع البيولوجي والهواء والمياه السطحية وأنواع التربة والجبال والأراضي الزراعية والبنية التحتية. وبسبب التَحضّر السريع والنشاط البشري المُستمر، يتغيّر سطح الأرض بصورة كبيرة على نطاق محلي وإقليمي وعالمي فيما يتعلق بالتأثيرات البيئية والاجتماعية الاقتصادية والجمالية. لذا، يُعد تحليل هذا الغطاء الأرضي والاستخدام الدقيق لبياناته ومعلوماته المتعلقة بالموارد الطبيعية والمادية في الوقت المناسب دوراً مهماً في تنمية المجتمع البشري ورفاهتيه.
وهناك طريقتان أساسيتان للكشف عن بيانات الغطاء الأرضي وتغيراته المستمرة على نطاق واسع: النهج الأول يتمثل في الحصول على البيانات الوصفية من النظم العالمية لتحديد المواقع الإحداثية (الطول والعرض والارتفاع) على الأرض باستخدام الإشارات المرسلة من الأقمار الاصطناعية Global Navigation Satellite Systemالتي تستغرق زمن معالجة أطول وتكون مكلفة أكثر في مسح الغطاء الأرضي. لذا يُستخدم النهج الثاني المتمثل في استخراج معلومات الغطاء الأرضي على شكل رقمي من معالجة الصور الفضائية لأنظمة الاستشعار عن بعد Remote Sensing. تغطي هذه الصور الفضائية satellite images مساحات شاسعة من سطح الكرة الأرضية، وتتضمن مجموعة البيانات البيئية والتوضعات الخاصة بالمعالم الجغرافية لشكل الأرض التي تساعد على دعم مراقبة الغطاء الأرضي وإدارة موارده الطبيعية. ويمكن استخراج المعلومات المفيدة بسرعة من هذه البيانات الجيومكانية الضخمة ومعالجتها بدقة عالية باستخدام تقنيات النمذجة الحاسوبية التي تُعد طريقة فعالة لتفسير العديد من المعلومات المفيدة المتعلقة بدراسة الغطاء الأرضي وتحليله.
وتُعد تقنيات تعلم الآلة Machine Learning والتعلم العميق Deep Learning، المعتمدة على الذكاء الاصطناعي، أساليب حسابيةً متطورةً في توفير المعرفة المُكتسبة بالتعلم من بيانات التدريب المُجمعة والتجارب السابقة. وتُساعد هذه المعرفة على دعم وتحسين أداء الأجهزة الحاسوبية وبرمجيات النمذجة الخاصة بتفسير وتحليل الأعداد الكبيرة من الصور الفضائية واستخلاص المعلومات المفيدة منها بدقة عالية واستخدامها في إنتاج الخرائط الغرضية وتنفيذ كثير من التطبيقات المتنوعة مثل إدارة خطر الكوارث، ومسح وتقييم الموارد الطبيعية وإدارتها، ومعالجة المشكلات البيئية، ودراسة البيئة الصحراوية والموارد المائية، ودراسة استخدامات الأراضي والتغيرات التي تطرأ عليها، وإنتاج خرائط جرد الأراضي، إلخ.
وتتطور هذه التقنيات والأساليب والنماذج الحاسوبية الذكية بصورة متسارعة ويومية، وهذا ما يجعل الكشف عن تغيرات الغطاء الأرضي أكثر دقة وفعالية في تصنيف مكونات الغطاء الأرضي في أقل وقت ممكن وبتكلفة منخفضة.

البيانات الجيومكانية الضخمة
يتصل معظم سكان العالم حالياً بعضهم ببعض على نطاق واسع من خلال المشاركة في البيانات الضخمة المتولدة من شبكات إنترنت الأشياء وشبكات التواصل الاجتماعي وأجهزة قياس المناخ والأجهزة الذكية (ولاسيما الجيل الخامس من الشبكات الخلوية المتصلة ببلايين الأجهزة المنتجة للبيانات بسرعة هائلة جداً)، ومن أجهزة الاستشعار عن بُعد لمراقبة الأرض التي أصبحت كوكباً رقمياً يجعل حياة الناس أكثر سهولة ومرونة. وللحصول على منظور أفضل لفهم الصورة الكبيرة حول حجم هذه البيانات الضخمة التي تنشئها وتديرها أنظمة مولدات البيانات الضخمة المذكورة آنفاً، يتبين أن 90 % من البيانات العالمية المتاحة حاليا تم توفيرها في العامين الماضيين، وأنه بنهاية عام 2020 سيصل حجم هذه البيانات إلى 44 زيتابايت zettabytes. وعلى سبيل المثال، وفقاً لشركة IBM يُنشئ المستخدمون 2.5 مليون بايت من البيانات يومياً، وتتحكم شركة وول مارت Walmart في أكثر من مليون معاملة للعملاء كل ساعة حيث تحول بعد ذلك إلى قاعدة بيانات تعمل بأكثر من 2.5 بيتابايت. ويحتفظ موقع فيسبوك Facebook بأكثر من 45 بليون صورة في قاعدة بيانات المستخدمين، وهو رقم يزداد يومياً. تتيح هذه المنصات لتوليد البيانات الضخمة الجديدة للباحثين الحصول على تفاصيل دقيقة حول عدد من المؤشرات الاجتماعية والاقتصادية والبيئية. وبناءً على ذلك، تُشبه البيانات الضخمة حالة الطقس المتغيرة بصورة أسرع مما يمكننا أن نتصوره ونسخره -والذي لا يمكن إدارته بسهولة- لكن نحاول جاهدين السيطرة عليه وفهمه واستخدامه واستغلاله (قدر الإمكان) باستخدام تقنيات التنبؤ بأحوال الطقس. فالبيانات كانت متاحة دائماً، لكن الفرق الآن هو أن كلها (أو معظمها) مُصاغة في شكل رقمي يمكن تخزينها والتعامل معها بمرونة وبمهنية. وتتسم البيانات الضخمة المُستخدمة في تحليل الصور الفضائية بمزايا عدة، أهمها الحجم (كميات البيانات الهائلة التي تنشأ كل ثانية)، والتنوع (البيانات المتنوعة من مصادر متعددة كالليزر والرادار)، والسرعة (السرعة في توليد بيانات جديدة وحركتها ومعالجتها وتحليلها، على سبيل المثال، يمكن للثواني أن تنقذ مئات الآلاف من الأرواح في زلزال)، والصدق (أي فوضى البيانات أو مصداقيتها)، والقيمة Value (الوصول إلى البيانات الضخمة ليس جيدًا ما لم يتم تحويلها إلى قيمة مضافة).
على أي حال، مع هذه الأرض الرقمية ومولدات البيانات المتحركة التي توفر ثروة من البيانات الضخمة ذات الفرص الكبيرة، لا تزال هناك مشكلة شائعة تتعلق بالحصول على رؤى حول كيفية الاستفادة من هذه الكميات الضخمة من البيانات ذات التعقيد الهائل والتنوع وعدم التجانس الذي يجعل من الصعب معالجتها وتحليلها في أقصر وقت ممكن وبأقل تكلفة. إن تحليل هذه البيانات الضخمة بسرعة ومعالجتها بدقة عالية يتطلب تصميم وتطوير منهجيات وتقنيات تعلم الآلة والتعلم العميق التي تساعد على تنفيذ ودعم عمليات كثيرة كالتحليل والتفسير وتنظيم البيانات والبحث والمشاركة والتصور والاستعلام والتحديث وخصوصية المعلومات.

خوارزميات ذكية
تُظهر النماذج الحاسوبية المبنية على تعلم الآلة والتعلم العميق قابلية التطبيق الجيدة في تحسين عمليات تحليل الغطاء الأرضي ولاسيما عمليات التصنيف classification والانحدار regression والمهام الأخرى المتعلقة بالبيانات الضخمة الجيومكانية والزمنية عالية الأبعاد. يُعرف التصنيف بأنه عملية تحديد مخرجات النموذج إلى فئات مختلفة أو التنبؤ بتلك المخرجات بناءً على فصول التدريب المدخلة، على سبيل المثال، البريد الإلكتروني هو بريد مزعج (spam) أم لا، وهل تحتوي هذه الطبقة الجيولوجية على ماء أم لا، إلخ. أما عمليات الانحدار فتُستخدم للتنبؤ بقيم الاستجابة المستمرة لعمل النموذج، على سبيل المثال، هبوط أسعار المنازل أو ارتفاعها، والتغيرات في مستويات المياه. ولاستخراج المعرفة واكتساب نظرة ثاقبة من قواعد البيانات الضخمة وتعزيز القدرات التنبؤية التي تدعم عملية اتخاذ القرار السليم، تتعلم خوارزميات تعلم الآلة من الحسابات والتجارب السابقة إنتاج قرارات ونتائج موثوقة قابلة للتكرار والاستخدام الفعال في المراحل المقبلة. ومن ثم تؤدي هذه الخوارزميات دوراً مهماً في العديد من المجالات، مثل التعرف على الكلام وأمن المعلومات. وعلى الرغم من أن تعلم الآلة يتكون من أنواع مختلفة من الخوارزميات بناءً على أسلوب التعلم ووظيفته، فإن جميع هذه الخوارزميات تتكون من ثلاث خطوات أساسية: التمثيل representation والتقييم evaluation والتحسين optimization. وتعتمد تقنيات التعلم العميق على أنماط البيانات المستخدمة والإحصاء ومفهوم تحليل البيانات في علوم الحاسوب، وتوجد طرق مختلفة لهذا التعلم مثل التعلم الخاضع للإشراف upervised learning الذي يعتمد على المهام والوظائف للتنبؤ بالقيمة التالية، والتعلم غير الخاضع للإشراف unsupervised learning الذي يعتمد على البيانات لتحديد المجموعات، والتعلم المُعزز reinforcement learning الذي يعتمد على مبدأ التعلم من الأخطاء. تدرس هذه الخوارزميات التوقعات المتعلقة ببيانات التدريب بشكل متكرر، ويتوقف التعلم عندما تصل هذه الخوارزمية إلى مستوى فعّال من الأداء كل حسب دورها وفعاليتها.

تعلم الآلة والاستشعار عن بعد
من أهم نُهج تعلم الآلة استخداماً في تطبيقات الاستشعار عن بعد: خوارزميات التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف. يتميز النموذج الخاضع للإشراف بالسرعة والدقة في التنبؤ ببيانات جديدة عن طريق التعلم من خلال إدخال مجموعة بيانات تدريب تتضمن مدخلات inputs وعلامات labels مصنفة، تُجمع وتحلل في عمليات التصنيف والانحدار.
وبعض الأنواع الشائعة لخوارزميات التعلم الخاضعة للإشراف تتضمن الانحدار الخطي linear regression والغابة العشوائية random forest، وشجرة القرار decision tree. أما نموذج التعلم غير الخاضع للإشراف، فيستخدم مجموعات بيانات إدخال ذات علامات غير مصنفة unlabelled ولا تحتوي على بيانات ذات ضوضاء noisy ومختلطة mixed وغير معروفة unknown لتدريب النماذج الحاسوبية، وبعدها يجب على هذه النماذج استخدام هذه البيانات المعطاة، ومن ثم إيجاد الأنماط المخفية hidden patterns التي تُعد مفيدة جدًا عندما لا يعرف علماء البيانات نوع الفئة class أو النمط pattern الذي يتم تعلمه من البيانات. من أمثلة خوارزميات التعلم غير الخاضعة للإشراف: خوارزمية التجميع clustering، واكتشاف الأبعاد dimension detection، وقواعد التجمع association rules.

معالجة البيانات الجيومكانية الضخمة
إن التحدي الأكبر الذي يواجه معالجة البيانات الجيومكانية الضخمة هو الحصول على أكبر قدرٍ ممكن من المعلومات الدقيقة بأسرع وقت وبأقل كلفة ممكنة. وتتم معالجة البيانات الجيومكانية الضخمة باستخدام تعلم الآلة والتعلم العميق وفق الإجراءات الآتية:
أولاً) إجراء عمليات تجميع البيانات من مصادر متنوعة: إضافة إلى مجموعة بيانات الصور الفضائية الملتقطة من أنظمة الاستشعار عن بعد مثل لاندسات Landsat الأمريكي، هناك مولدات بيانات متحركة تُعد المغذي الفعال الرئيسي للبيانات الضخمة في دراسة الغطاء الأرضي، مثل البيانات الوصفية لنظام تحديد المواقع العالمي، وخريطة الشارع المفتوح Open Street Map الذي هو مشروع معلومات جغرافي تطوعي عالمي يضم أكثر من مليون مساهم حول العالم ويوفر بيانات مفتوحة متاحة مجانًا لرسم الخرائط، ومنصات الحوسبة السحابية مثل Google Earth Engine. إن لاستخدام مثل هذه المحركات القائمة على الحوسبة السحابية في المراقبة الحضرية والبيئية أدوارا مفيدة نظرًا لوقت الحوسبة وسرعتها وتكلفتها.
ويوفر دمج بيانات الاستشعار عن بعد مع مجموعة البيانات الضخمة المذكورة آنفاً مورداً مهماً لدراسة الغطاء الأرضي وتحليله ورسم خرائط استخدام الأراضي، ويُعد أداة مهمة لرصد وتوصيف وتحديد حجم المشهد الطبيعي المدروس من هذا الغطاء، ومصدراً مهماً للمعلومات لصانعي السياسات والباحثين والدارسين العاملين في مجال تغيرات الغطاء لأرضي.
ثانياً) المعالجة المسبقة للصور الفضائية: تُعد هذه الخطوة مهمة في إجراءات تنظيف البيانات المُجمعة ومعالجة الصور الفضائية وتنقيتها من الأخطاء والتشوهات وإزالة تأثيراتها بهدف تحسين جودتها. ونظرًا لأن هذه الصور مأخوذة من مواقع بعيدة جدًا عن سطح الأرض، فإنها تحوي العديد من الضوضاء والتشويه أثناء مسح البيانات ونقلها وتسجيلها. وتتضمن المعالجة المسبقة تصحيح الغلاف الجوي، والتصحيح الهندسي، وتطبيق فسيفساء الصور، وتقوية وضوح الصورة للصور المستخدمة في تصنيف الغطاء الأرضي.
ثالثاً) عمليات التحليل التفصيلي لمخرجات النماذج الحاسوبية المبنية على تعلم الآلة والتعلم العميق: تتم هذه العمليات من خلال بناء النماذج واختيار أفضل خوارزميات تعلم الآلة والتعلم العميق للحصول على المعلومات الدقيقة من نتائج هذا النموذج ومخرجاته. في هذه الخطوة يعمل محرك البحث الخاص بكوكب الأرض كمنصة للحوسبة السحابية التي تدعم الوصول المجاني إلى مجموعات متنوعة من الصور الفضائية والبيانات الجغرافية المكانية الأخرى واسترجاع هذه الصور بشكل مباشر. باستخدام كل من نظم المعلومات الجغرافية ومحرك بحث الأرض، تتيح منهجيات تصنيف تعلم الآلة التحليل العلمي واختبار ومعالجة الصور والتصور لمجموعات البيانات الجغرافية المكانية وإجراء تصنيف الغطاء الأرضي للصورة متعددة الأطياف وتحقيق النتائج المناسبة ومقارنة دقتها، والحصول على المزيد من التفاصيل الدقيقة مثل تحديد قدرات المؤشرات الطيفية Spectral Indices المهمة في معالجة الصور الفضائية واستكشاف وتقييم فئات الغطاء الأرضي. تتكون هذه المؤشرات من مؤشر الغطاء النباتي المعياري (NDVI) Normalized Difference Vegetation Index الأكثر شيوعاً في دراسة الغطاء النباتي، ومؤشر تراكم الفروق المقيسة (NDBI) Normalized Difference Build-up Index الأكثر شيوعًا في رسم خرائط المناطق الحضرية التي تنتشر بسرعة حول العالم. وتستخرج المزايا من الصور الفضائية من مجموعة بيانات التدريب باستخدام منهجيات تصنيف تعلم الآلة التي تتيح التعرف على الأنماط عبر طبقات متعددة من المدخلات، وتحسين الدقة والسماح بإجراء تحليلات متعددة الأبعاد.
إن بعض خوارزميات التعلم العميق المستخدمة في هذه الخطوة هي خوارزمية الغابة العشوائية نظرا لدقتها في في تصنيف الغطاء الأرضي، وتحديدها للمتغيرات المهمة والقدرة على التنبؤ بالقيم المفقودة، وتقييم التوقعات باستخدام غابة من أشجار القرار، باعتبار أن مفتاح نجاح هذه الخوارزمية يعتمد على كيفية إنشاء الغابة باستخدام كل شجرة من أشجار القرار. أما خوارزمية أشجار التصنيف والانحدار التي تمتلك طبيعة غير مبنية على المعاملات فإنها تصنف فئات الغطاء الأرضي بناءً على البيانات التاريخية باستخدام مفهوم إنتروبيا المعلومات information entropy (أي إن مقدار توفر المعلومات هو الذي يتحكم في صحة القرار). إضافة إلى ذلك، تتعامل هذه الخوارزمية بسهولة مع المتغيرات العددية والفئوية والمتطرفة ، حيث تحدد المتغيرات الأكثر أهمية وتزيل المتغيرات غير المهمة. وأخيراً، خوارزمية الحد الأدنى للمسافة Minimum Distance التي تصنف الأنماط المجهولة إلى فئات استنادًا إلى الحد الأدنى لقياس أوجه التشابه بين الوظائف الموزعة.
رابعاً) عمليات التصور المرئي للبيانات وتحويل النتائج على شكل صور: في هذه الخطوة الأخيرة، تقوم نظم المعلومات الجغرافية المستخدمة جنباً إلى جنب مع منهجيات تعلم الآلة بتحليل البيانات الجيومكانية الضخمة وتحويلها إلى صور مرئية. تُعد نظم المعلومات الجغرافية برامج حاسوبية تتميز بالمقدرة الفائقة على جمع وإدارة ومعالجة المعلومات والبيانات ذات الطبيعة المكانية (بيانات تصف معالم جغرافية سطح الأرض) وتوثيقها وتداولها وتحليلها وإظهارها وتصنيفها في قاعدة بيانات، واستخدامها بفعالية في دراسة الغطاء الأرضي وتحليلها، واستخراج مجموعة كبرى من الخرائط الغرضية حسب الطلب والتطبيقات والجهات المستعملة. عند الانتهاء من تصنيف الغطاء الأرضي، تقيَّم دقة نموذج منهجية التصنيف لتحديد أداء ذلك النموذج، وذلك باستخدام مقاييس تقييم متنوعة مثل مصفوفة خطأ التصنيف classification error matrix التي تساعد على تحديد الدقة الإجمالية ودقة المستخدم ودقة المنتج.

فعالية واعدة
يوفر استخدام نظام الاستشعار عن بعد المقترن بنظم المعلومات الجغرافية أدوات فعالة في رسم خرائط الغطاء الأرضي وتحديد وفهم التغيرات السطحية على الأرض والمعلومات عن موارد الأراضي القيِّمة والفعالة للتخطيط الحضري والبنية التحتية لدول العالم كافة ولاسيما البلدان النامية. واستعرضنا آنفا الخطوة الأكثر تقدماً في مجال استخدام خوارزميات تعلم الآلة والتعلم العميق المبنية على الذكاء الاصطناعي في تحليل الصور الفضائية لنظام الاستشعار عن بعد، وتفسير البيانات الجيومكانية الضخمة بدقة عالية جداً للغطاء الأرضي.
وحتى الآن لم يتم التركيز على استخدام الخوارزميات الذكية لتعلم الآلة والتعلم العميق بشكل فعال في تحسين ثروة البيانات الجيومكانية الضخمة غير المستغلة والمتاحة، والتي يمكن دمجها في البيانات الاجتماعية والاقتصادية من أجل بناء نماذج للتنبؤ بالتهديدات البيئية والاجتماعية. يمكن لهذه الخوارزميات التي تتطور بسرعة هائلة مساعدة البيئة والمجتمع البشري على القدرة على التوسع من المستوى المحلي إلى المستوى العالمي لإدارة الكوارث والمخاطر وفهم الخسائر الاقتصادية والاجتماعية والإنسانية وإعدادها والاستجابة لها في الوقت المناسب.