إنترنتتكنولوجيا

محركات البحث والإبحار في الشبكة العنكبوتية

م. محمد البسام

لم يعد البحث عن كلمة ما، أو معلومة محددة، أو عبارة معينة، يحتاج إلى التنقيب في عشرات الكتب، أو التفتيش في رفوف المكتبات، أو الغوص العميق في الذاكرة البشرية . ولم تعد تلك الساعات الطوال التي تستغرقها عملية البحث والتنقيب عقبة تؤرق الباحثين، أو تشغل همَّ الدارسين، بعد أن أصبحت تلك الساعات دقائق معدودة، أو ثواني قليلة، وصارت تلك الكلمات أو المعلومات أو العبارات بين يدي الإنسان من خلال حاسوبه أو هاتفه الذكي.
فلقد صارت محركات البحث search engine – بقدراتها الذكية وإمكاناتها الكبيرة وبرامجها المتنوعة – أداة طيعة في خدمة الإنسان، تبحر به في عالم الشبكة العنكبوتية العالمية (الإنترنت) لتأخذه إلى أمكنة فسيحة، تضع بين يديه المعلومات في إطارات متنوعة، وأشكال مختلفة، ومؤثرات صوتية وبصرية باهرة.

وغدت محركات البحث في العصر الحديث أداة لا غنى عنها لجميع الباحثين والدارسين، ووسيلة أساسية لكل الطلبة الراغبين في البحث عن معلومة علمية أو مسألة دراسية تفيدهم في مراحلهم التعليمية، كما غدت المقصد الرئيسي لكل متصفحي الإنترنت الراغبين في معرفة معنى من المعاني، أو البحث عن معلومة ما أو عن فندق أو مستشفى أو شركة طيران، أو عن الطعام أو الصحة أو الملابس.. إلخ.
وعملية البحث في مواقع الإنترنت تعتمد على استقراء صفحات الوب web page «وهي مجموعة من الوثائق المترابطة interlinked documents في نظام نصوصٍ ممنهلة hypertext system، تكوِّن بمجموعها شبكة الإنترنت العالمية»، بواسطة متصفِّح وب Web browser، يبحث عن وثائقَ جديدة في الإنترنت، ويُخزِّن عناوينَها والمعلوماتِ المتعلقةَ بها في قاعدة بيانات (فهارس) تستطيع محركات البحث النفاذَ إليها، وعرْضَ الصفحات التي تُطابق كلمةَ ما أو عبارة معينة يحددها الباحث.
وبعد أن ازدادت مواقع الشبكة العنكبوتية بصورة كبيرة وتنوعت صفحاتها، لجأت الشركات الكبرى إلى التخصص في مجال محركات البحث، لتخدم كل مجموعة من المحركات موضوعاً أو شكلاً مخصصاً من أوعية معلومات الشبكة العنكبوتية، ولم يكن التخصص في الشكل والموضوع فحسب، بل تعدى ذلك إلى التخصص في مناطق جغرافية محددة تنتمي إليها صفحات الإنترنت فيما يعرف Regional Search Engines، واستمر ذلك التخصص وصولاً إلى الجيل الأكثر تقدماً من محركات البحث العادية، وهو محركات البحث المتعددة Meta Search Engines.
وتعرف محركات البحث بأنها أدوات بحث تعمل من خلال استراتيجيات محددة للبحث في حقول أو وثائق نصية، كما تبحث عن أشياء معينة كالصور والخرائط والأشكال الأخرى في بيئة محددة هي شبكة الإنترنت، وذلك يعني أنها تبحث في ملايين المواقع ومليارات الكلمات في وقت محدد، وتتميز بسرعة الاستجابة وعادة ما تكون إجاباتها إما مواقع على الإنترنت تتوافر فيها كل المصطلحات التي جرى البحث عنها أو بعضها، أو مواقع محددة سلفاً من خلال ما يعرف بأدلة البحث. وتختلف محركات البحث عن بعضها في أسلوب العمل، فمثلاً: تحتفظ قاعدة بيانات محرك البحث altavista بكل تفاصيل صفحة الوب المخزنة عليها، أما محركات البحث الأخرى فقد تحتفظ بالعناوين الرئيسية للصفحة فقط، وهذا ما يؤدي إلى اختلاف شكل ودقة نتائج البحث الظاهر للمستخدم.

نظرة تاريخية
في نهاية عقد السبعينيات تم تطوير مجموعة من القواعد والنظم والإجراءات المشتركة التي تعمل من خلالها شبكة الإنترنت، بحيث تجعل الحواسيب تتواصل وتتبادل المعلومات مع بعضها، وأطلق عليها تسمية (Protocol)، ثم استخدمت هذه البروتوكولات بحلول عام 1980، وفي عام 1983 طالبت وكالة مشروعات أبحاث الدفاع المتطورة في الولايات المتحدة (Darpa)، باستخدام ما عرف ببروتوكولات
(TCP/IP)، لكل الشبكات المترابطة.
وفي أواخر الثمانينيات ارتبطت بالإنترنت شبكات أخرى، من فرنسا واليابان والمملكة المتحدة، وغيرها من دول العالم، وساهمت أوروبا بممرات للنقل السريع مثل (Nordu Net)، لغرض توفير إمكانات ربط أكثر من مئة ألف حاسوب متفرقة عبر عدد كبير من الشبكات.
ومع بداية التسعينيات انتشرت الإنترنت لتغطي رقعة واسعة من العالم، وانضمت إليها آلاف الشبكات، ويعود الفضل في ذلك إلى تطبيق بروتوكول (TCP/IP). وبلغ عدد الشبكات حينها نحو (5000) شبكة في أكثر من (36) دولة، وارتبط بها أكثر من 7000 ألف حاسوب، وشهدت دخول شبكات أخرى إليها، زودتها بالصوت والصورة، وأدوات الإعلام المتعدد الوسائط.
ويعود تاريخ اختراع أول أداة بحث على الإنترنت إلى عام 1990 عندما تمكن الطالب في جامعة ماكغيل الكندية آلان إمتاج من اختراع أول أداة بحث. وكانت فكرته تعتمد على بناء قاعدة بيانات للملفات أطلق عليها اسم Archie (آرشي) المشتق من كلمة Archives أي أرشيفات.
وكان (Archie) برنامجاً حاسوبياً ذا قدرات محدودة يحمِّل قائمة بالملفات الموجودة في مواقع نقل الملفات ضمن شبكة من الحواسيب المرتبطة معاً. وفي سنة 1991، طرح الطالب في جامعة مينيسوتا الأمريكية مارك ماك كاهيل برنامجاً حاسوبياً سماه (Gopher) يقوم بأرشفة النصوص العادية الموجودة في المواقع و التي أصبحت فيما بعد مواقع وب.
واعتمادا على هذين البرنامجين، ومع التطور الحاصل في البرامج الحاسوبية، وانتشار الإنترنت بصورة كبيرة في عام 1993 انطلقت ثورة في مجال محركات البحث، كانت شرارتها برنامجاً يدعى (Wandex) أطلقه ماثيو غراي (في معهد ماساتشوستس للتكنولوجيا) ذلك العام، وجمع فيه بين خاصية البحث عن الملفات والنصوص داخل صفحات الوب عبر الاعتماد على خاصية الأرشفة في المواقع. وتبعه محركات أخرى منها (Aliweb) الذي ظهر عام 1993، و(WebCrawler)، الذي ظهر عام 1994.
وهذا البرنامج الأخير أتاح للمستخدمين حرية البحث عن أي كلمة على أي صفحة وب، وهو ما صار قاعدة لكل محركات البحث الكبرى منذ ذلك الوقت.
ثم أخذت محركات البحث تنتشر بصورة تجارية حتى صارت مركز استقطاب للاستثمارات الراغبة في الاستفادة من الطفرة في الإنترنت التي شهدها العقد الأخير من القرن الماضي.
وهنالك فرق جلي بين محرك البحث ودليل البحث، فمحرك البحث هو – كما ذكر آنفا- أداة برمجية (آلية) تتيح البحثَ عن كلمات وعبارات محدَّدة في النصوص، وفي مواقع الإنترنت، أما دليل البحث فهو يعمل بواسطة أشخاص متخصصين، وما يحدث هو أن العديد من المواقع يتم تسليمها إلى دليل ما، ثم يتم فرزها وتبويبها وفق تصنيف معين، ولأن هذه الأدلة تدار بشريا فإنها قادرة على  توفير معلومات أكثر دقة.
وتقدم الأدلة للمستخدم طريقة سريعة للبدء بعمليات البحث عن المعلومات بواسطة تفحص الموضوعات المصنفة التي تعرضها، إذ يندرج تحت كل موضوع لائحة من الموضوعات الفرعية، التي تتيح للمستخدم إمكان تفحصها تباعا إلى أن يصل إلى المعلومات المطلوبة، وفي حال عدم وجود المعلومات تحت الموضوع الذي اختاره المستخدم، فإنه يختار موضوعاً رئيسياً آخر ليقوم بالبحث في تفرعاته من جديد، وهكذا… لكن ينبغي التوضيح أن هناك عدداً من أدلة البحث تعمل أيضا كمحركات منها: yahoo – altavista – excite، وتم أخيراً إطلاق موقع بحث عربي بعنوان (yaarabi).

مراحل عملية البحث
تتكون عملية البحث من ثلاث مراحل رئيسية تمثل الأجزاء الأساسية لأي محرك بحث، وهي:

1 - برنامج العنكبوت
يستخدم هذا البرنامج للعثور على صفحات جديدة على الوب لإضافتها إلى قاعدة البيانات الخاصة بالمحرك، ويسمى هذا البرنامج أيضا (الزائر)؛ لأنه يبحر في الإنترنت بهدوء لزيارة صفحات الوب الجديدة والاطلاع على محتوياتها، وبصورة خاصة الكلمات الرئيسية (المفتاحية)، كما يتصفح الروابط (الوصلات) الخاصة بتلك الصفحات للاطلاع على مضمونها. ويأخذ هذا البرنامج مؤشرات المواقع من عنوان الصفحة، والكلمات الرئيسية التي تحتوي عليها. وترمي محركات البحث من الزيارات المعتادة و الدورية المتعاقبة إلى المواقع وروابطها إلى وضع النصوص المتاحة على تلك المواقع على فهارس محرك البحث، ليتمكن المحرك من العودة إليها فيما بعد، إضافة إلى الاطلاع على التعديلات المتلاحقة التي يتم إدخالها على المواقع المفهرسة.

2 –  برنامج المفهرس
يمثل برنامج المفهرس قاعدة بيانات ضخمة تستخدم لتوصيف صفحات الوب التي عثر عليها برنامج العنكبوت، وتعتمد على بعض المعايير مثل الكلمات الأكثر تكرارا من غيرها. وتختلف محركات البحث عن بعضها في هذه المعايير، إضافة إلى اختلافها في خوارزميات البحث.

3 – برنامج محرك البحث
يختلف التعامل في هذه المرحلة التي تعد الثالثة عن المرحلتين السابقتين؛ حيث يتعامل محرك البحث مع المستفيدين وليس مع صفحات الوب. وترتكز هذه المرحلة على إعداد مجموعة من استراتيجيات البحث مكونة من مجموعة من آليات البحث يتعامل بها الباحثون عن المعلومات مع قاعدة بيانات المحرك لاستدعاء مصادر معلومات الشبكة. ويأخذ هذا الجزء من عمل محرك البحث أهمية أكبر من الجزءين السابقين؛ نظرا لأنه الواجهة التي يتعامل معها المستفيد من كل أجزاء محركات البحث والذي يبني عليه المستفيدون تقييمهم لأداء محركات البحث.
وبالقدر الذي تكون عليه كفاءة آليات البحث يكون أداء المحرك في تحقيق الهدف المنشود، الذي يختلف من مستخدم إلى آخر.
وعادة ما يكون طلب المستخدم البحث عن كلمة أو عبارة، وتمكِّن محركات البحث عادةً من استخدام بعض المعامِلات لتوفير خيارات إضافية لعملية البحث. مثلاً: تستخدم علامات التنصيص ” ” للبحث عن العبارة المحددة بين هذه العلامات كما هي، ويُستخدَم رمز النجمة للبحث عن كلمة عُلِمَ أحد مقاطعها، وعلامة + قبل الكلمة لتصبح هذه الكلمة إجبارية، وبالعكس عند وضع علامة – قبل الكلمة، فالمطلوب هو عدم ورود الكلمة في الصفحات المسترجعة.
كما يستخدم المعامل المنطقي AND للبحث عن الصفحات التي تحتوي على الكلمتين الموجودتين قبله وبعده، والمعامل OR للبحث عن الصفحات التي تحتوي على أي من الكلمتين الموجودتين قبله وبعده، والمعامل NOT للبحث عن الصفحات التي لا تحتوي على الكلمة التي تليها، والمعامل NEAR للبحث عن الصفحات التي تكون فيها الكلمة الموجودة قبل NEAR قريبة من الكلمة الموجودة بعدها، وغيرها من المعاملات. كما تمكِّن محركات البحث من تحديد مجالات البحث للوصول إلى نتائج أكثر دقة.

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

زر الذهاب إلى الأعلى