د.طارق قابيل
شهدت السنوات الماضية ثورة علمية كبيرة في التقنيات الحيوية أدت إلى توافر كميات هائلة من المعلومات حول تراكيب ووظائف المكونات الخلوية والحيوية الدقيقة وبخاصة الحمض النووي المنقوص الأكسجين، والبروتينات. وتمثلت هذه المعلومات بشكل رئيسي في سلاسل الأحماض النووية والأمينية والخرائط الوراثية (الجينوم) للكائنات الحية والتراكيب الثلاثية الأبعاد للبروتين. وواكب هذه الثورة تطور كبير في مجال المعلوماتية، مما أدى إلى اندماج معظم هذه التقنيات معًا لتحليل تلك البيانات الضخمة والتوصل إلى حلول علمية كثيرة أدت إلى تثوير العديد من القطاعات العلمية والصناعية وفك غموض العديد من الأسرار العلمية الدفينة.
ثورة التركيب الجيني
شهدت تسعينيات القرن العشرين تقدّماً لافتا في علوم الوراثة والجينات، خصوصاً في مشروعات التعرّف إلى التركيب الجيني لعدد من الكائنات الحيّة، مثل خميرة الخبز والفأر وذبابة الفاكهة. وتوّجت هذه الجهود بالكشف عن التركيبة الجينية (الوراثية) للإنسان. وتلك الإنجازات ولّدت طوفانًا من المعلومات المتطورة في مجال علوم البيولوجيا، تضمنت الخريطة الجينية (الجينوم) للكائنات المختلفة، والمركبات التي تتفاعل في الخلية مع تلك الشفرة، وما ينتجه ذلك التفاعل من بروتينات أساسية وإنزيمات وغيرها من المُركّبات المسؤولة عن قراءة الشفرة الوراثية والتعامل مع معطياتها، بما في ذلك نسخ المعلومات التي تحملها تلك الشفرة الحيّة والفريدة من نوعها. وبذا، استطاع العلماء التعرّف إلى تلك المعلومات التي تُحدّد تركيب الجسم وطبيعة عمله ونسق نموه. وهكذا، أدّت تلك التطورات إلى نمو نوعي في معلومات البشر عن الظواهر البيولوجية وتراكيبها وآلياتها.
وطبقا لنشرة بنك المورثات في يونيو 2009، التابع للمركز الوطني لمعلومات التقنيات الحيوية في ميريلاند بالولايات المتحدة الأمريكية، فقد بلغ عدد محتويات البنك نحو 106 ملايين سلسلة تحتوي على أكثر من 105 مليارات قاعدة حمض نووي. ويتضاعف حجم المعلومات البيولوجية مرة كل سنة ونصف أو سنتين، لذا كان لا بد من اللجوء إلى تقانة المعلومات Information Technology التي تتضاعف قوتها كذلك بالوتيرة نفسها تقريباً. وأدى التزايد الكمي للمعلومات البيولوجية إلى بزوغ حقول علمية جديدة متعددة.
التطبيقات الطبية
اهتم العلماء بالتطبيقات الطبية بشكل كبير، نظرًا لأن فهماً أفضل لكيفية انتظام الجينات، ودورها في الخلية وفي تطور الكائنات، يفتح الباب أمام تصميم علاجات تتناسب مع المواصفات الوراثية للإنسان ولفهم المشكلات الصحية المترافقة مع التقدّم في العمر. وشكّلت المعلومات الجينية المكتشفة، بسرعة، الأساس لتصميم الكثير من الأدوية ومُكوّناتها. وأصبحت أداة لتحسين الكثير من التراكيب الوراثية لعدد كبير من المحاصيل الزراعية والحيوانات ذات الأهمية الاقتصادية.
وفي مقابل هذا التدفق المعلوماتي الكبير، واجه العلماء تحدي سُبل التنقيب والبحث عن معلومات مُحدّدة، بطريقة سريعة وفعّالة، في هذا الكم العارم، باعتبار ذلك من المتطلبات الأساسية في البحث العلمي. وبات العثور على المعلومة المطلوبة يُشبه محاولة العثور على إبرة في كومة من القشّ. وتطلب التطور في المعرفة انبثاق علم جديد هو علم المعلوماتية الحيوية أو «بيوإنفورماتيكس» (Bioinformatics) كعلم يلتقي فيه النمو الهائل للتقنية الحيوية مع التطور المطرد لتقانة المعلومات. وهو علم يدمج الحاسوب مع الرياضيات والجينوم، ويتعامل مع الخلية والحمض النووي كما لو أنها حاسوب.
ويعرف علم الأحياء الحاسوبي أو البيولوجيا الحاسوبية (Computational Biology) بأنه استخدام أحدث تقنيات الرياضيات التطبيقية، والمعلوماتية informatics، والإحصاء، وعلوم الحاسوب لحل مشكلات بيولوجية حيوية.
وبقول آخر، فإن ذلك العلم يدمج علم الظاهرة الحيّة مع الحاسوب والتقنيات الرقمية، باعتباره ضرورة لإدارة وتحليل وفهم الكم الهائل من المعلومات الناتجة من ثورة المعلومات الجينية.
كما يستهدف هذا العلم البحث عن المعلومات في كم هائل من البيانات للتوصل إلى الأسرار التي أودعها الخالق في صفاتنا الوراثية، وفهم أعمق لكيفية تفاعل هذه المكونات داخل وخارج خلية الكائن الحي، في مختلف الظروف التي تواجهه في حالة الصحة والمرض.
تطور المعلوماتية الحيوية
ظهر علم المعلوماتية الحيوية كخليط من علمي الأحياء، والحاسوب مثلا في علم قواعد البيانات، وذلك لحفظ واسترجاع البيانات الناتجة من تجارب التقنيات الحيوية. ولقد وفرت قواعد البيانات الحيوية مادة أولية للباحثين من المختصين في المجالات الأخرى كالإحصاء، والرياضيات، والذكاء الاصطناعي، والاحتمالات لإجراء أبحاث تعتمد على ما توصلت إليه هذه العلوم من طرق وأساليب للبحث في هذه المعلومات الحيوية. ومن هنا أصبح علم المعلوماتية الحيوية خليطا من كل هذه العلوم، مما فتح المجال أمام الباحثين لتبني أساليب جديدة متطورة للبحث في التراكيب الوراثية المعقدة، ووفر طرقا لفهم الأمراض ومسبباتها، ومراحل تطورها، ومن ثم القدرة على تشخيصها، وتصميم طرق العلاج المناسبة لها.
ترجع بداية استخدام مصطلح المعلوماتية الحيوية «بيوإنفورماتيكس» إلى ظهور كتاب «أطلس البروتينات الأساسية وتراكيبها» لمارغريت دايهوف عام 1968. وظهر المصطلح في الأدبيات العلمية عام 1991. ودخل ذلك العلم في مرحلة التطور العاصف مع استخدام تكنولوجيا الحاسوب في مجال البيولوجيا، وخصوصاً مع ابتكار برنامج «البحث التماثلي» (Similarity Search) الذي أدى استعماله إلى كشف العلاقة بين مكونات فيروس مُسبّب للسرطان بأحد الجينات. وانعكس التطور الكبير في تقنيات التعرّف إلى الشفرة الوراثية على نمو تقنية المعلوماتية الحيوية وتطورها؛ ما مكّنها من توفير الأرضية التقنية لمساعدة الاختصاصيين على التعامل مع الكميات الهائلة من البيانات العلمية.
وساعدت الرياضياتُ المعلوماتيةَ الحيوية على السير بمعدلات سريعة، وتحقيق قفزات تتلاءم مع حجم المعلومات المتضاعفة، من أجل أن تتكامل هذه المعلومات وتتضافر لتشكل صورة شاملة عن نشاطات الخلايا الحيّة، ما يساعد الباحثين في الكشف عن أسباب تغير هذه النشاطات في الأمراض المختلفة.
لغات البرمجة
ويدين ذلك العلم أيضاً للتطورات التقنية في لغات البرمجة، والتقدم الحاصل في تنسيق عمل الحواسيب، ما يُسمى «تكنولوجيا الحاسوب العنقودي» (Cluster Computer)، وزيادة قوة التخزين في الأقراص الصلبة والمتحركة، والتقدم في الشبكات، مثل ظهور الإنترنت.
ففي بداية الثورة الجينية، انصب اهتمام المعلوماتية الحيوية على إنشاء قاعدة بيانات لتخزين معلومات علوم البيولوجيا، بما في ذلك مقارنة المعلومات وتحليلها. ولا يشمل تطوير القواعد البيانية مسائل التصميم فقط، بل يشمل أيضا تطوير روابط إلكترونية متطورة بينها، لتضمن توفير المعلومات بطريقة سهلة وديناميكية، فضلاً عن إمكان إدخال بيانات جديدة وتنقيحها.
ولكي تتم الاستفادة القصوى من هذه البيانات، لا بد من توافر الأداة التي تمكن المستخدم من البحث في قاعدة البيانات المعينة، وأن تجلب له المعلومة التي يبحث عنها تحديداً. وظهرت مجموعة من تلك البرامج، مثل برنامج «إس أر إس» (SRS)، الذي يُعتبر من أهم برامج البحث المتخصّصة في هذا المجال.
ويضم الموقع الخاص بـ «المعهد الأوروبي للمعلوماتية الحيوية» (European Bioinformatics Institute) عدداً من البرامج المُشابهة. وتستطيع تلك البرامج إعطاء المعلومة المطلوبة، وأن تستنطق غير قاعدة بيانية من خلال أسلوب استفسار مُرَكّب.
قواعد البيانات
كانت بداية هذا المجال في أوائل الثمانينيات، وارتكزت على قاعدة بيانات عُرفت باسم «جِن بانك» (GenBank)، أنشأتها وزارة الطاقة الأمريكية لتخزين تتاليات قصيرة من تسلسلات الحمض النووي DNA . وفي الأيام الأولى لقاعدة البيانات «جِن بانك» كانت هنالك مجموعة محدودة من الفنيين تعمل على حواسيب تحوي لوحاتها أربعة أحرف هي A و C، و T و G، وكانت هذه المجموعة تُدخل بضجر تسلسلات الدنا التي كانت تنشر في المجلات الأكاديمية. وبمرور السنين، ظهرت بروتوكولات جديدة مكنت الباحثين من الاتصال مباشرة بالقاعدة «جِن بانك» وتفريغ التسلسلات التي كانوا يحصلون عليها، وفي الوقت نفسه تقريبًا انتقلت إدارة «جِن بانك» إلى مركز معلومات التقانة الحيوية (NCBI) التابع للمعاهد القومية للصحة في الولايات المتحدة. ومع إطلالة الشبكة العالمية (الوِب)، صار بمقدور الباحثين في جميع أنحاء العالم الحصول بسهولة على بيانات القاعدة «جِن بانك» من دون مقابل.
وبمجرد انطلاق مشروع الجينوم البشري (HGP) رسميًّا في عام 1990، فإن حجم بيانات تسلسلات الدنا في القاعدة «جِن بانك» نما بطريقة أُسِّية. ومع إدخال تقنية السَّلْسَلَة المباشرة ذات المردود المرتفع في التسعينيات (مقاربة تستعمل فيها الروبوتات (الإنسالات) Robotics، وآلات سَلْسَلة الحمض النووي DNA المؤتمتة والحواسيب، فإن بيانات «جِن بانك» ازدادت ازديادًا هائلا خلال مدة قصيرة. وبحلول ربيع عام 2000 ضمت القاعدة «جِن بانك» بيانات التسلسلات عن أكثر من سبعة بلايين وحدة من الحمض النووي DNA. وفي الوقت الذي انطلق فيه مشروع الجينوم البشري، بدأت شركات خاصة مشروعات سَلْسلة موازية، وأسست لنفسها قواعد بيانات ضخمة.
لكن القاعدة «جِن بانك» والشركات الشقيقة تمثل جزءًا فقط من الصورة الكلية للمعلوماتية الحيوية. فقواعد البيانات الأخرى العامة والخاصة تحتوي على معلومات عن التعبير الجيني، وعن الاختلافات الجينية الدقيقة بين الأفراد والتي تسمى التعدد الشكلي لاختلاف النكليوتيد الواحد Single Nucleotide Polymorphisms SNPs، كما تشتمل على بنى البروتينات المختلفة وخرائط تآثر هذه البروتينات.
تشابهات قطع الحمض النووي
إن تحديد وظيفة عمل البروتينات الأساسية، ومعرفة تراكيبها الهيكلية، أصبح من التحديات الكبيرة في مجال تصميم الأدوية. ومع ازدياد الفرق بين كمية المعلومات التي تنشرها مشروعات الجينوم، وعدد البروتينات المُكتشفة باستمرار؛ مع وظائفها وتركيبها؛ يصبح الالتجاء إلى أدوات المعلوماتية الحيوية أمراً لا مفر منه. وتتضمن إحدى أهم العمليات الأساسية في المعلوماتية الحيوية البحث عن التشابهات أو عن التماثلات بين قطع الحمض النووي التي تمت سَلسلتها حديثًا، وبين قطع من كائنات حية أخرى سبق أن سُلسلت. إن العثور على التسلسلات المتقاربة يتيح للباحثين التنبؤ بنمط البروتين الذي يكوِّده التسلسل الجديد. وهذا لا يتمخض فقط عن نتائج تقود إلى أهداف دوائية في مرحلة مبكرة من تطوير الدواء، إنما يستبعد أيضًا أهدافًا كثيرة أخرى قد تؤدي إلى طريق مسدود.
ومن أهم تلك الأدوات وأكثرها استخداماً، برنامج «بلاست» BLAST، الذي يقارن سلاسل القواعد المزدوجة والبروتينات الأساسية، لمعرفة ما يُشابهها في قواعد البيانات. وبهذا يمكن استخدام «بلاست» لاستنتاج العلاقة الوظيفية بين البروتينات الأساسية في الخلية والقواعد المزدوجة للجينات، إضافة إلى التعرف إلى الفئة التي ينتمي إليها الجين.
بنية البروتين
ويشغل التنبؤ بتركيب البنيـة الثلاثية الأبعاد للبروتين (Protein Structure Prediction) حيزاً كبيراً في علم المعلوماتية الحيوية.
و تعطي بعض أدوات علم المعلوماتية الحيوية فكرة تقريبية عن عمل البروتين الأساسي، انطلاقا من تركيبه الأول أيضاً. وتشمل نشاطات المعلوماتية الحيوية الأساسية مستويات عدّة، بداية من العمل النظري ووصولاً إلى صنع جداول إحصائية يستطيع الحاسوب التعامل معها؛ ما يُمهد لصنع أدوات التحليل المختلفة. ويُعطي التحليل المقارن للجينومات (Comparative Genomics) نموذجاً لتلك الأدوات التقنية المتقدمة في المعلوماتية الحيوية. ويمكّن هذا التحليل من التعرّف إلى العلاقة التطورية بين الكائنات، عبر اكتشاف أمكنة التشابه والاختلاف في تراكيبها الجينية.
والمعلومات التي يوفرها التحليل المقارن للجينومات تساعد على فهم أفضل لعمل جينات الإنسان، ومن ثم صوغ استراتيجيات أفضل لمكافحة الأمراض.
وبتوافر أدوات المعلوماتية الحيوية الجديدة، وتزايد البيانات الخاصة ببنى البروتينات وبالسبل الجزيئيـة الحيـويـة، فـإن بعــض الباحثــين يـــرى أن هــذا الجانب من تطوير الأدوية سينـحو أيضًـــا باتجــاه الحواســيب، أو ما يطلقــون عليــه البيــولوجيــا فــي السيليكــون In Silico Biology. ومع اكتمال الجينوم البشري، رأى المنظِّرون البيولوجيون أن العلماء سيكونون قادرين على استعمال المعلوماتية الحيوية لوضع النماذج الملائمة للعدد الفلكي من التفاعلات الكيميائية الحيوية التي تثري حياة الإنسان، وأن العلماء مؤهلون للتفكير في الجينات الموجودة في الخلية البشرية على أنها نوع من حواسيب كيميائية مُعالِجة، تعمل على التوازي، إذ تقوم الجينات باستمرار بتفعيل أو تعطيل عمل بعضها بعضًا في شبكـة من التآثرات الشديدة التعقيـد. وترتبط مسـالك التأشـير الخلـوي (Cell Signaling) بمسالك جينية مُنَظِّمة، وإن أضخم مشروع أمامنا للمعلوماتية الحيوية يتمثل بفك خيوط هذه الشبكة المنظمة التي تضبط تنامي الخلية من مرحلة البيضة المخصبة حتى مرحلة البلوغ.
يواجه ذلك العلم معضلة تتمثل في قلة عدد المتخصصين فيه. ومنذ أواسط تسعينيات القرن الماضي، يتزايد دور هذا العلم في مجال أبحاث البيولوجيا والصيدلة والجينات، بنسبة تزيد على 25 في المئة. ولم تترافق هذه القفزة مع ارتفاع مماثل في عدد الاختصاصيين.
المعلوماتية الحيوية والعلوم الأخرى
هناك مجموعة من العلوم ذات العلاقة الوثيقة بالمعلوماتية الحيوية أهمها:
> الفيزياء الحيوية (Biophysics): وتستخدم لفهم التراكيب الحيوية والوظائف الأحيائية.
> حوسبة الأحياء (Computational of Biology): وتستخدم لدراسة العمليات الأحيائية المعقدة من خلال تقنيات الذكاء الاصطناعي، والخوارزميات.
> الأحيائية الرياضية (Mathematical Biology): ويتم فيها استخدام النظريات الرياضية لفهم العمليات البيولوجية، وغالبا ما تستخدم في النمذجة.
> الجينوميات (Genomics): ويستخدم هذا العلم لدراسة أو تحليل أو مقارنة كامل المورثات، أو مقارنة أنواع مختلفة منها.
> البروتيوميات (Proteomics): ويهتم بدراسة البروتينات الناتجة من المورثات، وتراكيبها وتفاعلها بعضها مع بعض.
> الجينومات الصيدلانية (Pharmacogenomics): وتطبق منهجيات وتقنيات الجينوم من أجل اكتشاف العقاقير الجديدة.
> الوراثة الصيدلانية (Pharmacogenetics): وتستخدم لتحديد أسباب الاختلاف الوراثي بين الأفراد من حيث استجابتهم للأدوية.
> المعلوماتية الطبية (Medical Informatics): ويستفاد منها في فهم المعلومات الطبية وإدارتها وإجراء البحوث العلمية عليها.
> المعلوماتية الكيميائية (Cheminformatics): وتستعمل في اكتشاف وتطوير العقاقير الطبية.
> تحليل الصور الطبية (Medical Imaging Analysis): ويهتم بتحليل الصور وفقا للمعلومات الطبية وحالة المريض.