محمد المندعي
كاتب علمي (اليمن)
على مدار خمسين عاما كانت مشكلة طي البروتين تعد أحد أكبر الألغاز التي واجهت علماء الأحياء (البيولوجيا)، وإحدى أكثر المسائل التي تستدعي التوصل إلى حلول مناسبة لها. لذا لم يتمكن أولئك العلماء حتى وقت قريب من التعرف إلا على بنية 170 ألف بروتين فقط من أصل أكثر من 200 مليون بنية بروتينية موجودة في كل صور الحياة.
والعديد من التحديات التي تواجه المجتمع، مثل تطوير علاجات للأمراض واستنباط هياكل البروتينات بسرعة في مسببات الأمراض الجديدة والخطيرة مثل كوفيد-19 أو العثور على الإنزيمات التي تحلل النفايات الصناعية بشكل أساسي ترتبط بالبروتينات والدور الذي تؤديه.
ومن المعروف علميا أن البروتينات تجري معظم العمليات الكيميائية والميكانيكية في الخلايا، أو تؤدي دور عامل محفز لتلك العمليات. ومُعظم البروتينات (التي تكون مُخلَّقة على هيئة سلاسل خَطية من بقايا الأحماض الأمينية) تُطوى تلقائيًّا لتشكل بِنْية واحدة، أو عَددًا صغيرًا من البِنى ثلاثية الأبعاد، تميل إلى اتخاذها. ويحدد تسلسل الأحماض الأمينية بِنْية البروتين، ونطاق حركته، وهو ما يحدد بدوره وظيفة ذلك البروتين. وعلى مدى عقود، حَدد علماء البيولوجيا البنيوية -باستخدام منهج تجريبي- آلافًا من بِنى البروتينات، لكنّ صعوبة تلك الدراسات جذبت العلماء إلى استخدام النهج الحوسبي الواعد للتنبؤ ببِنْية البروتينات باستخدام تسلسلات الحمض النووي. وقدم خبراء من بعض الشركات وصفًا لخوارزمية تُعرَف باسم «ألفا فولد2» Alphafold2، تحقِّق تقدمًا كبيرًا في حل هذه المشكلة التقليدية، عبر تطبيق تقنيات تعلُّم الآلة.
مشكلة طي البروتين
ينثني البروتين ليشكل كتلة مضغوطة. وعلى هذا النحو فإنه يحتفظ ببعض الأحماض الأمينية بالقرب من مركز الكتلة وبعضها الآخر في الخارج، ويحافظ على بعض أزواج الأحماض الأمينية متقاربة وبعضها متباعدة.
ويطوى كل نوع من البروتين في شكل محدد؛ الشكل نفسه في كل مرة. وتفعل معظم البروتينات كل هذا من تلقاء نفسها، على الرغم من أن بعضها يحتاج إلى مساعدة إضافية ليطوى إلى الشكل الصحيح.
ويعد الشكل الفريد لبروتين معين هو الحالة الأكثر استقراراً التي يتخذها البروتين. على سبيل المثال، تخيل كرة على قمة تل. ستتدحرج الكرة دائما إلى الأسفل، وإذا حاولت إعادة الكرة إلى الأعلى فستظل تتدحرج إلى أسفل التل لأن هذا هو المكان الأكثر استقراراً.
وتكون عملية طيّ البروتينات موجَّهة بنظرية الكَمّ. فإذا أمكن حساب طاقة جزيئات البروتين بدقة من خلال تلك النظرية، وتطبيق ذلك على كل ترتيب بنيوي محتمَل، يصبح من السهل التنبؤ بالبِنْية التي تميل طاقة البروتين إلى تشكيلها. لكن المعالجة الكمّية للبروتينات تُعَد عملية عويصة من الناحية الحاسوبية (ربما تتمكن الحواسيب الكمّية من تغيير هذا الوضع).
وتقوم البروتينات بعملية الطي في غضون ملي ثانية، غير أن التحدي الرئيسي هو أن عدد الطرق التي يمكن أن ينثني بها البروتين نظرياً قبل الاستقرار في هيكله ثلاثي الأبعاد النهائي هو عدد فلكي. ففي عام 1969 ذكر سايروس ليفينثال Cyrus Levinthal -عالم البيولوجيا الجزيئية الأمريكي- أن تعداد جميع الأشكال الممكنة لبروتين نموذجي سيستغرق وقتاً أطول من عمر الكون المعروف.
وهذا العدد الهائل من الأشكال المحتملة هو ما يجعل من الصعب التنبؤ بكيفية طي البروتين، حتى عندما يعرف العلماء التسلسل الكامل للأحماض الأمينية التي تدخل في تكوينه. كان التَوَقَّع سابقاً ببنية البروتين من تسلسل الأحماض الأمينية أمراً مستحيلاً. وكانت هياكل البروتين تحدد تجريبياً، وهي محاولة مكلفة وتستغرق وقتاً طويلاً. وهذا المسعى كان محورا للبحث العلمي المكثف لسنوات عديدة باستخدام مجموعة متنوعة من التقنيات التجريبية، مثل الرنين المغناطيسي النووي والتصوير البلوري بالأشعة السينية.
وتعتمد هذه التقنيات، إضافة إلى الأساليب الأحدث مثل المجهر الإلكتروني عالي التبريد، على التجربة والخطأ المكثفين اللذين يستغرقان سنوات من العمل الدؤوب والشاق لكل هيكل بروتيني، وتتطلب استخدام معدات متخصصة ذات كلفة باهظة.
تُحدد البنية وظيفة البروتين. على سبيل المثال، إن البروتين الذي يفكك الغلوكوز – حتى تستطيع الخلية استعمال الطاقة المخزنة في السكر – سيكون له شكل يتعرف على الغلوكوز ويرتبط به (مثل القفل والمفتاح) وستتفاعل الأحماض الأمينية الفعّالة كيميائياً مع الغلوكوز وتحلله لتحرير الطاقة.
وساعدت معرفة أشكال البروتينات الباحثين على ابتكار عقاقير تغرز في جيوب البروتينات وشقوقها لأنها مصممة أي (الأدوية) لمحاكاة الهيكل الثلاثي الأبعاد. وهذا هو الحال فقط لربع نحو عشرين ألف بروتين بشري في حين يبقى نحو 15 ألف بروتين غير مستهدف بالعقاقير. كما أن القدرة على تصنيع البروتينات بالبنية المرغوبة قد تسرع من تطوير الإنزيمات التي تصنع الوقود الحيوي وتحلل النفايات البلاستيكية.
وفي المقابل، إذا تعطل الطي، فلن يتكون البروتين بالشكل الصحيح، ولن يكون قادراً على أداء وظيفته داخل الجسم. وهذا قد يؤدي إلى المرض- كما هو الحال في مرض شائع مثل الزهايمر، ونادر مثل التليف الكيسي.
حل المشكلة
قضى العلماء خمسين عاماً في محاولة لإيجاد طريقة للتنبؤ بسرعة ببِنْية البروتين. ولعقود من الزمن كانت التجارب المختبرية هي الطريقة الرئيسية للحصول على هياكل بروتينية جيدة. تم معرفة التراكيب الكاملة الأولى للبروتينات بدءًا من الخمسينات من القرن الماضي باستخدام تقنية تُطلق فيها حزم الأشعة السينية على البروتينات المتبلورة ويتحول الضوء المنحرف إلى نظائر ذرية بروتينية. أنتجت هذه التقنية نصيب الأسد من البِنْى البروتينية، بيد أنه على مدار العقد الماضي أصبح تطبيق المجهر الإلكتروني عالي التبريد الأداة المفضلة للعديد من مختبرات البيولوجيا البنيوية.
وفي الستينات من القرن الماضي أدرك الباحثون أنهم إذا استطاعوا حساب جميع التفاعلات الفردية داخل تسلسل البروتين يمكنهم التنبؤ بشكله ثلاثي الأبعاد. ومع وجود مئات من الأحماض الأمينية لكل بروتين والعديد من الطرق التي ربما يتفاعل بها كل زوج من الأحماض، فضلا عن العدد الفلكي للهياكل المحتملة لكل تسلسل، فقد انضم علماء الحاسوب إلى المشكلة، لكن التقدم كان بطيئا.
وكإجراء تقييمي، وتحفيزا للبحث ومراقبة التقدم والتوصل إلى أحدث تقنية في التنبؤ بهيكل البروتين، أسس العالمان جون مولت وكرزيستوف فيديليس عام 1994 فعالية معروفة اختصاراً CASP»»، وتعني التقييم الحاسم لتقنيات التنبؤ ببِنْى البروتينات Critical Assessment of Structure Prediction. وهي تقام كل سنتين وفيها تُعطى الفِرَق المتنافسة – من جميع أنحاء العالم- التسلسل الخطي للأحماض الأمينية لنحو 100 بروتين معروف الشكل ثلاثي الأبعاد لكن لم يتم نشرها بعد، ثم يتعين عليهم حساب كيفية طي هذه التسلسلات حاسوبياً. بعد ذلك يقوم فريق من العلماء المستقلين بتقييم التوقعات باستخدام المقاييس التي تقيس مدى تشابه البروتين المتوقع مع الهيكل المحدد تجريبياً.
وفي تلك الفعالية تسجل النتائج باستخدام ما يُعرف باسم فحص المسافة العالمية (GDT) الذي يقيس على مقياس 0 إلى 100 مدى قرب البنية المتوقعة من الشكل الفعلي للبروتين المحدَّد في التجارب المختبرية.
دقة مذهلة
كانت نتيجة التشابه بين المختبر والحاسوب مخيبة للآمال حتى عام 2018 في النسخة الثالثة عشرة من CASP13 حينما أذهل أداء إحدى الشركات المشاركة بإصدارها الأول من برنامج ألفا فولد العلماء في هذا المجال. ومع أنه كان لا يزال غير قادر على مماثلة دقة المختبر لكنه تفوق على تقنيات حاسوبية أخرى بمراحل عدة. وسرعان ما بدأ الكثير من الباحثين بتكييف أنظمتهم الخاصة للعمل مثل برنامج ألفا فولد.
وللحصول على دقة عالية للتنبؤ ببنية البروتين طوّر العلماء تصميما من برنامج ألفا فولد مستلهما من علم البيولوجيا والفيزياء وتعلم الآلة، إضافة إلى عمل العديد من الباحثين في مجال طي البروتين على مدى نصف القرن الماضي. وجمع العلماء بين التّعلم العميق وخوارزمية الانتباه التي تحاكي الطريقة التي يجمع بها الشخص أحجية الصور المقطوعة: أولا، يتم ربط القطع بمجموعات صغيرة – في هذه الحالة عناقيد من الأحماض الأمينية- ثم البحث عن طرق لربط المجاميع الصغيرة بمجموعة أكبر. ويحدث هذا بإدارة شبكة عصبية بنيت من نحو 128 معالجا لتعلم الآلة (ما يعادل 100-200 وحدة معالجة رسوم).
درّب العلماء الخوارزمية على بِنْى البروتين المعروفة التي يبلغ عددها 170 ألفا فحققت نجاحا لافتا. وحقق برنامج ألفا فولد في CASP14 متوسطا قدره 92.4 درجة على مقياس (GDT) بتطبيقه على البروتينات المستهدفة. وهذه الدرجة تعتبر أعلى من عتبة 90 على مقياس (GDT)، وهي قادرة على المنافسة مع النتائج المحصلة من الأساليب التجريبية. وكان لهذه التنبؤات هامش خطأ يبلغ نحو 1.6 أنغستروم، وهو ما يعادل عرض الذرة (أو 0.1 نانومتر).
أما بالنسبة للبروتينات الأكثر تحديا، فقد سجل برنامج Alphafold متوسطا قدره 87.25 نقطة أعلى من أفضل التوقعات التالية، حتى إنه تفوق في حل هياكل البروتينات الموجودة في أغشية الخلايا التي تعد مهمة للعديد من الأمراض لكن يصعب حلها بواسطة التصوير البلوري بالأشعة السينية.
وهذه النتائج المثيرة تعد بإمكانية استعمال علماء الأحياء توّقع البنية الحاسوبية كأداة أساسية في البحث العلمي وجهود الاستجابة للأوبئة في المستقبل. ففي وقتٍ سابق من عام 2021 تنبأ برنامج ألفا فولد بهياكل حفنة من بروتينات كوفيد-19 التي لم تُحدد تجريبياً بعد. وأكد العلماء دقة توقعات البرنامج مختبرياً بواسطة المجهر الإلكتروني فائق البرودة فيما بعد.