المعلوماتية الحيوية والجينومية والبروتيومية
علوم جديدة وآفاق واسعة لمستقبل البيولوجيا الحديثة
د. أحمد الزهيري
علم المعلوماتية الحيوية هو علم يستخدم الحاسوب والبرامج وقواعد البيانات لحل وشرح وتفسير عدد كبير من التساؤلات البيولوجية، ويتعامل مع مجموعة البيانات البيولوجية الهائلة الناتجة من المشروعات العلمية الكبيرة مثل مشروع الجينوم البشري. ويوجد مجالان كبيران من العلوم البيولوجية يستخدم فيهما علم المعلوماتية الحيوية بصورة أساسية هما علم الجينومية Genomics (دراسة التركيب والوظيفة للمجموع الكلي لجينات الكائن الحي)، وعلم البروتيومية Proteomics (دراسة التركيب والوظيفة للمجموع الكلي لبروتينات الكائن الحي).
ويعرف الجينوم بأنه مجموعة من تتابعات الدنا DNA التي تكون التركيب الوراثي للكائن الحي والتي تنتقل من جيل إلى آخر. وتشمل هذه التتابعات كل الجينات (الوحدة الوظيفية والطبيعية لمادة الوراثة المنتقلة من الأب إلى الأبناء) والجزيئات الأخرى المنسوخة وغير المشفرة. وعلى الجانب الآخر يشير علم البروتيومية إلى تحليل المجموعة الكاملة من بروتينات الكائن الحي والدراسة الكاملة للتركيب والوظيفة داخل الكائن.
إضافة إلى ذلك، فإن علم المعلوماتية الحيوية يستخدم في فروع كثيرة من علم البيولوجيا، مثل علم خرائط التمثيل الغذائي وشبكات الاتصال الخلوية والتفاعلات البيوكيميائية.
وتستهدِف كلُّ هذه النَّواحي المهمة فِي عِلم المَعلوماتية الحيوية فهم الأنظمة البيولوجية المعقدة.
وقد أدى التوسع الكبير في مجال المعلوماتية الحيوية إلى ارتباطه بمجموعة كبيرة من العلوم الأخرى في محيط الكائن الحي، لينتج ما يسمى بالنظام البيولوجي المتكامل System biology الذي يعتبر وسيلة مهمة لحل وتفسير العديد من التساؤلات البيولوجية المعقدة، وهو يتكون من اندماج علم الجينومية وعلم البروتيومات وعلم المعلوماتية الحيوية والعديد من العلوم الأخرى المتعلقة بها، وذلك لشرح وتفسير كيفية عمل المسار الحيوي في الخلية و التعرف إلى كيفية تفاعل الجينات والبروتينات والعناصر الأخرى الداخلية والخارجية المرتبطة بالمسار الحيوي بعضها ببعض، وبالبيئة المحيطة بها، كما يظهر في الشكل.
نبذة تاريخية في تقدم علم الوراثة
شهدت تسعينيات القرن العشرين تقدّماً كبيراً في علوم الوراثة والجينات، خصوصاً في المشروعات الخاصة بالتعرّف إلى التركيب الوراثي لعدد من الكائنات الحيّة، مثل الفأر وذبابة الفاكهة. وتوّجت هذه الجهود بالكشف عن التركيبة الوراثية (الجينية) للإنسان.
وتلك الإنجازات ولّدت كمية كبيرة من المعرفة والمعلومات المتطورة في مجال علم البيولوجيا، تضمنت معرفة الخريطة الجينية لعدد كبير من الكائنات المختلفة، والمركبات البروتينية الناتجة من الجينات المختلفة والتفاعل بينها، وما ينتجه ذلك التفاعل من بروتينات أساسية وإنزيمات وغيرها.
كما تمت دراسة الإنزيمات المسؤولة عن قراءة الشفرة الوراثية والتعامل مع بياناتها بمزيد من التفصيل، بما في ذلك نسخ المعلومات التي تحملها تلك الشفرة الحيّة والفريدة من نوعها. وبذلك استطاع العلماء التعرّف إلى تلك المعلومات التي تُحدّد تركيب الجسم وطبيعة عمله ونسق نموه.
وأدّت تلك التطورات إلى نمو نوعي في معلومات البشر عن الظواهر البيولوجية وتراكيبها وآلياتها. و ظهرت هنالك حاجة إلى حفظ هذه المعلومات في قواعد بيانات بيولوجية، يراوح عددها بين 500 و1000 قاعدة حتى الآن.
وتتزايد هذه القواعد بمرور الوقت وزيادة الأبحاث والمعلومات. ولوحظ اندماج العديد من قواعد البيانات المتشابهة للتسهيل على الباحث. فمثلاً قواعد البيانات الجينية الخاصة بكائن ما توضع في محتوى إلكتروني يسمى بنك الجينات، وتختص بحفظ المعلومات عن تركيب وتتابعات الجينات الوراثية للكائنات لهذا الكائن.
وغالباً ما نجد هذه البنوك الجينية للكائنات المختلفة مرتبطة ببعضها، وبقواعد البيانات البروتينية للكائنات نفسها، إضافة إلى بعض المعلومات البيولوجية الأخرى. وأدى التزايد الكمي والنوعي للمعلومات البيولوجية إلى تطوير حقول علمية أخرى، خصوصاً الطبية منها.
وترجع بداية استخدام علم المعلوماتية الحيوية إلى الباحثة مارغريت داي هوف في عام 1968، التي أنجزت خريطة ودليلاً للتتابعات البروتنية توضح فيه تركيب وتتابع مجموعة من البروتينات الفيروسية.
وقد ساعد ذلك على إنجاز برنامج حاسوبي للبحث عن مناطق التشابه والاختلاف
بين التتابعات الجينية والبروتينية المختلفة.
وتعد هذه الخطوة من أهم الخطوات في تطور علم المعلوماتية الحيوية؛ إذ استخدم في هذه الدراسة أول برنامج بحثي للكشف عن تشابه التتابعات أطلق عليه اسم
الـFASTP، وبذلك تم توضيح أن تتابع الجينوم الفيروسي المسبب للسرطان V-sis مشابه جداً لتتابع الجين PDGF الخلوي، وزودت هذه النتيجة علماء البيولوجيا بمعلومات كثيرة عن كيفية تسبب هذا التتابع الفيروسي في إحداث السرطان. وقد نشر هذا البحث في عام 1969 في مجلة Scientific American.
أكبر المشروعات العلمية
ويعد مشروع الجينوم البشري من أكبر وأنجح المشروعات العلمية التي استخدمت علم المعلوماتية الحيوية بكثافة. وأول الجينومات التي تم التعرف إلى تتابعها كان من الفيروسات، وهو MS2، وكذلك جينوم البكتريا المسببة لمرض الإنفلونزا.
ويزود علم المعلوماتية الحيوية العلماء ببرامج سهلة لتحليل البيانات الضخمة التي أصبحت وسيلة أساسية لحل الكثير من المشكلات العلمية الجديدة، ويعتبر علماً حيوياً مثيراً يعبر عن طريقة حديثة للتفكير في المشكلات البيولوجية التي سيقود
تطور الحاسوب فيها اكتشافات بيولوجية كبيرة.
ومعرفة برامج الحاسوب وقواعد البيانات الخاصة بالمعلوماتية الحيوية أصبحت جزءاً لا يتجزأ من العمل البيولوجي الحديث ولكل من يعمل في ذلك المجال في القرن الحادي والعشرين.
ويقوم علم المعلوماتية الحيوية بحل المشكلات البيولوجية المهمة التي تشمل فهم الارتباط بين التركيب الجيني والشكل المظهري للأمراض البشرية، وفهم العلاقة بين تركيب البروتينات ووظيفتها.
أساسيات مهمة
يعتبر علم المعلوماتية الحيوية Bioinformatics عملية دمج بين علوم البيولوجيا وعلوم الحاسوب، ويختص بدراسة كيفية استخدام إمكانات الحاسوب في تحليل وتفسير النتائج البيولوجية المختلفة.
وعلى الرغم من أن هناك الكثير من البرامج التحليلية المجانية الخاصة بالمعلوماتية الحيوية متاحة على شبكة الإنترنت؛ فإن هناك كثيراً من المختبرات الخاصة والمؤسسات العلمية الكبيرة تفضل تطوير برامج تحليلية خاصة بها تتناسب مع طبيعة الأبحاث فيها، لذلك تحرص على وجود مبرمج للحاسوب ضمن فريقها البحثي لتطوير تلك البرامج الخاصة.
التتابعات البيولوجية
التتابعات البيولوجية Biological sequences هي التي تستخدمها معظم برمجيات (المعلوماتية الحيوية) ومنها عدة أمثلة منها التتابعات البروتينية، وتتابعات الأحماض النووية. وتتكون البروتينات عادة من 20 وحدة بنائية مختلفة يطلق عليها الأحماض الأمينية.
وتختلف البروتينات في تركيبها ووظائفها باختلاف عدد ونوع الأحماض الأمينية الداخلة في تركيبها.
أكواد الأحماض الأمينية السبعة الإضافية
تستخدم هذه الأكواد السبعة الإضافية إما لوصف بعض الأحماض الأمينية الجديدة التي تم اكتشافها حديثاً في بعض أنواع البكتريا، أو للتعبير عن عدم التأكد من صحة وجود بعض الأحماض الأمينية.
قراءة التتابع البروتيني
تكوين السلسلة البيتيرية: الأحماض الأمينية (Amino Acid) هي لبنات البناء الرئيسية لبناء البروتين.
وعلى الرغم من اختلاف تركيب الأحماض الأمينية وشحنتها فإنها جميعاً تتشابه في وجود طرف أميني (NH2) وطرف كربوكسيلي (COOH). وترتبط الأحماض الأمينية ببعضها عن طريق ارتباط الطرف الأميني بالطرف الكربوكسيلي للحمض الأميني الآخر مكوناً رابطة ببتيدية مع خروج جزيء ماء.
قراءة السلسلة الببتيدية في الغالب يتم قراءة السلسلة الببتيدية بدءاً من الطرف الأميني أقصى اليسار إلى الطرف الكربوكسيلي أقصى اليمين.
وكمثال على قراءة سلسلة ببتيدية قصيرة مكونة من خمسة أحماض أمينية بالشفرة أحادية الكود أو بالاسم الكامل (M إلى D):
MAVLD = Methanine – Alanine – Valeine – Leusine – Aspartic
كما يمكن قراءة الأحماض الأمينية نفسها باستخدام الشفرة الثلاثية:
MAVLD = Met – Ala – Val – 1eu – ASP
مثال: الإنسولين Insulin يتكون من 110 أحماض أمينية، ويمكن كتابته على الصورة الآتية (30 غليسين Glycines 44+ ألانين Alanines 5+ تيروزين Tyrosines 4+ غلوتامين Glutamines +……..). لكن هذه الطريقة تستهلك كمية كبيرة من المساحة التخزينية للحاسوب وبخاصة عند التعامل مع كمية كبيرة من التتابعات البروتينية.
ولذلك تظهر فائدة الشفرات الأحادية التي يمثل فيها كل حمض أميني عن طريق حرف واحد، وذلك لتوفير المساحة التخزينية للحاسوب، ولزيادة سرعة التعامل مع أكبر قدر من هذه البيانات في أقل وقت ممكن.
الشكل الثلاثي الأبعاد للبروتين
إذا حدث تغير في أحد التتابعات الشفرية المكونة للأحماض الأمينية فإن ذلك يؤدي إلى تغير في التركيب البروتيني الناتج، ومن ثمّ التغير في الوظيفة. وأفضل مثال على ذلك هو مرض أنيميا خلايا الدم المنجلية؛ إذ إن التغير الحادث في إحدى الشفرات الوراثية لأحد الأحماض الأمنية يؤدي إلى تغير التركيب البروتيني الناتج ومن ثمّ قدرته على أداء وظيفته. ونشير إلى أن أول شكل ثلاثي الأبعاد (3D) للبروتين تم تحديده عام 1985 بواسطة الباحثين كندرو وبيروتز باستخدام الأشعة السينية وعلم البلورات. وحصل كلاهما على جائزة نوبل في العلوم إضافة إلى فوز أحدهما بجائزة نوبل في مجال البيولوجيا الجزيئية. ولوحظ ما يأتي:
1 – البروتينات المتشابهة في التركيب الثلاثي الأبعاد تؤدي وظائف متشابهة. من المتوقع أن تكون البروتينات التي تحتوي على تتابعات ببتيدية متشابهة تتشابه في الشكل الثلاثي الأبعاد الخاص بها، ومن ثمّ تؤدي الوظائف نفسها.
2 – وظيفة البروتين تعتمد اعتماداً مباشراً على الشكل الثلاثي الأبعاد لهذا البروتين.