الطب وصحةعلم الجينات والوراثة

علم البيانات والسرطان

اتحاد مع علم الجينوم لفك أسراره

د. محمد حلمي
باحث في مجال بيولوجيا النظم والمعلوماتية الحيوية (كندا)

بعد أن غدا السرطان ثاني أكبر أسباب الوفاة في العالم تاركا الصدارة لأمراض القلب والأوعية الدموية، سارعت دول العالم والمؤسسات المعنية إلى رصد ميزانيات ضخمة لأبحاثه؛ سعيا إلى الحد من خطورته أوإيجاد علاج ناجع له. ففي عام 2019، تسبب السرطان في وفاة نحو١٠ ملايين شخص، فيما تظهر الإحصائيات زيادة عدد الوفيات الناجمة عنه بنسبة 66 % في المدة ما بين 1990 و2017.
وفي عام 2019 مول المعهد الوطني للصحة (NIH) في الولايات المتحدة أكثر من 15 ألف مشروع بحثي في مجال السرطان بمجموع تجاوز 6.5 بليون دولار. ومولت المفوضية الأوروبية (EC) أبحاث السرطان بما يزيد عن ثلاثة بلايين يورو في آخر عشر سنوات. هذا إضافة إلى جهات التمويل الأخرى بالولايات المتحدة والاتحاد الأوروبي والمملكة المتحدة واليابان والصين وكندا وغيرها من الدول، مما يجعل السرطان على قمة مجالات استنزاف ميزانيات البحث العلمي في العالم. ويمكن ملاحظة الشيء نفسه في ميزانيات نظم الرعاية الصحية في دول أخرى، حيث يشغل السرطان المركز الأول في تكاليف تقديم الرعاية الصحية والأدوية. ففي عام 2018 مثلت أدوية العلاج الكيميائي 14.3 % من إجمالي سوق الدواء في العالم بقيمة 123.8 بليون دولار، في حين يتوقع أن تبلغ تكلفة رعاية مرضى السرطان نحو 160بليون دولار في 2020، ونحو 237 بليون دولار بحلول عام 2024.
يتضح مما سبق أن السرطان يمثل تحدياً رئيسياً للبشرية؛ إذ يستهلك موادها المخصصة للبحث العلمي والرعاية الصحية، فضلاً عما يسببه من أضرار أسرية ونفسية للمرضى وذويهم. وهذا يطرح سؤالاً جوهرياً مفاده: لماذا تقف البشرية عاجزة حتى الآن عن التغلب على ذلك الداء المزمن؟

تحديات كثيرة
هنالك عدد من التحديات التي تزيد من صعوبة التغلب على السرطان، وهي تتمثل في الأمور الآتية:
التنوع: السرطان ليس مرضاً واحداً بل أكثر من مئة نوع مختلف تشترك جميعاً في كونها أوراماً خبيثة، لكن تلك الأورام تختلف في صفات رئيسية كثيرة؛ فهناك الأورام الصلبة والسائلة واللحمية، وهناك الأورام التي تصيب الصغار فقط أوالمرتبطة بالجنس كسرطان الثدي والرحم والبروستاتا، أوالتي تنتج عن الإصابة بأمراض أخرى مثل بعض الأمراض الفيروسية والبكتيرية. وهناك متغيرات كثيرة تجعل التغلب على السرطان أصعب بمراحل عدة من غيره من الأمراض.
الانتشار السريع: إن عدد الحالات الجديدة المصابة بالسرطان المسجلة كل عام يزيد عن العام السابق. وتظهر الدراسات أن شخصا من كل أربعة أشخاص في دول العالم الأول سيصاب بالسرطان في مرحلة ما من حياته، الأمر الذي يستلزم توجيه الميزانيات المخصصة للرعاية الصحية والبحث العلمي في اتجاه الرعاية والعلاج والتشخيص على حساب البحث العلمي الخاص بفهم المرض وأسبابه وتطوره.
كثرة الطفرات الوراثية: يرتبط السرطان ارتباطا وثيقا بحدوث تغيرات في التركيب الوراثي لمجموعة من خلايا الجسم. وينتج عن هذا التغير خلل في سلوك الخلايا يؤدي إلى تكون الأورام. والتغير في التركيب الوراثي يسمى طفرة وراثية. وتقسم الطفرات الوراثية في السرطان من حيث تأثيرها إلى طفرات تؤدي إلى الإصابة بالسرطان أو تساهم في تطور المرض أو تعطي الخلايا السرطانية مزية في النمو والتكاثر مقارنة بالخلايا الطبيعية، وهي تسمى الطفرات المسببة أوالقائدة driver mutations، وطفرات تنتج عن الإصابة بالسرطان نتيجة خلل في الخلايا المريضة ولا تساهم في المرض، وهي تسمى طفرات تابعة passenger mutations. وعدد الطفرات التي يمكن تعريفها في جينوم مريض السرطان الواحد كبير جداً قد يصل إلى آلاف الطفرات، كما في بعد حالات فرط الطفور hyper mutagenesis. ومن ثم فإن تمييز الطفرات المهمة التي يؤدي استهدافها إلى إيقاف المرض يصبح أمراً بالغ الصعوبة.
أسباب أخرى: منها تأخر التشخيص، إذ يتم غالبا بعد ظهور الأعراض أو تضخم حجم الورم، الأمر الذي يجعل السرطان دائماً متقدما بخطوة، ومنها أيضا أن برامج العلاج تعتمد على الأعراض والمضاعفات دون أخذ التركيب الوراثي للمريض في الاعتبار، الأمر الذي يؤدي أحيانا إلى عدم فاعلية العلاج لأسباب ترجع إلى التركيب الوراثي للمريض.

اتحاد عالمي لجينوم السرطان
في محاولة لمواجهة بعض هذه التحديات، أنشىء الاتحاد العالمي لجينوم السرطان International Cancer Genome Consortium – ICGC في عام 2008. وهو جهة تطوعية تهدف إلى تنسيق جهود دراسة جينوم السرطان على مستوى العالم، وتوفير بيانات أكبر عدد ممكن من تتابعات جينوم السرطان للباحثين بهدف التوصل إلى فهم أفضل للأسس الجزيئية والبنيوية للمرض. ويتم تمويل جهود الاتحاد ICGC من الدول الأعضاء البالغ عددها 18 دولة. وتدرس كل دولة نوعا أو أكثر من السرطان. استهدف المشروع في بدايته تجميع تتابعات الجينوم المتاحة فعلياً ودمجها في مصدر واحد بصيغة format واحدة تسهل تحليلها وتعظم من قيمتها. في سبيل ذلك دمج المشروع وحلل بيانات مشروعين سابقين هما أطلس جينومات السرطان The Cancer Genome Atlas – TCGA ومشروع جينوم السرطان في معهد سانجر Sanger Cancer Genome Project بالمملكة المتحدة. واستهدف المشروع الوصول بعدد جينومات الأورام السرطانية التي أجري تتابع sequencing لها وأضيفت إلى قاعدة بياناته إلى 25 ألف جينوم لـ 50 نوعا مختلفا من السرطانات الأكثر انتشاراً، وهو حجم بيانات غير مسبوق، ورقم جعل المشروع هوالأكبر من نوعه في العالم.

تحليل جينومات الكاملة السرطان
في عام 2013 قدم الاتحاد ICGC مبادرة تحليل الجينومات الكاملة للسرطان Pan-Cancer Analysis of Whole Genomes – PCAWG التي استهدفت تجميع ما لا يقل عن 2500 عينة من مختلف أنواع السرطان مع عينات مناظرة من الأنسجة السليمة من نفس المرضى، ثم إجراء تسلسل الجينوم الكامل بما في ذلك المناطق التي لا تدخل في تكوين البروتينات أو المناطق غير المشفرة non- coding regions مع قياس التعبير الجيني gene expression في نسيج الورم والنسيج الطبيعي، وغير ذلك من التحليلات التي تهدف في النهاية إلى تكوين صورة متكاملة عن كل نوع من السرطان ومقارنته بالأنواع الأخرى.
وبدراسة التتابع الكامل لجينوم الورم ومقارنته بالتتابع الكامل لجينوم الخلايا السليمة يمكن تعريف الطفرات الخاصة بكل نوع من أنواع السرطان، وتمييز بعض الأنواع عن بعض على مستوى جزيئي، ثم استنتاج الآثار الوظيفية المترتبة على هذه الطفرات. إن تقديم مثل هذه المعلومات، وبهذه الدرجة من التفاصيل للمرة الأولى عن السرطان يبشر بفتح طرق جديدة وغير مسبوقة للدراسة والتشخيص والعلاج والوقاية، بل وأيضاً التنبؤ بإمكانية إصابة الشخص السليم بالسرطان في المستقبل. وهذ الأمر قد يجعلنا للمرة الأولى متقدمين على السرطان بخطوة.
وفي شهر فبراير 2020، وبعد أكثر من سبع سنوات من العمل في المشروع الذي شارك فيه أكثر من 700 باحث وعالم من مختلف دول العالم ومختلف المجالات العلمية، نشر مشروع ICGC- PCAWG نتائجه ورفع الحظر عن بياناته وجعلها متاحة للباحثين من جميع أنحاء العالم. فما الذي أنجزه المشروع؟ وما أهم نتائجه؟ وما قيمة بياناته التي أصبحت متاحة للعموم؟
قام المشروع بتجميع وإجراء تسلسل لأكثر من 2650 جينوما لـ 38 نوعا من السرطان. وحُللت عينات الأورام بطرق مختلفة لقياس مستوى التعبير الجيني للجينات المختلفة في حالة المرض ومقارنة ذلك بالتعبير الجيني للخلايا الطبيعية وغيرها من التحليلات المهمة. وفي كل جينوم عُرّفت الطفرات الموجودة به، وأضيفت إلى قاعدة بيانات طفرات جينوم السرطان الخاصة بالمشروع ICGC. ونتيجة لذلك ارتفع عدد الطفرات السرطانية الموجودة في قاعدة بيانات المشروع ICGC إلى 81.8 مليون طفرة سرطانية جينومية. وحُللت هذه البيانات وفق ستة محاور رئيسة هي:
تحديد الطفرات القائدة cancer drivers.
دراسة التغيرات التي تطرأ على الأجزاء غير المشفرة من الجينوم non-coding region.
تحديد الطفرات المميزة لكل نوع من السرطان لتصبح بمثابة بصمة له mutation signature.
دراسة البدائل البنيوية structural variants المختلفة الناتجة عن الطفرات.
الدراسة التطورية للسرطان cancer evolution.
التغيرات التي تطرأ على الحمض النووي الريبوزي RNA alterations.

دور البيانات الضخمة
إن بيانات الـ 2650 جينوما وتتابعاتها الوراثية وتحليلاتها الأخرى تمثل كمية ضخمة من البيانات، وهو ما يمثل تحدياً في كل خطوة من خطوات التعامل معها، بدءا من تخزين هذه الكمية من البيانات، مرورا بإيجاد طريقة سهلة لمشاركتها بين 700 باحث، وصولا إلى تطوير أدوات وطرق جديدة للتعامل معها. وتبلغ بيانات تسلسل الجينوم فقط الناتجة عن المشروع نحو 725 تيرابايت، في حين تجاوز حجم بعض الملفات 300 غيغابايت للملف المضغوط.
وشكلت طبيعة البيانات تحدياً خاصا؛ إذ إنها بيانات لمرضى من عدة دول، ويجب التعامل معها بما يتوافق مع قوانين الخصوصية لدولة المريض، وهي قوانين تختلف من بلد إلى آخر. وقد انعكس هذا الأمر على صعوبة تحديد آلية سهلة للوصول إلى البيانات وتخزينها واستدعاء بعض الأجزاء شديدة الخصوصية منها. وأضاف هذا الأمر تحدياً أخلاقياً وقانونياً إلى جانب التحدي الفني.
ولمواجهة التحديات الفنية الناجمة عن التعامل مع البيانات اعتمد المشروع على الحواسيب السحابية cloud computers فائقة الأداء لمشاركة البيانات بين الباحثين، وأنشأ وطور العديد من الأدوات والوسائل لتوفير آلية لحفظ البيانات واستعمالها وتحليلها على الرغم من حجمها الكبير. وعلى سبيل المثال، طورت إحدى مجموعات المشروع خوارزمية algorithm لضغط الملفات توفر %30 من مساحة التخزين مع حفظ القدرة علي الدخول العشوائي random access للبيانات، وهو ما يسمح باستخدام الملفات المضغوطة من دون فك ضغطها ويوفر 30 % من تكلفة التخزين. وطورت مجموعة أخرى أداة تسمى Butler، وهي أداة سحابية cloud tool لتحليل الجينومات الكاملة على الحواسيب السحابية بسرعة تزيد بنحو 43 % عن أسرع الأدوات المتاحة. وقد استُخدم Butler في تحليل بيانات مشروع PCAWG كاملة والتي تبلغ 750 تيرابايت، في حين استخدمت مجموعات أخرى الذكاء الاصطناعي لاكتشاف الأنماط patterns المختلفة للطفرات التي تميز كل نوع من أنواع السرطان. وطورت فرق البحث عددا كبيرا من طرق تحليل البيانات الضخمة، وابتكرت طرقا لعرض النتائج، وهو ما يبدو واضحاً في الأبحاث الناتجة عن المشروع.

تسوق لمجلتك المفضلة بأمان
اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى