المعلوماتية الحيوية والمتسلسلات العالية الإنتاجية
د. منذر الحمدوش
إن فهم ما يجري داخل الخلايا يعتمد بصورة أساسية على محتوى الخلية من الأحماض النووية والأحماض النووية الريبية والبروتينات، لذلك سعى الباحثون في علم الأحياء الجزيئي خلال العقود الثلاثة الماضية إلى تطوير العديد من الطرق التي تمكنهم من تحديد سلاسل الأحماض النووية داخل الخلايا، وهنا نقصد ترتيب النيكليوتيدات في كامل الجينوم أو في جزء من الجينوم أو في الحمض النووي الريبي كاملا أو في جزء منه. بمعنى آخر تهدف هذه التقنيات إلى استخلاص جزيء الحمض النووي من داخل النواة وعزله، ومن ثم إعادته إلى شكله الخطي وأخيراً تحديد ترتيب النيكليوتيدات في كامل الجزيء أو في جزء منه فقط وهذه العملية تبدو بسيطة من حيث الشرح لكنها معقدة جداً من حيث التطبيق؛ فنحن نتعامل هنا مع جزيئات بحجم النانومتر، والحمض النووي له خواص فيزيائية وكيميائية تجعله حساساً لدرجة الحرارة والعديد من العوامل الأخرى.
في معظم تقنيات التسلسل المطورة يتم استخدام تفاعل البلمرة التتابعي PCR لنسخ سلاسل الحمض النووي الحيوية ومضاعفتها آلاف المرات بحيث يمكن التعامل معها، وهذا التفاعل يستفيد من خاصية السلسلة المزدوجة للحموض الأمينية (الشكل 1)، إذ إن كل سلسلة حمض نووي يرتبط بها سلسلة مكملة (النيكليوتيد A يقابله دائماً T و C يقابله دائماً G) وللسلسلتين اتجاهان متعاكسان من حيث طريقة ارتباط النيكليوتيدات بعضها ببعض.
إن متسلسلات الأحماض النووية يمكن أن تقسم إلى نوعين أساسيين: المتسلسلات المنخفضة الإنتاجية أو ما يسمى بمتسلسلات الجيل الأول، ومنها متسلسلات Sanger ومتسلسلات Gilbert والتي تعتمد بصورة أساسية على استخدام النيكليوتيدات المنقوصة الأكسجين لتوليد سلاسل جزئية من سلسلة الحمض النووي الأصلية بأطوال مختلفة، ومن ثم يتم فرز هذه السلاسل حسب طولها واستخدام ماسح ليزري لكشف النيكليوتيدات في نهايات السلاسل الجزيئية، ثم تطبيق المعلوماتية الحيوية لتوليد قراءة نصية لسلسلة الحمض النووي يفهمها الحاسوب (الشكل 2). وهذه المتسلسلات تستطيع توليد قراءة واحدة في كل تشغيل بطول بين 400 إلى 900 نيكليوتيد، وخلال 20 دقيقة إلى 3 ساعات لكنها ذات كلفة مرتفعة جداً تصل إلى 2400 دولار لكل مليون نيكليوتيد. والنوع الثاني من المتسلسلات هو المتسلسلات العالية الإنتاجية، أو ما يسمى بمتسلسلات الجيل الثاني أو المقبل NGS، التي تعتمد بصورة أساسية على تقنية التسلسل بالتركيب، إذ إنها تقوم بتقطيع جزيء الحمض النووي إلى جزيئات صغيرة بطول 500 نيكليوتيد تقريباً، ومن ثم توجد سلسلة كل مقطع على حدة عن طريق تركيب السلسلة المكملة للمقاطع (الشكل 3). هذه المتسلسلات تستطيع توليد عدد كبير جداً من القراءات في كل تشغيل قد يبلغ 400 مليون قراءة، لكن بأطوال أقصر قليلاً تراوح بين 50 و 300 نيكليوتيد. ويندرج ضمن هذا النوع متسلسلات Roche 454 و SOLiD
و Illumina، وأشهرها في الوقت الحالي هي متسلسلات Illumina لكن معداتها ذات كلفة عالية. كلا الجيلين من المتسلسلات وصل إلى دقة تتجاوز %99 في سلسلة الأحماض النووية بتكلفة تبلغ أقل من 15 سنتاً لقراءة كل مليون نيكليوتيد وبزمن تشغيلي يراوح بين 24 ساعة
و 10 أيام متواصلة. إن المتسلسلات العالية الإنتاجية تعتمد على التقاط صور متتابعة للألوان المختلفة التي تصدرها التفاعلات الكيميائية أثناء عملية التسلسل، وهذا يحتاج إلى حاسوب فائق حتى يعالج هذه الصور.
إن متسلسلات الجيل الثاني فتحت الباب أمام تطبيقات كثيرة في المجالات الطبية الحيوية، وساهمت في قفزات نوعية فيها.
توليد البيانات في المتسلسلات العالية الإنتاجية
تؤدي المعلوماتية الحيوية دوراً مهماً في تطبيقات المتسلسلات العالية الإنتاجية؛ فهذه التقنيات الحديثة تولد بيانات هائلة تحتاج إلى مهارات معلوماتية ورياضية كبيرة للتعامل معها، وإلى حواسيب فائقة. لكن، أين يكمن التحدي في تحليل بيانات المتسلسلات العالية الإنتاجية؟ حتى نجيب عن هذا السؤال نحتاج إلى فهم طبيعة هذه البيانات، وسنستخدم الجينوم البشري ومتسلسلات Illumina للتوضيح، إذ إن جميع ما سيذكر لاحقاً يمكن أن يطبق على الحيوان والنبات والبكتريا على حد سواء.
يظهر (الشكل 3) أن المتسلسلات العالية الإنتاجية تقرأ مقاطع الحمض النووي التي يراوح طولها عادة بين 200 و1000 نيكليوتيد، لكن هذه المتسلسلات لا تستطيع قراءة أكثر من 300 نيكليوتيد بصورة متواصلة، لذلك يوجد لدينا نوعان من القراءات (كما هو موضح في الشكل 4)، هما: القراءات الأحادية الطرف، حيث يتم قراءة أول 50 – 300 نيكليوتيد من مقاطع الحمض النووي ومن جهة واحدة فقط ، أما النوع الثاني فهو القراءات الثنائية الطرف، حيث يتم قراءة أول 50 – 300 نيكليوتيد من طرفي مقاطع الحمض النووي، بحيث يمثل كل مقطع بزوج من القراءات. ولكل نوع من القراءتين تطبيقات خاصة به. إذا علمنا أن لكل عينة عادة ما يتم سلسلة ما بين 25 مليون مقطع من الحمض النووي (وهذا ينتج قرابة 3 غيغابايت من البيانات) إلى 750 مليون مقطع (وهذا ينتج قرابة 500 غيغابايت من البيانات) ، حيث يتم تمرير العينة نفسها على المتسلسلة أكثر من مرة، فإنه إذا أجرينا تجربة تحوي 100 عينة فإننا نتوقع كميات هائلة من البيانات قد تبلغ 100 تيرابايت للتجربة الواحدة.
وكما نلاحظ في (الشكل 3) فإننا عندما نقرأ عددا كافيا من المقاطع، فإن القراءت ستكون متداخلة إلى حد كبير، ومن ثمّ ، باستخدام خوارزميات المعلوماتية الحيوية هذه يمكننا إعادة بناء سلسلة الحمض النووي الأصلية كاملة كما لو أننا قرأنا الحمض النووي دون تقطيعه. عادة عندما نصمم تجربة تسلسل معينة فإننا نأخذ بعين الاعتبار حجم الجينوم المرجعي (إذا كان معروفاً) الذي نقوم بسَلسلةه وطول القراءات وعمق التسلسل أو ما يسمى بالتغطية التي نريد أن نحققها للجينوم، مثلا إذا كان حجم الجينوم 3.3 بليون نيكليوتيد ونريد سَلسلته بتغطية 50 ضعفا وبطول قراءات 100 نيكليوتيد أحادية الطرف، فإننا نحتاج إلى توليد قرابة بليون ونصف قراءة وبحجم يبلغ قرابة 400 غيغابايت. في بعض التجارب قد نحتاج إلى تغطية تتجاوز ال 100 ضعف للجينوم وخصوصاً إذا كان الجينوم المرجعي غير معروف.
تطبيقات المتسلسلات العالية الإنتاجية
إن المتسلسلات العالية الإنتاجية وتطور خوارزميات المعلوماتية الحيوية مكن العلماء من تصميم تجارب تسلسل لدراسة العديد من جوانب الحمض النووي والحمض النووي الريبي، إضافة إلى دراسة جهاز المناعة وفهم بنية الصبغيات الثلاثية البعد، وكيفية تفاعل البروتينات مع الحمض النووي لأداء وظائف الخلايا الطبيعية، أو الكيفية التي تؤدي بها إلى العديد من الأمراض المعقدة كأمراض السرطان. ومن هذه التطبيقات:
سلسلة كامل الحمض النووي (الجينوم) WGS
إن سلسلة كامل الحمض النووي تؤدي دوراً مهما في دراسة الأمراض المعقدة كأمراض السرطان، لأنها تساعد على اكتشاف الطفرات الجينية التي تؤدي إلى حدوث الأمراض في شخص أو شريحة معينة من المجتمع. ولكي ندرك أهمية ذلك يكفي أن نعرف أن سلاسل الحمض النووي بين البشر – على سبيل المثال – تتشابه بنسبة 99 % تقريباً، وهناك فقط 1 % من النيكليوتيدات (قرابة 4 – 5 ملايين) تختلف من إنسان إلى آخر، ومن ثمّ فإن إعادة سَلسلة كامل الحمض النووي تساعد على اكتشاف هذه الاختلافات (تسمى متغيرات جينومية) بين الأفراد، والتي تؤدي دوراً مهماً في تحديد أنواع السرطانات واستجابة المرضى للأدوية المتوفرة، وسَلسلة كامل الحمض النووي تساعد أيضاً على تحديد عدد نسخ الصبغيات أو عدد نسخ أجزائها الوظيفية (الجينات) الموجودة في الخلايا، ففي الخلايا السليمه يوجد نسختان لكل صبغي ، أما في الخلايا السرطانية فهذا العدد قد يتغير ، كما أن بعض الصبغيات قد تندمج مع بعضها لتشكل صبغيات جديدة كلياً. وهذه التغيرات في بنية الصبغيات لا يتم كشفها إلا بسَلسلة الحمض النووي كاملاً، وعادة باستخدام القراءات الثنائية الطرف. كما أن سَلسلة كامل الحمض النووي تؤدي دوراً مهماً في بناء سلاسل جينومات جديدة، فمثلا تم بناء الجينوم لبضعة آلاف من الكائنات الحية حتى الآن. وبحلول عام 2025 يقدر أن يصل هذا العدد إلى مليون جينوم، وخصوصاً مع انخفاض كلفة عمليات التسلسل في السنوات الأخيرة.
إن العديد من خوارزميات المعلوماتية الحيوية تستخدم لتحليل كميات هائلة من القراءات الناتجة عن سَلسلة كامل الحمض النووي، كما يتم استخدام خوارزميات البحث عن المتغيرات الجينومية لإيجاد المتغيرات الجينومية مقارنة بالجينوم المرجعي، ويتم استخدام خوارزميات البحث عن تغيرات بنية الصبغيات للكشف عن تغير عدد الصبغيات أو أجزاء منها، وأخيراً يتم استخدام خوارزميات بناء الجينوم عن طريق دمج القراءات القصيرة بناء على نظرية المخططات الشهيرة في علوم الحاسوب. وبعض هذه الخوارزميات قد تستغرق أياماً أو أسابيع لكل تعالج عينة واحدة فقط، وذلك باستخدام حاسوب فائق.
سَلسلة كامل الحمض النووي الريبي
من المعروف أن سلاسل الحمض النووي تكون موجودة نفسها تماماً في جميع خلايا الكائن الحي، ولكن جزءا من سلاسل الصبغيات (نسميها الجينات وتشكل فقط 1.5% من كامل الجينوم) يتم نسخها باستخدام بعض البروتينات لتشكل سلاسل الحمض النووي الريبي RNA التي ستنتج لاحقاً البروتينات التي ستؤدي وظائف الخلايا. هذا المحتوى الريبي يتغير من لحظة إلى أخرى ومن خلية إلى أخرى ومن عضو إلى آخر في الجسم، ومن ثمَّ ، فإن من المهم جداً دراسة الحمض النووي الريبي لفهم كيفية تطور الأمراض ومدى استجابة الجسم للعلاجات التي نقدمها. إن تقنيات سلسلة الحمض النووي الريبي تقوم على استخراج جزيئات الحمض النووي الريبي في لحظة معينة، ومن ثم تقطيعها إلى مقاطع قصيرة وأخيراً سَلسلتها باستخدام المتسلسلات العالية الإنتاجية، وهذا ينتج قراءات تغطي مناطق الجينات فقط وليس كامل الجينوم كما في التطبيق السابق. وحتى ندرك أهمية هذه التقنيات يجب أن نعرف أن الجينات لايتم نسخها كما هي بشكل كامل، وإنما يتم نسخ أجزاء معينة منها فقط ندعوها الإكسونات exons . وأثناء عملية النسخ قد يتم حذف بعض هذه الإكسونات ، كما قد يحدث أخطاء عند دمج الإكسونات مع بعضها لتشكل الحمض النووي الريبي. وهذا أحد مسببات الأمراض كما تم اكتشافه حديثا (الشكل 5) .
إن العديد من طرق المعلوماتية الحيوية تستخدم هنا لرصف القراءات بالنسبة للجينوم المرجعي، ومن ثم يتم حساب مستويات نسخ جميع الجينات الملاحظة في العينة المدروسة وتحديد الجينات التي تنسخ بنسب متفاوتة بين عدد من العينات وضمن شروط مختلفة. فعلى سبيل المثال تمكننا هذه الخوارزميات من معرفة الجينات التي يتم نسخها بصورة متكررة جداً في عينات لأشخاص مصابين بمرض الربو مقارنة بعينات سليمة، وهذا يمكن أن يستخدم لاحقاً لتشخيص مرضى الربو ومعرفة مستوى تقدم المرض. وحديثا تم تطوير خوارزميات تعيد بناء الحمض النووي الريبي المنسوخ لاكتشاف أي إجراء غير طبيعي قد يحدث أثناء عملية النسخ.
سَلسلة الحمض النووي والتفاعل مع البروتينات ChipSeq
من التطبيقات المهمة جداً للمتسلسلات العالية الإنتاجية هي إمكانية تحديد نقاط تفاعل بروتين معين مع الحمض النووي على مستوى الجينوم كاملاً، إذ إن هناك بروتينات معينة تدعى عوامل النسخ تؤدي دوراً مهماً في تحديد الجين الذي سيتم نسخه في الخلية ضمن شروط معينة أو في عضو معين. وهذه البروتينات نفسها تحدد مستويات النسخ وأي جين معين سيتم نسخه بكثرة أو بنسبة قليلة، وهذا ينعكس على أداء الخلايا، ومن ثمَّ الأعضاء. وينتج عن ذلك قراءات تتطابق مع مواقع التفاعل مع البروتين، ونسميها قمما Peaks.
تقوم خوارزميات المعلوماتية الحيوية برصف هذه القراءات بالنسبة للجينوم المرجعي وتحديد المناطق الجينومية التي يرتبط بها البروتين المدروس، ومن ثمَّ تحديد سلسلة النيوكليوتيدات التي يرتبط بها هذا البروتين وتعريف ما يسمى بنموذج الارتباط binding motif، كما أن هذه الخوارزميات تمكننا من دراسة الفروق بين شروط مختلفة. ومن التطبيقات المهمة لهذه الخوارزميات أنها تمكننا من بناء الشبكات التنظيمية للجينات لحالة حيوية أو طبية معينة، وهذه الشبكات تظهر الكيفية التي تتفاعل بها الجينات المختلفة والبروتينات مع بعضها لتحقيق وظيفة معينة أو لتؤدي إلى حالة مرضية معينة.
سَلسلة جزء معين من الحمض النووي
إن توليد قراءات للحموض النووية على مستوى الجينوم كاملاً ليس بالشيء المرغوب دائماً؛ نظراً للكلفة العالية وكمية البيانات الضخمة التي يتم توليدها من هذه التجارب، لذلك تم تطوير عدة تجارب لسلسلة جزء معين من الحمض النووي، على سبيل المثال يمكن سلسلة جين معين أو منطقة وظيفية معينة نشتبه في دورها في حالة حيوية معينة.
سَلسلة المخزون المناعي
حظي الجهاز المناعي بنصيب جيد من تطبيقات المتسلسلات العالية الإنتاجية، فكما هو معروف فإن أجسام الكائنات الحية تحوي عددا كبيرا جداً من المضادات الحيوية والخلايا المناعية وبأنواع مختلفة قد تصل إلى أكثر من تريليون نوع وبنسب متفاوتة، ويتم نسخ هذه المضادات واستخدامها لاحقاً في تصنيع الأدوية أيضاً. وقد دأب العلماء في العقدين الأخيرين على إيجاد طريقة تمكنهم من معرفة سلاسل الأحماض النووية التي تفرز هذه المضادات الحيوية (التي هي عبارة عن بروتينات). وبسبب عددها الكبير جداً لم تتمكن أي من تقنيات السَلسَلة الماضية من معرفة ذلك. وعند ظهور المتسلسلات العالية الإنتاجية تمكن العلماء من فرز الخلايا المناعية التي تولد المضادات الحيوية، ومن ثم سَلسلة أجزاء الحمض النووي التي تفرز المضادات الحيوية (الشكل 5) ، وهذا مكنهم من فهم آلية توليد هذا العدد الضخم من المضادات، وكيفية توليد الجسم نوعا معينا من المضادات لمكافحة مرض أو إصابة معينة، كما أن هذه التقنيات مكنت العلماء من تحديد بعض الحالات المرضية بناء على المخزون المناعي للمريض.
وهذا النوع من البيانات يحتاج إلى خوارزميات معلوماتية حيوية وطرق رياضية إحصائية خاصة لكي يتم تحليلها، فهي تتميز بأن القراءات متشابهة إلى حد ما وتختلف في مناطق معينة قصيرة من سلسلة الحمض النووي، ومن ثمّ فإن التمييز بين سلسلتي مضادين حيويين ليس بالشيء البديهي.
سَلسلة مواقع التقارب في الصبغيات Hi-C
مكنت المتسلسلات العالية الإنتاجية الباحثين حديثا من دراسة البنية الثلاثية البعد للصبغيات، إذ إن سلاسل الحمض النووي الخطية تتموضع داخل النواة بشكل مضغوط، ومن ثّم فإن تقارب بعض مناطق الحمض النووي من بعضها يؤدي دوراً مهما في علاقة الجينات بعضها ببعض، إذ يعتقد أن المواقع المتقاربة من بعضها في الفضاء الفراغي ترتبط ببعضها بعلاقة حيوية معينة كدورها في نسخ الجينات. لذا تقوم هذه التقنيات بتوليد قراءات لمواقع الحمض النووي المتقاربة مما يسمح للعلماء بإعادة بناء التموضع الفراغي للحمض النووي، وهنا تؤدي خوارزميات الرصف ونظريات علوم الحاسوب دوراً مهماً في بناء هذه البنية الفراغية.
سَلسلة الحمض النووي الريبي في خلية واحدة فقط
إن معظم تجارب التسلسل التي ذكرناها آنفاً تقوم على سَلسلة عينة من نسيج معين تحوي مئات الآلاف إلى ملايين الخلايا من أنواع مختلفة، ومن ثمّ فما نشاهده في الدراسات السابقة هو ملخص لما يحدث في العينة بصورة عامة، لكن ما يحدث حقيقة هو أكثر تعقيداً، ففي النسيج الواحد يوجد مئات الأنواع من الخلايا، وعادة ما يكون هناك عشرات الأنواع التي توجد بكثرة في النسيج، ولكل نوع من هذه الخلايا خصائص حيوية معينة كمحتوى الحمض النووي الريبي والبروتينات، وحتى الحمض النووي نفسه قد يختلف بين الخلايا في بعض الأمراض، فبعض أنواع السرطانات نجد أن سببها طفرة تحدث في نوع معين فقط من الخلايا وليس في كل الخلايا. لذلك كان هناك حاجة لتطوير تقنيات تمكننا من سَلسلة خلية واحدة في كل مرة بدلاً من تجمع خلايا كما اعتدنا أن نفعل في السابق. ومن التطبيقات المهمة لهذه التقنيات هي دراسة الأحياء المجهرية أو ما يسمى بالمايكروبيوم التي توجد وتتعايش معنا مثلا على سطح الجلد أو في أمعائنا، وهي دقيقة جداً وتوجد بالآلاف وبأنواع عديدة جداً. وفي السنتين الأخيرتين تم تطوير العديد من الخوارزميات للتعامل مع القراءات الناتجة عن هذه التقنيات، إذ إن لهذه البيانات خصائص مختلفة جداً عن سابقاتها، فمثلاً في الخلية الواحدة لا يتم في الوقت نفسه نسخ أكثر من 2000 – 3000 جين من أصل 25000 ألف جين، وبنسب نسخ متفاوتة، ومن ثمّ ستحوي البيانات الناتجة عددا كبيرا جداً من الأصفار.
مستقبل المتسلسلات
إن المتسلسلات العالية الإنتاجية ذات القراءات القصيرة أثبتت فعالية كبيرة، وساهمت في نهضة علمية في المجالات الطبية والحيوية، لكن هذه التقنيات لا تزال تعاني مشكلات عديدة وخصوصاً عندما يتعلق الأمر بإعادة بناء سلسلة الحمض النووي دون وجود جينوم مرجعي، فهذا ذو كلفة مادية كبيرة جداً، لذلك كان لابد من تطوير تقنيات جديدة قادرة على توليد قراءات طويلة جداً تصل إلى بضعة آلاف من النيكليوتيدات و بإنتاجية عالية، لذلك عملت عدة شركات في هذا المجال ، من أشهرها شركة Pacific Biosciences التي طورت متسلسلة قادرة على سَلسلة قراءات بطول يصل إلى 20 ألف نيكليوتيد، وبحيث يتم استخدام نفس مادة الحمض النووي أكثر من مرة على خلاف ما هو مستخدم في متسلسلات Illumina . وعلى الرغم من أن دقة هذه المتسلسلات لا تزال قرابة 90 % ، فإنها تساعد العلماء على الإجابة عن الكثير من الأسئلة وخصوصاً عندما يتعلق الأمر بدراسة كائنات حية جديدة لم يسبق فك شيفرتها الوراثية بعد.
على الطرف الآخر فإن هناك عملا دؤوبا لتطوير متسلسلات صغيرة الحجم محمولة بحيث يمكن استخدامها في المناطق النائية التي لا تتوافر فيها مختبرات مجهزة، فحديثا، طورت شركة اكسفورد نانوبور البريطانية متسلسلة MinIon لايتجاوز حجمها الكف الواحد (الشكل 6)، وهي تولد قراءات طويلة جداً وبزمن حقيقي، وهو ما يتيح لسَلسلة أكثر من 10 ملايين نيكليوتيد باستخدام خلية تشيغيلة واحدة، وهذا سيتيح في السنوات القليلة المقبلة استخدام المتسلسلات في العيادات الطبية، وبالتالي تمكين الأطباء من دراسة مرضاهم على مستوى الحمض النووي وتشخيصهم بشكل أفضل وخصوصاً في الأمراض المعقدة كأمراض السرطان.
ملاحظات ختامية
إن تصميم تجربة التسلسل بشكل جيد عن طريق التشاور مع العلماء المعنيين قبل إجراء التجربة يؤدي دوراً مهماً في الإجابة عن الأسئلة المطروحة حول التجربة.
إن تحليل بيانات المتسلسلات العالية الإنتاجية يعتمد بشكل كبير على قواعد البيانات الحيوية المتوفرة في الإنترنت من قبل معاهد الأبحاث العالمية ، وهذه القواعد تحوي النسخ الأصلية للجينومات المرجعية ومواضع الجينات في كل جينوم، إضافة إلى سلاسل الحمض النووي والحمض النووي الريبي، ومعلومات عن أقسام الجينات وأنواعها والعديد من البيانات الأساسية، وكذلك الأمر فإن معظم البرمجيات المستخدمة في هذا المجال هي مفتوحة المصدر ويطورها باحثون من جامعات عدة. وقواعد البيانات هذه والبرمجيات يتم تحديثها بشكل دوري بناء على الاكتشافات الجديدة التي تحدث في مجال علم الأحياء الجزيئي.
إن دمج عدة أنواع من البيانات مما ذكرناه آنفا يؤدي دوراً مهماً في فهم الوظائف والآليات الحيوية للكائنات الحية والأمراض، وهذا ما يسمى بالطريقة المتكاملة في المعلوماتية الحيوية التي تعتبر أساس البحث على مستوى النظام الحيوي كاملاً، إذ يتم توظيف خوارزميات معقدة جداً لاستخراج وبناء نماذج رياضية يمكن أن تستخدم في التطبيقات الطبية الحيوية.