شغف العلم الذي لا ينتهي

استخدام الحمض النووي DNA لتخزين البيانات - ساينسوفيليا

  استخدام الحمض النووي DNA لتخزين البيانات

بقلم: محمد عبد المحسن يحيى

إشراف ومراجعة: د.ندى مكاوي

تدقيق لغوي: نور الهدى سعد

استخدام الحمض النووي DNA لتخزين البيانات - ساينسوفيليا


أصبحت تنتج البشرية كميات هائلة من البيانات يوميا
ً؛
 الأمر الذي جعل تقنيات التخزين الإلكترونية المتعارف عليها غير قادرة على الإستيعاب فكل خمسة أعوام تتضاعف كمية البيانات التى ينتجها العالم عشرة أضعاف.

في بحث تم إجراؤه عام 2018 وُجٍد أنه في كل دقيقة يتم إجراء 3.88 مليون عملية بحث على جوجل، ويتم مشاهدة 4.33 مليون مقطع فيديو على يوتيوب، وتم إرسال 159362760 بريداً إلكترونياً، وعلى تويتر أجرى المستخدمون 473000 تغريدة، و49000 صورة على instgram، هذا الكم الهائل من البيانات يتم تخزينة في أنظمة تخزين بيانات إلكترونية  وهذا يحدث فقط في الدقيقة الواحدة، فماذا إن قلت لك في الساعة أو في اليوم أو في السنة، هل ستتحمل محركات الأقراص هذا الكم الهائل من المعلومات؟.

إذاً ما الحل؟، إنه الحمض النووي DNA!

ما علاقة الـ DNA بتخزين البيانات؟

لقد لفت نظر الباحثين أن الحمض النووي DNA أكثر كثافة من وسائط التخزين الإلكترونية الحديثة؛ بحيث أن البيانات التى يتم تخزينها على مئات أو آلاف من أقراص الــ DVD يمكن أن يكفي لتخزينها مجرد حجم ملئ عبوة كبريت من الــ DNA، وكذلك أيضا الــ DNA أكثر متانة وتحمل ويدوم بحالته لآلاف السنين مثلما يحدث فى الحفريات والمومياوات وهي ميزة غير متوفرة فى وسائط التخزين الإلكترونية المستخدمة حالياً والتي تعمل لسنوات أو على الأكثر بضعة عقود.

ما هو الحمض النووي DNA وقدراته الهائلة على تخزين البيانات:

الحمض النووي DNA هو عبارة عن مخزن شفرات المعلومات الوراثية الخاصة بكل كائن حي، وهو عبارة عن شريطين يلتفان حول بعضهما مثل اللولب المزدوج، لنأخذ شريطاً واحداً ونرى سنجد في كل شريط من ال DNA أربعة مواد كيميائية تسمى النيوكليوتيدات Nucleotides وهم:

adenine, thymine, cytosine, and guanine  ويُرمز لهم كالآتي A، T، C، G.

ولا يوجد منهم نسخة واحدة فقط بل الملايين من النسخ داخل الشريط الواحد، أو بمعنى آخر ملايين من الشفرات والأكواد تتكون حسب اختلاف تتابع تلك النيوكليوتيدات وسنعود لهذا لاحقاً.  

هذا الـ DNA الذي نتحدث عنه الآن أين يوجد؟

يوجد داخل النواة الموجودة داخل الخلية التى تتكون من العديد من المكونات، ومن ضمن هذه المكونات السيتوبلازم (السائل العائم بداخله كل مكونات الخلية) ويوجد داخل السيتوبلازم الأحماض الأمينية Amino Acids ولكن ما علاقتها ب ال DNA؟، بكل تأكيد نقول إن الأحماض الأمينية بدون الDNA لا تساوي شيئاً؛ لأنها تأخذ الأوامر المُشفرة من الDNA لتقوم بصناعة البروتين ثم بعد ذلك يتكون النسيج وبعد تكوين النسيج يتكون العضو وبعد العضو يتكون الكائن الحي، وهكذا.



قلنا إن تخزين البيانات يتم على محركات الأقراص الثابتة، فما علاقة الحمض النووي DNA بتخزين البيانات؟ 

إن الحمض النووي يمكنه تخزين المعلومات الرقمية وذلك لأن كثافته تفوق ألف مرة على الأقل كثافة وسائط التخزين الحالية، وأكثر ثباتاً بمقدار ثلاثمائة ضعف على الأقل من الأشرطة المغناطيسية الأكثر استقرارًا، وبفضل النيوكليوتيدات الموجودة فيه يمكنه توفير بيئة تشفير مناسبة لتخزين البيانات.

وبسبب المشكلة العالمية في عملية تخزين البيانات فقد توصل الباحثون لطريقة جديدة لتشفير البيانات الرقمية في الحمض النووي لإنشاء أعلى نظام تخزين بيانات واسع النطاق بكثافة أعلى من أعلى نظام تخزين بيانات تم اختراعه على الإطلاق؛ حيث أن الحمض النووي قادر على تخزين 215 بيتا بايت (215 مليون جيجا بايت) وذلك يكون في جرام واحد فقط من الحمض النووي، وهذه البيانات تكون قادرة على الاستمرار لآلاف السنين ولكن بشروط :

  1. إذا تم حفظها في مكان بارد وجاف.
  2. أن يكون لدينا القدرة على تشفير هذه البيانات على الـ DNA.
  3. أن يكون لدينا القدرة على استعادة البيانات المشفرة من الـ DNA.

وهنا يأتي السؤال كيف يتم تخزين البيانات على الحمض النووي DNA؟ 

طريقة تخزين البيانات على الحمض النووي DNA:

مبدئيًا يجب أن نعرف بشكل مبسط كيف يتم تخزين البيانات على الحاسب الآلى أو وسائط التخزين الإلكترونية، الإجابة: عن طريق النظام الثنائي ( (binary code systemوهو معتمد على تغيير المواصفات المغناطيسية أو الضوئية أو الكهربائية لقرص التخزين _مثلا (ON & OFF)_  و يرمز لشفرة التغير تلك بإستخدام تتابعات من الرقمين   0,1 لتشفير كل البيانات فى شكل أكواد من هذين الرقمين، ومن الطريف أن مبدأ الأكواد لصناعة شفرة هو تماماً ما يحدث في الـ DNA  و لكن عن طريق النيوكليوتيدات A، T، C، G  وهى ما تقابل  0,1 فى النظام الثنائى للتخزين فى وسائط التخزين التقليدية.

كيف يتم تطبيق ذلك على الـDNA ؟

فمثلاً 00   يمكن أن يساوى A و  01 , 10= T ,11=G  لحفظ صورة على سبيل المثال التى تبدأ بإمتداد JPEG و الذى يرمز له بشريط طويل من 0s and 1s ، فلو فرضنا أن أول 8 بايت من الملف هم 01111000  فيمكن ان يتم تقسيمهم الى أربعة أزواج (01 11 10 00 )  ويكون المقابل لهم C-G-T-A  وليكن هذا هو ترتيب ربط النيوكليوتيدات معاً على شريط الــ DNA لنحصل على كود لتشفير نفس الملف على الحمض النووى.



ولكن قبل ذلك يجب أن نعرف أن شريط الحمض النووي الذي نستخدمه لتخزين البيانات يجب أن يكون قصيرًا؛ بحيث يحتوي على 20بايت لكل شريط لأنه كلما زاد طول الحمض النووي كان من الصعب بنائه كيميائياً. 

وبالتالي الآن نحن بحاجة إلى تقسيم البيانات لأجزاء أصغر، وإضافة مؤشرIndicator على مكان وضع كل منها في التسلسل الصحيح   لماذا؟ 

لأنه عندما يحين وقت قراءة المعلومات المخزنة على DNA، سوف يضمن هذا المؤشر بقاء جميع البيانات في ترتيبها الصحيح، والآن معنا خطة لكيفية تخزين البيانات، تأتي المرحلة التالية وهي عملية تنفيذ تخزين البيانات

بعد تحديد التتابع الصحيح لكل حرف فى مكانه يتم عمل خيط من الحمض النووي حرفًا بحرف عن طريق تفاعل كيميائى؛ هذه التفاعلات تتم عن طريق معدات معينة داخل أنابيب تحتوى على مجموعة مختلفة من النيوكليوتيدات A ,C ,G ,T مع مواد كيميائية أخرى مثل الإنزيمات؛ ذلك للتحكم في التفاعلات التي تحدد ترتيب خيوط الحمض النووي. 

ومن المميز هو أن ناتج هذا التفاعل عبارة عن عدد كبير من النسخ الا
حتياطية من خيوط الحمض النووي  backup copies في المرة الواحدة بدلاً من صناعة نسخة واحدة فقط من الخيط، 
ولكن يجب حماية هذه النسخ من الرطوبة والضوء فنقوم بعمل تجفيف لها بعد التفاعل، ونضعها في وعاء يجعلها باردة، وتُحجب عن الماء والضوء، إلى هنا نكون وصلنا لتخزين البيانات وعمل نسخ احتياطية من خيوط الحمض النووي، ولكن هل هذه البيانات التي قمنا بتخزينها مفيدة في حالة تم استردادها لاحقاً؟

إعادة قراءة البيانات:

تتم هذه العملية عن طريق استخدام آلة تسلسل sequencing machine مثل التي تستخدم فى تحليل الحمض النووي الجيني فى الخلايا لتحديد البصمة الوراثية، حيث يتم تحليل كل جزئ إلى تسلسل من الحروف ثم بعد ذلك يتم فك تشفير الحروف طبقاً لما يقابلها من النظام الثنائي 0,1 بالترتيب، ولكن هذه العملية قد تقوم بتدمير الحمض النووي، وهنا تأتى أهمية النسخ الاحتياطية backup copies من خيوط الحمض النووي ،حتى إن تلفت تلك النسخ فالحل بسيط وهو القيام بعملية نسخ مستمر لإعادة ملئ التخزين مثلما يحدث بشكل طبيعي مع الـ DNA داخل الخلية.

التحديات الراهنة للتنفيذ:

والآن قد علمنا طريقة التخزين ثم فك التشفير ورأينا صعوبة في الأمر في حالة إعادة قراءة البيانات، وهنا يأتي التحدي وهو أنه ما تم قراءته هو جزء ضئيل جداً من البيانات وهذا ليس المطلوب؛ لأننا قمنا بتخزين البيانات لغرض قرائتها كلها وليس قراءة جزء ضئيل منها.، بل والتحدي الآخر هو أن عملية قراءة و تخزين البيانات تتم بصورة بطيئة، أي إننا إذا أردنا تخزين صورة تم تصويرها بهاتف محمول؛ فإن تخزين هذه الصورة على الحمض النووي يحتاج لساعات وهذا الأمر بطيء جداً، وهنا يأتي التفكير في أمر التطوير لهذه التقنية.

ففي عام 2017 قام باحثون من جامعة واشنطن بتطوير نظام آلي كامل؛ وذلك لكتابة وتخزين وقراءة البيانات المشفرة في الحمض النووي DNA، وبالمثل قامت عدد من الشركات مثل Twist و Microsoft بتطوير تقنية تستخدم لتخزين البيانات على DNA.

ورغم هذا التطور توجد تحديات أخرى تواجه تخزين البيانات على ال DNA وهذه التحديات هي تكلفة التخزين؛ حيث إن تكلفة التخليق الكيميائي لل DNA تكون 3500 دولار لكل 1 ميجابايت من المعلومات وهذه التكلفة تحتاج لمزيد من الانخفاض؛ لأنه إن لم يصبح الحمض النووي مادة لتخزين البيانات فإنه من شبه المؤكد سيتم استخدامه لتوليد المعلومات بمعايير جديدة تماماً وذلك للحفاظ على البيانات على المدى الطويل. 

المراجع العلمية:

ليست هناك تعليقات