معلومة

كيف يمكن للتنبؤ بانطواء البروتين تسريع اكتشاف الأدوية؟

كيف يمكن للتنبؤ بانطواء البروتين تسريع اكتشاف الأدوية؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أسأل هذا بصفتي شخصًا عاديًا بدون معرفة كبيرة في علم الأحياء ، لذا يرجى تصحيح ما إذا كان فهمي خاطئًا.

تمكنت مؤخرًا AlphaFold من DeepMind من التنبؤ ببنية البروتين من تسلسل الأحماض الأمينية بدقة مذهلة. قيل لنا أن هذا يمكن "يمهد الطريق نحو التقدم في اكتشاف الأدوية."

لكني فشلت في رؤية كيف يمكن أن يحدث ذلك. من خلال فهمي أن تركيبة بنية البروتين لا حصر لها ، وإذا قمنا بتعديل بنية البروتين التي تعمل بشكل جيد لمحاربة الفيروس ، فسوف تعمل بشكل أفضل أو أسوأ ، ولكن النقطة الأساسية هي لا نعرف حتى نحاول. لذلك ، لا يزال هذا أمرًا صعبًا ، اعتمادًا فقط على الحظ الغبي.

فكيف يمكن أن يساعد التنبؤ السريع والدقيق لطي البروتين في اكتشاف الأدوية؟


أولاً ، هياكل البروتين ليست لانهائية. تعتمد معظم البروتينات بنية محددة.
تؤدي الأدوية وظيفتها من خلال الارتباط بالبروتين المستهدف. يساعد التنبؤ بالبنية على عملية اكتشاف الدواء بطريقتين -

  1. يسمح بتحديد الجيوب في البروتينات المستهدفة (حيث يمكن للعقاقير الارتباط) التي لم يتم حل هياكلها بعد باستخدام الطرق التجريبية
  2. يسمح بتجربة السيليكو ، أي يمكنك أن تأخذ عددًا كبيرًا من الجزيئات وتحاكي ما إذا كانت سترتبط بموقع معين في هدفك

أود أن أقترح مراجعة هذه المراجعات للحصول على نظرة عامة أفضل على أهمية التحديد السريع والدقيق للهيكل في اكتشاف الأدوية:

  1. فيريندي وهول ، 1994 ، الهيكل
  2. مونتفورت ووركمان ، 2017 ، مقالات في الكيمياء الحيوية

عادة ما تتضمن محاكاة ارتباط Ligand-Receptor استرجاع علم البلورات بالأشعة السينية للبروتين المطلوب (المستقبل) من قواعد بيانات المعلومات الحيوية. تحتوي بيانات الأشعة السينية للبروتين على سمات مهمة للبروتين ، أحدها تكوين البروتين (حالة الطي). يعد جمع بيانات علم البلورات بالأشعة السينية لعديد ببتيد جديد محدد عملية صعبة للغاية وتستغرق وقتًا طويلاً وتتطلب تقنيات متقدمة وتنقية دقيقة للبروتين من الأنظمة البيولوجية. لذلك ، إذا تمكنت الخوارزمية من توقع طي البروتين بشكل صحيح (على الأقل إلى بعض النطاقات) ، فيمكن أن تستفيد خوارزميات أخرى من هذا الاستقلال عن النتائج التجريبية. استطلاعات سريعة ومتزامنة لرسو السفن (فحص افتراضي) سيكون متاحًا بسهولة أكبر مما يؤدي في النهاية إلى تصميم أدوية جديدة فقط عن طريق محاكاة الكمبيوتر (الأمر الذي يتطلب ميزانية مالية أقل للغاية مقارنة باختبار كل جزيء مرشح واحدًا تلو الآخر على الحيوانات)


قصة ذات صلة

في CASP لهذا العام ، توقع AlphaFold بنية عشرات البروتينات بهامش خطأ يبلغ 1.6 أنجستروم فقط - أي 0.16 نانومتر ، أو بحجم الذرة. هذا يتجاوز بكثير جميع الأساليب الحسابية الأخرى وللمرة الأولى يطابق دقة التقنيات المستخدمة في المختبر ، مثل المجهر الإلكتروني بالتبريد والرنين المغناطيسي النووي وعلم البلورات بالأشعة السينية. هذه التقنيات باهظة الثمن وبطيئة: يمكن أن تستغرق مئات الآلاف من الدولارات وسنوات من التجربة والخطأ لكل بروتين. يمكن أن يجد AlphaFold شكل البروتين في غضون أيام قليلة.

يمكن أن يساعد الاختراق الباحثين في تصميم عقاقير جديدة وفهم الأمراض. على المدى الطويل ، سيساعد توقع بنية البروتين أيضًا في تصميم البروتينات الاصطناعية ، مثل الإنزيمات التي تهضم النفايات أو تنتج الوقود الحيوي. يستكشف الباحثون أيضًا طرقًا لإدخال البروتينات الاصطناعية التي من شأنها زيادة غلة المحاصيل وتجعل النباتات أكثر تغذية.

يقول محمد القريشي ، عالم بيولوجيا الأنظمة بجامعة كولومبيا ، والذي طور برنامجه الخاص للتنبؤ ببنية البروتين: "إنه تقدم كبير للغاية". "إنه شيء لم أكن أتوقع حدوثه بهذه السرعة تقريبًا. إنه أمر صادم بطريقة ما ".

يقول ديفيد بيكر ، رئيس معهد تصميم البروتين في جامعة واشنطن وقائد الفريق وراء Rosetta ، وهي عائلة من أدوات تحليل البروتين: "هذه حقًا صفقة كبيرة". "إنه إنجاز رائع ، مثل ما فعلوه مع Go."

أرقام فلكية

من الصعب جدًا تحديد بنية البروتين. بالنسبة لمعظم البروتينات ، يمتلك الباحثون تسلسل الأحماض الأمينية في الشريط ولكن ليس الشكل الملتوي الذي يطويون فيه. ويوجد عادةً عدد فلكي من الأشكال الممكنة لكل سلسلة. كان الباحثون يتصارعون مع هذه المشكلة على الأقل منذ السبعينيات ، عندما فاز كريستيان أنفينسن بجائزة نوبل لإظهاره أن التسلسلات تحدد الهيكل.

أعطى إطلاق CASP في عام 1994 المجال دفعة قوية. كل عامين ، يطلق المنظمون 100 أو نحو ذلك من سلاسل الأحماض الأمينية للبروتينات التي تم تحديد أشكالها في المختبر ولكن لم يتم الإعلان عنها بعد. ثم تتنافس عشرات الفرق من جميع أنحاء العالم لإيجاد الطريقة الصحيحة لطيهم باستخدام البرامج. يستخدم الباحثون الطبيون بالفعل العديد من الأدوات التي تم تطويرها من أجل CASP. لكن التقدم كان بطيئًا ، مع فشل عقدين من التقدم التدريجي في إنتاج طريق مختصر للعمل المخبري الشاق.

حصلت CASP على الهزة التي كانت تبحث عنها عندما دخلت DeepMind المنافسة في عام 2018 بإصدارها الأول من AlphaFold. لا يزال غير قادر على مطابقة دقة المختبر ولكنه ترك تقنيات حسابية أخرى في الغبار. لاحظ الباحثون: سرعان ما بدأ الكثيرون في تكييف أنظمتهم الخاصة للعمل مثل AlphaFold.

يقول مولت إن أكثر من نصف المشاركات يستخدم هذا العام شكلاً من أشكال التعلم العميق. كانت الدقة بشكل عام أعلى نتيجة لذلك. يستخدم نظام بيكر الجديد ، المسمى trRosetta ، بعض أفكار DeepMind من عام 2018. لكنه لا يزال يأتي "في المرتبة الثانية البعيدة جدًا" ، كما يقول.

في CASP ، يتم تسجيل النتائج باستخدام ما يُعرف باختبار المسافة العالمية (GDT) ، والذي يقيس على مقياس من 0 إلى 100 مدى قرب الهيكل المتوقع من الشكل الفعلي للبروتين المحدد في التجارب المعملية. سجل أحدث إصدار من AlphaFold نتائج جيدة لجميع البروتينات في التحدي. لكنها حصلت على درجة GDT أعلى من 90 لحوالي ثلثيهم. كان GDT لأقسى البروتينات أعلى بـ 25 نقطة من الفريق التالي الأفضل ، كما يقول جون جامبر ، الذي يرأس فريق AlphaFold في DeepMind. في عام 2018 كان الصدارة حوالي ست نقاط.

تعني الدرجة التي تزيد عن 90 أن أي اختلافات بين الهيكل المتوقع والهيكل الفعلي يمكن أن تكون ناتجة عن أخطاء تجريبية في المختبر بدلاً من خطأ في البرنامج. قد يعني أيضًا أن الهيكل المتوقع هو تكوين بديل صالح للتكوين المحدد في المختبر ، ضمن نطاق التباين الطبيعي.

وفقًا لـ Jumper ، كانت هناك أربعة بروتينات في المسابقة لم ينتهها المحكمون المستقلون من العمل في المختبر وتنبؤات AlphaFold وجهتهم نحو الهياكل الصحيحة.

يعتقد القريشي أن الأمر سيستغرق الباحثين 10 سنوات للوصول من نتائج AlphaFold لعام 2018 إلى نتائج هذا العام. يقول إن هذا قريب من الحد المادي لمدى الدقة التي يمكنك الحصول عليها. "هذه الهياكل مرنة في الأساس. ليس من المنطقي التحدث عن قرارات أقل من ذلك بكثير ".

قطع اللغز

يعتمد AlphaFold على عمل مئات الباحثين حول العالم. اعتمدت DeepMind أيضًا على مجموعة واسعة من الخبرات ، حيث شكلت فريقًا من علماء الأحياء والفيزيائيين وعلماء الكمبيوتر. سيتم إصدار تفاصيل كيفية عملها هذا الأسبوع في مؤتمر CASP وفي مقالة تمت مراجعتها من قبل الأقران في عدد خاص من المجلة البروتينات العام القادم. لكننا نعلم أنه يستخدم شكلاً من أشكال شبكة الانتباه ، وهو أسلوب التعلم العميق الذي يسمح للذكاء الاصطناعي بالتدريب من خلال التركيز على أجزاء من مشكلة أكبر. يقارن Jumper نهج تجميع بانوراما: فهو يقطع القطع المحلية معًا أولاً قبل تركيبها في الكل.

قامت شركة DeepMind بتدريب AlphaFold على حوالي 170000 بروتين مأخوذ من بنك بيانات البروتين ، وهو مستودع عام للتسلسلات والهياكل. قارنت تسلسلات متعددة في بنك البيانات وبحثت عن أزواج من الأحماض الأمينية التي غالبًا ما تنتهي بالقرب من بعضها البعض في هياكل مطوية. ثم تستخدم هذه البيانات لتخمين المسافة بين أزواج الأحماض الأمينية في الهياكل التي لم تُعرف بعد. كما أنه قادر على تقييم مدى دقة هذه التخمينات. استغرق التدريب "بضعة أسابيع" ، باستخدام قوة حوسبة تعادل ما بين 100 و 200 وحدة معالجة رسومات.


كيف يمكن للتنبؤ بانطواء البروتين تسريع اكتشاف الأدوية؟ - مادة الاحياء

في دراستنا المنشورة في دورية Nature ، نوضح كيف يمكن لأبحاث الذكاء الاصطناعي أن تقود وتسريع الاكتشافات العلمية الجديدة. لقد أنشأنا فريقًا متخصصًا متعدد التخصصات على أمل استخدام الذكاء الاصطناعي لدفع البحث الأساسي إلى الأمام: الجمع بين خبراء من مجالات البيولوجيا الهيكلية والفيزياء والتعلم الآلي لتطبيق تقنيات متطورة للتنبؤ بالبنية ثلاثية الأبعاد للبروتين القائم. فقط على تسلسلها الجيني.

نظامنا AlphaFold - الموصوف في الأوراق التي راجعها النظراء والمنشور الآن في Nature and PROTEINS - هو تتويج لعدة سنوات من العمل ، ويبني على عقود من البحث السابق باستخدام مجموعات بيانات جينومية كبيرة للتنبؤ ببنية البروتين. تعد النماذج ثلاثية الأبعاد للبروتينات التي يولدها AlphaFold أكثر دقة بكثير من أي نماذج ظهرت من قبل - مما يشير إلى تقدم كبير في أحد التحديات الأساسية في علم الأحياء. يتوفر رمز AlphaFold المستخدم في CASP13 على Github هنا لأي شخص مهتم بمعرفة المزيد أو تكرار نتائجنا. يسعدنا أيضًا أن هذا العمل قد ألهم بالفعل تطبيقات أخرى مستقلة ، بما في ذلك النموذج الموضح في هذه الورقة ، وتنفيذ مفتوح المصدر مبني على المجتمع ، موصوف هنا.

ما هي مشكلة طي البروتين؟

البروتينات هي جزيئات كبيرة ومعقدة ضرورية للحياة كلها. تعتمد كل وظيفة يؤديها جسمنا تقريبًا - تقلص العضلات أو استشعار الضوء أو تحويل الطعام إلى طاقة - على البروتينات وكيفية تحركها وتغيرها. يعتمد ما يمكن أن يفعله أي بروتين على هيكله الفريد ثلاثي الأبعاد. على سبيل المثال ، بروتينات الجسم المضاد التي تستخدمها أجهزتنا المناعية "على شكل Y" ، وتشكل خطافات فريدة. من خلال الالتصاق بالفيروسات والبكتيريا ، تكون بروتينات الأجسام المضادة هذه قادرة على اكتشاف المرض ووسمته - مسببة الكائنات الحية الدقيقة للتخلص منها. تتشكل بروتينات الكولاجين مثل الحبال التي تنقل التوتر بين الغضاريف والأربطة والعظام والجلد. تشمل الأنواع الأخرى من البروتينات Cas9 ، والتي تستخدم تسلسل CRISPR كدليل ، وتعمل كمقص لقطع ولصق أجزاء من بروتينات الحمض النووي المضادة للتجمد ، والتي يسمح هيكلها ثلاثي الأبعاد لها بالارتباط ببلورات الجليد ومنع الكائنات الحية من التجمد والريبوزومات ، والتي تعمل مثل خط تجميع مبرمج ، يساعد على بناء البروتينات نفسها.

وصفات هذه البروتينات - تسمى الجينات - مشفرة في حمضنا النووي. قد يؤدي خطأ في الوصفة الجينية إلى بروتين مشوه ، مما قد يؤدي إلى مرض أو موت كائن حي. لذلك ، ترتبط العديد من الأمراض أساسًا بالبروتينات. لكن لمجرد أنك تعرف الوصفة الجينية للبروتين لا يعني أنك تعرف شكله تلقائيًا. تتكون البروتينات من سلاسل من الأحماض الأمينية (يشار إليها أيضًا بمخلفات الأحماض الأمينية). لكن الحمض النووي يحتوي فقط على معلومات حول تسلسل من الأحماض الأمينية - وليس كيفية طيها في الشكل. كلما زاد حجم البروتين ، زادت صعوبة نمذجة ، نظرًا لوجود تفاعلات أكثر بين الأحماض الأمينية التي يجب أخذها في الاعتبار. كما يتضح من مفارقة ليفينثال ، سيستغرق الأمر وقتًا أطول من عمر الكون المعروف لتعداد جميع التكوينات الممكنة لبروتين نموذجي بشكل عشوائي قبل الوصول إلى البنية ثلاثية الأبعاد الحقيقية - ومع ذلك فإن البروتينات نفسها تنثني تلقائيًا في غضون أجزاء من الثانية. إن توقع كيفية طي هذه السلاسل في البنية ثلاثية الأبعاد المعقدة للبروتين هو ما يُعرف باسم "مشكلة طي البروتين" - وهو تحد عمل العلماء عليه لعقود من الزمن. لقد ألهمت هذه المشكلة التي لم يتم حلها بالفعل تطورات لا حصر لها ، من تحفيز جهود IBM في الحوسبة الفائقة (BlueGene) ، إلى جهود علوم المواطنين الجديدة (Folding @ Home و FoldIt) إلى مجالات هندسية جديدة ، مثل تصميم البروتين العقلاني.

لماذا يعتبر طي البروتين مهما؟

أعتقد أننا سنكون قادرين على الحصول على فهم أكثر شمولاً لطبيعة المرض بشكل عام من خلال فحص الجزيئات التي يتكون منها جسم الإنسان ، بما في ذلك الجزيئات غير الطبيعية ، وهذا الفهم سيسمح بذلك. يجب مهاجمة مشكلة المرض بطريقة أكثر وضوحًا بحيث يتم تطوير طرق جديدة للعلاج.

لطالما اهتم العلماء بتحديد هياكل البروتينات لأن شكل البروتين يُعتقد أنه يحدد وظيفته. بمجرد فهم شكل البروتين ، يمكن تخمين دوره داخل الخلية ، ويمكن للعلماء تطوير عقاقير تعمل مع الشكل الفريد للبروتين.

على مدى العقود الخمسة الماضية ، تمكن الباحثون من تحديد أشكال البروتينات في المختبرات باستخدام تقنيات تجريبية مثل المجهر الإلكتروني بالتبريد والرنين المغناطيسي النووي وعلم البلورات بالأشعة السينية ، لكن كل طريقة تعتمد على الكثير من التجربة والخطأ ، والتي يمكن أن تأخذ سنوات من العمل ، وتكلف عشرات أو مئات الآلاف من الدولارات لكل بنية بروتينية. هذا هو السبب في أن علماء الأحياء يتجهون إلى أساليب الذكاء الاصطناعي كبديل لهذه العملية الطويلة والشاقة للبروتينات الصعبة. يمكن أن تساعد القدرة على توقع شكل البروتين بطريقة حسابية من شفرته الجينية وحدها - بدلاً من تحديده من خلال التجارب المكلفة - في تسريع البحث.

كيف يمكن للذكاء الاصطناعي أن يحدث فرقا؟

لحسن الحظ ، فإن مجال علم الجينوم غني جدًا بالبيانات بفضل الانخفاض السريع في تكلفة التسلسل الجيني. نتيجة لذلك ، أصبحت مناهج التعلم العميق لمشكلة التنبؤ التي تعتمد على البيانات الجينية شائعة بشكل متزايد في السنوات القليلة الماضية. لتحفيز البحث وقياس التقدم المحرز في أحدث الأساليب لتحسين دقة التنبؤات ، تم إنشاء مسابقة عالمية كل سنتين تسمى CASP (التقييم النقدي لتوقع بنية البروتين) في عام 1994 ، وأصبحت المعيار الذهبي لتقييم التقنيات التنبؤية. نحن مدينون لعقود من العمل السابق من قبل منظمي CASP ، بالإضافة إلى آلاف التجريبين الذين تتيح هياكلهم هذا النوع من التقييم.

أدى عمل DeepMind على هذه المشكلة إلى AlphaFold ، والذي قدمناه إلى CASP13. نحن فخورون بأن نكون جزءًا مما أسماه منظمو CASP "التقدم غير المسبوق في قدرة الأساليب الحسابية على التنبؤ بهيكل البروتين" ، حيث احتلنا المرتبة الأولى في الترتيب بين الفرق المشاركة (مشاركتنا هي A7D).

ركز فريقنا بشكل خاص على مشكلة نمذجة الأشكال المستهدفة من البداية ، دون استخدام البروتينات التي تم حلها مسبقًا كقوالب. لقد حققنا درجة عالية من الدقة عند التنبؤ بالخصائص الفيزيائية لبنية البروتين ، ثم استخدمنا طريقتين متميزتين لبناء تنبؤات بهياكل البروتين الكاملة.

استخدام الشبكات العصبية للتنبؤ بالخصائص الفيزيائية

اعتمدت كلتا الطريقتين على الشبكات العصبية العميقة المدربة على التنبؤ بخصائص البروتين من تسلسله الجيني. الخصائص التي تتنبأ بها شبكاتنا هي: (أ) المسافات بين أزواج الأحماض الأمينية و (ب) الزوايا بين الروابط الكيميائية التي تربط تلك الأحماض الأمينية. التطور الأول هو تقدم في التقنيات شائعة الاستخدام التي تقدر ما إذا كانت أزواج الأحماض الأمينية قريبة من بعضها البعض.

قمنا بتدريب شبكة عصبية للتنبؤ بتوزيع المسافات بين كل زوج من المخلفات في البروتين (كما هو موضح في الشكل 2). تم بعد ذلك دمج هذه الاحتمالات في النتيجة التي تقدر مدى دقة بنية البروتين المقترحة. قمنا أيضًا بتدريب شبكة عصبية منفصلة تستخدم جميع المسافات بشكل إجمالي لتقدير مدى قرب الهيكل المقترح من الإجابة الصحيحة.

الشكل 2: طريقتان لتصور دقة تنبؤات AlphaFold. يظهر الشكل العلوي مصفوفات المسافة لثلاثة بروتينات. يمثل سطوع كل بكسل المسافة بين الأحماض الأمينية في التسلسل الذي يشتمل على البروتين - وكلما زاد سطوع البكسل ، كان الزوج أقرب. تظهر في الصف العلوي المسافات الحقيقية المحددة تجريبياً ، وفي الصف السفلي ، متوسط ​​توزيعات المسافة المتوقعة لـ AlphaFold. الأهم من ذلك ، أنها تتطابق بشكل جيد على المستويين العالمي والمحلي. تمثل الألواح السفلية نفس المقارنة باستخدام نماذج ثلاثية الأبعاد ، تعرض تنبؤات AlphaFold (باللون الأزرق) مقابل بيانات الحقيقة الأرضية (الخضراء) لنفس البروتينات الثلاثة.

باستخدام وظائف التسجيل هذه ، تمكنا من البحث في مشهد البروتين للعثور على الهياكل التي تتوافق مع توقعاتنا. طريقتنا الأولى مبنية على تقنيات شائعة الاستخدام في علم الأحياء البنيوي ، واستبدلنا بشكل متكرر أجزاء بنية بروتينية بشظايا بروتينية جديدة. قمنا بتدريب شبكة عصبية توليدية لاختراع شظايا جديدة ، والتي تم استخدامها لتحسين درجة بنية البروتين المقترحة باستمرار.

الطريقة الثانية هي تحسين الدرجات من خلال النسب المتدرج - وهي تقنية رياضية شائعة الاستخدام في التعلم الآلي لإجراء تحسينات صغيرة وتدريجية - والتي نتج عنها هياكل عالية الدقة. تم تطبيق هذه التقنية على سلاسل البروتين بأكملها بدلاً من القطع التي يجب طيها بشكل منفصل قبل تجميعها في هيكل أكبر ، لتبسيط عملية التنبؤ.

يتوفر إصدار AlphaFold المستخدم في CASP13 على Github لأي شخص مهتم بمعرفة المزيد ، أو تكرار نتائج طي البروتين لدينا.

ماذا حدث بعد ذلك؟

بينما يسعدنا نجاح نموذج طي البروتين لدينا ، لا يزال هناك الكثير الذي يتعين القيام به في مجال بيولوجيا البروتين ، ونحن متحمسون لمواصلة جهودنا في هذا المجال. نحن ملتزمون بتأسيس طرق يمكن للذكاء الاصطناعي أن يساهم بها في الاكتشافات العلمية الأساسية ، على أمل إحداث تأثير في العالم الحقيقي. قد يعمل هذا النهج في النهاية على تحسين فهمنا للجسم وكيفية عمله ، مما يمكّن العلماء من استهداف وتصميم علاجات جديدة وفعالة للأمراض بشكل أكثر كفاءة. قام العلماء فقط بتعيين الهياكل لنحو نصف جميع البروتينات التي تصنعها الخلايا البشرية. تتضمن بعض الأمراض النادرة حدوث طفرات في جين واحد ، مما يؤدي إلى تكوين بروتين مشوه يمكن أن يكون له تأثيرات عميقة على صحة الكائن الحي بأكمله. قد تساعد أداة مثل AlphaFold الباحثين في الأمراض النادرة على توقع شكل بروتين مهم بشكل سريع واقتصادي. نظرًا لأن العلماء يكتسبون مزيدًا من المعرفة حول أشكال البروتينات وكيفية عملها من خلال المحاكاة والنماذج ، فقد تساعدنا هذه الطريقة في النهاية في المساهمة في اكتشاف الأدوية بكفاءة ، مع تقليل التكاليف المرتبطة بالتجربة أيضًا. نأمل أن يكون الذكاء الاصطناعي مفيدًا لأبحاث الأمراض ، وفي النهاية يحسن نوعية الحياة لملايين المرضى حول العالم.

لكن الفوائد المحتملة لا تقتصر على الصحة وحدها - فهم طي البروتين سيساعد في تصميم البروتين ، والذي يمكن أن يطلق عددًا هائلاً من الفوائد. على سبيل المثال ، يمكن أن تساعد التطورات في الإنزيمات القابلة للتحلل - والتي يمكن تمكينها من خلال تصميم البروتين - في إدارة الملوثات مثل البلاستيك والزيت ، مما يساعدنا على تفكيك النفايات بطرق أكثر ملاءمة لبيئتنا. في الواقع ، بدأ الباحثون بالفعل في هندسة البكتيريا لإفراز البروتينات التي تجعل النفايات قابلة للتحلل البيولوجي ، وتسهل معالجتها.

يشير نجاح غزتنا الأولى في مجال طي البروتين إلى كيف يمكن لأنظمة التعلم الآلي أن تدمج مصادر متنوعة للمعلومات لمساعدة العلماء على التوصل إلى حلول إبداعية للمشكلات المعقدة بسرعة. تمامًا كما رأينا كيف يمكن للذكاء الاصطناعي مساعدة الأشخاص على إتقان الألعاب المعقدة من خلال أنظمة مثل AlphaGo و AlphaZero ، نأمل بالمثل أن تساعد اختراقات الذكاء الاصطناعي يومًا ما كمنصة لتعزيز فهمنا للمشاكل العلمية الأساسية أيضًا.

من المثير رؤية هذه العلامات المبكرة للتقدم في طي البروتين ، مما يدل على فائدة الذكاء الاصطناعي في الاكتشاف العلمي. على الرغم من وجود الكثير من العمل الذي يتعين القيام به قبل أن نتمكن من إحداث تأثير قابل للقياس على معالجة الأمراض وإدارة النفايات وغير ذلك ، فإننا نعلم أن الإمكانات هائلة. من خلال فريق متخصص يركز على الخوض في كيفية قيام التعلم الآلي بتطوير عالم العلوم ، نتطلع إلى رؤية الطرق العديدة التي يمكن أن تحدث بها تقنيتنا فرقًا.

استمع إلى البودكاست الخاص بنا الذي يظهر الباحثين وراء هذا العمل.

تستند هذه المدونة إلى العمل التالي:

يتوفر إصدار AlphaFold المستخدم في CASP13 على Github لأي شخص مهتم بمعرفة المزيد ، أو تكرار نتائج طي البروتين لدينا.

تم إنجاز هذا العمل بالتعاون مع أندرو سينيور ، وريتشارد إيفانز ، وجون جمبر ، وجيمس كيركباتريك ، ولوران سيفر ، وتيم جرين ، وتشونغلي كين ، وأوغستين سيدك ، وساندي نيلسون ، وأليكس بريدجلاند ، وهوجو بينيدونس ، وستيج بيترسن ، وكارين سيمونيان ، وستيف كروسان ، وبوشمييت ديفيد جونز كوهلي ، ديفيد سيلفر وكوراي كافوك أوغلو وديميس هسابيس


كيف يمكن للتنبؤ بانطواء البروتين تسريع اكتشاف الأدوية؟ - مادة الاحياء

البروتينات ضرورية للحياة ، فهي تدعم عمليا جميع وظائفها. إنها جزيئات معقدة كبيرة ، تتكون من سلاسل من الأحماض الأمينية ، وما يفعله البروتين يعتمد إلى حد كبير على هيكله الفريد ثلاثي الأبعاد. يُعرف اكتشاف الأشكال التي تطوى فيها البروتينات باسم "مشكلة طي البروتين" ، وظلت تمثل تحديًا كبيرًا في علم الأحياء على مدار الخمسين عامًا الماضية. في تقدم علمي كبير ، تم الاعتراف بأحدث إصدار من نظام الذكاء الاصطناعي AlphaFold كحل لهذا التحدي الكبير من قبل منظمي التقييم النقدي الذي يُجرى كل سنتين لتوقع بنية البروتين (CASP). يوضح هذا الاختراق التأثير الذي يمكن أن يحدثه الذكاء الاصطناعي على الاكتشاف العلمي وقدرته على تسريع التقدم بشكل كبير في بعض المجالات الأساسية التي تشرح وتشكل عالمنا.

يرتبط شكل البروتين ارتباطًا وثيقًا بوظيفته ، والقدرة على التنبؤ بهذه البنية تفتح فهماً أكبر لما يفعله وكيف يعمل. ترتبط العديد من أكبر التحديات التي يواجهها العالم ، مثل تطوير علاجات للأمراض أو العثور على الإنزيمات التي تكسر النفايات الصناعية ، بشكل أساسي بالبروتينات والدور الذي تلعبه.

لقد علقنا في هذه المشكلة الوحيدة - كيف تنطوى البروتينات - منذ ما يقرب من 50 عامًا. لرؤية DeepMind ينتج حلاً لهذا ، بعد أن عملت شخصيًا على هذه المشكلة لفترة طويلة وبعد العديد من التوقفات والبدء ، أتساءل عما إذا كنا سنصل إلى هناك ، فهذه لحظة خاصة جدًا.

المؤسس المشارك ورئيس CASP ، جامعة ماريلاند

لقد كان هذا محورًا للبحث العلمي المكثف لسنوات عديدة ، باستخدام مجموعة متنوعة من التقنيات التجريبية لفحص وتحديد هياكل البروتين ، مثل الرنين المغناطيسي النووي وعلم البلورات بالأشعة السينية. تعتمد هذه التقنيات ، بالإضافة إلى الأساليب الأحدث مثل المجهر الإلكتروني بالتبريد ، على التجربة والخطأ المكثفين ، والتي يمكن أن تستغرق سنوات من العمل الشاق والمضني لكل هيكل ، وتتطلب استخدام معدات متخصصة بملايين الدولارات.

مشكلة "طي البروتين"

في خطاب قبوله لجائزة نوبل في الكيمياء عام 1972 ، افترض كريستيان أنفينسن أنه ، من الناحية النظرية ، يجب أن يحدد تسلسل الأحماض الأمينية للبروتين هيكله بالكامل. أثارت هذه الفرضية سعيًا لمدة خمسة عقود لتكون قادرًا على التنبؤ حسابيًا بالبنية ثلاثية الأبعاد للبروتين استنادًا فقط إلى تسلسل الأحماض الأمينية 1D كبديل مكمل لهذه الأساليب التجريبية باهظة الثمن وتستغرق وقتًا طويلاً. ومع ذلك ، فإن التحدي الرئيسي هو أن عدد الطرق التي يمكن أن ينثني بها البروتين نظريًا قبل الاستقرار في هيكله ثلاثي الأبعاد النهائي هو عدد فلكي. في عام 1969 ، أشار سايروس ليفينثال إلى أن الأمر سيستغرق وقتًا أطول من عمر الكون المعروف لتعداد جميع التكوينات الممكنة لبروتين نموذجي من خلال حساب القوة الغاشمة - وقدر ليفينثال 10 ^ 300 مطابقة محتملة لبروتين نموذجي. ومع ذلك ، في الطبيعة ، تنثني البروتينات تلقائيًا ، بعضها في غضون ميلي ثانية - وهو تقسيم يُشار إليه أحيانًا بمفارقة ليفينثال.

وأوضح طي البروتين

نتائج تقييم CASP14

في عام 1994 ، أسس البروفيسور جون مولت والبروفيسور كرزيستوف فيديليس CASP كتقييم أعمى كل سنتين لتحفيز البحث ، ومراقبة التقدم ، وإنشاء أحدث ما توصل إليه العلم في التنبؤ ببنية البروتين. إنه المعيار الذهبي لتقييم التقنيات التنبؤية ومجتمع عالمي فريد مبني على المسعى المشترك. بشكل حاسم ، تختار CASP الهياكل البروتينية التي تم تحديدها تجريبيًا مؤخرًا فقط (كان البعض لا يزال ينتظر التحديد في وقت التقييم) لتكون أهدافًا للفرق لاختبار طرق التنبؤ الهيكلية الخاصة بهم مقابل عدم نشرها مسبقًا. يجب أن يتنبأ المشاركون بشكل أعمى ببنية البروتينات ، وتتم مقارنة هذه التنبؤات لاحقًا بالبيانات التجريبية للحقيقة الأساسية عندما تصبح متاحة. نحن مدينون لمنظمي CASP والمجتمع بأسره ، وليس أقلهم التجريبيون الذين تتيح هياكلهم هذا النوع من التقييم الدقيق.

AlphaFold: تحقيق اختراق علمي

المقياس الرئيسي الذي تستخدمه CASP لقياس دقة التنبؤات هو اختبار المسافة العالمية (GDT) الذي يتراوح من 0-100. بعبارات بسيطة ، يمكن اعتبار GDT تقريبًا كنسبة مئوية من بقايا الأحماض الأمينية (خرزات في سلسلة البروتين) ضمن مسافة عتبة من الموضع الصحيح. وفقًا للبروفيسور مولت ، تعتبر النتيجة حوالي 90 GDT بشكل غير رسمي منافسة للنتائج التي تم الحصول عليها من الأساليب التجريبية.

في نتائج تقييم CASP الرابع عشر ، الذي تم إصداره اليوم ، حقق أحدث نظام AlphaFold لدينا متوسط ​​درجة 92.4 GDT بشكل عام عبر جميع الأهداف. هذا يعني أن تنبؤاتنا بها خطأ متوسط ​​(RMSD) يبلغ حوالي 1.6 أنجستروم ، وهو ما يمكن مقارنته بعرض الذرة (أو 0.1 نانومتر). حتى بالنسبة لأصعب أهداف البروتين ، تلك الموجودة في فئة النمذجة الحرة الأكثر تحديًا ، يحقق AlphaFold متوسط ​​درجة 87.0 GDT (البيانات متوفرة هنا).

تحسينات في متوسط ​​دقة التنبؤات في فئة النمذجة المجانية لأفضل فريق في كل CASP ، والتي تم قياسها على أنها أفضل 5 GDT.

مثالان على أهداف البروتين في فئة النمذجة المجانية. تتنبأ AlphaFold بهياكل عالية الدقة يتم قياسها مقابل النتيجة التجريبية.

تفتح هذه النتائج المثيرة إمكانية استخدام علماء الأحياء للتنبؤ بالهيكل الحسابي كأداة أساسية في البحث العلمي. قد تكون طرقنا مفيدة بشكل خاص لفئات مهمة من البروتينات ، مثل بروتينات الغشاء ، التي يصعب جدًا بلورتها وبالتالي يصعب تحديدها تجريبيًا.

يمثل هذا العمل الحسابي تقدمًا مذهلاً في مشكلة طي البروتين ، وهي تحدي كبير عمره 50 عامًا في علم الأحياء. لقد حدث قبل عقود من توقع كثير من الناس في هذا المجال. سيكون من المثير رؤية الطرق العديدة التي سيغير بها البحث البيولوجي بشكل أساسي.

البروفيسور فينكي راماكريشنان

الحائز على جائزة نوبل ورئيس الجمعية الملكية

نهجنا في مشكلة طي البروتين

دخلنا لأول مرة CASP13 في عام 2018 بإصدارنا الأولي من AlphaFold ، والذي حقق أعلى دقة بين المشاركين. بعد ذلك ، نشرنا ورقة بحثية عن أساليب CASP13 الخاصة بنا في Nature مع الكود المرتبط بها ، والتي استمرت في إلهام أعمال أخرى وتطبيقات مفتوحة المصدر طورها المجتمع. الآن ، أحدثت هياكل التعلم العميق الجديدة التي طورناها تغييرات في أساليبنا في CASP14 ، مما مكننا من تحقيق مستويات لا مثيل لها من الدقة. هذه الأساليب مستوحاة من مجالات البيولوجيا والفيزياء والتعلم الآلي ، وكذلك بالطبع عمل العديد من العلماء في مجال طي البروتين على مدى نصف القرن الماضي.

يمكن اعتبار البروتين المطوي على أنه "رسم بياني مكاني" ، حيث تكون البقايا هي العقد والحواف التي تربط المخلفات على مسافة قريبة. هذا الرسم البياني مهم لفهم التفاعلات الفيزيائية داخل البروتينات ، بالإضافة إلى تاريخها التطوري. بالنسبة إلى أحدث إصدار من AlphaFold ، المستخدم في CASP14 ، أنشأنا نظام شبكة عصبية قائم على الانتباه ، ومدرب من البداية إلى النهاية ، والذي يحاول تفسير بنية هذا الرسم البياني ، مع التفكير في الرسم البياني الضمني الذي يقوم ببنائه. يستخدم التسلسلات ذات الصلة التطورية ، ومحاذاة التسلسل المتعدد (MSA) ، وتمثيل أزواج بقايا الأحماض الأمينية لتحسين هذا الرسم البياني.

من خلال تكرار هذه العملية ، يطور النظام تنبؤات قوية للبنية الفيزيائية الأساسية للبروتين ويكون قادرًا على تحديد الهياكل عالية الدقة في غضون أيام. بالإضافة إلى ذلك ، يمكن لـ AlphaFold التنبؤ بأجزاء كل بنية بروتينية متوقعة يمكن الاعتماد عليها باستخدام مقياس ثقة داخلي.

قمنا بتدريب هذا النظام على البيانات المتاحة للجمهور والتي تتكون من

170000 بنية بروتينية من بنك بيانات البروتين مع قواعد بيانات كبيرة تحتوي على تسلسلات بروتينية ذات بنية غير معروفة. يستخدم ما يقرب من 16 TPUv3s (وهو 128 نواة TPUv3 أو ما يعادله تقريبًا

100-200 وحدة معالجة رسومات (GPU) على مدار بضعة أسابيع ، وهي كمية متواضعة نسبيًا من الحوسبة في سياق معظم النماذج الكبيرة الحديثة المستخدمة في التعلم الآلي اليوم. كما هو الحال مع نظام CASP13 AlphaFold الخاص بنا ، نقوم بإعداد ورقة عن نظامنا لتقديمها إلى مجلة تمت مراجعتها من قبل الزملاء في الوقت المناسب.

نظرة عامة على بنية نموذج الشبكة العصبية الرئيسية. يعمل النموذج على متواليات البروتين المرتبطة تطوريًا وكذلك أزواج بقايا الأحماض الأمينية ، ويمرر المعلومات بشكل متكرر بين كلا التمثيلين لتوليد بنية.

إمكانية التأثير في العالم الحقيقي

عندما بدأت DeepMind قبل عقد من الزمن ، كنا نأمل أن تساعد اختراقات الذكاء الاصطناعي يومًا ما كمنصة لتعزيز فهمنا للمشاكل العلمية الأساسية. الآن ، بعد 4 سنوات من الجهد في بناء AlphaFold ، بدأنا في رؤية هذه الرؤية تتحقق ، مع آثارها على مجالات مثل تصميم الأدوية والاستدامة البيئية.

أخبرنا البروفيسور أندريه لوباس ، مدير معهد ماكس بلانك لبيولوجيا التنمية ومقيِّم CASP ، أن "نماذج AlphaFold الدقيقة بشكل مذهل سمحت لنا بحل بنية البروتين التي كنا عالقين فيها لما يقرب من عقد من الزمان ، وإعادة إطلاق جهودنا من أجل فهم كيفية انتقال الإشارات عبر أغشية الخلايا. "

نحن متفائلون بشأن التأثير الذي يمكن أن يحدثه AlphaFold على البحث البيولوجي والعالم الأوسع ، ومتحمسون للتعاون مع الآخرين لمعرفة المزيد عن إمكاناته في السنوات المقبلة. إلى جانب العمل على ورقة تمت مراجعتها من قبل الزملاء ، فإننا نستكشف أفضل السبل لتوفير وصول أوسع إلى النظام بطريقة قابلة للتطوير.

في غضون ذلك ، ندرس أيضًا كيف يمكن لتنبؤات بنية البروتين أن تساهم في فهمنا لأمراض معينة مع عدد صغير من المجموعات المتخصصة ، على سبيل المثال من خلال المساعدة في تحديد البروتينات التي تعرضت لخلل وفي التفكير في كيفية تفاعلها. يمكن أن تتيح هذه الأفكار عملًا أكثر دقة في تطوير الأدوية ، واستكمال الأساليب التجريبية الحالية لإيجاد علاجات واعدة بشكل أسرع.

يعتبر AlphaFold تقدمًا يحدث مرة واحدة في جيل ، حيث يتنبأ بهياكل البروتين بسرعة ودقة لا تصدق. توضح هذه القفزة إلى الأمام كيف تستعد الأساليب الحسابية لتحويل البحث في علم الأحياء وتبشر بالكثير لتسريع عملية اكتشاف الدواء.

دكتوراه ، مؤسس ومدير تنفيذي ، Calico ، رئيس مجلس إدارة سابق ومدير تنفيذي ، Genentech

لقد رأينا أيضًا علامات تشير إلى أن التنبؤ ببنية البروتين يمكن أن يكون مفيدًا في جهود الاستجابة للوباء في المستقبل ، كأحد الأدوات العديدة التي طورها المجتمع العلمي. في وقت سابق من هذا العام ، توقعنا العديد من الهياكل البروتينية لفيروس SARS-CoV-2 ، بما في ذلك ORF3a ، التي لم تكن هياكلها معروفة من قبل. في CASP14 ، توقعنا بنية بروتين فيروس كورونا آخر ، ORF8. لقد أكد العمل السريع المثير للإعجاب من قبل التجريبيين الآن هياكل كل من ORF3a و ORF8. على الرغم من طبيعتها الصعبة ووجود عدد قليل جدًا من التسلسلات ذات الصلة ، فقد حققنا درجة عالية من الدقة في كل من تنبؤاتنا عند مقارنتها بهياكلها المحددة تجريبياً.

بالإضافة إلى تسريع فهم الأمراض المعروفة ، نحن متحمسون لإمكانية هذه التقنيات لاستكشاف مئات الملايين من البروتينات التي لا نملك نماذج لها حاليًا - تضاريس شاسعة من البيولوجيا غير المعروفة. نظرًا لأن الحمض النووي يحدد تسلسل الأحماض الأمينية التي تشتمل على هياكل البروتين ، فقد أتاحت ثورة الجينوميات قراءة تسلسلات البروتين من العالم الطبيعي على نطاق واسع - مع 180 مليون تسلسل بروتيني والعدد في قاعدة بيانات البروتين العالمي (UniProt). في المقابل ، نظرًا للعمل التجريبي اللازم للانتقال من تسلسل إلى هيكل ، يوجد حوالي 170000 بنية بروتينية فقط في بنك بيانات البروتين (PDB). من بين البروتينات غير المحددة ، قد يكون لبعض البروتينات وظائف جديدة ومثيرة - وكما يساعدنا التلسكوب على رؤية أعمق في الكون المجهول - فقد تساعدنا تقنيات مثل AlphaFold في العثور عليها.

فتح آفاق جديدة

يعد AlphaFold أحد أهم التطورات التي حققناها حتى الآن ، ولكن ، كما هو الحال مع جميع الأبحاث العلمية ، لا يزال هناك العديد من الأسئلة للإجابة عليها. لن تكون كل بنية نتوقعها مثالية. لا يزال هناك الكثير لنتعلمه ، بما في ذلك كيفية تكوين البروتينات المتعددة للمركبات ، وكيفية تفاعلها مع الحمض النووي ، أو الحمض النووي الريبي ، أو الجزيئات الصغيرة ، وكيف يمكننا تحديد الموقع الدقيق لجميع السلاسل الجانبية للأحماض الأمينية. بالتعاون مع الآخرين ، هناك أيضًا الكثير لتتعلمه حول أفضل السبل لاستخدام هذه الاكتشافات العلمية في تطوير الأدوية الجديدة وطرق إدارة البيئة والمزيد.

بالنسبة لنا جميعًا الذين يعملون على أساليب التعلم الحاسوبي والآلي في العلوم ، تُظهر أنظمة مثل AlphaFold الإمكانات المذهلة للذكاء الاصطناعي كأداة للمساعدة في الاكتشاف الأساسي. مثلما وضع Anfinsen قبل 50 عامًا تحديًا بعيدًا عن متناول العلم في ذلك الوقت ، هناك العديد من جوانب كوننا التي لا تزال غير معروفة. يمنحنا التقدم الذي تم الإعلان عنه اليوم مزيدًا من الثقة في أن الذكاء الاصطناعي سيصبح أحد أكثر الأدوات المفيدة للبشرية في توسيع حدود المعرفة العلمية ، ونحن نتطلع إلى سنوات عديدة من العمل الجاد والاكتشاف في المستقبل!

إلى أن ننشر بحثًا عن هذا العمل ، يُرجى الاستشهاد بما يلي:

تنبؤ عالي الدقة ببنية البروتين باستخدام التعلم العميق

جون جامبر ، ريتشارد إيفانز ، ألكسندر بريتزل ، تيم جرين ، مايكل فيغورنوف ، كاثرين تونياوفوناكول ، أولاف رونبيرجر ، روس بيتس ، أوغستين سيدك ، أليكس بريدجلاند ، كليمنس ماير ، سيمون إيه إيه كول ، آنا بوتابينكو ، أندرو جيه بالارد ، أندرو كاوي ، برناردينو روميرا- باريديس ، ستانيسلاف نيكولوف ، ريشوب جاين ، جوناس أدلر ، تريفور باك ، ستيج بيترسن ، ديفيد ريمان ، مارتن شتاينجر ، ميشالينا باتشولسكا ، ديفيد سيلفر ، أوريول فينيلز ، أندرو دبليو سينيور ، كوراي كافوك أوغلو ، بوشميت كوهلي ، ديميس هاسابيس.

في التقييم النقدي الرابع عشر لتقنيات التنبؤ ببنية البروتين (كتاب مختصر) ، 30 نوفمبر - 4 ديسمبر 2020. تم الاسترجاع من هنا.


تصور الانتباه

لقد تصورنا طبقات الانتباه لنموذج BERT لذراع الترابط. توقعنا من طبقات الانتباه أن تؤكد وتسليط الضوء على الأجزاء المسؤولة عن الارتباط في كل من الروابط والمستقبلات. كما ذكرنا أعلاه ، يتم تمثيل الانتباه داخل بنية BERT من خلال 6 طبقات مع 12 مصفوفة من الأوزان ، كل منها مسؤول عن إبراز مناطق مختلفة من الجزيء. لقد جربنا طريقتين للتحويل من مصفوفة إلى متجه من أجل تعيين الأوزان على متجه تمثيل السلسلة: الطريقة الأولى تأخذ الصف الأول من أوزان المصفوفة فقط ، بينما تأخذ المتوسطات الأخرى فوق الأعمدة.

ومع ذلك ، فقد انتشر تركيز الانتباه في كلتا الطريقتين عبر الجزيئات بدلاً من مواقع معينة. نوضحها بأحد الأمثلة في الشكل أدناه.

في الرسم الأيسر ، نعرض موقعًا نشطًا للثرومبين البشري (المستقبل ، كما هو موضح على شكل سطح برتقالي) ولجند مرتبط (العصي الزرقاء) كما هو مأخوذ من بنك بيانات البروتين (http://www.rcsb.org/) الأشكال البيضاوية الخضراء ضع علامة على المجموعات المتفاعلة بالفعل. يُظهر المخطط الأيمن إسقاطًا مستويًا للرابط: مرة أخرى ترسم الأشكال البيضاوية الخضراء المجموعات المتفاعلة ، بينما تشير البقع الحمراء والخضراء إلى الأجزاء الجزيئية التي يفترض الانتباه أنها مسؤولة عن ارتباط اللجند بالمستقبل. يمكن للمرء أن يرى أن الاهتمام ينتشر إلى ما وراء المجموعات المتفاعلة ، مما قد يُظهر أن الارتباط يعتمد في الواقع على هيكل كامل لهيكل بدلاً من أن يُنسب إلى مواقع معينة.


& ldquo لحظة خاصة جدًا "

تتكون الخلايا الحية من بلايين من البروتينات المختلفة ، ولكل منها شكل ثلاثي الأبعاد معقد يحدد ما يفعله وكيف يعمل.

تم اكتشاف أكثر من 200 مليون بروتين ، ويستمر العدد في الارتفاع. But we only know the exact shape of only a few hundred thousand.

Each protein is a string made up 20 amino acids, arranged in different orders. Their interactions with each other make the protein fold, with scientist Cyrus Levinthal estimating in 1969 that there were some 10^300 possible conformations for a typical protein.

A major goal of computational biologists has therefore been to work out how to predict a protein's shape just from looking at a string of amino acids.

Using brute force computing is essentially impossible, given the astronomical number of configurations, so scientists have increasingly looked to artificial intelligence as a way to achieve this goal.

Enter AlphaFold. Trained on the sequences and structures of about

170,000 proteins mapped out by the RCSB Protein Data Bank and other protein databases, it can accurately predict the shape of proteins simply from their sequence of amino acids. The system was trained on 128 TPUv3 cores for the duration of a "few weeks."

This month, AlphaFold defeated around 100 teams in a protein-structure prediction challenge called Critical Assessment for Structure Prediction (CASP), set up 25 years ago to encourage research in the field.

"We have been stuck on this one problem &ndash how do proteins fold up &ndash for nearly 50 years," CASP co-founder and chair Professor John Moult said.

"To see DeepMind produce a solution for this, having worked personally on this problem for so long and after so many stops and starts, wondering if we&rsquod ever get there, is a very special moment."

CASP uses a metric called the Global Distance Test (GDT) which measures how accurate protein folding predictions are when compared to the correct position, out of a score of 100.

A score of 90 GDT has long been considered to be the benchmark to beat, as it is similar to what can be obtained from experimental lab methods (something which can take months or years, expensive equipment, and still fail). In the latest CASP assessment, AlphaFold achieved a median score of 92.4 GDT across all targets &ndash an average error of about the width of an atom.

For the hardest protein targets, it had a median score of 87.0 GDT.

"This computational work represents a stunning advance on the protein-folding problem, a 50-year-old grand challenge in biology," said Nobel laureate and President of the Royal Society, Professor Venki Ramakrishnan.

"It has occurred decades before many people in the field would have predicted. It will be exciting to see the many ways in which it will fundamentally change biological research.&rdquo

The hope is that the breakthrough will allow scientists to understand how proteins work, making drug development easier, and potentially setting humanity on a path towards being able to develop enzymes that can eat plastic, or absorb carbon.

Significant work is still required, particularly on how proteins combine to form complexes, and how they react with RNA, DNA, and small molecules.

"AlphaFold is a once in a generation advance, predicting protein structures with incredible speed and precision," said Arthur Levinson, former CEO of Genentech and current CEO of Alphabet's Calico. "This leap forward demonstrates how computational methods are poised to transform research in biology and hold much promise for accelerating the drug discovery process.&rdquo

DeepMind plans to publish a paper detailing AlphaFold's achievement, but it was coy on whether it would release the algorithm itself.

&ldquoWe&rsquore right at the beginning of exploring how best to enable other groups to use our structure predictions,&rdquo the company said.


قبل الميلادBetweenness Centrality
H3AfricaHuman Heredity and Health in Africa
HTSHigh Throughput Sequencing
HUMAHuman Mutation Analysis web server
إلShortest path
PRIMOProtein Interactive Modeling web server
RINResidue Interaction Network
RMSDRoot Mean Square Deviation
RMSFRoot Mean Square Fluctuation
VAPORVariant Analysis Portal

إخلاء مسؤولية الناشر: هذا ملف PDF لمخطوطة غير محررة تم قبولها للنشر. كخدمة لعملائنا ، نقدم هذه النسخة المبكرة من المخطوطة. ستخضع المخطوطة للتدقيق والتنضيد ومراجعة الإثبات الناتج قبل نشرها في شكلها النهائي القابل للاستدلال عليه. يرجى ملاحظة أنه قد يتم اكتشاف أخطاء أثناء عملية الإنتاج والتي قد تؤثر على المحتوى ، وجميع إخلاء المسؤولية القانونية التي تنطبق على المجلة مرتبطة.


How Do Proteins Fold? Levinthal’s Paradox and the Protein Folding Problem

Now we know that the form of a protein is tightly related to its function. Knowledge of protein’s 3D structure is a huge hint for understanding how the protein works, and use that information for different purposes control or modify protein’s function, predict what molecules bind to that protein and understand various biological interactions, assist drug discovery or even design our own proteins.

Yet, one of the biggest challenges of biology has been to accurately predict the 3D native structure of the protein from only its 1D sequence of amino acidic residues. Why is this a big problem?

The protein folding problem is stated in Levinthal’s paradox:

“Finding the native folded state of a protein by a random search among all possible configurations can take an enormously long time. Yet proteins can fold in seconds or less.”

From a general physicochemical point of view, how can proteins adopt their unique 3D native structure -a global free energy minimum form- in a biologically reasonable time without exhaustive enumeration of all possible conformations? This is under the assumption that proteins should randomly search configurations until the native form is reached.

Levinthal believed that proteins must solve the problem by folding through predetermined pathways.


Future promises

Well this is just a first step into the biological scientific discovery, a lot more work needed to be done to successfully predict the exact protein structure. Which will change the whole biological history, making us able to have a quantifiable impact on treating diseases, managing the environment, and more.

This article is written on the basis of research by DeepMind’s scientist. Below is research paper published by DeepMind’s team. (Cited).

De novo structure prediction with deep-learning based scoring
R.Evans, J.Jumper, J.Kirkpatrick, L.Sifre, T.F.G.Green, C.Qin, A.Zidek, A.Nelson, A.Bridgland, H.Penedones, S.Petersen, K.Simonyan, S.Crossan, D.T.Jones, D.Silver, K.Kavukcuoglu, D.Hassabis, A.W.Senior
In Thirteenth Critical Assessment of Techniques for Protein Structure Prediction (Abstracts) 1–4 December 2018.


شاهد الفيديو: Medaxes - Generieke geneesmiddelen (قد 2022).