معلومة

لماذا ينقص الحجم عبر تسلسل الكروموسومات البشرية؟

لماذا ينقص الحجم عبر تسلسل الكروموسومات البشرية؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

يوضح الرسم البياني التالي انخفاضًا في عدد الأزواج الأساسية لكل كروموسوم عبر المجموعة المتسلسلة من الكروموسومات البشرية:

هل هذا بسبب ترقيم الكروموسومات في الأصل حسب حجمها على النمط النووي؟


لقد فعلتها!

التسمية

الكروموسومات الجسدية

يتم ترقيم الكروموسومات بناءً على حجمها (في أزواج أساسية).

الكروموسومات الجنسية

يتم تعريف الكروموسومات الجنسية (عند وجودها) على أنها أكبر عدد بغض النظر عن طولها. لاحظ أن تعريف الكروموسوم الجنسي قد يكون أحيانًا مزعجًا بعض الشيء (انظر هذا الكتاب).

استثناءات

يحدث أحيانًا أن يكون التقريب الأول لطول الكروموسوم غير دقيق وبالتالي يتم ترقيم الكروموسومات بشكل خاطئ. في مثل هذه الحالة ، عندما ندرك الخطأ ، نستمر في ترقيم الكروموسومات بالطريقة نفسها التي فعلناها من قبل حتى لو لم تتبع المصطلحات القياسية! هذا ، على سبيل المثال ، حالة الكروموسومات 19 و 20 بوصة الانسان العاقل كما ترون على باربلوت الخاص بك. الكروموسوم 20 هو في الواقع أطول قليلاً (بحوالي 4.5 ميجا بايت) من الكروموسوم 19. وهناك العديد من أنواع الاستثناءات الأخرى أيضًا. بفضلDexter مشيرًا إلى أنه يعلق على ذلك بتنسيق ذبابة الفاكهة سوداء البطن (كائن نموذجي) يتم ترقيم كروموسوم الجنس قبل الجسيمات الذاتية (جسمية = كروموسوم غير جنسي).


رسم خرائط الكروموسوم 21

شكلت مجلة Nature سابقة مهمة لعالم الويب مؤخرًا ، حيث نشرت مقالة عبر الإنترنت قبل 10 أيام من ظهورها المقرر في 18 مايو. قرارهم ، بالطبع ، يتوقف على أهمية الورقة. في ذلك ، يكشف اتحاد العلماء الدولي عن التسلسل الكامل للكروموسوم 21 ، وهو الأصغر بين جميع الكروموسومات البشرية الـ 24. وما وجدوه - ندرة غير متوقعة في الجينات في 21 - يلمح إلى أن العدد الإجمالي للجينات البشرية قد تم المبالغة فيه على الأرجح.

كان من المتوقع أن يكون الكروموسوم 21 ، الذي يمثل حوالي 1 في المائة من الجينوم بأكمله ، فقيرًا في الجينات ، ولكن ليس فقيرًا كما يبدو الآن. في الواقع ، خمن مشروع Unigene أن 21 ستتحمل 80٪ فقط من عدد الجينات التي قد يتوقعها المرء لكروموسوم بحجمه. لذلك إذا كان العدد الإجمالي للجينات البشرية المتوقعة حوالي 100،000 ، فإن التنبؤ كان أن 21 سيحتوي على 800 إلى 1،000 جين ، أو 80٪ من 1٪ من الجينوم.

لكن في الواقع ، وجد اتحاد الكروموسوم 21 - الذي شمل باحثين من اليابان وألمانيا وفرنسا وسويسرا وإنجلترا والولايات المتحدة - 225 جينًا فقط. هذا رقم صغير ليس فقط من حيث ما تم توقعه ، ولكن أيضًا مقارنة بالكروموسوم الآخر المتسلسل تمامًا حتى الآن ، 22 ، والذي يحتوي على 545 جينًا وهو مشابه في الحجم. يعتبر الكروموسوم 22 "غنيًا بالجينات" ، لكن المعلومات الجديدة لا تزال تجعل الباحثين يراجعون توقعاتهم حول الجينوم نفسه.

كتب مؤلفو الورقة البحثية أن "هذين الكروموسومين معًا يمثلان حوالي 2٪ من الجينوم البشري ويحتويان معًا على 770 جينًا. وبافتراض أن كلا الكروموسومين مجتمعين يعكسان متوسط ​​المحتوى الجيني للجينوم ، فإننا نقدر أن العدد الإجمالي للجينات البشرية قد يقترب من 40.000 ".

على الرغم من قلة عدد الجينات في الكروموسوم 21 ، لم يكن من السهل فك تشابك كرة الحمض النووي ، وبذلك ، حقق الاتحاد العديد من التطورات التقنية. تبدو جميع الكروموسومات مثل X ، ولها أذرع قصيرة وطويلة من الحمض النووي ، وتتألف من ملايين الأزواج القاعدية. أبلغت المجموعة عن تسلسل يغطي 99.7 في المائة من الذراع الطويلة للكروموسوم 21 ، أو 33.55 مليون زوج أساسي. وضمن هذا التسلسل يوجد امتداد غير متقطع لـ 28.5 مليون زوج قاعدي - أطول تسلسل DNA مستمر معروف حتى الآن.

تصف الورقة أيضًا تسلسلًا من 281000 زوج أساسي على الذراع القصيرة للكروموسوم 21 ، والتي كان من الصعب تعيينها واستنساخها لأنها تحتوي على عدد من المتواليات شديدة التكرار (انظر الشكل في اليسار). يختلف طول هذا الذراع القصير اختلافًا كبيرًا بين الأفراد ، وبالتالي فإن هذا التسلسل يمثل المثال الأول لجزء كبير من الجينوم الذي يمكن أن يتوسع أو ينكمش بشكل كبير.

قد يكون اكتشاف المزيد من التفاصيل حول ما تفعله الجينات الموجودة على الكروموسوم 21 بمثابة نعمة للباحثين الطبيين. تلعب الطفرات في 14 جينًا معروفًا على الكروموسوم 21 دورًا في أحد أشكال مرض الزهايمر والتصلب الجانبي الضموري والصرع العضلي التدريجي ، من بين أمراض أخرى. يوجد أيضًا على الكروموسوم 21 جينات لم يتم التعرف عليها بعد ، ولكن من المعروف أنها مسؤولة عن خمسة ما يسمى الاضطرابات أحادية الجين ، بما في ذلك شكلين من الصمم ومتلازمات أوشر ونوبلوخ.

ولعل الأهم من ذلك ، وجود نسخة ثالثة من الكروموسوم 21 ، أو التثلث الصبغي 21 ، ينتج عنه متلازمة داون ، التي تصيب ما يصل إلى واحد من كل 700 ولادة وهي السبب الأكثر شيوعًا للتخلف العقلي. هذا محتمل لأن الكروموسوم 21 يحتوي على عدد قليل جدًا من الجينات بحيث أن التثلث الصبغي 21 ، على عكس العديد من الاضطرابات الصبغية الأخرى ، ليس قاتلاً قبل الولادة ، أو حتى في سن مبكرة. ومع ذلك ، ترتبط متلازمة داون بأكثر من 80 مشكلة جسدية وعقلية ، بما في ذلك أمراض القلب الخلقية ، وزيادة خطر الإصابة ببعض أنواع اللوكيميا ، ونقص المناعة.

تحمل الورقة أخبارًا جيدة للعلماء الذين يأملون في تحديد الجينات الموجودة على الكروموسوم 21 التي تكمن وراء المضاعفات المتنوعة لمتلازمة داون: تشترك مناطق الكروموسوم البشري 21 في الكثير من القواسم المشتركة مع العديد من مناطق كروموسومات الفئران 10 و 16 و 17 - وهي مناطق تسمى المخلوقات المحفوظة عبر الأنواع. تعني هذه الدرجة العالية من الحفظ أنه يمكن للعلماء البدء في استخدام خرائط الماوس للإرشاد. قد لا تظهر طرق أفضل للتعامل مع متلازمة داون على الفور ، لكنها بداية.


الاتحاد الدولي لتسلسل الجينوم البشري يعلن عن "مسودة عمل" للجينوم البشري

أعلن الاتحاد العام لمشروع الجينوم البشري اليوم أنه قد جمع مسودة عمل لتسلسل الجينوم البشري و [مدش] المخطط الجيني للإنسان. تضمن هذا المعلم الرئيسي مهمتين: وضع أجزاء كبيرة من الحمض النووي بالترتيب الصحيح لتغطية جميع الكروموسومات البشرية ، وتحديد تسلسل الحمض النووي لهذه الأجزاء.

يتكون التجميع الذي تم الإبلاغ عنه اليوم من أجزاء متداخلة تغطي 97 بالمائة من الجينوم البشري ، والتي تم بالفعل تجميع تسلسل منها لما يقرب من 85 بالمائة من الجينوم. تم ربط التسلسل معًا في سلسلة من As و Ts و Cs و Gs مرتبة على طول الكروموسومات البشرية.

ارتفع إنتاج تسلسل الجينوم بشكل كبير خلال العام الماضي ، حيث تم إنتاج أكثر من 60 في المائة من التسلسل في الأشهر الستة الماضية وحدها. خلال هذا الوقت ، كان الكونسورتيوم ينتج 1000 قاعدة في الثانية من التسلسل الخام و [مدش] 7 أيام في الأسبوع ، 24 ساعة في اليوم.

متوسط ​​جودة & ldquoworking Draft & rdquo يتجاوز بكثير التوقعات الأصلية للكونسورتيوم و rsquos لهذا المنتج الوسيط.

أنتجت مراكز الاتحاد بيانات تسلسل أكثر بكثير مما كان متوقعًا (أكثر من 22.1 مليار قاعدة من بيانات التسلسل الأولي ، والتي تضم أجزاء متداخلة يبلغ مجموعها 3.9 مليار قاعدة وتوفر تغطية تسلسلية 7 أضعاف للجينوم البشري).

ونتيجة لذلك ، فإن مشروع & ldquoworking & rdquo أقرب كثيرًا إلى الشكل النهائي & ldquofinished & rdquo مما يتوقعه الاتحاد في هذه المرحلة. ما يقرب من 50 في المائة من تسلسل الجينوم في شكل شبه منتهي & rdquo أو أفضل ، و 24 في المائة منه في شكل كامل & ldquofinished & rdquo. عبر الجينوم ، يكمن متوسط ​​مقطع الحمض النووي في تسلسل مستمر بلا فجوة & ldquocontig & rdquo من 200000 قاعدة. متوسط ​​دقة كل تسلسل الحمض النووي في هذا التجميع هو 99.9 بالمائة.

تم الإفراج عن تسلسل المعلومات من المشروع العام بشكل مستمر وفوري وبحري للعالم ، دون قيود على استخدامه أو إعادة توزيعه. يتم فحص المعلومات يوميًا من قبل العلماء في الأوساط الأكاديمية والصناعية ، وكذلك من قبل شركات قواعد البيانات التجارية التي تقدم خدمات المعلومات لخبراء التكنولوجيا الحيوية.

بالفعل ، تم التعرف على عشرات الآلاف من الجينات من تسلسل الجينوم. يُظهر تحليل التسلسل الحالي 38000 جينة متوقعة تم تأكيدها من خلال الأدلة التجريبية. هناك عدة آلاف من تنبؤات الجينات الإضافية التي يجب اختبارها تجريبيًا. تم تحديد العشرات من الجينات المرضية من خلال الوصول إلى مسودة العمل.

أهداف الاتحاد. كان هدف الكونسورتيوم لربيع عام 2000 هو إنتاج مسودة & ldquoworking & rdquo للتسلسل البشري ، وهي مجموعة تحتوي على أجزاء متداخلة تغطي ما يقرب من 90٪ من الجينوم والتي يتم تسلسلها في شكل & ldquoworking & rdquo ، أي مع بعض الثغرات والغموض. الهدف النهائي من كونسورتيوم و rsquos هو إنتاج تسلسل كامل & ldquofinished & rdquo ، أي واحد بدون فجوات ودقة 99.99 في المائة. كان التاريخ المستهدف لهذا الهدف النهائي هو 2003 ، ولكن نتائج اليوم & rsquos تعني أنه من المحتمل أن يتم إنتاج التسلسل النهائي الذي يتم اختباره في اختبار الزمن قبل ذلك الجدول الزمني بشكل كبير.

النهج التكميلية. في إعلان ذي صلة ، أعلنت شركة Celera Genomics اليوم أنها أكملت أول تجميع خاص بها لتسلسل الحمض النووي للجينوم البشري.

تستخدم المشاريع العامة والخاصة تقنية الأتمتة والتسلسل المتشابهة ، لكن أساليب مختلفة لتسلسل الجينوم البشري. يستخدم المشروع العام أسلوب & lsquohierarchical gungun & rsquo حيث تتعرض شظايا الحمض النووي الكبيرة الفردية ذات الموقع المعروف لتسلسل البندقية (أي تمزيقها إلى أجزاء صغيرة يتم تسلسلها ، ثم إعادة تجميعها على أساس تداخل التسلسل).

يستخدم مشروع Celera نهج & ldquowhole genome shotgun & rdquo ، حيث يتم تقطيع الجينوم بأكمله إلى أجزاء صغيرة يتم تسلسلها وإعادة تجميعها معًا على أساس تداخل التسلسل.

تتميز طريقة البندقية الهرمية بميزة أن الموقع العالمي لكل تسلسل فردي معروف على وجه اليقين ، ولكنه يتطلب إنشاء خريطة لشظايا كبيرة تغطي الجينوم. لا تتطلب طريقة البندقية بأكملها هذه الخطوة ، ولكنها تقدم تحديات أخرى في مرحلة التجميع.

كلا النهجين يحاذيان التسلسل على طول الكروموسومات البشرية باستخدام المعالم الموجودة في الخريطة المادية التي أنتجها مشروع الجينوم البشري.

"النهجان متكاملان تمامًا. المشروع العام وخطة Celera لمناقشة المزايا العلمية النسبية للطرق التي يستخدمها المشروعان. في النهاية ، قد يكون أفضل نهج هو استخدام مجموعة من الطرق لتسلسل الجينوم في المستقبل قال فرانسيس كولينز ، دكتوراه في الطب ، دكتوراه ، مدير المعهد القومي لبحوث الجينوم البشري في المعاهد الوطنية للصحة. في الواقع ، الخطط الحالية للمشروع العام لتسلسل جينوم فأر المختبر تتضمن هذه الإستراتيجية الهجينة.

الطور التالي. سيركز مشروع الجينوم البشري الآن على تحويل مسودة & ldquoworking & rdquo والتسلسلات القريبة من & ldquofinished & rdquo إلى شكل & ldquofinished & rdquo. سيتم ذلك عن طريق ملء الفجوات في تسلسل & ldquoworking & rdquo وزيادة دقة التسلسل الإجمالية إلى 99.99 بالمائة. على الرغم من أن مسودة & ldquoworking & rdquo مفيدة لمعظم الأبحاث الطبية الحيوية ، إلا أن التسلسل الدقيق للغاية الذي يقترب من الكمال قدر الإمكان أمر بالغ الأهمية للحصول على جميع المعلومات التي يمكن الحصول عليها من بيانات التسلسل البشري. وقد تم تحقيق ذلك بالفعل بالنسبة للكروموسومات 21 و 22 ، وكذلك بالنسبة لـ 24٪ من الجينوم بأكمله.

اختلاف الحمض النووي البشري. أنتج إنتاج التسلسل الأكبر من المتوقع أيضًا محصولًا وفيرًا من الاختلافات الجينية البشرية - تسمى تعدد أشكال النوكليوتيدات المفردة أو SNPs. وضع مشروع الجينوم البشري هدفًا لاكتشاف 100000 تعدد الأشكال بحلول عام 2003. وبالفعل ، مع التسلسلات المجمعة اليوم و rsquos والبيانات الأخرى التي جمعتها The SNP Consortium ، وجد العلماء الآن أكثر من 300000 SNP ومن المحتمل أن يكون لديهم مليون SNPs بحلول نهاية العام. توفر هذه النيوكلوتايد أداة قوية لدراسات الأمراض البشرية والتاريخ البشري.

التسلسل ، الذي يحدد الترتيب الدقيق للـ DNA و rsquos الأربعة قواعد كيميائية ، والمختصرة عادة A و T و C و G ، تم تسريعها في مشروع الجينوم البشري من خلال التقدم التكنولوجي في فك تشفير الحمض النووي والطبيعة التعاونية للجهد ، والتي تشمل حوالي 1000 العلماء في جميع أنحاء العالم يعملون معًا بشكل فعال.

يهدف مشروع تسلسل الجينوم البشري إلى تحديد تسلسل الجزء المتماثل اللون من الجينوم البشري. يستثني الجزء المتساوي اللون مناطق معينة تتكون من امتدادات طويلة من الحمض النووي عالي التكرار الذي يشفر القليل من المعلومات الجينية ، والتي لا يتم استعادتها في أنظمة الناقل المستخدمة في مشروع الجينوم. تمثل هذه المناطق حوالي 10 ٪ من الجينوم ، ويقال إنها متغايرة اللون. (على سبيل المثال ، يتألف مركز الكروموسومات ، الذي يسمى السنتروميرات ، من الحمض النووي غير المتجانس).

يضم الاتحاد الدولي لتسلسل الجينوم البشري علماء في 16 مؤسسة في فرنسا وألمانيا واليابان والصين وبريطانيا العظمى والولايات المتحدة. توجد أكبر خمسة مراكز في: كلية بايلور للطب ، هيوستن ، معهد تكساس المشترك للجينوم في والنوت كريك ، مركز سانجر بالقرب من كامبريدج ، كلية الطب بجامعة واشنطن ، وسانت لويس ومعهد وايتهيد ، كامبريدج ، ماساتشوستس. معًا ، أنتجت هذه المراكز الخمسة حوالي 82٪ من التسلسل. توفر القائمة التالية مزيدًا من التفاصيل حول المراكز الستة عشر ومساهماتهم الفردية في مشروع الجينوم البشري.

تم تنسيق المشروع بإحكام بحيث لا تترك أي منطقة من الجينوم دون رقابة ، وتقليل الازدواجية. التزم جميع المشاركين في الاتحاد الدولي بمعايير جودة المشروع و rsquos وسياسة إصدار البيانات اليومية. يتم تمويل المشروع من خلال منح من الجهات الحكومية والجمعيات الخيرية العامة في مختلف البلدان. وتشمل هذه المعهد القومي لأبحاث الجينوم البشري في المعاهد الوطنية للصحة ، وويلكوم ترست في إنجلترا ، ووزارة الطاقة الأمريكية.

تبلغ التكلفة الإجمالية لمسودة العمل حوالي 300 مليون دولار في جميع أنحاء العالم ، حيث يتم تمويل نصفها تقريبًا (150 مليون دولار) من قبل المعاهد الوطنية الأمريكية للصحة. تبلغ تكلفة تسلسل الجينوم البشري أحيانًا 3 مليارات دولار. ومع ذلك ، يشير هذا الرقم إلى التقدير الأصلي لإجمالي التمويل لمشروع الجينوم البشري على مدى فترة 15 عامًا (1990-2005) لمجموعة واسعة من الأنشطة العلمية المتعلقة بعلم الجينوم. وتشمل هذه دراسات الأمراض البشرية ، والكائنات التجريبية (مثل البكتيريا ، والخميرة ، والديدان ، والذباب والفئران) ، وتطوير تقنيات جديدة للبحوث البيولوجية والطبية ، والطرق الحسابية لتحليل الجينوم ، والقضايا الأخلاقية والقانونية والاجتماعية المتعلقة بعلم الوراثة.

تشمل المؤسسات الستة عشر التي تشكل اتحاد تسلسل الجينوم البشري ما يلي:

1. كلية بايلور للطب ، هيوستن ، تكساس ، الولايات المتحدة الأمريكية
2. مركز بكين للجينوم البشري ، معهد علم الوراثة ، الأكاديمية الصينية للعلوم ، بكين ، الصين
3. Gesellschaft fur Biotechnologische Forschung mbH ، براونشفايغ ، ألمانيا
4. جينوسكوب ، إيفري ، فرنسا
5. شركة Genome Therapeutics Corporation ، والثام ، ماساتشوستس ، الولايات المتحدة الأمريكية
6. معهد التكنولوجيا الحيوية الجزيئية ، جينا ، ألمانيا
7. معهد الجينوم المشترك ، وزارة الطاقة الأمريكية ، والنوت كريك ، كاليفورنيا ، الولايات المتحدة الأمريكية
8. جامعة كيو ، طوكيو ، اليابان
9. معهد ماكس بلانك للوراثة الجزيئية ، برلين ، ألمانيا
10. مركز RIKEN للعلوم الجينومية ، سايتاما ، اليابان
11. مركز سانجر ، هينكستون ، المملكة المتحدة
12. مركز ستانفورد لتسلسل الحمض النووي وتطوير التكنولوجيا ، بالو ألتو ، كاليفورنيا ، الولايات المتحدة الأمريكية
13. مركز الجينوم بجامعة واشنطن ، سياتل ، واشنطن ، الولايات المتحدة الأمريكية
14. مركز التسلسل متعدد القواعد بجامعة واشنطن ، سياتل ، واشنطن ، الولايات المتحدة الأمريكية
15. معهد وايتهيد لأبحاث الطب الحيوي ، MIT ، كامبريدج ، ماساتشوستس ، الولايات المتحدة الأمريكية
16. مركز تسلسل الجينوم بجامعة واشنطن ، سانت لويس ، ميزوري ، الولايات المتحدة الأمريكية

بالإضافة إلى ذلك ، لعبت مؤسستان دورًا رئيسيًا في توفير الدعم والتحليل الحسابي لمشروع الجينوم البشري على مدار الثمانية عشر شهرًا الماضية. وتشمل هذه:

المركز الوطني لمعلومات التكنولوجيا الحيوية في المعاهد الوطنية للصحة

المعهد الأوروبي للمعلومات الحيوية في كامبريدج ، المملكة المتحدة

ساعد العلماء في جامعة كاليفورنيا ، سانتا كروز ، وشركة Neomorphic ، Inc. أيضًا في تجميع تسلسل الجينوم عبر الكروموسومات.


نتائج

لقد قمنا بتحليل توزيع SSRs المثالي الذي يمتد إلى 12 نقطة أساس أو أكثر في الجينوم البشري الكامل. وهكذا ، بالنسبة لـ SSR 12 نقطة أساس ، قد يشتمل الحدوث الواحد على تكرار 12 مونومر ، أو ستة ثنائيات ، أو أربعة قواطع ، أو ثلاثة رباعي (أو خماسيات) أو اثنين من السداسيات. تتضمن بيانات SSR المقدمة هنا كلاً من خيوط تسلسل الحمض النووي. AGAT ، على سبيل المثال ، يشمل أيضًا GATA والعكس يكمل TATC و CTAT ، وجميع مجموعات القاعدة الممكنة غير المتداخلة. تم تصنيف المتواليات التي تم تحليلها إلى ثلاث مناطق جينومية ، وهي exons (بما في ذلك المناطق غير المترجمة (UTRs)) والإنترونات والمناطق بين الجينات. بالنسبة لهذا التحليل ، قمنا بحساب الأطوال الإجمالية لجميع مكررات أحادي وثنائي وثلاثي ورباعي وخماسي وسداسي النوكليوتيدات من حيث أزواج قاعدة SSR لكل زوج ميغا بايت من الحمض النووي.

وفرة SSRs في الجينوم البشري

لقد حددنا العدد الإجمالي للمواقع لجميع SSRs في الجينوم البشري على أساس كروموسوم على أساس كروموسوم ، ثم حسبنا عدد وحدات التكرار في كل موضع. كما هو متوقع ، يعتمد العدد الإجمالي لحدوث SSRs على حجم الكروموسوم. على سبيل المثال ، الكروموسوم 1 هو الأعلى و Y هو الأقل حدوث SSR. ثم قمنا بتحليل كثافة كل تكرار كما هو مذكور في المواد والطرق. نوضح أن كثافة SSR الإجمالية قابلة للمقارنة عبر الكروموسومات (الشكل 1). ومع ذلك ، أظهرت بعض الكروموسومات ، مثل 16 و 17 و 19 و 22 ، زيادة طفيفة في كثافة SSR. تم العثور على أعلى كثافة SSR في الكروموسوم 19 (20351 نقطة أساس / ميجابايت) تليها 17 (17385 نقطة أساس / ميجابايت) و 22 (16147 نقطة أساس / ميجابايت). من المثير للاهتمام أن نلاحظ أن كروموسوم Y ، على الرغم من أنه يظهر أصغر عدد من SSRs ، إلا أنه يحتوي على كثافة SSR مماثلة للجسيمات الذاتية الأخرى والكروموسوم X (الشكل 1).

كثافة SSR الشاملة عبر مجموعة الكروموسوم البشري. يتم التعبير عن الكثافة في أزواج أساسية من تسلسل SSR لكل أزواج ميغا قاعدة من تسلسل الكروموسوم.

لقد أجرينا تحليلًا شاملاً لكل SSR موجود في الجينوم البشري ، والذي يتوفر كبيانات إضافية (انظر ملفات البيانات الإضافية). لتكرار معين ، يتم إعطاء عدد التكرارات والطول الإجمالي للتسلسل المتكرر ، جنبًا إلى جنب مع موضع بدء التكرار فيما يتعلق بكل من معرف الاتصال ومعرف انضمام GenBank المحدد. إذا تم العثور على التكرار في الجين ، فسيتم عرض اسم الجين والمناطق المعنية. في حالة وجود التكرار في منطقة جينية ، يتم إعطاء أقرب جين في مجرى النهر والمسافة بين التكرار والجين. لقد قدمنا ​​أيضًا ارتباط SSRs بالمواقع ذات العلامات التسلسلية (STS) من حيث المسافة بين SSR وعلامة STS المعروفة. يتم تضمين تفاصيل كل نوع مكرر في ملفات البيانات الإضافية.

يكرر أحادي النوكليوتيد

أظهرت جميع الكروموسومات البشرية كثافة متشابهة إلى حد ما لتكرار المونومر (الشكل 2 أ). مقارنة بالكروموسومات الأخرى ، أظهرت المناطق الخارجية للكروموسومات 7 و 16 كثافة قصوى - 6063 نقطة أساس / ميجابايت و 5928 نقطة أساس / ميجابايت ، على التوالي - بينما أظهرت المنطقة الخارجية من Y أقل كثافة (786 نقطة أساس / ميجابايت) لتكرار المونومر. باستثناء الكروموسوم 19 ، كانت كثافة تكرار المونومر في المنطقة غير المشفرة قابلة للمقارنة في جميع الكروموسومات الأخرى. ومن المثير للاهتمام ، مع ذلك ، أن كثافة intronic كانت أعلى قليلاً ولكن بثبات من كثافة المناطق الجينية لجميع الكروموسومات (الشكل 2 أ). أظهر الكروموسوم 19 أعلى كثافة مونومر إجمالية. من بين نوعي تكرار المونومر ، كان poly (A) (أو poly (T)) أكثر وفرة بكثير من poly (C) (أو G) في جميع الكروموسومات (الشكل 3). يحتوي الكروموسوم 19 على أقصى كثافة تكرار لـ A (أو T) (7،429 نقطة أساس / ميجا بايت) متبوعة بالكروموسومات 17 و 22 و 16. يحتوي الكروموسوم 16 على أقصى كثافة (96 نقطة أساس / ميجا بايت) لـ C (أو يتكرر Go (الشكل 3) .

كثافة SSR في المناطق الخارجية والداخلية والجينية على الكروموسومات البشرية الفردية: (أ) مونمر (ب) ثنائيات (ج) قادين (د) رباعيات (هـ) البنتامرون (F) السداسيات. الأشرطة الزرقاء ، الأشرطة الحمراء exons ، الأشرطة الصفراء للإنترونات ، المناطق الجينية.

تتكرر كثافة كل مونومر عبر مجموعة الكروموسوم البشري بأكملها. أ ، أزرق ج ، أحمر.

يكرر ثنائي النوكليوتيد

أظهر تحليل التكرارات AC و AG و AT و CG ميزتين مثيرتين للاهتمام: أولاً ، أظهرت المناطق الخارجية كثافة إجمالية أقل لهذه التكرارات مقارنة بالمناطق غير المشفرة ، وثانيًا ، داخل المنطقة غير المشفرة ، كما في حالة يكرر المونومر ، كان للإنترونات كثافة تكرار باهتة أعلى من المنطقة الجينية (الشكل 2 ب). كانت كثافات التكرارات الثنائيه في كل من المناطق الجينية والجينية قابلة للمقارنة وأكثر أو أقل انتظامًا عبر الكروموسومات. من بين التكرارات dimer ، كانت AC و AT هي السائدة ، في حين أن تكرار CG كان أندر (الشكل 4). أظهرت كثافة تكرار AT أكبر اختلاف من كروموسوم إلى آخر. على سبيل المثال ، كان للكروموسومات 3 و 4 و 11 و 12 و 13 و X و Y كثافة AT مماثلة لتلك الموجودة في AC ، بينما في جميع الكروموسومات الأخرى وُجد أنها أقل بكثير من AC. كانت كثافة مكررات AG موحدة بشكل ملحوظ في جميع الكروموسومات باستثناء 19 و X ، اللذين كان لهما أعداد أكبر قليلاً من هذا التكرار. للحصول على تفاصيل تكرارات dimer فردية في مناطق exonic و intronic و intergenic ، راجع ملفات البيانات الإضافية.

تتكرر كثافة كل ديمر عبر مجموعة الكروموسوم البشري بأكملها. AC ، أزرق AG ، أحمر AT ، أصفر CG ، فيروزي.

يكرر ثلاثي النوكليوتيد

كشف تحليل جميع عمليات تكرار القطع (AAC ، AAG ، AAT ، ACC ، ACG ، ACT ، AGC ، AGG ، ATC ، CCG) عن كثافة أكبر واضحة بمقدار ضعفين تقريبًا في المناطق الخارجية مقارنة بالكثافة في المناطق intronic و intergenic في جميع الكروموسومات باستثناء Y (الشكل 2 ج). في حين أن كثافة القطع في المناطق غير المشفرة لجميع الكروموسومات كانت متشابهة ، أظهر الكروموسوم 19 أقصى كثافة في المناطق غير المشفرة. كشف تحليل كثافات المقاطع المختلفة أن تكرار AAT و AAC و AAG و AGG كانت الأكثر شيوعًا ، بترتيب الوفرة هذا (الشكل 5). وجد أن تكرار ACG و ACT و CCG أكثر ندرة في الجينوم. تم العثور على كثافة نوع التكرار المحدد لتكون موحدة إلى حد ما عبر جميع الكروموسومات. كان هناك عدد قليل جدًا من الانحرافات عن هذا النمط على سبيل المثال ، أظهر الكروموسوم 19 كثافة تكرار AAT (446 نقطة أساس / ميغا بايت) وهي أعلى بكثير من تلك الموجودة في الكروموسومات الأخرى. للحصول على تفاصيل تكرارات القاطع الفردي في exons و introns و intergenic المناطق ، انظر ملفات البيانات الإضافية.

تتكرر كثافة كل أداة تقليم عبر مجموعة الكروموسومات البشرية بأكملها.

يكرر رباعي النوكليوتيد

تكون كثافة التكرارات الرباعية في المناطق الخارجية أقل مما هي عليه في المناطق الداخلية والجينية في معظم الكروموسومات. أظهرت معظم الكروموسومات البشرية نمط كثافة خارجي مماثل ، ومع ذلك ، أظهر الكروموسومات 7 و 22 كثافة أكبر من هذه التكرارات (الشكل 2 د). يحتوي الكروموسوم 19 على معظم تكرارات رباعي النوكليوتيد في المنطقة غير المشفرة. تراوحت كثافة التكرار في المناطق الداخلية للكروموسومات الأخرى بين 2،085 نقطة أساس / ميغا بايت (كروموسوم 5) إلى 3،172 نقطة أساس / ميغا بايت (كروموسوم 22). كشف تحليل كثافات كل نوع مكرر رباعي أن AAAT و AAAG و AAAC و AAGG كانت الأنواع السائدة عبر الجينوم. كانت الكثافات الإجمالية للتكرارات الرباعية مثل AACC و AACT و AACG و AAGC و AAGT و AATC و ACCC و ACCG و ACCT و ACGC و ACGG و ACGT و AGCC و AGCG و AGCT و ATCG و ATGC و CCGG و CCCG أقل. يكرر AGAT ، ومع ذلك ، يسيطر على كروموسوم Y (الشكل 6). يتم تقديم تفاصيل تكرارات رباعي رباعي الفردي في exons ، و introns والمناطق بين الجينات في ملفات البيانات الإضافية.

تتكرر كثافة كل رباعي عبر مجموعة الكروموسوم البشري بأكملها.

يكرر البنتانوكليوتيد

في الكروموسومات 4 و 7 و 13 و 14 ، كانت كثافة تكرار pentamer في المناطق الخارجية أكبر مقارنة بتلك الموجودة في المناطق غير المشفرة. احتوى الكروموسوم 7 على أقصى كثافة تكرار خارجية (921 نقطة أساس / ميجابايت). تراوحت الكثافة الخارجية للخماسيات بين 362 نقطة أساس / ميغا بايت في الكروموسوم Y إلى 885 نقطة أساس / ميغا بايت في الكروموسوم 15. وكانت الكثافة الجينية أكبر في الكروموسوم 3 و 10 و 16 و 17 و 19 و Y (الشكل 2 هـ). لوحظت ميزة بارزة للتكرار الخماسي في حالة الكروموسوم 19 ، حيث كانت الكثافة الجينية والجينية أكبر مرتين (1،195 و 1،201 نقطة أساس / ميجابايت على التوالي) من الكثافة الخارجية (633 نقطة أساس / ميجابايت). يتم توفير وفرة جميع التكرارات الخماسية ، بما في ذلك رقم التكرار في كل موضع ، في ملفات البيانات الإضافية.

يكرر هيكسانوكليوتيد

مثل تكرارات أداة القطع ، تكون عمليات التكرار السداسية أيضًا أكثر وفرة في منطقة exoninc ، باستثناء كروموسوم Y (الشكل 2f). لكن المثير للدهشة أن كثافة التكرارات السداسية كانت أكثر من ضعفين إلى ثلاثة أضعاف كثافة التكرارات الثلاثية في الإكسونات. أظهرت الكروموسومات 7 و 16 و 22 كثافة متزايدة من التكرارات السداسية الخارجية عند مقارنتها بالكروموسومات الأخرى. تراوحت كثافة التكرار الخارجية في الكروموسومات الأخرى ، بما في ذلك Y ، من 2176 نقطة أساس إلى 4628 نقطة أساس / ميغا بايت. أظهرت معظم الكروموسومات كثافات سداسية الشكل موحدة بشكل ملحوظ في المناطق الداخلية والجينية (الشكل 2 و). يتم تقديم تفاصيل كثافات كل التكرار السداسي وأطوال التكرار لكل تكرار سداسي في الجينوم البشري في ملفات البيانات الإضافية.


تخليق البروتين

في كل من بدائيات النوى وحقيقيات النوى ، فإن الغرض الرئيسي من الحمض النووي هو توفير المعلومات اللازمة لبناء البروتينات ضروري للخلية يمكن أن تؤدي جميع وظائفها. البروتينات هي جزيئات كبيرة ومعقدة تلعب العديد من الأدوار الحاسمة في الجسم. يقومون بمعظم العمل في الخلايا وهي ضرورية لبنية ووظيفة وتنظيم أنسجة وأعضاء الجسم.

تذكر أن البروتينات تتكون من مئات أو آلاف الوحدات الأصغر التي تسمى الأحماض الأمينية ، والتي ترتبط ببعضها البعض في سلاسل طويلة. هناك 20 نوعًا مختلفًا من الأحماض الأمينية التي يمكن دمجها لصنع بروتين. يحدد تسلسل الأحماض الأمينية البنية الفريدة ثلاثية الأبعاد لكل بروتين ووظيفته المحددة.

الجدول 1: بعض وظائف البروتينات في الخلايا ، مرتبة حسب الترتيب الأبجدي:

وصف

يتم تخزين المعلومات اللازمة لصنع البروتينات في DNA الكائن الحي. يتم ترميز كل بروتين بواسطة قسم معين من الحمض النووي يسمى أ الجين. الجين هو جزء من الحمض النووي المطلوب لإنتاج بروتين واحد. عادة ما يكون طول الجينات مئات أو آلاف الأزواج القاعدية لأنها ترمز لبروتينات مكونة من مئات أو آلاف الأحماض الأمينية.

تذكر أن الحمض النووي في حقيقيات النوى يوجد كجزيئات خطية طويلة تسمى الكروموسومات (الشكل 1). يبلغ طول الكروموسومات ملايين الأزواج الأساسية وتحتوي كل منها على العديد والعديد من الجينات (الجدول 2). يشار إلى مجموعة كاملة من الحمض النووي للكائنات الحية (بما في ذلك جميع جيناتها) باسمها الجينوم.

الجدول 2 حجم وعدد الجينات للعديد من الكروموسومات البشرية.

كروموسوم الحجم (في أزواج أساسية) # من الجينات
1 248,956,422 2058
10 133,797,422 733
22 50818468 488

/> الشكل 1: نمط نووي يوضح أحجام جميع الكروموسومات البشرية. لاحظ أنها تتناقص في الحجم.

للتلخيص: العديد من الأزواج الأساسية تشكل جينًا واحدًا ، والعديد من الجينات توجد في كروموسوم واحد ، ويمكن العثور على العديد من الكروموسومات في جينوم واحد.

الشكل 2: ترتيب الحمض النووي في الكروموسومات. رصيد الصورة: Thomas Splettstoesser (www.scistyle.com)


معهد بحوث الخلق

تُعرف إحدى الحجج الأكثر شيوعًا المستخدمة للإنسان المفترض تطوره من القردة باسم اندماج الكروموسوم. الدافع وراء هذا المفهوم هو المشكلة التطورية المتمثلة في أن لدى القردة زوجًا إضافيًا من الكروموسومات و mdashhumans لديها 46 بينما تمتلك القردة 48. إذا تطور البشر من مخلوق يشبه القرد منذ ثلاثة إلى ستة ملايين سنة فقط ، فإن مجرد صورة خاطفة في المخطط الكبير لـ قصة تطورية ، لماذا يوجد هذا التناقض بين البشر والقرود؟

يقترح الحل التطوري أن الاندماج من طرف إلى طرف لاثنين من الكروموسومات الصغيرة الشبيهة بالقرد (المسمى 2 أ و 2 ب) أنتج كروموسوم بشري 2 (الشكل 1). ظهر مفهوم الاندماج لأول مرة في عام 1982 عندما فحص العلماء أوجه التشابه بين كروموسومات الإنسان والقرد تحت المجهر. في حين أن التقنية كانت بدائية إلى حد ما ، إلا أنها كانت كافية لبدء الفكرة. 1

موقع الانصهار المزعوم

تم اكتشاف أول توقيع فعلي للحمض النووي لحدث اندماج محتمل في عام 1991 على كروموسوم بشري رقم 2. 2 وجد الباحثون مجموعة صغيرة مشوشة من متواليات نهاية تشبه التيلومير والتي تشبه بشكل غامض اندماجًا محتملاً. التيلوميرات عبارة عن تسلسل من ستة قواعد لأحرف الحمض النووي TTAGGG تتكرر مرارًا وتكرارًا في نهايات الكروموسومات.

ومع ذلك ، فإن توقيع الاندماج كان إلى حد ما لغزًا يعتمد على الاندماج الحقيقي الذي يحدث أحيانًا في الطبيعة. تتضمن جميع عمليات الاندماج الموثقة في الحيوانات الحية نوعًا معينًا من التسلسل يسمى DNA القمر الصناعي (satDNA) الموجودة في الكروموسومات وتوجد في حالات الانكسار والاندماج. 3-5 توقيع الاندماج على الكروموسوم البشري 2 يفتقد إلى هذا الدلالة satDNA. 6

مشكلة أخرى هي الحجم الصغير لموقع الاندماج ، والذي يبلغ طوله 798 حرفًا من أحرف الحمض النووي فقط. يتراوح طول تسلسل التيلومير في نهايات الكروموسومات من 5000 إلى 15000 قاعدة. إذا اندمج اثنان من الكروموسومات ، يجب أن ترى توقيع تيلومير مدمج يتراوح من 10000 إلى 30000 قاعدة طويلة و mdashnot 798.

لا يمثل الحجم الصغير مشكلة لقصة الاندماج فحسب ، بل إن التوقيع لا يمثل حقًا اندماجًا واضحًا للتيلوميرات. يوضح الشكل 2 أحرف الحمض النووي لموقع الاندماج ذي القاعدة 798 مع تسلسل التيلومير السليم المكون من ستة قواعد (حرف الحمض النووي) الذي تم التأكيد عليه بخط غامق. عندما تتم مقارنة تسلسل الاندماج مع تسلسل الانصهار الأصلي من نفس الحجم ، فإنه يكون متطابقًا بنسبة 70 ٪ فقط بشكل عام.

أشار الباحثون العلمانيون إلى هذا التناقض ووصفوا موقع الانصهار بأنه كبير & ldquodegenerate. & rdquo 7 نظرًا للنموذج النظري القياسي للتطور البشري ، يجب أن يكون متطابقًا بنسبة 98 إلى 99٪ ، وليس 70٪. علق الباحثون الذين وصفوا هذا الاكتشاف ، "لقد تدهورت صفائف التكرارات من الرأس إلى الرأس في موقع الاندماج بشكل كبير (14 ٪) من المصفوفات شبه المثالية لـ (TTAGGG)ن وجدت في التيلوميرات & rdquo وسأل السؤال المناسب & ldquo إذا حدث الاندماج داخل مصفوفات تكرار التيلوميرات أقل من

6 ميا ، لماذا تتدهور المصفوفات في موقع الاندماج إلى هذا الحد؟ & rdquo 7 وتجدر الإشارة إلى أن الانحطاط بنسبة 14٪ الذي استشهد به المؤلفون يشير إلى فساد التسلسلات المكونة من ستة قواعد فقط نفسها ، وليس القواعد الـ 798 بأكملها.

موقع الاندماج داخل الجين؟

تبين أن أكثر الاكتشافات المضادة للتطور بروزًا حول موقع الاندماج هو موقعه وما يفعله بالفعل. جاء هذا الاكتشاف أثناء قراءتي للورقة البحثية التي أبلغت عن تحليل مفصل لـ 614000 قاعدة من قواعد تسلسل الحمض النووي المحيطة بموقع الاندماج المزعوم. لاحظت في أحد الأشكال أن موقع الانصهار كان موجودًا داخل الجين ، ومن اللافت للنظر أن هذه الغرابة لم يتم الاعتراف بها حتى في نص الورقة. 8

اكتشاف مثل هذا جدير بالملاحظة للغاية. ربما تكون هذه المعلومة هي المسمار في نعش التطور ، إذا جاز التعبير ، ولهذا السبب رفض الباحثون مناقشتها. ألهمني هذا الشذوذ الكبير لإعطاء موقع الاندماج دراسة عن كثب. This paper was published in 2002, and I took notice of it in 2013. A huge amount of data on the structure and function of the human genome had been published in the meantime, and there was likely much more to the story that needed to be uncovered.

When I performed further research, I verified that the fusion site was positioned inside an RNA helicase gene now called DDX11L2. Most genes in plants and animals have their coding segments in pieces called exons so they can be alternatively spliced. Based on the addition or exclusion of exons, genes can produce a variety of products. The intervening regions between exons are called الإنترونات, which often contain a variety of signals and switches that control gene function. The alleged fusion site is positioned inside the first intron of the DDX11L2 gene (Figure 3). 9

The DNA molecule is double-stranded, with a plus strand and a minus strand. It was engineered this way to maximize information density while also increasing efficiency and function. As a result, there are genes running in different directions on the opposing strands. As it turns out, the DDX11L2 gene is encoded on the minus strand. Because genes in humans are like Swiss army knives and can produce a variety of RNAs, in the case of the DDX11L2 gene it produces short variants consisting of two exons and long variants with three (Figure 3). 9

The Fusion Site Is a Gene Promoter

What might this DDX11L2 gene be doing? My research showed it&rsquos expressed in at least 255 different cell or tissue types. 9 It&rsquos also co-expressed (turned on at the same time) with a variety of other genes and is connected to processes associated with cell signaling in the extracellular matrix and blood cell production. The location of the so-called fusion sequence inside a functional gene associated with the genetics of a variety of cellular processes strongly refutes the idea that it&rsquos the accidental byproduct of a head-to-head telomeric fusion. Genes are not formed by catastrophic chromosomal fusions!

Even more amazing is that the fusion site is itself functional and serves an important engineered purpose. The site actually acts as a switch for controlling gene activity. In this respect, a wealth of biochemical data showed that 12 different proteins called عوامل النسخ regulate this segment of the gene. One of these is none other than RNA polymerase II, the main enzyme that copies RNA molecules from DNA in a process called النسخ. Further supporting this discovery is the fact that the actual process of transcription initiates inside the region of the so-called fusion site.

Technically, we would call the activity in the alleged fusion site a منطقة المروج. Promoters are the main switches at the beginning of genes that turn them on and are also where the RNA polymerase starts to create an RNA. Many genes have alternative promoters like the DDX11L2 الجين.

There are actually two areas of transcription factor binding in the DDX11L2 الجين. The first is in the promoter directly in front of the first exon, and the second is in the first intron corresponding to the fusion site sequence. Not only is the DDX11L2 gene itself complexly controlled, with the alleged fusion sequence playing a key role, but even the RNA transcripts produced are very intricate. The RNAs themselves contain a wide variety of binding and control sites for a class of small regulatory molecules called microRNAs. 9

Functional Internal Telomere Sequences Are All Over the Genome

The presence of internally located telomere sequence is found all over the human genome. These seemingly out-of-place telomere repeats have been dubbed interstitial telomeres. The presence of these sequences presents another challenge for the fusion site idea. It&rsquos a fact that very few of the telomere repeats in the fusion site occur in tandem. As noted in Figure 2, the sequence of the 798-base fusion site contains only a few instances where two repeats are actually in tandem and none that have three repeats or more. However, there are many other interstitial telomere sites all over the human genome where the repeats occur in perfect tandem three to ten times or more. 10-11

Even besides their role at the ends of chromosomes, it appears interstitial telomeric repeats may serve an important function in the genome related to gene expression. In a recent research project, I identified telomere repeats all over the human genome and then intersected their genomic locations with a diversity of data sets containing functional biochemical information for gene activity. 12 Literally thousands of internal telomeric repeats across the genome were directly associated with the hallmarks of gene expression. The same type of transcription factor binding and gene activity occurring at the alleged fusion site was also occurring genome-wide at numerous other interstitial telomeric repeats. Clearly, these DNA features are not accidents of evolution but purposefully and intelligently designed functional code.

Bogus Cryptic Centromere Inside a Gene

Another key problem with the fusion model is the lack of viable evidence for a signature of an extra centromere region. Centromeres are sections of chromosomes, often in central locations, that play key roles during cell division. As depicted in Figure 1, the newly formed chimeric chromosome would&rsquove had two centromere sites immediately following the alleged head-to-head fusion of the two chromosomes. In such a case, one of the centromeres would be functional while the other would be disabled. The presence of two active centromeres is bad news for chromosomes and would lead to dysfunction and cell destruction.

Interestingly, the evidence for a cryptic (disabled) centromere on human chromosome 2 is even weaker than that for a telomere-rich fusion site. Evolutionists explain the lack of a clearly distinguishable nonfunctional secondary centromere by arguing that a second centromere would&rsquove been rapidly selected against. After that, the disabled centromere would&rsquove deteriorated over time since there were no functional restraints placed on it anymore by its doing something useful in the genome.

However, the evidence for a second remnant centromere at any stage of sequence degeneration is problematic for the evolutionary paradigm. Functional centromere sequences are composed of a repetitive type of DNA called alphoid sequences, with each alphoid repeat being about 171 bases long. Some types of alphoid repeats are found all over the genome, while others are specific to centromeres. The structure of the sequences found at the cryptic centromere site on human chromosome 2 doesn&rsquot match those associated with functional human centromeres. 13 Even worse for the evolutionary model is that they have no highly similar counterparts in the chimp genome&mdashthey are human-specific. 13

The alleged fossil centromere is also exceptionally tiny compared to a real one. The size of a normal human centromere ranges in length between 250,000 and 5,000,000 bases. 14 The alleged cryptic centromere is only 41,608 bases long, but it&rsquos also important to note that there are three different regions of it that aren&rsquot even alphoid repeats. 15 Two of these are called retroelements, with one being a LPA3/LINE repeat 5,957 bases long and the other an SVA-E element with 2,571 bases. When we subtract the insertions of these non-alphoid sequences, it gives a length of only 33,080 bases, which is a fraction of the length of a real centromere.

The most serious evolutionary problem with the idea of a fossil centromere, though, is that like the alleged fusion site, it&rsquos positioned inside a gene. The alleged cryptic centromere is located inside the ANKRD30BL gene, and its sequence spans both intron and exon regions of the gene. 12,15

In fact, the part of the alleged fossil centromere sequence that lands inside an exon actually codes for amino acids in the resulting gene&rsquos protein. The gene produces a protein that&rsquos believed to be involved in the interaction of the structural network of proteins inside the cell called the الهيكل الخلوي in connection with receptor proteins embedded in the cell membrane. 16 The fact that the so-called fossil or cryptic centromere is a functional region inside an important protein-coding gene completely refutes the idea that it&rsquos a defunct centromere.

Conclusion: No Fusion

Due to the muddled signatures and small sizes of the alleged fusion and fossil centromere sites, it&rsquos highly questionable that their sequence was evolutionarily derived from an ancient chromosome fusion. Not only that, they represent functional sequence inside genes. The alleged fusion site is an important genetic switch called a promoter inside the DDX11L2 long noncoding RNA gene, and the so-called fossil centromere contains both coding and noncoding sequence inside a large ankyrin repeat protein-coding gene.

This is an undeniable double whammy against the whole mythical fusion idea, utterly destroying its validity. The overwhelming scientific conclusion is that the fusion never happened.


Maternal Effect Genes in Development

Arunika Das , . Michael A. Lampson , in Current Topics in Developmental Biology , 2020

الملخص

The centromere directs chromosome segregation but is not itself genetically encoded. In most species, centromeres are epigenetically defined by the presence of a histone H3 variant CENP-A, independent of the underlying DNA sequence. Therefore, to maintain centromeres and ensure accurate chromosome segregation, CENP-A nucleosomes must be inherited across generations through the germline. In this chapter we discuss three aspects of maternal centromere inheritance. First, we propose mechanisms for maintaining CENP-A nucleosomes through the prolonged prophase arrest in mammalian oocytes. Second, we review mechanisms by which selfish centromeres bias their transmission through female meiosis. Third, we discuss regulation of centromere size through early embryonic development.


Local Adaptation and Speciation in a Monkeyflower

في هذا العدد من بلوس علم الأحياء, Lowry and Willis [31] announce the discovery of an inversion in the yellow monkeyflower ميمولوس جوتاتوس that at once includes some of their most interesting features. This species has a very broad geographical and ecological range in western North America, and occurs in two distinct ecotypes. One is an annual form adapted to the dry habitats commonly found inland. The second is perennial, and is adapted to moist and cool areas typical of the coast. These two forms differ genetically in several ways. Key among the differences is flowering time: the annual form flowers early, before the hot and dry summer, while the perennial form takes advantage of the longer season by investing in more growth and then flowering later. This adaptive difference produces premating isolation, since the two forms are not available at the same time for pollination. It also causes postzygotic isolation, since survival of hybrids is reduced in moist coastal habitats.

Lowry and Willis discovered the inversion by noticing that hybrids between the ecotypes showed no recombination between molecular markers along part of one chromosome. Further, they saw that much of the phenotypic variation that distinguishes the two ecotypes cosegregates with the inversion. The traits involved include three that contribute to reproductive isolation between the forms, as well as other traits such as morphology. The inversion is polymorphic over much of the species' range, and acts as a supergene that makes important contributions to both local adaptation and reproductive isolation between the annual and perennial forms.

This marvelous story seems like a poster child for the local adaptation hypothesis for inversions. A plausible scenario is that an ancestral monkeyflower was under disruptive selection, with the annual form favored in some habitats and the perennial form in others. One day, an inversion arose that captured a set of alleles adapted to one or the other habitat, and it invaded. Currently, other genes throughout the genome also contribute to the differences between the ecotypes. That suggests the possibility that another inversion elsewhere in the genome could appear and invade via the local adaptation mechanism. It is easy to imagine that if this event is repeated one or a few times, what are now two ecotypes within a species will become two distinct species, genetically distinguished by several inversions. Perhaps the yellow monkeyflower is showing us a snapshot of inversions in the process of splitting one species into two.

But this hypothesis has competitors. Perhaps, for example, the breakpoint of the inversion itself has disrupted a gene that has cascading effects on flowering time and growth. Then the inversion evolved not because it prevents recombination between a set of locally adapted genes, but rather as a mutation at a single gene. A second issue is whether the genetic differences that now distinguish the inverted and ancestral chromosomes were responsible for the inversion to invade (as in the local adaptation mechanism), or accumulated after it became established for some other reason.

To test alternative hypotheses for how inversions evolve, we would like to understand what genes or chromosome regions are the targets of selection—are they at the breakpoints, for example, or genes within the inversion? With model organisms, transformations of genes at candidate loci could give strong evidence. But that approach is often not an option, both because the genetic tools are not yet available in most species, and because the effects of transformations generally cannot be tested in natural conditions. An alternative way forward is to use patterns of neutral genetic variation in the DNA inverted and uninverted chromosomes. Under the right conditions, these could be used to find quantitative trait loci (QTL) under divergent selection within the inversion. We might then be able to date the ages of selected alleles relative to the origin of the inversion, to see which came first. Further, different hypotheses, for example selection on the breakpoints versus local adaptation with suppressed recombination, should leave contrasting signatures of neutral genetic variation. Tantalizing hints of such patterns have been seen in in ذبابة الفاكهة [32] and أنوفيليس [34]. So far, however, there has been no rigorous test of alternative hypotheses using any approach. A synthesis of genomics and ecological genetics in the style of Lowry and Willis holds the promise of being able to do that before long, with luck before the centenary of Sturtevant's great discovery.


أساليب

Generation of the gene catalogue

We started by aligning all available human RefSeq, MGC and GenBank messenger RNA sequences, as well as GenPept sequences from several species, to the finished sequence. Gene models were inspected manually to ensure accurate transcriptional start and stop sites, and to correct splice sites. Non-canonical splice sites were used only if supported by sufficient complementary DNA-based evidence. Partial transcripts (those containing a partial open reading frame (ORF) or overlapping non-coding exons of sibling transcripts) were annotated in cases for which there was firm evidence of their existence. Gene symbols for biologically characterized loci were assigned by the HUGO Gene Nomenclature Committee. See Supplementary Table S10 for a complete list of gene symbols. Our annotations are available from the Vertebrate Genome Annotation database (VEGA, http://vega.sanger.ac.uk/Homo_sapiens).

Comparative analysis: creation of synteny maps

We performed full genomic alignments of repeat masked sequence from mouse 4 (builds 31 and 33), rat 21 and dog (CanFam 1.0 K. Lindblad-Toh, personal communication) with the human genome sequence using the PatternHunter program 30 . We did this for human build 34 with the Broad finished chromosomes (8, 15, 17, 18) inserted, and also for human build 35 (mouse build 31 was used against human build 34, and mouse build 33 against human build 35). From these alignments we identified collinear clusters of conserved microsynteny, which were then used to form larger syntenic segments in a hierarchical fashion. Syntenic maps and their underlying syntenic anchors serve as the basis for identification of conserved elements.

Comparative analysis: identification of conserved elements

Starting with large-scale syntenic blocks defined by the human–mouse and human–dog syntenic maps, we generated pair-wise alignments within these syntenic blocks using the PatternHunter program 30 . We then scanned 50-bp windows with 5-bp offset and calculated the fraction of aligning bases that were matches (discarding windows with fewer than 20 aligning bases). These percentage conservation values were locally normalized to the average conservation in the surrounding 5 Mb to generate ض-scores measuring divergence from the local average (0) for every window. We examined the joint empirical distribution of mouse and dog ض-scores for windows contained within ancestral repeat sequence (undergoing neutral evolution and believed to predate the mouse–human split) and windows overlapping coding exons (Supplementary Fig. S4a). Coding sequence is defined as all bases that are annotated as coding in any transcript. All analysis presented uses Ensembl 31 genes on human build 35 analysis with both Ensembl and Broad annotations on build 34 yields substantially similar results (Supplementary Information).

We combined dog and mouse ض-scores to generate a ‘composite’ ض-score (see Supplementary Information). We estimated the distribution of composite ض-scores for selected sequence by decomposing the global distribution of ض-scores into two components: a ‘neutral distribution’ centred at zero and corresponding to the conservation scores for ancestral repeat sequences, and a ‘selected distribution’ consisting of the residual after subtraction of the neutral distribution (Supplementary Fig. S4b). Taking into account the relative fractions of the aligning windows in each distribution, we were able to assign a probability that a window at a given score is under purifying selection.

We then divided the genome into non-overlapping 5-Mb windows. Within each such window, we counted the number of syntenic bases, the number of syntenic 50-bp windows, and the number of 50-bp windows under selection. The fraction of coding sequence (the explanatory variable in all regressions) was taken as the number of syntenic bases annotated as coding divided by the number of syntenic bases. The fraction under selection was calculated as the sum of all selection probabilities for all windows divided by the number of syntenic windows. If windows of only a certain class were considered, the probabilities were calculated only for windows in that class. We note that, on average, windows contained within coding exons scored only slightly higher than 0.67 probability of selection, owing to the large prior probability of neutrality. Thus, the slopes of all regressions are <1. For all analyses, we discarded any 5-Mb window with less than 4 Mb of syntenically assigned sequence (retaining >85% of all windows of non-zero euchromatic length). Similar results are obtained if the discarded windows are included, but the variance is higher.

Annotation

RefSeq (release 1), mammalian gene collection (MGC, 3 February 2003), dbEST and GenBank (29 December 2002) mRNAs were aligned to the genomic assembly using BLAT 32 . GenPept protein sequences (3 February 2003) were aligned using BLASTX 33 and GeneWise 34 . All gene models were created manually using these aligned sequences as evidence, following HAWK2 (www.sanger.ac.uk/Info/workshops/hawk2) transcript type conventions. Gene models derived from aligned mRNA evidence were extended when possible using spliced EST evidence at the 5′ end and spliced and unspliced EST evidence in the 3′ untranslated region (UTR). Evidence was given relative priority as follows (high–low): RefSeq/MGC, GeneWise, other mRNAs, spliced ESTs and unspliced ESTs. We found CpG islands within 2-kb upstream and 1-kb downstream of the 5′ end of 73% of known category loci, which is somewhat higher than previous reports (in the range of 61–66% cited in ref. 3, also refs 5–7).


A Look to the Future

The genomic architectures being revealed by the sequences of many diverse species pose interesting puzzles and questions. Why are big genes big? Do the genes found in gene-dense clusters lie together for a reason? Why have some transposable elements died in the human genome but not in rodents? What are the mechanisms for segmental duplication? If repeat sequences are important then why does the pufferfish (فوغو روبريبس) genome, at about 350 Mb, contain only about 4% of repetitive DNA ? Does the pufferfish also have big genes and gene deserts?

In coming years, many more species will have their genomes sequenced. Out of this work will come a better understanding of the dynamic evolutionary forces that have shaped genomes and the relationships between chromosome structure and the functions of genes. Perhaps even the regulatory codes will be cracked eventually, through a combination of experimentation and genome structure analysis.


شاهد الفيديو: 28- الاختلالات الوراثية عند الانسان جزء2 تغير عدد الكروموسومات احياء توجيهي الاردن (قد 2022).