معلومة

لماذا نحلل الترنسكريبتوم بدلا من البروتين؟

لماذا نحلل الترنسكريبتوم بدلا من البروتين؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

من المحتمل أن يكون تحليل النسخة (RNA-Seq ، المصفوفات الدقيقة ، qPCR ، إلخ) أكثر التقنيات استخدامًا لتقييم التعبير الجيني والعمليات الخلوية الديناميكية. ثم يتم استقراء النتائج (التحليلات الوظيفية ، GO ، إلخ) لاستنتاج النتائج الخلوية البيولوجية. RNAs هي في الحقيقة فقط الرجل الوسيط. لا يعني وجود الرنا المرسال بالضرورة أنه سيصبح بروتينًا. يمكن أن تتحلل بواسطة microRNAs وما إلى ذلك قبل الترجمة. في النهاية يكون البروتين هو السبب الحقيقي لتغير بيولوجي.

لذا ، سؤالي هو لماذا لا نذهب مباشرة إلى البروتينات. لماذا لا تقوم فقط باستخراج البروتينات وتسلسلها وتحديدها كميا وتحليلها واستخلاص النتائج؟ ما هي الحجج المقنعة لدراسة الترنسكربيتوم لفهم العمليات البيولوجية؟


س: لماذا لا نستخرج البروتينات فقط ...

ج: إنها ليست مجرد مسألة استخراج البروتينات التي قد تحتاجها منفصل منهم وبعد ذلك عزل كل واحد منهم. لا توجد حاليًا طريقة عملية للقيام بذلك ، على سبيل المثال ، 10000 بروتين ، والتي قد تحتوي في أي حال على أشكال متعددة. جمال طريقة RNAseq هو أنها تفعل ذلك ليس تتطلب الفصل المادي أو عزل النصوص.

من المرجح أن يكون النهج مفيدًا في تحديد البروتينات وقياسها فى الموقع، ولكن لا يزال هذا بعيدًا بعض الشيء عن الشمولية والحساسية المطلوبة.

س: ... تسلسلهم ...

ج: إن تسلسل البروتين بطيء وصعب. لا يمكن تطبيقه على نطاق واسع ، على عكس تسلسل نسخ الحمض النووي لنصوص الحمض النووي الريبي. تعتبر الطرق الأخرى لتحديد الهوية القائمة على السلوك الجسدي (الهجرة أو موضع الشطف) واعدة أكثر ، والاتجاه الذي من المرجح أن يتم اتباعه.

س: ... حددهم كميا ...

ج: حتى هذا الأمر صعب ، عند استخلاص البروتينات من المواد الهلامية ، على سبيل المثال. في كونتاست ، تحسب منهجية RNAseq النصوص فقط. (لكن الاتجاه المحتمل الذي سيسلكه هذا هو القياس الكمي بارتفاع الذروة ، دون فصل أو عزل ، كما هو الحال مع الأيض ، أو عن طريق شدة بعض الإشارات من البروتين الثابت في الهلام ، مما يؤدي إلى تلطيخ شيء أكثر تعقيدًا.)

لذلك ، بشكل عام ، تقوم بتحليل البروتين على بروتينات فردية معينة تهمك ، بينما يمكنك إجراء تحليل RNAseq على جميع النصوص في عينة بيولوجية ، ثم الذهاب للصيد (من بين النتائج ، وبعد ذلك في البحيرة إذا كان هذا هو شيء).


لماذا لا تقوم فقط باستخراج البروتينات وتسلسلها وتحديدها كميا وتحليلها واستخلاص النتائج؟

لأن البروتينات هل حقا الصعب. لتقديم مثال واحد ، لا يوجد مكافئ بروتيني لـ PCR. هذا يعني أنه لا توجد طريقة بسيطة لاختيار وتضخيم بروتين معين من خليط معقد. كان اختراع تفاعل البوليميراز المتسلسل محوريًا للتقدم السريع في علم الجينوم على مدار الأربعين عامًا الماضية.

قياس الطيف الكتلي هو الأداة الأساسية للبروتيوميات عالية الإنتاجية ولا تزال تحليلات المواصفات الجماعية صعبة للغاية ، بل وأكثر صعوبة في التفسير.


بينما أنت محق في أن "الناتج النهائي" دائمًا ما يكون بروتينًا وأن التحليل الوظيفي على مستوى mRNA يمكن أن يتجاهل التحكم متعدية الأشياء ، فهناك أسباب وجيهة لتحليل النسخة:

1) كما قلت ، يمكن أن يحدث الكثير مع mRNA: يمكن أن تتحلل أو تترجم أو يتم قمعها أيضًا لبعض الوقت حتى يتم تنشيطها مرة أخرى. معظم عمليات التحكم هذه لها تأثير قوي جدًا على "مخرجات البروتين النهائية" ولكن من الأسهل بكثير دراستها على مستوى mRNA / الترنسكريبتوم (نظرًا لأن هذا هو مكان حدوثها).

2) يعد تحليل النسخ على مستوى الجينوم الواسع أمرًا سهلاً نسبيًا من الناحية الفنية: تقنية التسلسل متطورة جدًا الآن وهناك العديد من البروتوكولات المختلفة التي تم إنشاؤها للنظر ليس فقط في مستويات التعبير عن mRNAs الفردية ولكن أيضًا أشياء أخرى مثل الاستقرار والمعالجة (أي الربط أو polyadenylation) وكذلك ترجمة mRNA. يمكن القيام بكل هذا أيضًا باستخدام مدخلات مادية منخفضة نسبيًا.
يتطلب تحليل البروتين من جهة أخرى استخدام مقياس طيف الكتلة الذي لا يكون بالضرورة بنفس القوة أو الحساسية مثل التسلسل.


ما هي الحجج المقنعة لدراسة الترنسكربيتوم لفهم العمليات البيولوجية؟

هناك حجج مقنعة لدراسة النسخ لكنها تعتمد على سؤال البحث. يجب أن يستخدم البحث الذي يركز على تنشيط عوامل النسخ بيانات النسخ كما ينبغي البحث في أحداث معالجة الحمض النووي الريبي (الربط ، معالجة ما قبل الرنا المرسال ، الاستقرار). تريد أيضًا بيانات النسخ عند دراسة نسخ RNA التي لا تشفر البروتينات.

لا أعتقد أن هناك حججًا بيولوجية مقنعة لدراسة الترنسكريبتوم عندما تريد أن تعرف عن تعبير جينات ترميز البروتين في الأنسجة أو الخلايا. يجب أن تركز على البروتينات لأنها الخطوة الأخيرة في التعبير عن جينات ترميز البروتين. يمكن أن يكون التطابق بين مستويات نصوص ترميز البروتين والبروتينات ممتازًا ولكنه قد يكون ضعيفًا أيضًا. لا يمكن لبيانات النص فصل هذه المجموعات. في التقديرات العالمية ، تشرح مستويات النسخ حوالي نصف التباين في مستويات البروتين. أعتقد أن هذا المستوى من عدم الدقة غير مقبول عندما يكون هناك بديل قابل للتطبيق.

لماذا لا نكتفي باستخراج البروتينات وتحديدها كميا؟

هناك قيود مادية وتاريخية على القياس الكمي العالمي للبروتينات. لقد جمعت بعض القيود التي أعتبرها أكثر أهمية. مقياس الطيف الكتلي (MS) هو الطريقة الحالية المختارة لتقدير كمية البروتين عالي الإنتاجية. طرق مثل تسلسل Edman أو الكشف المناعي لها تأثير أقل بكثير.

هناك قيود مادية تمنع حاليًا مرض التصلب العصبي المتعدد من إجراء قياسات كمية عالمية باستخدام بروتينات سليمة. هذا مؤسف جدا. يتم إجراء القياسات العالمية حاليًا عن طريق تحديد كمية الببتيدات من البروتينات المهضومة باستخدام نظام كروماتوجرافي سائل لتغذية MS بالببتيدات (LC-MS). يتم تحديد الببتيدات ثم تخصيصها لبروتين أو مجموعة من البروتينات. النتائج النهائية موثوقة وسيحدد معظمها التعرف على البروتين الفردي. بعض الببتيدات ستحل فقط لتحديد مجموعة من البروتينات. هذا هو قيد بسيط في معظم الحالات.

أصبح إجراء قياسات عالمية لكميات البروتين ممكنًا فقط في العقد الماضي بينما أصبحت القياسات العالمية روتينية فقط مع ظهور LC عالي الأداء المقترن بأحدث أجهزة قياس الطيف الكتلي. سيتمكن العديد من الباحثين الأكاديميين من الوصول إلى هذه التقنية عبر مرفق قياس الطيف الكتلي المحلي الخاص بهم ولكن معظمهم لن يدرك ذلك. هذه الحداثة جزء كبير من السبب في أنها أقل شيوعًا.

ملخص

أعتقد أنه سيتم استخدام القياس الكمي للبروتينات LC-MS بدلاً من بيانات النسخ في كثير من الأحيان خلال العامين المقبلين. ويرجع ذلك إلى قدرة أدوات LC-MS الحالية على توفير إجابات أفضل في الأنظمة البيولوجية التي تتطلب معلومات على مستوى البروتين. سيبدأ المراجعون في المطالبة به. أعتقد أنه خلال العقد القادم يمكن أن يصبح LC-MS عالي الأداء رخيصًا بما يكفي لاستبدال التقنيات المناعية ذات الإنتاجية المنخفضة مثل التخثر المناعي والتألق المناعي.


هناك جانب واحد لم يتم تفصيله: النسخ أرخص بكثير من البروتين. حلل بروتين واحد في LC-MS / MS يمكن أن يكلف بقدر ما يكلف نسخة. وإذا كنت تنتمي إلى تلك المجموعات الصغيرة التي تعاني من نقص التمويل والتي تعمل على الكائنات الحية غير النموذجية والتي هي حقًا مثيرة للاهتمام ولكنها ليست مفيدة حقًا في علاج السرطان ، فلا خيار أمامك.


بروتين

أهمية البروتين

ماذا يمكن أن نتعلم من البروتين؟ نظرًا لأن معظم الوظائف الأنزيمية الخلوية ، والمفاتيح التنظيمية ، ومحولات الإشارة ، والمكونات الهيكلية تتكون من بروتينات ، فإن توصيف البروتينات التي تعبر عنها الخلية يمكن أن يعطي أدلة مهمة للوظيفة والتنظيم والاستجابة المتأصلة في الخلية. بالإضافة إلى ذلك ، من خلال تحديد التباين بين الخلايا المختلفة ، وبين الخلايا المعرضة لمحفزات مختلفة ، يمكننا فهم:

التكيف الخلوي للإشارات البيئية

آليات التمايز الخلوي والتطور العضوي

الجوانب الخلوية لعمليات المرض

الاستجابات الخلوية للشيخوخة

الاختلاف بين الأفراد داخل النوع ، أي الأساس الجزيئي لفرديتنا في علم وظائف الأعضاء ، وقابلية المرض ، والاستجابة للعلاجات والتعرضات البيئية.

يوجد حاليًا قدر كبير من الإثارة حول إمكانية قياس مستويات التعبير الجيني لكل جين في الكائن الحي. جعلت تسلسلات الجينوم الشاملة أو الكاملة من الممكن تحديد مستويات نسخ mRNA لجميع الجينات في وقت واحد عن طريق تهجين DNA microarray. لذلك ، هل من الضروري دراسة تعبير البروتين الآن بحيث يسهل قياس التعبير الجيني على مستوى الرنا المرسال؟ يعتقد معظم العلماء أن الإجابة هي نعم ، لأن الطريقتين مختلفتين من حيث الكم والنوع. أولاً ، لا تفرق معظم المصفوفات الدقيقة للحمض النووي عادةً بين النسخ المتغيرة (التي يتم إنتاجها عن طريق التضفير البديل ، أو استخدام مواقع بدء النسخ البديلة أو مواقع تعدد الأدينيل ، أو تحرير الحمض النووي الريبي). ثانيًا ، قد لا يتم التنبؤ بدقة بوفرة البروتين من خلال مستوى الرنا المرسال نظرًا لأن معدل الترجمة وتدهور البروتين غير معروف لكل مرنا. ثالثًا ، تعد التعديلات اللاحقة للترجمة والانقسامات المحللة للبروتين أمرًا بالغ الأهمية لوظيفة البروتين ، ولكن لا يمكن اكتشافها أو التنبؤ بها بواسطة مستوى الرنا المرسال. أخيرًا ، تعمل البروتينات عادةً في مجمعات ويتم تنظيم توطين البروتين بواسطة الخلية ، ومع ذلك لا يتم التعامل مع أي من هذه الخصائص من خلال فحص مستويات الرنا المرسال.

تتجلى أهمية وتعقيد دراسة البروتين في حجمه الهائل. يكون البروتين أكبر بكثير من الجينوم ، بالنظر إلى الدرجة الواسعة من التعديلات والمعالجة اللاحقة للترجمة التي تخضع لها جميع البروتينات تقريبًا. توجد العديد من الأمثلة حيث يمكن لجين واحد (يتكون من العديد من exons) أن يولد المئات وربما الآلاف من جزيئات البروتين المختلفة عن طريق التضفير البديل والتعديلات اللاحقة للترجمة. وبالتالي ، فإن تحليل البروتين بأكمله يمثل تحديًا أكثر صعوبة من مشاريع تسلسل الجينوم.


خلفية

تعيش معظم البكتيريا في بيئات لا تحافظ على النمو المستمر. بدلاً من ذلك ، عادةً ما تكون المجموعات الطبيعية ثابتة فيما يتعلق بالنمو ، نظرًا لأن العوامل المطلوبة للنمو عادةً ما تكون مقيدة (مثل العناصر الغذائية والأكسجين) أو عوامل تثبيط النمو (على سبيل المثال ، منتجات النفايات) التي تراكمت (تمت مراجعتها في [1]). ومع ذلك ، فإن المرحلة الثابتة ليست بالضرورة الحالة النهائية. يستأنف النمو البكتيري بمجرد أن تصبح الظروف البيئية مواتية مرة أخرى. يفترض ، تم تحسين مجموعات الطور الثابت للتعامل مع أي من الاحتمالين. من ناحية ، يجب أن يتحملوا الظروف البيئية الصعبة التي تمنع النمو. من ناحية أخرى ، يجب أن يكونوا قادرين على استئناف النمو بسرعة في حالة التغيرات البيئية التي تفضل النمو. كان الهدف من هذه الدراسة هو معرفة كيفية تعامل البكتيريا مع هذا الموقف. يمكن أن توفر البيانات النسخية والبروتينية الخاصة بالسكان البكتيري أثناء عبورها لحالات النمو المختلفة بعض التلميحات. تم استخدام مناهج النسخ لدراسة التغيرات بين مراحل النمو [2 ، 3]. يتميز النهج الترانسكريبتوميك والبروتيني المدمج بميزة توفير رؤى أعمق للتغيرات الجزيئية الكامنة وراء تكيف النمو البكتيري [4 ، 5 ، 6 ، 7]. بشكل عام ، توقعنا أن تدفق المعلومات من الحمض النووي إلى الحمض النووي الريبي يرتبط مع الحمض النووي الريبي بتحويل البروتين ، أي أنه من المتوقع أن تؤدي التغييرات في الترنسكريبتوم إلى تغييرات مقابلة في البروتين والأيض. ومع ذلك ، تظهر أدلة من مجموعة واسعة من الكائنات الحية على أن وفرة الحمض النووي الريبي بشكل عام لا ترتبط بشكل جيد بوفرة البروتين [8]. كان الهدف الآخر من هذه الدراسة هو معرفة ما إذا كان هذا هو الحال بالفعل.

في دراسة سابقة ، قمنا بتحليل بيانات النسخ من نموذج الكائن الحي لدينا ، رودوباكتر سبيرويدس، في المرحلة الأسية وبعد أوقات حضانة مختلفة في المرحلة الثابتة [9]. R. sphaeroides هي بكتيريا ألفا ذات التغذية الضوئية الاختيارية ، توجد في الغالب في موائل المياه العذبة. تخضع هذه البيئات لتغييرات متكررة ، وهذا ينعكس في مرونة R. sphaeroides للاختيار من بين عدد من المسارات الأيضية لتحسين النمو وتقليل الإجهاد. على سبيل المثال، R. sphaeroides يستخدم التنفس الهوائي لإنتاج ATP في وجود مستويات أكسجين كافية. في حالة انخفاض شد الأكسجين ، تبدأ البكتيريا في تكوين مجمعات التمثيل الضوئي. إذا كان الضوء متاحًا ، يتم إجراء التمثيل الضوئي غير المؤكسد [10]. نظرًا لأن التواجد المتزامن للضوء والأكسجين والكلوروفيل الجرثومي يؤدي إلى إجهاد مؤكسد ضوئي من خلال توليد الأكسجين القمعي الضار ، تحاول البكتيريا تجنب هذا الموقف عن طريق كبت التعبير الجيني لعملية التمثيل الضوئي في وجود الضوء والأكسجين [11 ، 12]. بالإضافة إلى ذلك ، فإنهم يشكلون استجابة للحماية من الإجهاد الناتج عن الأكسدة الضوئية [13 ، 14]. استجابة R. sphaeroides للعديد من الضغوط مثل الإجهاد التأكسدي (بيروكسيد الهيدروجين) ، والإجهاد الضوئي (أكسجين القميص) ، والحد من الحديد تمت دراستها بشكل مكثف [14،15،16،17،18،19]. هذا الكم الهائل من المعرفة على R. sphaeroides توفر لنا الاستجابة للضغوط المختلفة فرصة لمقارنة نسخة هذه البكتيريا في استجابات الإجهاد المختلفة مع النسخ في مراحل النمو المختلفة. على وجه الخصوص ، نحن مهتمون بالعوامل التنظيمية المشتركة وأنماط التعبير.

تم تجسيد نجاح هذا النهج في دراسة سابقة حول R. sphaeroides التي ركزت على التغييرات النسخية أثناء الخروج من المرحلة الثابتة بعد الوصول إلى العناصر الغذائية الطازجة (يشار إليها فيما بعد بالنمو). كشفت بياناتنا أن عوامل سيجما البديلة RpoHI و RpoHII تلعبان دورًا مهمًا في النمو بعد مرحلة ثابتة ممتدة. مطلوب أيضًا RpoHI و RpoHII للاستجابة لمجموعة متنوعة من الضغوط ، بما في ذلك الحرارة ، والأكسجين المفرد ، وبيروكسيد الهيدروجين ، والأكسيد الفائق ، و CdCl2 [20]. بشكل ملحوظ ، كان هناك تداخل كبير بين نسخة النمو الناتج واستجابة الإجهاد الضوئي [9] ، مما يشير إلى أن الاستجابة البكتيرية للتغير المفاجئ في الظروف التي تبدأ النمو تشبه استجابة الإجهاد الضوئي.

تقدم هذه الدراسة تحليلًا مقارنًا شاملاً للتغيرات في الترنسكربيتوم وتقارن هذا بالبروتين على مدار مراحل النمو المختلفة. نحن لا نقوم فقط بتضمين البيانات النصية والبروتينية أثناء الانتقال إلى المرحلة الثابتة ، ولكن أيضًا البروتين في المرحلة الثابتة العميقة. تستند بيانات الترنسكريبتوم إلى تحليل ميكروأري تم نشره مسبقًا [9] ، وتستند البيانات البروتينية إلى قياس الطيف الكتلي الكمي.


علم البروتينات: المفاهيم الأساسية والتكنولوجيا والتطبيقات

تشير النسخ الجينية التي يمكن للفرد أن يصنعها في حياته - التي يطلق عليها كلمة ترانسكريبتوم (عن طريق القياس بمصطلح الجينوم) - إلى مجموعة الكروموسومات أحادية الصيغة الصبغية التي تحمل جميع الجينات الوظيفية.

وبالمثل ، يتم الآن تجميع جميع البروتينات التي ينتجها كائن حي تحت ظل البروتيوميات. تتضمن البروتيوميات الدراسة المنهجية للبروتينات من أجل توفير رؤية شاملة للهيكل والوظيفة والدور في تنظيم النظام البيولوجي.

وتشمل هذه التفاعلات تفاعل البروتين والبروتين ، وتعديل البروتين ، ووظيفة البروتين ودراسات توطينها. الهدف من علم البروتينات ليس فقط تحديد جميع البروتينات في الخلية ولكن أيضًا لإنشاء خريطة ثلاثية الأبعاد كاملة للخلية تشير إلى مكان وجود البروتينات. إلى جانب التقدم في المعلوماتية الحيوية ، فإن هذا النهج لوصف الأنظمة البيولوجية بشكل شامل سيكون له بلا شك تأثير كبير على فهمنا للنمط الظاهري لكل من الخلايا الطبيعية والمريضة.

البروتين (المصطلح الذي صاغه مارك ويلكينز في عام 1995) لخلية معينة هو العدد الإجمالي للبروتينات في أي لحظة معينة وهو ديناميكي للغاية استجابة للإشارات الداخلية والخارجية. يمكن تعديل البروتينات عن طريق التعديلات اللاحقة للترجمة ، أو الخضوع لعمليات النقل داخل الخلية أو تصنيعها أو تدهورها.

لذلك ، فإن فحص بروتينات الخلية في وقت معين يعكس بيئة البروتين المباشرة التي تتم دراستها فيها. البروتين الخلوي هو مجموعة البروتينات الموجودة في نوع خلية معين تحت تأثير مجموعة معينة من الظروف البيئية مثل التعرض لتحفيز الهرمونات. ستشكل مجموعة كاملة من البروتينات من جميع البروتينات الخلوية المختلفة بروتينًا كاملًا للكائن الحي.

اكتشاف مثير للاهتمام لمشروع الجينوم البشري هو أن هناك بروتينات أكثر بكثير في البروتينات البشرية (

400000 بروتين) من الجينات المشفرة للبروتين في الجينوم البشري (

22000 جين). يُعتقد أن الزيادة الكبيرة في تنوع البروتين ترجع إلى التضفير البديل والتعديل اللاحق للبروتينات. يشير هذا إلى أنه لا يمكن وصف تنوع البروتين بشكل كامل من خلال تحليل التعبير الجيني وحده. وبالتالي فإن علم البروتينات هو أداة مفيدة لتوصيف الخلايا والأنسجة ذات الأهمية.

بدأت دراسات البروتين الأولى التي يمكن تسميتها بالبروتينات بإدخال الرحلان الكهربائي للهلام ثنائي الأبعاد لبروتينات الإشريكية القولونية (O & # 8217Ferrall ، 1975) تليها دراسات بروتين الفئران وخنازير غينيا (Ksole ، 1975). على الرغم من أن الرحلان الكهربائي ثنائي الأبعاد (2-DE) كان خطوة كبيرة إلى الأمام ويمكن فصل العديد من البروتينات وتصورها بهذه التقنية ، إلا أنها لم تكن كافية لتحديد البروتين من خلال أي تقنية تسلسل بروتين حساس.

بعد جهود معينة ، كانت أول تقنية رئيسية لتحديد البروتين هي تسلسل البروتين عن طريق تدهور Edman (Edman ، 1949). تم استخدام هذه التقنية لتحديد البروتينات من المواد الهلامية ثنائية الأبعاد لإنشاء أول قاعدة بيانات ثنائية الأبعاد (سيليس وآخرون 1987). التطور الأكثر أهمية في تحديد البروتين هو تقنية قياس الطيف الكتلي (MS) (أندرسن وآخرون ، 2000). تمت زيادة تسلسل البروتين بواسطة تقنية MS نظرًا لحساسية التحليل وتحمل مجمعات البروتين وقابليتها لعمليات الإنتاجية العالية.

على الرغم من حدوث العديد من التطورات في تحديد البروتين (عن طريق MS أو تسلسل Edman) دون وجود قاعدة بيانات لتسلسل الحمض النووي على نطاق واسع للتسلسلات المعبر عنها والحمض النووي الجيني ، لا يمكن وصف البروتينات لأن الأشكال الإسوية البروتينية المختلفة يمكن أن تتولد من جين واحد من خلال عدة التعديلات (الشكل 18.1). وقد تراكمت غالبية تسلسل الحمض النووي والبروتينات في غضون فترة زمنية قصيرة.

في عام 1995 ، تم إجراء تسلسل جينوم الكائن الحي لأول مرة في المستدمية النزلية (Fleischmann et al. 1995). حتى الآن ، تم الانتهاء من تسلسل العديد من الجينومات حقيقية النواة الأخرى. Arabidopsis thaliana (Tabata، 2000)، Sachcharomyces cerevisiae (Goffeau، 1996)، Caenorhabditis elegans (Abbott، 1998)، Oryza (Matsumoto، 2001) and human (Venter، 2001).

لتوصيف التعبير البروتيني ، فإن الإجراء الشائع هو تحليل mRNA بطرق مختلفة بما في ذلك التحليل التسلسلي للتعبير الجيني (SAGE) (Velculescu et al. 1995) وتكنولوجيا DNA microarray (Shalon ، 1996). ومع ذلك ، فإن مستوى نسخ الجين يعطي فقط فكرة تقريبية عن المستوى الحقيقي للتعبير عن هذا الجين.

قد يتم إنتاج الرنا المرسال بوفرة ، ولكن في نفس الوقت يتحلل بسرعة ، أو يترجم بشكل غير فعال مع الاحتفاظ بكمية البروتين في الحد الأدنى. تخضع البروتينات التي تم تكوينها أيضًا لتعديلات لاحقة للترجمة. تعمل التعديلات المختلفة اللاحقة للترجمة أو التحلل البروتيني والتجزئة على تنظيم وظائف البروتين في الخلية (الشكل 18.1).

كان من المتوقع أن يكون متوسط ​​عدد البروتينات المتكونة لكل جين واحدًا أو اثنين في البكتيريا ، وثلاثة في الخميرة وثلاثة أو أكثر في البشر (ويلكينز وآخرون ، 1996). استجابةً للاستجابات خارج الخلية ، يخضع عدد من البروتينات لتعديلات ما بعد الترجمة. فسفرة البروتين هي آلية تأشير مهمة ويمكن أن يؤدي تنظيم بروتين كيناز والفوسفاتيز إلى تكوين الأورام (هنتر ، 1995).

من خلال تحليل البروتينات ، يمكن تحليل التغييرات في تعديلات العديد من البروتينات التي تعبر عنها الخلية بعد الترجمة. ميزة أخرى مهمة للبروتين هي توطينه في الخلية. من المعروف أن سوء توطين البروتينات له تأثير سلبي على الوظيفة الخلوية (التليف الكيسي) (Drumm and Collins ، 1993). يتم تنظيم نمو الخلية وموت الخلية المبرمج وقرار المضي قدمًا خلال دورة الخلية عن طريق نقل الإشارة من خلال مجمعات البروتين (Pippin et al. 1993). يمكن اكتشاف تفاعل البروتين باستخدام نظام الخميرة ثنائي الهجين (Rain et al. 2001).

لفهم البروتين ، يجب إجراء ثلاثة أنواع مختلفة من التحليل:

(1) بروتينات التعبير عن البروتين هي الدراسة الكمية للتعبير البروتيني للبروتين بأكمله أو البروتين الفرعي لعينتين تختلفان ببعض المتغيرات. يعتبر تحديد البروتينات الجديدة في نقل الإشارات والبروتينات الخاصة بالمرض نتيجة رئيسية لهذا النهج.

(2) تحاول البروتينات الإنشائية تحديد جميع البروتينات داخل معقد أو عضية ، وتحديد توطينها ، وتوصيف جميع تفاعلات البروتين والبروتين. الهدف الرئيسي من هذه الدراسات هو تحديد بنية مجمعات البروتين أو بروتينات العضية الخلوية (Blackstock and Weir ، 1999).

(3) تسمح البروتينات الوظيفية بدراسة مجموعة مختارة من البروتينات المسؤولة عن إشارات المسارات والأمراض وتفاعلات البروتين البروتين. قد يكون هذا ممكنًا عن طريق عزل البروتينات الفرعية المحددة بواسطة كروماتوجرافيا التقارب لمزيد من التحليل (الشكل 18.2):

تكنولوجيا البروتينات:

لا يعطي قياس مستوى نسخة الجين بالضرورة صورة واضحة لمنتجات البروتين المتكونة. لذلك ، لقياس التعبير الجيني الحقيقي ، يجب تحليل البروتينات. قبل تحديد النشاط وقياسه ، يجب فصل جميع البروتينات الموجودة في البروتين في أي لحظة عن بعضها البعض.

يمكن تقسيم تجربة البروتينات النموذجية (على سبيل المثال ، التنميط التعبير عن البروتين) إلى الفئات التالية:

(ط) فصل وعزل البروتين

(2) الحصول على المعلومات الهيكلية للبروتين لتحديد البروتين وتوصيفه

(ط) فصل البروتين وعزله:

يعتبر الرحلان الكهربائي للبروتين أحد المكونات الأساسية للبروتينات ، وهو الطريقة الأكثر فعالية لحل مزيج معقد من البروتينات. يتوفر نوعان من الرحلان الكهربي كرحلان كهربائي أحادي وثنائي الأبعاد. في الفصل الكهربائي للهلام أحادي البعد (1-DE) ، يتم حل البروتينات على أساس كتلها الجزيئية. البروتينات مستقرة بدرجة كافية خلال 1-DE بسبب قابليتها للذوبان في كبريتات دوديسيل الصوديوم (SDS). يمكن فصل البروتينات ذات الكتلة الجزيئية من 10-300 كيلو دالتون بسهولة من خلال 1-DE.

ولكن مع خلائط البروتين المعقدة ، تكون النتائج مع 1-DE محدودة ، لذلك بالنسبة لمزيج البروتين الأكثر تعقيدًا مثل محلول الخلية الخام ، فإن أفضل أداة فصل متاحة هي الرحلان الكهربائي للهلام ثنائي الأبعاد (2-DE) (O & # 8217Ferrall ، 1975). هنا ، يتم فصل البروتينات وفقًا لشحناتها الصافية في البعد الأول ووفقًا لكتلها الجزيئية في البعد الثاني.

نظرًا لأن هلام 2-DE واحد يمكنه حل آلاف البروتينات ، فإنه يظل أداة قوية لفهرسة البروتينات. يتمتع الرحلان الكهربي ثنائي الأبعاد بالقدرة على حل البروتينات التي خضعت لبعض التعديلات اللاحقة للترجمة وكذلك التعبير البروتيني لأي عينتين يمكن مقارنتها من حيث الكمية والنوعية. تم إدخال تدرجات الأس الهيدروجيني مؤخرًا إلى 2-DE مما أدى إلى تحسن كبير في إمكانية تكرار هذه التقنية (Bjellqvist et al.1993).

ومع ذلك ، لا يزال هناك عدد قليل من المشكلات المتعلقة بـ 2-DE لم يتم حلها. على الرغم من الجهود المبذولة لأتمتة تحليل البروتين بواسطة 2-DE ، إلا أنها لا تزال عملية كثيفة العمالة وتستغرق وقتًا طويلاً. يتمثل أحد القيود الرئيسية الأخرى لـ 2-DE في عدم القدرة على اكتشاف البروتينات ذات عدد النسخ المنخفض عند تحليل محلل الخلية الكلي (Link et al. 1997 Shevchenko et al. 1996) بالإضافة إلى عدم الكفاءة لتسريع عملية الهضم في الهلام أيضًا.

لذلك ، تم البحث عن بدائل لتجاوز البروتين الهلامي الكهربائي. تتمثل إحدى الطرق في الهضم التحلل للبروتين لمزيج البروتين لتحويلها إلى ببتيدات ثم تنقية الببتيدات قبل إخضاعها للتحليل عن طريق قياس الطيف الكتلي (MS). تم تبسيط تنقية الببتيد من خلال الفصل الكروماتوجرافي السائل (Link et al. 1999 McCormack et al. 1997) ، والرحلان الكهربي الشعري (Figeys et al. 1999 Tong et al. 1999) وكروماتوجرافيا الطور العكسي (Opiteck et al. 1997).

في الآونة الأخيرة ، خوان وآخرون. (2005) طور نهجًا جديدًا لتسريع عملية تحديد البروتين باستخدام تقنية & # 8216microwave & # 8217. تخضع البروتينات المستخلصة من المواد الهلامية لهضم التربسين عن طريق إشعاع الميكروويف ، والذي ينتج بسرعة شظايا الببتيدات. يمكن تحليل هذه الأجزاء بواسطة MALDI (امتصاص الليزر / التأين بمساعدة المصفوفة). على الرغم من الكثير من الأبحاث النهائية حول بدائل معينة لـ 2-DE ، إلا أن هذا هو الأسلوب الأكثر استخدامًا لدراسات البروتينات.

(2) اكتساب هياكل البروتين: تحديد البروتين:

كانت إحدى أقدم الطرق المستخدمة لتحديد البروتين هي التسلسل الدقيق بواسطة كيمياء إدمان للحصول على تسلسل الأحماض الأمينية N-terminal. تم تقديم هذه التقنية بواسطة Edman في عام 1949. في تسلسل Edman ، يتم ترتيب N-terminal للبروتين لتحديد موقع البداية الحقيقي. تسلسل Edman هو طريقة تسلسل أكثر قابلية للتطبيق لتحديد البروتينات المفصولة بواسطة الرحلان الكهربائي للهلام SDS-Polyacrylamide.

تم استخدام هذه الطريقة على نطاق واسع في السنوات الأولى للبروتيوميات ولكن ظهرت قيود معينة في الآونة الأخيرة. أحد القيود الرئيسية هو تعديل N-terminal للبروتينات. إذا تم حظر أي بروتين على N-terminal قبل التسلسل ، فمن الصعب جدًا تحديد البروتين.

للتغلب على هذه المشكلة ، تم استخدام نهج جديد لتسلسل الببتيد المختلط (Damer et al.1998) مؤخرًا. في هذا النهج ، يتم تحويل البروتين إلى ببتيدات عن طريق الانقسام باستخدام بروميد السيانوجين (CNBr) أو سكاتول متبوعًا بتسلسل Edman للببتيدات.

كان الاختراق الأكثر أهمية في علم البروتينات هو تحديد طيف الكتلة للبروتينات المفصولة بالهلام. نظرًا لمستويات الحساسية العالية ، وتحديد البروتينات في مجمعات / مخاليط البروتين والإنتاجية العالية ، فقد ثبت أن هذه التقنية أفضل بكثير من ES.

في مقياس الطيف الكتلي ، يتم هضم البروتينات إلى ببتيدات في الهلام نفسه عن طريق البروتيز المناسب مثل التربسين ، لأن البروتينات ، على هذا النحو ، يصعب استخلاصها من المواد الهلامية. علاوة على ذلك ، لا يكون الوزن الجزيئي للبروتينات مناسبًا عادةً لتحديد قاعدة البيانات. في المقابل ، يمكن استخلاص الببتيدات من المواد الهلامية بسهولة ، كما أن مطابقة مجموعة صغيرة من الببتيدات مع قاعدة البيانات كافية تمامًا لتحديد البروتين.

هناك طريقتان رئيسيتان لتحديد البروتين الطيفي الكتلي:

(1) & # 8220 التأين بالرش الكهربائي & # 8221 (ESI) يتضمن تجزئة الببتيدات الفردية متبوعة بالتأين المباشر من خلال الرش الكهربائي في مطياف الكتلة الترادفية. في ESI ، تتدفق عينة سائلة من أنبوب ميكروكابيلاري إلى فتحة مطياف الكتلة ، حيث يؤدي اختلاف الجهد بين الشعيرات الدموية والمدخل إلى مطياف الكتلة إلى توليد ضباب خفيف من القطرات المشحونة (Fenn et al. 1989) هانت وآخرون 1981).

لديه القدرة على حل الببتيدات في خليط ، وعزل نوع واحد في وقت واحد وفصله إلى أجزاء amino أو carboxy-terminal تحتوي على شظايا محددة & # 8216b & # 8217 و "y" ، على التوالي.

(2) في & # 8220 الببتيد رسم الخرائط الكتلي & # 8221 النهج (Henzel et al. 1993) يتم الحصول على الطيف الكتلي لمزيج الببتيد المزال ، مما يؤدي إلى بصمة كتلة الببتيد للبروتين قيد الدراسة. يتم الحصول على الطيف الكتلي من خلال طريقة بسيطة نسبيًا & # 8216 مطيافية - مصفوفة بمساعدة الليزر / التأين & # 8217 (MALDI).

في هذا النهج ، يتم تحليل خليط الببتيد التجريبي لأن التربسين يشق البروتينات في الحمض الأميني أرجينين والليسين. نظرًا لأنه يمكن توقع الببتيدات التجريبية نظريًا لأي بروتين ، يمكن مقارنة كتل الببتيد المتوقعة مع تلك التي تم الحصول عليها تجريبيًا عن طريق تحليل MALDI. إذا كان العدد الكافي من الببتيد يتطابق مع تسلسل البروتين الموجود في قاعدة البيانات ، فإن دقة تحديد البروتين عالية.

بعد انشقاقات البروتياز للبروتينات ، يتم تحليلها عن طريق التحليل الشامل أيضًا. يتبع تحليل الكتلة تحويل البروتينات أو الببتيدات إلى أيونات جزيئية. تم فصل هذه الأيونات في مطياف الكتلة بناءً على نسبة الكتلة / الشحنة (m / z). يتم تحديده بالوقت الذي تستغرقه الأيونات للوصول إلى الكاشف. ومن ثم تسمى الأداة أداة وقت الرحلة (TOF).

العلاقة التي تسمح بتحديد نسبة m / z هي E = 1/2 (m / z) v 2. في هذه المعادلة. E هي الطاقة المنقولة على الأيونات المشحونة نتيجة للجهد المطبق بواسطة الجهاز و V هي سرعة الأيونات أسفل مسار الرحلة. عندما يتم إدخال أيونات الببتيد في حجرة التصادم ، فإنها تتفاعل مع غاز الاصطدام وتخضع للتفتت على طول العمود الفقري للببتيد (الشكل 18.4).

نظرًا لأن جميع الأيونات تتعرض لنفس المجال الكهربائي ، فإن جميع الأيونات المتشابهة سيكون لها طاقات مماثلة. لذلك ، بناءً على المعادلة أعلاه ، يجب أن يكون للأيونات التي لها كتلة أكبر سرعات أقل ، وبالتالي سوف تتطلب أوقاتًا أطول للوصول إلى الكاشف. الخطوات المختلفة المتضمنة في قياس الطيف الكتلي موصوفة في مخطط تدفق في الشكل 18.3.

(3) استخدام قاعدة البيانات:

في البداية ، أنشأ تسلسل بعض البروتينات أو الببتيدات متبوعًا بتقديم التسلسلات معًا مجموعة من البروتينات تسمى قاعدة بيانات البروتين. يتم أيضًا التنبؤ بالهضم التحلل للبروتين للعديد من البروتينات نظريًا وترسبه في قاعدة البيانات. ومن ثم ، في الوقت الحالي ، تم تجميع الكثير من المعلومات بحيث يمكننا البحث عن تناظر بين تسلسل الببتيد الجديد والتسلسلات الموجودة في قاعدة البيانات لتحديد البروتين.

الهدف الرئيسي من البحث في قاعدة البيانات هو تحديد عدد كبير من البروتينات - بسرعة وبدقة. يتم استخدام جميع المعلومات المتراكمة من خلال تسلسل Edman أو قياس الطيف الكتلي لتحديد البروتينات. في قاعدة بيانات البحث في قاعدة بيانات البصمات الكتلية الببتيدية ، تتم مقارنة كتلة الببتيد غير المعروف بعد الهضم التحلل للبروتين بالكتلة المحسوسة من الببتيد من الهضم النظري للبروتينات في قاعدة البيانات. في البحث في قاعدة بيانات تسلسل الأحماض الأمينية ، يتم تحديد تسلسل الأحماض الأمينية من الببتيد ويمكن استخدامه للبحث في قواعد البيانات للعثور على البروتين الذي اشتُق منه.

تم تصميم مجموعة قواعد بيانات تسلسل البروتين لتمثيل قائمة جزئية لجينوم الكائن الحي ، أي الجينات وجميع البروتينات التي تقوم بتشفيرها. عادةً ما تُصنف عائلات البروتين وفقًا لتاريخها التطوري المستنتج من التماثل المتسلسل.

These databases are excellent tools for gene discovery, comparative genomics and molecular evolution. The purpose of database similarity searching is the sensitive detection of sequence homologues, regardless of the species relationship in order to infer similarity of function from similarity of sequence.

Recently, Chromatography-based proteomics is used to measure the concentration of low molecular weight peptides in complex mixtures such as plasma or sera. These technologies use time-of-flight (TOF) spectroscopy with matrix-assisted or surface- enhanced laser desorption/ionization to produce a spectrum of mass-to-charge (m/z) ratios that can be analysed in order to identify unique signatures from its chromatography pattern.

Applications of Proteomics:

1. Post-Translational Modifications:

Proteomics studies involve certain unique features as the ability to analyze post- translational modifications of proteins. These modifications can be phosphorylation, glycosylation and sulphation as well as some other modifications involved in the maintenance of the structure of a protein.

These modifications are very important for the activity, solubility and localization of proteins in the cell. Determination of protein modification is much more difficult rather than the identification of proteins. As for identification purpose, only few peptides are required for protease cleavages followed by database alignment of a known sequence of a peptide. But for determination of modification in a protein, much more material is needed as all the peptides do not have the expected molecular mass need to be analyzed further.

For example, during protein phosphorylation events, phosphopeptides are 80 Da heavier than their unmodified counterparts. Therefore, it gives, rise to a specific fragment (PO 3- mass 79) bind to metal resins, get recognized by specific antibodies and later phosphate group can be removed by phosphatases (Clauser et al. 1999 Colledge and Scott, 1999). So protein of interest (post-translationally modified protein) can be detected by Western blotting with the help of antibodies or 32 P-labelling that recognize only the active state of molecules. Later, these spots can be identified by mass spectrometry.

2. Protein-Protein Interactions:

The major attribution of proteomics towards the development of protein interactions map of a cell is of immense value to understand the biology of a cell. The knowledge about the time of expression of a particular protein, its level of expression, and, finally, its interaction with another protein to form an intermediate for the performance of a specific biological function is currently available.

These intermediates can be exploited for therapeutic purposes also. An attractive way to study the protein-protein interactions is to purify the entire multi-protein complex by affinity based methods using GST-fusion proteins, antibodies, peptides etc.

The yeast two-hybrid system has emerged as a powerful tool to study protein-protein interactions (Haynes and Yates, 2000). According to Pandey and Mann (2000) it is a genetic method based on the modular structure of transcription factors in the close proximity of DNA binding domain to the activation domain induces increased transcription of a set of genes.

The yeast hybrid system uses ORFs fused to the DNA binding or activation domain of GAL4 such that increased transcription of a reporter gene results when the proteins encoded by two ORFs interact in the nucleus of the yeast cell. One of the main consequences of this is that once a positive interaction is detected, simply sequencing the relevant clones identifies the ORF. For this reason it is a generic method that is simple and amenable to high throughput screening of protein-protein interactions.

Phage display is a method where bacteriophage particles are made to express either a peptide or protein of interest fused to a capsid or coat protein. It can be used to screen for peptide epitopes, peptide ligands, enzyme substrate or single chain antibody fragments.

Another important method to detect protein-protein interactions involves the use of fluorescence resonance energy transfer (FRET) between fluorescent tags on interacting proteins. FRET is a non-radioactive process whereby energy from an excited donor fluorophore is transferred to an acceptor fluorophore. After excitation of the first fluorophore, FRET is detected either by emission from the second fluorophore using appropriate filters or by alteration of the fluorescence lifetime of the donor.

A proteomics strategy of increasing importance involves the localization of proteins in cells as a necessary first step towards understanding protein function in complex cellular networks. The discovery of GFP (green fluorescent protein) and the development of its spectral variants has opened the door to analysis of proteins in living cells by use of the light microscope.

Large-scale approaches of localizing GFP-tagged proteins in cells have been performed in the genetically amenable yeast S. pombe (Ding et al. 2000) and in Drosophila (Morin et al. 2001). To localize proteins in mammalian cells, a strategy was developed that enables the systematic GFP tagging of ORFs from novel full-length cDNAs that are identified in genome projects.

3. Protein Expression Profiling:

The largest application of proteomics continues to be protein expression profiling. The expression levels of a protein sample could be measured by 2-DE or other novel technique such as isotope coded affinity tag (ICAT). Using these approaches the varying levels of expression of two different protein samples can also be analyzed.

This application of proteomics would be helpful in identifying the signaling mechanisms as well as disease specific proteins. With the help of 2-DE several proteins have been identified that are responsible for heart diseases and cancer (Celis et al. 1999). Proteomics helps in identifying the cancer cells from the non-cancerous cells due to the presence of differentially expressed proteins.

The technique of Isotope Coded Affinity Tag has developed new horizons in the field of proteomics. This involves the labeling of two different proteins from two different sources with two chemically identical reagents that differ in their masses due to isotope composition (Gygi et al. 1999). The biggest advantage of this technique is the elimination of protein quantitation by 2-DE. Therefore, high amount of protein sample can be used to enrich low abundance proteins.

Different methods have been used to probe genomic sets of proteins for biochemical activity. One method is called a biochemical genomics approach, which uses parallel biochemical analysis of a proteome comprised of pools of purified proteins in order to identify proteins and the corresponding ORFs responsible for a biochemical activity.

The second approach for analyzing genomic sets of proteins is the use of functional protein microarrays, in which individually purified proteins are separately spotted on a surface such as a glass slide and then analyzed for activity. This approach has huge potential for rapid high-throughput analysis of proteomes and other large collections of proteins, and promises to transform the field of biochemical analysis.

4. Molecular Medicine:

With the help of the information available through clinical proteomics, several drugs have been designed. This aims to discover the proteins with medical relevance to identify a potential target for pharmaceutical development, a marker(s) for disease diagnosis or staging, and risk assessment—both for medical and environmental studies. Proteomic technologies will play an important role in drug discovery, diagnostics and molecular medicine because of the link between genes, proteins and disease.

As researchers study defective proteins that cause particular diseases, their findings will help develop new drugs that either alter the shape of a defective protein or mimic a missing one. Already, many of the best-selling drugs today either act by targeting proteins or are proteins themselves. Advances in proteomics may help scientists eventually create medications that are “personalized” for different individuals to be more effective and have fewer side effects. Current research is looking at protein families linked to disease including cancer, diabetes and heart disease.


A paradigm-shifting book from an acclaimed Harvard Medical School scientist and one of زمن’s most influential people.

It’s a seemingly undeniable truth that aging is inevitable. But what if everything we’ve been taught to believe about aging is wrong? What if we could choose our lifespan?

In this groundbreaking book, Dr. David Sinclair, leading world authority on genetics and longevity, reveals a bold new theory for why we age. As he writes: “Aging is a disease, and that disease is treatable.”

This eye-opening and provocative work takes us to the frontlines of research that is pushing the boundaries on our perceived scientific limitations, revealing incredible breakthroughs—many from Dr. David Sinclair’s own lab at Harvard—that demonstrate how we can slow down, or even reverse, aging. The key is activating newly discovered vitality genes, the descendants of an ancient genetic survival circuit that is both the cause of aging and the key to reversing it. Recent experiments in genetic reprogramming suggest that in the near future we may not just be able to يشعر younger, but actually أصبح younger.


نتائج

Cytological analysis of anthers from R2P2 and R2P2CMS

As with our previous cytological analysis of the anthers of OguCMS cabbage [22], the abnormal pollen development of the OguCMS cabbage line was mainly due to the proliferation and expansion of the tapetum at the anther development stage 9–12 according to Sanders et al [28]. and tapetum PCD from stage 5 to the tetrad stage. To further investigate the tapetum development in anthers of OguCMS cabbage, we performed light and transmission electron microscopy. Paraffin sections (Fig 1) revealed enlarged abnormal tapetum at the tetrad stage of the OguCMS line resulting in delayed deposition of sporopollenin. Compared to R2P2 (Fig 1C and 1D), light microscopy of the tetrads (anther development stage:7–8) and the uninucleate stage (anther development stage:9–10) revealed a fat abnormal tapetum in R2P2CMS (Fig 1E and 1F). Furthermore, the hypertrophic abnormal tapetum at the tetrad stage was observed in R2P2CMS (Fig 1H) using transmission electron (TE) microscopy.

Correlation between samples

Correlation analysis of gene expression level among samples was used to verify experimental reliability and sampling accuracy. The correlation value between the two replicates was calculated based on FPKM, and should be ≥0.92 as per the Encode plan. Correlation between R2P2CMS-1 and R2P2CMS-2 was 0.9479 and 0.9341 between R2P2-1 and R2P2-2 (Table 1). High correlation suggests the replicate samples have high reliability and repeatability, ensuring subsequent analysis reflects real differences in gene expression between R2P2CMS and R2P2.

Differentially expressed genes in R2P2CMS and R2P2 by RNA-seq analysis

RNA-seq analysis generated 13,037,109 to 13,066,594 SE50-clean reads, which were assembled into 36,890 unigenes. A total of 1323 genes (307 up- and 1016 down-regulated genes) with probability ≥0.8 &│log2Ratio(R2P2CMS/R2P20029│≥1 were differentially regulated in R2P2CMS. DEGs were mainly assigned (GO analysis) into three groups: (1) response to stimulus including light intensity and reactive oxygen species (2) cell wall organization or biogenesis (3) pollen development. There were 22 DEGs assigned to pollen development, pollen wall assembly and pollen exine formation, and all were down-regulated in R2P2CMS as showed in Table 2.

Validation of RNA-seq-based DEGs by qRT-PCR

There were 23 DEGs selected for validation using qRT-PCR. Correlation analysis was performed to evaluate the two platforms. The RNA-seq data (log2 (R2P2CMS/R2P2)) and qRT-PCR data (log2(2 -ΔΔCt )) for each DEG (S1 Table) was positively correlated at 0.8438 (Fig 2, correlation is significant at the 0.01 level).

Factors related to tapetum programmed cell death (PCD)

Cytological analysis showed that proliferation and expansion of the tapetum appeared at the anther developmental stage 9–12. Furthermore, most of the microspores were compressed by abnormal hypertrophic tapetum cells in R2P2CMS. Two DEGs were identified (Bol017269, log2Ratio: -12.4592 Bol008912:-9.2109) encoding GA-regulated family protein[29,30], MYB101 (Bol013459:-7.9363)[31–33] involved in GA mediated signaling pathway- triggered PCD, TDF1/MYB 35 (Bol042967:-6.6075)[34], PLP4 (Bol028944:-6.7823)[35] and AMS genes (Bol042692:-2.6678 Bol004758:-3.0183)[36,37], and all these genes were significantly down-regulated in R2P2CMS (S2 Table). Four DEGs were identified as belonging to the cysteine proteinase superfamily[38,39] (Bol041049:-14.5119, Bol015354:-2.0250, Bol041861:-7.6149, Bol023341:-11.0642) and were rarely expressed in R2P2CMS. مستويات التعبير MYB101 (Bol013459), GA-regulated family protein (Bol008912) and cysteine proteinase (Bol041049) were verified by qRT-PCR with a value of log2(2 -PCR -4.6459, -6.9604, -11.6789.

Essential biosynthesis pathways and key related genes in exine development

From our pathway enrichment results, sporopollenin biosynthesis such as fatty acid elongation (S3 Table), biosynthesis of unsaturated fatty acid (S4 Table), phenylpropanoid biosynthesis pathway (S5 Table), flavonoid biosynthesis (S6 Table), carotenoid biosynthesis (S7 Table), pathway of cutin, suberine and wax biosynthesis (S8 Table) and protein processing in ER (S9 Table) were among the top 20 significantly enriched pathways (pathways with Q-value ≤ 0.05).

All 8 DEGs identified as being involved in fatty acid elongation and 8 DEGs identified as being involved in biosynthesis of unsaturated fatty acid were down-regulated in R2P2CMS. Most of the genes involved in fatty acid elongation were KCS (3-ketoacyl-CoA synthase) genes.

All 24 DEGs (except Bol017968) involved in the phenylpropanoid biosynthesis pathway and 20 DEGs involved in flavonoid biosynthesis were down-regulated in R2P2CMS. Key genes participated both in flavonoid biosynthesis and phenylpropanoid biosynthesis or metabolic process by KEGG annotation included DRL1 (Bol016365: -1.6646), LAP5 (Bol013698: -2.3969 Bol034656: -3.1199), LAP6 (Bol025267: -1.8631), CYP78A7 (Bol043713: -5.2576) and CYP98A8 (Bol039941: -7.1587). Other key phenylpropanoid biosynthesis genes included ACOS5 (Bol029711: -2.3937) and PAL1 (Bol037689: -1.5571 Bol025522: -2.1679) which were also identified as participating in gametophyte development annotated by GO. Other key DEGs involved in the flavonoid biosynthesis included CYP703A2 (Bol018458: -4.5243 Bol040704: -1.6142), and CHS (Bol043396: -2.2360 Bol034259:-1.3776). مستويات التعبير DRL1 (Bol016365), LAP5 (Bol034656), CYP98A8 (Bol039941), ACOS5 (Bol029711) and CYP703A2 (Bol018458) were verified by qRT-PCR with log2(2 -ΔΔCt ) values of -2.5752, -3.9456, -7.5928, -1.8604, -6.1178, -11.6789, respectively.

All 15 DEGs involved in carotenoid biosynthesis were down-regulated in the CMS line except 3 genes. Key genes were analyzed including GELPs (GDSL-like Lipases, Bol026926:-11.0867 Bol023605:-10.7184 Bol002897:-10.6968 Bol002899:-9.1983 Bol029971:-2.4724 and Bol026928:-10.9374), EXL4 (extracellular lipase 4, Bol039273:-14.7554 and Bol037608:-14.7206), CYP97A3 (Bol005984:-1.6580) and ATA27 (Glycosyl hydrolase superfamily protein, Bol039271:-10.9311). Among them, low expression was observed in the two EXL4, six GELPs (except gene Bol029971) and ATA27 in R2P2CMS, yet expression was high in R2P2. Log2(2 -ΔΔCt ) values of qRT-PCR analysis of two GELPs genes (Bol023605 and Bol002899) were -10.9400 and -10.7869, respectively.

Twelve DEGs identified as being involved in cutin, suberine and wax biosynthesis were down-regulated in R2P2CMS and key related genes were analyzed. اثنين ms2/jojoba FAR2 genes (Bol010336:-1.6689 Bol007277:-1.6803) were annotated in pollen wall assembly using GO analysis. In R2P2CMS, three CYP86C (Bol032609: -6.4276 Bol004019: -7.1397 Bol029152:-12.8476) and four HXXXD-type acyl-transferase family proteins (Bol033609: -7.6484 Bol033614:-13.5615 Bol033616:-14.2310 Bol033612:-10.4104) were inhibited, yet highly expressed in R2P2. Furthermore, key genes CYP704B1 (Bol023932:-1.8321) and GMC oxidoreductase (Bol029117: -4.0004 Bol045261:-2.7731) are identified.

There were 71 DEGs identified as involved in protein processing in ER and most of the up-regulated genes in the CMS line were heat shock proteins (HSPs) involved in response to stress. HSPs in the ER are thought to prevent tapetum differentiation.

Secretion and translocation of sporopollenin precursors

Secretion and translocation of sporopollenin precursors to the microspores should be inhibited in the CMS lines. ABC (ATP binding cassette) transporters and LTPs (lipid transfer proteins) have been shown to play essential roles in secretion of sporopollenin precursors from tapetal cells and in delivery of these precursors. Here, two of the four identified ABC-2 type transporter family proteins (Bol042334: -5.7642 Bol013065: -4.9162) and three, LTP12 (Bol004980: -11.8782 Bol010612: -17.1135 Bol014756: -10.9286) (S2 Table), showed very low expression in R2P2CMS compared to R2P2. For Bol013065, log2Ratio by RNA-seq was -4.9162 and log2(2 -ΔΔCt ) by qRT-PCR was -5.6584, which is consistent.

In addition to producing precursors for sporopollenin development, tapetum also synthesizes and secretes callose synthase (CALS), also termed β-1,3-glucanase, to degrade the callose wall surrounding the microspores after the tetrad stage. Furthermore, it is thought that the callose wall may play an important role in pollen development as a glucose source or as a stress factor forming tectum of the sexine [40]. Here, the expression level of the DEG CALS5 (Bol019328) was extremely low in R2P2CMS, and a log2Ratio by RNA-seq of -6.1683 and log2(2 -ΔΔCt ) by qRT-PCR of -4.0327. A series of tapetum specific genes expressed at the tetrad stage are listed in Table 3. Tapetum specific proteins with unknown function, anther 20, lysine histidine transporter 2, thaumatin-like protein 3 and pectin lyase-like superfamily proteins, were all down-regulated in R2P2CMS. Expression levels of ATLP-3 (Bol039345), TAP35/TAP44 (Bol011923) and ATA20 (Bol011894) were verified with the log2(2 -ΔΔCt ) of -3.3718, -3.97709 and -14.6351.

Proteomic differences in R2P2CMS and R2P2 by ITRAQ analysis

Quantification repeat analysis.

Here, CV was used to evaluate reproducibility. CV is defined as the ratio of the standard deviation (SD) to the mean. The lower the CV, the better the reproducibility. The mean CV for this experiment was 0.079 (Fig 3), indicating our data was reliable for further study.

X-axis is the deviation between the protein ratio of the replicate samples. Y-axis is the percentage that a protein at a certain angle comprise quantified protein amount.

In total, 274,364 spectrum were generated 22,634 peptides and 7,147 unique proteins were identified with the cutoff: MascotPercolator Q-value ≤ 0.01. While, 833 proteins were differentially expressed including 538 up- and 295 down-regulated in R2P2CMS compared to R2P2, with a significant threshold of fold change ≥ 1.2 or ≤1/1.2 (0.8333333) and Q-value ≤ 0.05.

Among the 833 DEPs, 553 (66.39%) were classified into KEGG pathways, 6 of which were characterized as enrichment pathways with p-value < 0.05. These included ribosome (63, 11.39%), spliceome (36, 6.51%), mRNA surveillance pathway (30, 5.42%), other types of O-glycan biosynthesis(2, 0.36%), glycosphingolipid biosynthesis - ganglio series(4, 0.72%) and other glycan degradation (10, 1.81%) as shown in Table 4, which showed that substantial proteins change and glycan degradation in R2P2CMS compared to R2P2. Sporopollenin biosynthesis related pathways among KEGG analysis of DEPs include protein processing in ER (19, 3.44%), carotenoid biosynthesis (10, 1.81%), phenylpropanoid biosynthesis (17, 3.07%), flavonoid biosynthesis (7, 1.27%), biosynthesis of unsaturated fatty acids(4, 0.72%), cutin, suberine and wax biosynthesis (3, 0.54%), pathways and related DEPs were listed in S10 Table. And DEPs like cysteine proteins(Bol041861 Bol037199) and ABC transporters(Bol013065) were all up-regulated in R2P2. Lipid-transfer protein(Bol033811) was down-regulated in R2P2CMS. Key DEPs involved in pathway of protein processing in ER, except for Bol013102, all the HSPs (Bol039505, Bol036095, Bol032900, Bol039198, Bol010195) were up-regulated in the CMS line, which was consistent with the results of transcriptome. In carotenoid biosynthesis pathway, 5 GDSL-like Lipases(Bol026926, Bol035147, Bol026928, Bol035145, Bol002897) and 2 DEPs EXL4 (Bol037608, Bol039273)were all up-regulated in CMS line. Key DEPs CYP98A8 Bol039941) in phenylpropanoid biosynthesis was up-regulated in R2P2CMS, other key DEPs like DRL1, LAP5, LAP6, ACOS5, and PAL1 found in DEGs were not identified. In flavonoid biosynthesis, key DEPs participated include CYP98A8(Bol039941,+), CHS (Bol043396,-) CYP82F1 (Bol033613, -).

Correlation analysis of DEGs and DEPs

Correlation analysis of DEGs and DEPs was performed between R2P2CMS and R2P2. DEGs and DEPs were divided into four groups according to expression in R2P2CMS compared to R2P2: Group 1, 22 DEGs and DEPs (13 down-regulated and 9 up-regulated) with the same expression Group 2, 70 DEGs and DEPs with opposite expression Group 3, 741 DEPs whose corresponding genes were not differentially expressed Group 4, 1232 DEGs whose corresponding proteins were not differentially expressed. DEGs and DEPs are displayed in the Venn diagram (Fig 4).

KEGG pathways analysis of all the correlated DEGs/DEPs

KEGG pathway analysis of all 92 DEGs/DEPs are shown in Fig 5. Among them, pathways identified include: phenylalanine metabolism (Bol005311, Bol013614), isoflavonoid biosynthesis (Bol041944), fatty acid biosynthesis (Bol008037), ABC transporters (Bol013065), cutin, suberine and wax biosynthesis (Bol032609, Bol004019) and protein processing in ER (HSPS: Bol013102, Bol039505, Bol039198). Except for Bol013102, the expression pattern of other two HSPs in was the same. Key CHS(Bol043396) in flavonoid biosynthesis pathway in both analysis was all down-regulated, while CYP98A8 Bol039941) had the opposite expression pattern. Only one cysteine protein Bol041861 was correlate, but the expression pattern was opposite. 2 DEPs EXL4 (Bol037608, Bol039273) and 3 GDSL-like Lipases Bol026926, Bol002897 and Bol026928 with opposite expression pattern were all correlated in carotenoid biosynthesis pathway. In phenylpropanoid biosynthesis other key genes like DRL1, LAP5, LAP6, ACOS5, and PAL1 found in DEGs were all not identified, only DEPs CYP98A8 Bol039941) up-regulated in R2P2CMS was correlate and it’s expression pattern was opposite. ABC transporters (Bol013065) in both analysis was opposite. In biosynthesis of unsaturated fatty acids, only one NAD(P)-binding Rossmann-fold superfamily protein Bol008037 was correlated with opposite expression pattern. The glycan degradation pathway was identified in both transcriptome and proteome analysis including GELPs (Bol002897 and Bol026928), BGAL (beta-galactosidase, Bol035797 and Bol000448) and EXL6 (extracellular lipase 6, Bol039272) and were expressed at a very low level in R2P2CMS. GELPs (Bol002897 and Bol026928) are also involved in the carotenoid biosynthesis pathway, and EXL6 may play an essential role in pollen development in B. rapa and Arabidopsis [41]. Among DEGs and DEPs with the same trend pattern, EF hand calcium-binding protein family(Bol026249, -3.8032 Bol015339, -3.8569), embryo-specific protein 3 (ATS3, Bol020675, AT5G62210–3.5356) which was participated in reproduction developmental process by GO annotation, late embryogenesis abundant domain-containing protein(Bol042711, AT2G03740–16.9392) which was verified to be accumulated late in embryogenesis of cotton[42], lipid-transfer protein(Bol033811, -11.5318), CHS Bol043396, -2.2360) may be important for resulting in the sterility in R2P2CMS.

X-axis represents the numbers of DEGs or DEPs.


Transcriptome Analysis of Adrenocortical Cells in Health and Disease

The transcriptome is the complete set of transcripts in a specific type of cell or tissue. Generally, the goal of transcriptome analysis is to identify genes differentially expressed among different conditions, leading to a new understanding of the genes or pathways associated with the conditions. Transcriptome analysis requires an appropriate statistical method with a multiple comparison test to interpret global changes in the expression of thousands of genes. This chapter reviews and describes recent progress in transcriptome analysis of adrenocortical cells. Strategies for determining transcriptomes and data mining to interpret analysis are discussed. Representative studies are introduced, including a mouse model for human lipoid adrenal hyperplasia that proposes, as a new pathophysiological hallmark, a reciprocal interaction between adrenocortical cells and infiltrated macrophages. Analysis of global transcript profiling will be an essential tool for future research on the nature of adrenocortical cells.


Why analyse transcriptome instead of proteome? - مادة الاحياء

Proteomics is the large-scale study of proteins, particularly their structures and functions. The proteome is the entire complement of proteins, including the modifications made to a particular set of proteins, produced by an organism or system. This will vary with time and distinct requirements, or stresses, that a cell or organism undergoes.

While proteomics generally refers to the large-scale experimental analysis of proteins, it is often specifically used for protein purification and mass spectrometry. After genomics and transcriptomics, proteomics is considered the next step in the study of biological systems. It is much more complicated than genomics mostly because while an organism’s genome is more or less constant, the proteome differs from cell to cell and from time to time. This is because distinct genes are expressed in distinct cell types. This means that even the basic set of proteins which are produced in a cell needs to be determined. In the past, this was done by mRNA analysis, but this was found not to correlate with protein content. It is now known that mRNA is not always translated into protein. The amount of protein produced for a given amount of mRNA depends on the gene it is transcribed from and the current physiological state of the cell.

Proteomics confirms the presence of the protein and provides a direct measure of the quantity present. Not only does the translation from mRNA cause differences, but many proteins are also subjected to a wide variety of chemical modifications after translation which are critical to the protein’s function such as phosphorylation, ubiquitination, methylation, acetylation, glycosylation, oxidation, and nitrosylation. Some proteins undergo ALL of these modifications, often in time-dependent combinations, aptly illustrating the potential complexity one has to deal with when studying protein structure and function.

Proteomics typically gives us a better understanding of an organism than genomics. First, the level of transcription of a gene gives only a rough estimate of its level of expression into a protein. An mRNA produced in abundance may be degraded rapidly or translated inefficiently, resulting in a small amount of protein. Second, as mentioned above many proteins experience post-translational modifications that profoundly affect their activities. For example, some proteins are not active until they become phosphorylated. Third, many transcripts give rise to more than one protein through alternative splicing or alternative post-translational modifications. Fourth, many proteins form complexes with other proteins or RNA molecules. They only function in the presence of these other molecules. Finally, protein degradation rate plays an important role in protein content.

One way in which a particular protein can be studied is to develop an antibody which is specific to that modification. For example, there are antibodies that only recognize certain proteins when they are tyrosine-phosphorylated, known as phospho-specific antibodies. There are also antibodies specific to other modifications. These can be used to determine the set of proteins that have undergone the modification of interest. For more quantitative determinations of protein amounts, techniques such as ELISAs can be used.

Most proteins function in collaboration with other proteins. One goal of proteomics is to identify which proteins interact. This is especially useful in determining potential partners in cell signaling cascades. Several methods are available to probe protein–protein interactions. The traditional method is yeast two-hybrid analysis. New methods include protein microarrays, immunoaffinity, and chromatography followed by mass spectrometry, dual polarisation interferometry, Microscale Thermophoresis, and experimental methods such as phage display and computational methods.

Robotic preparation of MALDI mass spectrometry samples: Matrix-assisted laser desorption/ionization (MALDI) is a soft ionization technique used in mass spectrometry. It allows for the analysis of biomolecules and large organic molecules which tend to be fragile and fragment when ionized by more conventional ionization methods.

One of the most promising developments to come from the study of human genes and proteins has been the identification of potential new drugs for the treatment of disease. This relies on genome and proteome information to identify proteins associated with a disease, which computer software can then use as targets for new drugs. For example, if a certain protein is implicated in a disease, its 3-D structure provides the information to design drugs to interfere with the action of the protein. A molecule that fits the active site of an enzyme, but cannot be released by the enzyme, will inactivate the enzyme. Understanding the proteome, the structure and function of each protein and the complexities of protein–protein interactions will be critical for developing the most effective diagnostic techniques and disease treatments in the future. Moreover, an interesting use of proteomics is using specific protein biomarkers to diagnose disease. A number of techniques allow testing for proteins produced during a particular disease, which helps to diagnose the disease quickly.


استنتاج

In summary, there is clearly enormous potential in the integration and use of (multi)omics data for a better understanding of the molecular mechanisms, processes and pathways discriminating health and disease.

The success of this new model of science will depend on the gradual shift from a reductionist to a global approach, sustained by a lively and proactive flow of data across and between different fields of expertise, and funding programmes promoting and supporting this endeavour [ 153]. It is reassuring that governments are starting to acknowledge the importance of translating this comprehensive biomedical knowledge to the bedside and thus fostering the implementation of plans supporting the logistics and regulatory actions for such transformation to take place.

Together, this will eventually aid the development of measures for disease prevention, early diagnosis, disease monitoring and treatment, thus making precision medicine a forthcoming possibility.

We present an overview on the basics and exponential growth of genomics, transcriptomics and proteinomics.

We summarize the principal bioinformatics and biostatistics tools for omics analysis.

Genetics, functional biology, bioinformatics and biostatistics established specific jargons, impacting communication and data interpretation. We particularly aim at targeting a broad range of scientific professionals (including students) seeking knowledge outside their field of expertise.

We provide a critical view of strengths and weaknesses of these omic approaches.


معلومات الكاتب

الانتماءات

Department of Pharmaceutical Sciences, University of Toronto, Toronto, ON, Canada

Mahmoud Labib & Shana O. Kelley

Department of Chemistry, University of Toronto, Toronto, ON, Canada

Institute for Biomaterials and Biomedical Engineering, University of Toronto, Toronto, ON, Canada

Department of Biochemistry, University of Toronto, Toronto, ON, Canada

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

مساهمات

ساهم المؤلفون بالتساوي في جميع جوانب المقال.

المؤلف المراسل


شاهد الفيديو: Proteins (أغسطس 2022).