معلومة

تحليل RNA-seq - قيم q في cuffdiff

تحليل RNA-seq - قيم q في cuffdiff


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أستخدم cuffdiff 2.1.1 للبحث عن التعبير الجيني التفاضلي بين حالتين. كل حالة لها 2 مكررات بيولوجية. النتائج التي أحصل عليها تبدو واعدة من منظور تغيير أضعاف السجل - الكثير من الجينات التي أتوقع أن تتأثر لها قيم التغيير الأعلى أضعاف. ومع ذلك ، من منظور قيمة q ، يبدو عددًا قليلاً جدًا من النتائج واعدة ، حيث تحتوي على قيم q> 0.05.

سؤالي هو ، مع وجود مكررين ، كيف يتم حساب قيمة q؟ بالتأكيد إذا كان هناك تباين كبير بين التكرارات ولكن كان الفرق بين الظروف التجريبية كبيرًا أيضًا ، فستكون قيم q عالية في المقابل؟

في هذه الحالة ، هل يمكنني ، أو هل يجب أن أثق حقًا في قيم q؟


q-value هي القيمة الاحتمالية المصححة لحساب اختبارات متعددة (أي أنك تختبر آلاف الجينات). تلك التي تحتوي على قيمة q <0.05 تعتبر مهمة من حيث التجربة. يستخدم Cuffdiff تصحيح Benjamini-Hochberg لحساب FDR (أي قيمة q). لا يعتمد الحساب على عدد التكرارات ، بل يعتمد على توزيع قيم p التي تتأثر ، نعم ، بعدد التكرارات. كلما زاد عدد التكرارات لديك كان ذلك أفضل).


يجد Cuffdiff تغييرات كبيرة في تعبير النص ، والربط ، واستخدام المروج. يمكنك استخدامه للعثور على الجينات والنصوص المعبر عنها تفاضليًا ، وكذلك الجينات التي يتم تنظيمها بشكل تفاضلي على مستوى النسخ وما بعد النسخ.

لتحديد الجين أو النص على النحو المعبر عنه تفاضليًا ، يختبر Cuffdiff التغيير الملحوظ في طية السجل في تعبيره مقابل الفرضية الصفرية بعدم التغيير (أي أن التغيير الحقيقي في طية السجل = صفر). نظرًا لأن خطأ القياس ، والتباين التقني ، والتباين البيولوجي المتقاطع قد ينتج عنه تغيير ملحوظ في طية السجل يكون غير صفري حتى إذا لم يتم التعبير عن الجين / النص بشكل تفاضلي ، فإن Cuffdiff يقيم أيضًا أهمية كل مقارنة. لمزيد من المعلومات حول النموذج ، راجع Trapnell et al (2013) أو راجع & quot كيف تعمل & quot صفحة على موقع Cufflinks.

يقوم Cuffdiff أيضًا بتجميع النصوص في مجموعات ذات مغزى بيولوجيًا ، مثل النصوص التي تشترك في نفس موقع بدء النسخ (TSS) ، من أجل تحديد الجينات التي يتم تنظيمها تفاضليًا على مستوى النسخ أو ما بعد النسخ.

تم إنشاء Cuffdiff في مركز المعلوماتية الحيوية والبيولوجيا الحاسوبية بجامعة ميريلاند. هذا المستند مقتبس من وثائق Cufflinks للإصدار 2.0.2.


تحليل RNA-seq - قيم q في cuffdiff - علم الأحياء

تقوم هذه الأداة بإجراء تحليل التعبير التفاضلي باستخدام الإصدار 2.1.1 من حزمة Cufflinks.

العوامل

  • نوع الإخراج (موجز ، كامل) [موجز]
  • التعليق التوضيحي GTF (الإنسان (hg19) ، الماوس (مم 10) ، الجرذ (rn5)) [الإنسان (hg19)]
  • تبدو أسماء الكروموسومات في ملف BAM بالشكل (chr1، 1) [1]
  • معدل الاكتشاف الخاطئ المسموح به (0-1) [1]
  • تمكين تصحيح القراءة متعدد الخرائط (نعم ، لا) [لا]
  • تصحيح التحيز الخاص بالتسلسل (نعم ، لا) [لا]
  • الجينوم المستخدم لتصحيح التحيز (الإنسان (hg19) ، الفأر (mm10) ، الفأر (mm9) ، الجرذ (rn4)) [الإنسان (hg19)]
  • نوع المكتبة (fr-unstranded ، fr-firststrand ، fr-secondstrand) [fr-unstranded]

تفاصيل

بالنظر إلى ملفات GTF و BAM ، يقوم Cuffdiff بإجراء تحليل التعبير التفاضلي للجينات والنصوص باستخدام خوارزمية Cufflinks. لاستخدام عينات مكررة في Chipster ، يرجى استخدام التعبير التفاضلي للأداة باستخدام Cuffdiff مع التكرارات.

يمكن أن تكتشف أزرار الكم التحيز الخاص بالتسلسل وتصحيحه في تقدير الوفرة.

بشكل افتراضي ، ستقسم أزرار الكم بشكل موحد كل قراءة متعددة الخرائط على جميع المواضع التي تعينها. إذا تم تمكين تصحيح القراءة متعدد الخرائط ، فإن أزرار الكم ستعيد تقدير وفرة النص الذي يقسم كل قراءة متعددة الخرائط احتمالية بناءً على تقدير الوفرة الأولي وطول الجزء المستنتج وانحياز الجزء ، إذا تم تمكين تصحيح التحيز.

يتم حساب قيم p المعدلة FDR (قيم q). تتضمن ملفات الإخراج الموجزة فقط تلك الجينات أو النصوص التي لها قيمة q أقل من FDR المعطى. يتم تعديل قيمة العمود الكبير وفقًا لذلك (نعم / لا) في جميع ملفات الإخراج.

انتاج |

تتكون مخرجات التحليل الموجزة من الملفات التالية:

  • de-genes-cufflinks.tsv: جدول يحتوي على نتائج الاختبار الإحصائي للجينات المعبر عنها تفاضليًا ، بما في ذلك تقديرات تغيير الطيات والقيم p.
  • de-genes-cufflinks.bed: تحتوي نسخة BED لجدول النتائج للجينات على إحداثيات جينومية وتقديرات تغيير أضعاف للتنقل السريع في متصفح الجينوم.
  • de-isoforms-cufflinks.tsv: جدول يحتوي على نتائج الاختبار الإحصائي للأشكال الإسوية المعبر عنها تفاضليًا ، بما في ذلك تقديرات تغيير الطيات والقيم p.
  • de-isoform-cufflinks.bed: يحتوي إصدار BED لجدول النتائج للأشكال الإسوية على إحداثيات جينومية وتقديرات لتغيير الطيات للتنقل السريع في متصفح الجينوم.
  • cufflinks.log: يحتوي على معلومات مفيدة لتشغيل التحليل.

إذا تم تحديد الإخراج الكامل ، فيمكن أيضًا إنشاء المخرجات الاختيارية التالية:

  • genes.fpkm_tracking.tsv: الجينات FPKMs. يتتبع FPKM المجمل للنصوص التي تشترك في كل gene_id
  • isoforms.fpkm_tracking.tsv: نسخة FPKMs
  • tss_groups.fpkm_tracking.tsv: النسخة الأولية FPKMs. يتتبع FPKM المجمل للنصوص التي تشارك كل tss_id
  • cds.fpkm_tracking.tsv: تسلسل الترميز FPKMs. يتتبع FPKM المجمعة للنصوص التي تشارك كل p_id ، بشكل مستقل عن tss_id
  • genes.count_tracking.tsv: عدد الجينات. يتتبع الأعداد المجمعة للنصوص التي تشترك في كل gene_id
  • isoforms.count_tracking.tsv: عدد النسخ
  • tss_groups.count_tracking.tsv: عدد النسخ الأولية. يتتبع الأعداد المجمعة للنصوص التي تشترك في كل tss_id
  • cds.count_tracking.tsv: عدد تسلسل الترميز. يتتبع الأعداد المجمعة للنصوص التي تشترك في كل p_id ، بشكل مستقل عن tss_id

3. قراءة ملفات تتبع المجموعة

  • genes.read_group_tracking.tsv: قراءة الجينات تتبع المجموعة. يتتبع التعبير المُجمل وأعداد النصوص التي تشارك كل gene_id في كل نسخة مكررة
  • isoforms.read_group_tracking.tsv: قراءة نص تتبع المجموعة
  • tss_groups.read_group_tracking.tsv: النسخة الأولية FPKMs. يتتبع التعبير المُجمَّع وأعداد النصوص التي تشارك كل tss_id في كل نسخة متماثلة
  • cds.read_group_tracking.tsv: تسلسل الترميز FPKMs. يتتبع التعبير المُجمع وعدد النصوص التي تشارك كل p_id ، بشكل مستقل عن tss_id في كل نسخة متماثلة

4. اختبارات التعبير التفاضلي

  • gene_exp.diff.tsv: التفاضل الجيني FPKM. اختبارات الاختلافات في FPKM المجمعة للنصوص التي تشترك في كل gene_id
  • isoform_exp.diff.tsv: تفاضل النسخ FPKM.
  • tss_group_exp.diff.tsv: تفاضل النسخة الأولية FPKM. اختبارات الاختلافات في FPKM المجمعة للنصوص التي تشترك في كل tss_id
  • cds_exp.diff.tsv: تفاضل تسلسل الترميز FPKM. اختبارات الاختلافات في FPKM المجمعة للنصوص التي تشترك في كل p_id بشكل مستقل عن tss_id

5. اختبارات الربط التفاضلي

  • splicing.diff.tsv: يسرد ملف محدد بعلامة التبويب هذه ، لكل نسخة أولية ، مقدار التحميل الزائد المكتشف بين الأشكال الإسوية ، أي مقدار التضفير التفاضلي الموجود بين الأشكال الإسوية المعالجة من نسخة أولية واحدة. يتم سرد النصوص الأولية فقط التي يتم من خلالها تقسيم اثنين أو أكثر من الأشكال الإسوية في هذا الملف.

6. إخراج الترميز التفاضلي

  • cds.diff.tsv: يسرد ملف محدد بعلامة التبويب هذه ، لكل جين ، مقدار التحميل الزائد الذي تم اكتشافه بين تسلسلات الترميز الخاصة به ، أي مقدار تباين مخرجات CDS بين العينات. فقط الجينات التي تنتج اثنين أو أكثر من CDS (أي جينات متعددة البروتينات) مدرجة هنا.

7. استخدام المروج التفاضلي

  • Promers.diff.tsv: يسرد ملف محدد بعلامة التبويب هذه ، لكل جين ، مقدار التحميل الزائد المكتشف بين النصوص الأولية ، أي مقدار استخدام المروج التفاضلي الموجود بين العينات. فقط الجينات التي تنتج نسختين أو أكثر من النسخ الأولية المتميزة (أي الجينات متعددة المحفزات) مدرجة هنا.
  • read_groups.info.txt: قوائم الملفات المحددة بعلامة التبويب هذه ، لكل تكرار ، الخصائص الرئيسية التي يستخدمها Cuffdiff أثناء القياس الكمي ، مثل عوامل تسوية المكتبة.
  • run.info.txt: يسرد هذا الملف المحدد بعلامة التبويب أجزاء مختلفة من المعلومات حول تشغيل Cuffdiff للمساعدة في تتبع الخيارات المتوفرة.

مراجع

تستخدم هذه الأداة حزمة Cufflinks للتحليل الإحصائي. يرجى قراءة المقالة التالية لمزيد من المعلومات التفصيلية:


Кспериментальные методы в системной биологии

تعرف على التقنيات الأساسية للتجربة المستخدمة في بيولوجيا الأنظمة ، مع التركيز بشكل خاص على تسلسل الحمض النووي الريبي ، والبروتينات القائمة على المواصفات الجماعية ، وقياس التدفق / الكتلة الخلوية وتصوير الخلايا الحية. المحرك الرئيسي لمجال بيولوجيا الأنظمة هو التكنولوجيا التي تسمح لنا بالتعمق بشكل أعمق وأوسع في كيفية استجابة الخلايا للاضطرابات التجريبية. يسمح لنا هذا بدوره ببناء نماذج كمية أكثر تفصيلاً للوظيفة الخلوية ، والتي يمكن أن تعطي نظرة ثاقبة مهمة في التطبيقات التي تتراوح من التكنولوجيا الحيوية إلى الأمراض البشرية. يقدم هذا المساق نظرة عامة واسعة على مجموعة متنوعة من التقنيات التجريبية الحالية المستخدمة في بيولوجيا الأنظمة الحديثة ، مع التركيز على الحصول على البيانات الكمية اللازمة لأغراض النمذجة الحسابية في تحليلات المصب. نتعمق في أربع تقنيات على وجه الخصوص ، تسلسل mRNA ، والبروتيوميات القائمة على قياس الطيف الكتلي ، وقياس التدفق / الكتلة الخلوية ، وتصوير الخلايا الحية. غالبًا ما تُستخدم هذه التقنيات في بيولوجيا الأنظمة وتتراوح من التغطية على نطاق الجينوم إلى تغطية الجزيء الفردي ، وملايين الخلايا إلى الخلايا المفردة ، والنقاط الزمنية الفردية إلى الدورات الزمنية التي يتم أخذ عينات منها بشكل متكرر. لا نقدم فقط الخلفية النظرية التي تعمل عليها هذه التقنيات ، ولكننا ندخل أيضًا في بيئات المختبرات الرطبة الحقيقية لتقديم إرشادات حول كيفية تنفيذ هذه التقنيات في الممارسة العملية ، وكيفية تحليل البيانات الناتجة من حيث الجودة والمحتوى.

Рецензии

أحببت هذه الدورة. البروفيسور بيرتويستل هو حقًا في التدريس وقد أحب الطريقة التي نظم بها هذه الدورة. شكرا!

صعب جدًا ، قد يساعد إذا قدم المعلم مفتاح الإجابة أو قام بمراقبة الدردشة أكثر قليلاً


ورشة عمل تحليل بيانات RNA-Seqمراقبة الجودة ، قراءة الخرائط ، التصور والتحليلات النهائية

تقدم بأبحاثك. فهم تحليل RNA-Seq للتحديات وحلها بنفسك.

شيء صغير

  • يتعلم مهارات الحوسبة الأساسية للمعلوماتية الحيوية في NGS
  • تفهم خوارزميات تحليل NGS (مثل محاذاة القراءة) وتنسيقات البيانات
  • يستخدم أدوات المعلوماتية الحيوية لمعالجة بيانات RNA-Seq
  • إنشاء الرسومات التشخيصية والإحصاءات
  • قارن مناهج مختلفة لتحليل التعبير التفاضلي

متى؟
من 5 إلى 8 أكتوبر 2021

أين؟
ليبتسغ - ألمانيا

النطاق والموضوعات

الغرض من هذه الورشة هو الحصول على فهم أعمق في تسلسل الجيل التالي (NGS) مع التركيز بشكل خاص على قضايا المعلوماتية الحيوية. سيتم اكتشاف مزايا وعيوب تقنيات التسلسل الحالية وآثارها على تحليل البيانات. سيتم تدريبك على فهم تنسيقات بيانات NGS والتعامل مع المشكلات / الأخطاء المحتملة فيها. في الدورة التدريبية ، سوف نستخدم مجموعة بيانات RNA-seq واقعية من الشركة الرائدة حاليًا في السوق illumina.

سيتم تمكين جميع الحاضرين في ورشة العمل من أداء المهام الأولى المهمة لتحليل بيانات NGS بأنفسهم. تم تكييف تخطيط الدورة التدريبية لاحتياجات المبتدئين في مجال المعلوماتية الحيوية NGS ويسمح للعلماء الذين ليس لديهم خلفية قليلة في علوم الكمبيوتر بالحصول على أول تجربة عملية في هذا الموضوع البحثي الجديد والسريع التطور.

فلسفتنا

احصل على تدريب من قبل خبراء

يتمتع مدربونا بسجل حافل من الخبرة الأكاديمية و / أو الصناعية في تحليل بيانات NGS. لأن المعرفة الخبيرة الحديثة ضرورية للإجابة على أسئلتك ومعرفة ما هو مهم في هذا المجال.

أدوات NGS مفتوحة المصدر

نحن نستخدم فقط أدوات مفتوحة المصدر مجانية الاستخدام. نحاول عرض ومقارنة الأدوات المختلفة (مثل مصممي خرائط NGS) ، حيث لا يتناسب كل برنامج مع كل مهمة / سؤال.

تعلم بشكل فعال باستخدام مواد جيدة التنظيم

للحصول على تجربة تعليمية مثالية ، نقوم بإعداد المواد التعليمية وبيانات الأمثلة بعناية. جميع المواد والأدوات والنتائج التي تم إنشاؤها أثناء الدورة التدريبية هي لأخذها معك إلى المنزل.

تصميم ورشة العمل

تم إعادة تصميم ورشة العمل هذه وتكييفها مع احتياجات المبتدئين في مجال المعلوماتية الحيوية NGS وتتألف من وحدات الدورة التدريبية الثلاث هذه:

  1. لينكس للمعلوماتية الحيوية:
    ستقدم هذه الوحدة الأدوات الأساسية وتنسيقات الملفات المطلوبة لتحليل بيانات NGS. يساعد في التغلب على العقبات الأولى عند الدخول إلى نظام التشغيل (لتحليلات NGS) الذي لا مفر منه.
  2. مقدمة في تحليل بيانات NGS:
    سيتم شرح طرق مختلفة لـ NGS ، وإعطاء أهم الرموز وإجراء التحليلات الأولى. تغطي هذه الوحدة المعرفة الأساسية لتحليل بيانات RNA-Seq.
  3. تحليلات بيانات RNA-seq: في هذه الوحدة ، سيتم وصف واختبار أدوات المعلوماتية الحيوية المختلفة لمحاذاة RNA-seq. ثم نقوم بتطبيق ومقارنة الطرق المختلفة لتحليل التعبير التفاضلي باستخدام RNA-Seq.

برنامج الدورة التفصيلي

لينكس للمعلوماتية الحيوية

  • مقدمة لسطر الأوامر والأوامر المهمة
  • الجمع بين الأوامر عن طريق الأنابيب وإعادة التوجيه
  • مقدمة إلى تنسيقات ملفات المعلومات الحيوية وقواعد البيانات (مثل UCSC و ENSEMBL)

مقدمة في تحليل بيانات NGS

  • مقدمة لتقنيات التسلسل من وجهة نظر محللي البيانات
  • ملفات التسلسل الأولي (تنسيق FASTQ)
  • المعالجة المسبقة للقراءات الأولية: مراقبة الجودة (FastQC) ، قص المحول ، تقليم الجودة
  • مقدمة لقراءة الخرائط (طرق المحاذاة ، استدلال الخرائط)
  • فهم تعيين القراءة المقسمة
  • تشغيل مخططات مختلفة للقراءة المقسمة (Tophat ، STAR)
  • قم بتشغيل أداة المحاذاة الزائفة السلمون
  • إخراج التعيين (تنسيق SAM / BAM)
  • استخدام مجموعات أدوات NGS المهمة (samtools)
  • إحصائيات الخرائط
  • تصور القراءات المعينة (IGV ، UCSC)

تحليلات بيانات RNA-seq

  • تعرف على مجموعة Tuxedo Suite (أزرار أكمام ، وأزرار أكمام ، و Cuffmerge ، و cuffdiff ، وما إلى ذلك)
  • فهم الإحصائيات وراء DEseq2 و DIEGO
  • تحديد exons / الجينات / النصوص
  • يتنبأ
    • الربط التفاضلي باستخدام DIEGO
    • التعبير الجيني التفاضلي باستخدام DEseq2
    • التعبير الإسوي التفاضلي باستخدام صفعة

    مكبرات الصوت

    دكتور كريستيان أوتو (ecSeq Bioinformatics GmbH)
    كريستيان هو أحد مطوري أداة قراءة الخرائط segemehl وهو خبير في تنفيذ الخوارزميات الفعالة لتحليل بيانات NGS. المنشورات

    د. ماريو فاسولد (ecSeq Bioinformatics GmbH)
    يعمل ماريو في تحليل بيانات المصفوفات الدقيقة منذ عام 2007 وقام بتطوير العديد من أدوات المعلوماتية الحيوية مثل حزمة الموصل الحيوي AffyRNADegradation وحزمة برنامج Larpack. منذ عام 2011 تخصص في مجال تحليل بيانات NGS وساعد في تحليل بيانات التسلسل للعديد من مشاريع الكونسورتيوم الكبيرة. المنشورات

    متطلبات

    الجمهور المستهدف هو علماء الأحياء أو محللي البيانات مع خبرة قليلة أو معدومة في تحليل بيانات NGS. يُفترض وجود فهم أساسي للبيولوجيا الجزيئية (DNA ، RNA ، التعبير الجيني ، PCR ،.).

    تعد المعرفة الأساسية بلينكس والمعلوماتية الحيوية (استخدام سطر الأوامر والأوامر والأدوات الشائعة) مفيدة ولكنها ليست مطلوبة. يمكنك أن تعد نفسك مع تعلم برنامج شل التعليمي.

    المدرجة في الدورة

    • مواد الدورة
    • تقديم الطعام خلال ورشة العمل
    • عشاء المؤتمر
    • محطات عمل عالية الأداء (لا حاجة إلى كمبيوتر محمول)
    • USB-Stick لأخذ النتائج والتحليل إلى المنزل

    حضور

    موقع: Z & ampP Schulung GmbH ، Rabensteinplatz 1 ، لايبزيغ ، ألمانيا
    لغة: إنجليزي
    المقاعد المتاحة: 18 (من يأتي أولاً يخدم أولاً)

    رسوم التسجيل: 1،359 يورو (غير شامل ضريبة القيمة المضافة)

    لا تغطي رسوم التسجيل نفقات السفر والإقامة.

    التواريخ الرئيسية

    تاريخ افتتاح التسجيل: 1 مارس 2021
    تاريخ إغلاق التسجيل: 1 أكتوبر 2021
    ورشة عمل: من 5 إلى 8 أكتوبر 2021 (9 صباحًا - 5 مساءً)

    ما يقوله المشاركون لدينا

    "تجربة رائعة ومعلمون متعاونون ودودون وورشة عمل مثيرة للاهتمام ومنظمة بشكل جيد. قدمت هذه الدورة التدريبية اللازمة في NGS التي يمكن استخدامها في المشاريع البحثية. شخصيًا ، لكوني في المراحل الأولى من دراستي الجامعية في علم الأحياء الجزيئي وعلم الوراثة ، ألهمت هذه الورشة حقًا أنا ووسعت آفاقي. وبشكل أكثر تحديدًا ، من خلال مقابلة مشاركين من جميع أنحاء العالم يشاركون في مجالات علمية مختلفة ، وحضور محادثات من متحدثين خارجيين وصفوا مسار حياتهم المهنية والتعرف على مدربي الدورة الذين كانوا مليئين متحمسًا للمعلوماتية الحيوية ، أدركت الترابط بين المجالات العلمية والخيارات المهنية المختلفة التي من المحتمل أن أشارك فيها في المستقبل. " إيوانا جكوغكا ، البيولوجيا الجزيئية وعلم الوراثة ، جامعة تراقيا ، اليونان

    "تم تصميم الدورة للأشخاص الذين يبدأون عملهم مع RNA-Seq وتم إعدادها وقيادتها بشكل جيد للغاية. يتم تقديم المعلومات بطريقة واضحة ويمكن الوصول إليها ، والأهم من ذلك ، من وجهة نظر عملية. يتمتع المدربون بخبرة واسعة و تقديم رؤى قيمة حول المشكلات الحقيقية الناشئة عن تحليل البيانات. ويسعدني أن أتيحت لي الفرصة لحضور ورش العمل هذه. وستكون المعرفة والمهارات المكتسبة خلال ورش العمل مفيدة للغاية في التخطيط لتجاربي الخاصة وستمكنني من البدء في تحليل البيانات الخاصة بي. أوصي بالتأكيد بهذه الورش لأي شخص يخطط لإجراء تجارب RNA-seq. " Dorota Magner ، معهد الكيمياء الحيوية ، الأكاديمية البولندية للعلوم ، بولندا

    "لقد تأثرت بشكل خاص بالتركيز على تعليمنا كيفية التفكير في تحليلاتنا ، بدلاً من مجرد اتباع سلسلة من الأوامر. تركيزك على توقع المصادر المحتملة للخطأ ، وعدم الثقة بشكل أعمى في أن أمرًا أو جزء من البرنامج قد فعل ما تفعله أعتقد أنه تم القيام به دون تأكيد (بالإضافة إلى تعليمنا طرق للتأكيد) تركنا بمجموعة مهارات مستقلة عن خط أنابيب معين ، وسوف يخدمنا تغيير اهتماماتنا (والبرامج المتاحة). كانت التدريبات النشطة بوضوح تم تصميمها بعناية فائقة وكانت فعالة حقًا ليس فقط في تطبيق ما تعلمناه للتو ، ولكن في رؤية كيف يمكن أن تقع في فخ التحليل / التفسير إذا لم تكن حريصًا. كان هذا حقًا عقلية / فلسفة للتدريب على التحليل بقدر ما لقد كان تدريبًا عمليًا ، وأنا أقدر ذلك كثيرًا. شكرًا لك! " مورجان بينويتز فريدريكس ، جامعة باكنيل ، الولايات المتحدة الأمريكية

    سجل الان

    عندما تقوم بالتسجيل في ورشة العمل هذه ، فإنك توافق على شروط وأحكام ورشة العمل الخاصة بنا. يرجى قراءتها قبل التسجيل.


    أسئلة متسلسلة RNA مبتدئ

    & # x27m جديد لتحليل تسلسل الحمض النووي الريبي ، وأود & # x27d الحصول على رأي حول سير العمل الخاص بي. أريد التعبير الجيني التفاضلي للطفرة مقابل التحكم (خلايا الفأر الأولية) مكررين بيولوجيين لكل منهما. & # x27m أفعل هذا في Galaxy هنا رابط imgur لسير العمل الخاص بي. هل هناك شيء خاطئ بشكل صارخ في ذلك؟ أو أي شيء تعتقد أنه يجب تغييره / تحسينه؟

    & # x27m باستخدام igenomes mm10.gtf للنموذج الجيني الخاص بي في STAR ولملف ملف النسخ لـ cuffdiff. هل هذا كافٍ ، أم أنك توصي بإنشاء نموذج جيني وجينوم مرجعي جديد من UCSC / Ensembl؟ & # x27m أيضًا لست متأكدًا من الملف الذي يجب استخدامه لتصحيح الانحياز في Cuffdiff. ماذا أستخدم؟

    قمت بتشغيل كلاً من Cuffdiff و Feature Counts - & gtDEseq2 ، لكنني & # x27m لست متأكدًا من أداة DE التي يفضلها. في نهاية المطاف ، أود أن أقوم بتحليل الأنطولوجيا الجينية عبر البراعة أو أي برنامج آخر. القراءة عنهم تربكني أكثر ، حيث يبدو أن لكل منهما إيجابيات وسلبيات.

    إحصائياتي صدئة جدًا وأنا لست متأكدًا من طرق التطبيع والتشتت التي يجب استخدامها. حتى الآن ، كنت & # x27ve أستخدم الإعداد الافتراضي ، لكني & # x27m لست متأكدًا من أن هذه هي أفضل الخيارات بالنسبة لي. هل يمكن لأي شخص أن يوجهني في الاتجاه الصحيح لمعرفة المزيد عن هذا؟

    أهمية CUFFDIFF

    أخيرًا ، عند النظر إلى جينات DE المهمة عبر Cuffdiff ، أجد المشكلات التالية:

    عندما يكون لأحد الشروط صفر والآخر له قيمة موجبة ، فإن Cuffdiff لا ينتج عنه & # x27t تغييرًا مطويًا ولا يختبره من أجل الأهمية. أنا أفهم لماذا ، رياضيًا ، أتوقع أن بعض هذه الجينات تعمل أو لا تعمل في حالة الطفرات. أريد التأكد من التقاط تلك الجينات.

    أحيانًا ألاحظ تغييرًا كبيرًا في الطية ، لكن Cuffdiff لا يطلق عليه & # x27t أنه مهم ، على سبيل المثال:

    من خلال النظر إليه ، يبدو وكأنه تغيير كبير في الطية. لدي بيانات RT-qPCR والبروتين التي تُظهر أن الجين X خاضع للتنظيم في المتحول. لماذا & # x27t Cuffdiff يسمي هذا الأمر مهمًا؟


    القسم 4. كرر بدون تكرار [20 دقيقة] والفقرة

    في هذا القسم ، سنقوم بتشغيل Cuffdiff بعدد أقل من التكرارات.

    توقف و فكر:

    كرر اختبار التعبير الجيني التفاضلي من القسم 2 ، ولكن هذه المرة فقط استخدم نسخة مكررة واحدة من كل مجموعة شرطية (C1 و C2).
    من لوحة أدوات Galaxy ، حدد NGS: تحليل الحمض النووي الريبي و GT Cuffdiff وقم بتعيين المعلمات على النحو التالي:

    • النصوص: ensembl_dm3.chr4.gtf
    • شرط:
      • 1: الشرط
        • اسم: C1
        • مكررات: Tophat على البيانات 1: Accept_hits
        • اسم: C2
        • مكررات: Tophat على البيانات 4: Accept_hits

        قم بتصفية مجموعة الجينات التي تم إنشاؤها مؤخرًا للجينات المعبر عنها تفاضليًا بشكل كبير من خلال الانتقال إلى تصفية وفرز وتصفية GT:

        • منقي: & ldquo تعثر على البيانات. اختبار التعبير التفاضلي الجيني rdquo و
        • بالشروط التالية: c14 == & rsquoyes & rsquo
        • ينفذ

        أعد تسمية ملف الإخراج إلى شيء ذي معنى مثل & ldquoSignificant_DE_Genes_C1_R1_vs_C2_R1 & rdquo

        اضغط على رمز العين من Significant_DE_Genes_C1_R1_vs_C2_R1.
        يجب ان تحصل على لا الجينات المعبر عنها تفاضليًا عند دلالة إحصائية قدرها 0.05. لم يتم تحديد الجين & ldquoAnk & rdquo و & ldquoCG1277 & rdquo ، اللذان تم التعبير عنهما بشكل تفاضلي بشكل كبير في تحليلنا الأول ، على أنهما معبران بشكل تفاضلي عندما نستخدم عينة واحدة فقط لكل حالة.

        كرر تحليل عدم التكرار هذا ، ولكن هذه المرة حدد مجموعة مختلفة من العينات. من لوحة أدوات Galaxy ، حدد NGS: تحليل الحمض النووي الريبي و GT Cuffdiff وقم بتعيين المعلمات على النحو التالي:

        • النصوص: ensembl_dm3.chr4.gtf
        • شرط:
          • 1: الشرط
            • اسم: C1
            • مكررات: Tophat على البيانات 1: Accept_hits
            • اسم: C2
            • مكررات: Tophat على البيانات 5: Accept_hits

            قم بتصفية مجموعة الجينات التي تم إنشاؤها مؤخرًا للجينات المعبر عنها تفاضليًا بشكل كبير من خلال الانتقال إلى تصفية وفرز وتصفية GT:

            • منقي: & ldquo تعثر على البيانات. اختبار التعبير التفاضلي الجيني rdquo و
            • بالشروط التالية: c14 == & rsquoyes & rsquo
            • ينفذ

            أعد تسمية ملف الإخراج إلى شيء ذي معنى مثل & ldquoSignificant_DE_Genes_C1_R1_vs_C2_R2 & rdquo

            اضغط على رمز العين من Significant_DE_Genes_C1_R1_vs_C2_R2.
            نرى الآن & ldquoCG2177 & rdquo تظهر مرة أخرى في القائمة كما تم التعبير عنها بشكل تفاضلي بشكل كبير ، ولكن ليس & ldquoAnk & rdquo.

            كيف يمكننا تفسير الاختلاف في النتائج من استخدام مكررات مختلفة؟

            يوجد فرق مطلق أكبر في تعبير CG1277 بين العينات 1 (C1_R1) و 5 (C2_R2) من العينات 1 (C1_R1) و 4 (C2_R1) ، ومن ثم يحدد Cuffdiff CG1277 على أنه معبر عنه تفاضليًا بين C1_R1 و C2_R2 ، ولكن ليس بين C1_R1 و C2_R1 .

            من ناحية أخرى ، تكون الاختلافات في مستوى التعبير عن Ank أصغر بكثير بين العينات ، لذلك نحتاج إلى رؤيتها باستمرار عبر مكررات متعددة حتى يكون Cuffdiff واثقًا من وجودها بالفعل. تكرار واحد لا يكفي.

            يعتمد تحديد الجينات المعبر عنها تفاضليًا على حجم الاختلاف في التعبير والتباين الملاحظ عبر التكرارات المتعددة. يوضح هذا مدى أهمية وجود مكررات بيولوجية في تجارب التعبير الجيني التفاضلي.

            إذا قلنا أن الجينات Ank و CG2177 موجودة حقا بالتعبير التفاضلي ، يمكننا تسمية هذه الحالات التي لا يتم فيها تحديد الجينات الحقيقية المعبر عنها تفاضليًا على أنها سلبيات كاذبة. بشكل عام ، تؤدي زيادة التكرارات إلى تقليل عدد السلبيات الخاطئة.

            من المرجح أيضًا أن ترى المزيد من الإيجابيات الخاطئة عند استخدام عدد غير كافٍ من التكرارات. يمكن تعريف الإيجابيات الكاذبة على أنها تحديد الجين على أنه يتم التعبير عنه بشكل تفاضلي عندما يكون ، في الواقع ، لا.

            [خطوة اختيارية]
            كرر هذا التحليل ، وحدد مجموعات من نسختين لكل منهما. على ماذا تحصل؟ كم عدد التكرارات التي نحتاجها لتحديد Ank كما تم التعبير عنه بشكل تفاضلي؟


            الملخص

            جنس Amaryllidaceae نرجس يحتوي على مستقلبات ثانوية متنوعة ، وهي مصادر مهمة للقلويدات النشطة بيولوجيًا. تتطلب المسارات البيوكيميائية لإنتاج المستقلبات الثانوية أن تخضع المستقلبات الأولية لسلسلة من التعديلات المحفزة بواسطة العديد من الإنزيمات ولكن المعرفة حول تركيبها الحيوي محدودة للغاية. أجريت هذه الدراسة للكشف عن التعبير التفاضلي للنصوص المتعلقة بالتخليق الحيوي للمستقلبات الثانوية في نرجس لوحة القاعدية و في المختبر الكالس.

            تحليل تسلسل الحمض النووي الريبي نرجس الصفيحة القاعدية (الحقل) و في المختبر تلا ذلك الكالس إجمالي 2153 نسخة معبر عنها تفاضليًا وتم شرح 83.46٪ منها. تم تصنيف أكبر مجموعة جينية على أنها بروتينات غير مميزة (10.24٪) وكانت ثاني أكبر مجموعة هي الجينات المسؤولة عن إنتاج المستقلب الثانوي (8.88٪). الجينات المشاركة في التخليق الحيوي للقلويدات السيتوكروم P450s، O- ميثيل ترانسفيرازات (OMTs), NADP / NADPH ديهيدروجينازات أو اختزال ، سام-التركيبات أو decarboxylases ، 3-ketoacyl-CoA ، acyl-CoA ، cinnamoyl-CoA ، سينامات 4-هيدروكسيلاز ، الكحول ديهيدروجينيز ، حمض الكافيك ، نميثيل ترانسفيراز ، و نادف-سيتوكروم P450s كانت موجودة في كل من الصفيحة القاعدية والكالس. ومع ذلك ، السيتوكروم P450s، و OMTs المسؤولة عن تنظيم المرحلة اللاحقة من التخليق الحيوي للقلويدات تم تنظيمها بشكل رئيسي في العينات الميدانية. في حين أن الإنزيمات المشاركة في مسارات التخليق الحيوي الأولية ، والفركتوز ثنائي فوسفات adolase (FBA) ، و aminotransferase ، و dehydrogenase ، و hydroxyl methyl glutarate (HMT) ، و glutamate synthase (GS) المؤدية إلى التخليق الحيوي للسلائف من المستقلبات الثانوية ، التيروزين ، منظم في الكالس. علاوة على ذلك ، تم افتراض شرح توضيحي لعلم الوجود الجيني للنصوص وما يرتبط بها من موسوعة كيوتو للجينات والجينوم (KEGG) وخرائط مسار النبات. هذه المعرفة حول الجينات أو الإنزيمات المحتملة المشاركة في التمثيل الغذائي الثانوي ، ومسار الشبكات والتنظيم الجزيئي في المجال و في المختبر سيوفر الكالس نظرة عميقة على نرجس بيولوجيا النبات المتعلقة بإنتاج المستقلبات القيمة.


            0.4 تحليل تفاضلي تسلسل الحمض النووي الريبي

            لنفترض & # x27s أن لدينا سلالة من الإشريكية القولونية نريد تحسينها لإنتاج الإيثانول ، لكننا لا نعرف الجينات المعنية. ماذا نفعل؟

            نقوم بإجراء تحليل التعبير التفاضلي على بيانات RNA-seq الخاصة بنا. تم بالفعل حساب مستويات التعبير باستخدام أزرار الكم.

            منهجية بسيطة لتقييم مستويات التعبير التفاضلي هي الاختلافات في عدد النسخ بين ظروف العينة ، ولكن قد يكون هذا خاطئًا بسبب التضفير البديل والتحيزات في التسلسل.

            هناك طريقة أكثر قوة وهي ملائمة ملف توزيع السم بالنظر إلى توقع أن احتمالات رؤية تغيير في مستوى التعبير صغيرة.

            لكن Poisson لا يمثل & # x27t حسابًا لحساب عدم اليقين وإحصاء التشتت!

            عد عدم اليقين: حقيقة أن القراءات يمكن مشاركتها عبر جينات متعددة بسبب البيانات الجينية المشتركة.

            عدد التشتت: حقيقة أن عدد القراءات المنتجة متغير بدرجة كبيرة بين التكرارات.

            تعالج طريقتنا كلتا هاتين المسألتين من خلال نمذجة كيف يعتمد التباين في قياسات نسخة وعدد أجزاء # x27s على كل من تعبيرها وهيكل الربط الخاص بها.

            الطريقة التي يحدث بها هذا هي:

            تلتقط الخوارزمية عدم اليقين في عدد النسخ & # x27s كتوزيع بيتا والتشتت الزائد في هذا العدد بحدين سالب ، وتخلط التوزيعات معًا. الخليط الناتج هو توزيع ذو حدين سالب بيتا يعكس كلا مصدري التباين في مستوى التعبير المقاس في الشكل الإسوي & # x27s.


            الانتماءات

            مركز العلوم الحيوية المتجددة ، جامعة جورجيا ، أثينا ، جورجيا ، الولايات المتحدة الأمريكية

            Xiaogang Cui ، Brett Marshall & amp Hong-Xiang Liu

            قسم علوم الحيوان والألبان ، كلية العلوم الزراعية والبيئية ، جامعة جورجيا ، أثينا ، جورجيا ، الولايات المتحدة الأمريكية

            Xiaogang Cui و Brett Marshall و Romdhane Rekaya & amp Hong-Xiang Liu

            قسم علم وظائف الأعضاء وعلم الأدوية ، كلية الطب البيطري ، جامعة جورجيا ، أثينا ، جورجيا ، الولايات المتحدة الأمريكية

            معهد المعلوماتية الحيوية ، جامعة جورجيا ، أثينا ، جورجيا ، الولايات المتحدة الأمريكية

            يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

            يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

            يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

            يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

            يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

            يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

            مساهمات

            تصور وتصميم التجارب: XC ، BM ، RR ، HXL ، أجرى التجارب: XC ، BM ، NS ، HXL ، البيانات المحللة: XC ، BM ، RR ، HXL ، الكواشف / المواد / الأدوات المساهمة: SC ، RR ، HXL ، مخطوطة مكتوبة ومحررة: XC، BM، SC، RR، HXL

            المؤلف المراسل


            شاهد الفيديو: RNA Integrity and Quality Standardize RNA Quality Control (يونيو 2022).


تعليقات:

  1. Cipriano

    رسالة ممتازة وفي الوقت المناسب.

  2. Sciiti

    في رأيي كنت قد خدعت ، كطفل.

  3. Dazshura

    الرسالة الاستبدادية :) ، الغريب ...

  4. Jock

    في رأيي ، إنها طريقة خاطئة.

  5. Maeret

    في مكانك ، أود أن أتناول المساعدة في محركات البحث.



اكتب رسالة