معلومة

نظرية بايز للطفرات

نظرية بايز للطفرات


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

MEN 2A هو مرض وراثي سائد ناتج عن طفرة في الجين الورمي الأولي لـ RET. يختلف احتمال الإصابة بالمرض عندما يكون لديك طفرة في الجين الورمي الأولي لـ RET مع تقدم العمر ويفترض أن يكون 40٪ عند سن 40 عامًا.

مع الأمراض الوراثية السائدة ، يمكن استخدام هذه الصيغة ، حيث يشير p إلى الاختراق و D هو الأليل المريض:

P (II يرث D نظرًا لأن II صحي) = $ frac {1-p} {2-p} $

يعاني عم الابن III1 الموجود في الشجرة من المرض ، لذلك يفترض أنه يأتي من I1 أو I2. والد الابن II2 يبلغ من العمر 40 عامًا ولا يعاني من أي أعراض.

ما هي احتمالات إصابة الأب بالطفرة؟

ما هي احتمالات أن يعرف الابن الطفرة النسبة المئوية في السؤال الأول؟

لقد استخدمت الصيغة أعلاه فقط للسؤال الأول: $$ frac {1-0.4} {2-0.4} = 37.5 ٪ $$

أواجه مشاكل مع الثانية على الرغم من أنني أفترض استخدام صيغة بايز.

لقد حاولت على النحو التالي:

$$ P ( text {son mutيار dad mut}) = frac {P ( text {Dad mut Given son mut}) cdot P ( text {son mut)}} {P ( text {Dad mut })} $$

أعلم أن احتمال إصابة الأب بالطفرة هو 37.5٪ واحتمال إصابة الأب بالطفرة بنسبة 100٪. ومع ذلك ، لا يبدو أنني أعرف ما الذي يجب أن أضعه في احتمال إصابة الابن بالطفرة؟ أي مساعدة مقدرة ، شكرا! آسف لسؤال طويل.


لا أفهم حساباتك ولا أفهم سبب محاولتك استخدام صيغة Bayes. لا أعرف صيغة $ frac {1-p} {2-p} $ ولا أفهم ما يفترض أن تحسبه. يبدو لي أنك تفكر كثيرًا في مشكلة بسيطة.

ليس لدينا كل المعلومات ونحتاج إلى عمل مجموعة من الافتراضات ولكن إذا فهمت السؤال بشكل صحيح ، إذن ...

احتمال أن الأب يحمل الأليل الطافر

أنا أهمل احتمال حدوث طفرة جديدة وأن الابن هو أول حامل للطفرة في النسب. أفترض أن لدينا احتمال صفر للإصابة بالمرض إذا لم نحمل المرض. نظرًا لأن MEN مرض سيء جدًا ، فمن المحتمل أن يتم الاحتفاظ بالجين السائد في الجسم الذي يسبب المرض عند تردد منخفض جدًا. من الويكي ، قرأت أن تردد MEN 2A هو 1/40000. هذا يعني أن احتمالية أن تكون متحولة متماثلة اللواقح هي $ left ( frac {1} {40000} right) ^ 2 ≈ 10 ^ {- 9} $. أعتقد أنه يمكننا أن نفترض بأمان أن الطفل المريض متغاير الزيجوت. بالنظر إلى أن الطفل متغاير الزيجوت ، فإن الأليل الطافر يأتي إما من الأم أو من الأب باحتمالية متساوية. لذا فإن الاحتمال الذي يأتي من الأب هو 0.5 دولار والاحتمالات هي $ frac {p} {1-p} = frac {0.5} {1-0.5} = frac {0.5} {0.5} = 1 $

مع العلم أن الأب متغاير الزيجوت ، ما هو احتمال أن يتلقى طفل معين هذه الطفرة

وفقًا لقانون الفصل ، يكون الاحتمال 0.5 والاحتمالات 1.


الشبكات

يعد سرطان الثدي والمبيض من الأمراض الرهيبة التي يمكن أن تصيب بشكل متقطع ، ولكن لوحظ أيضًا أنها تتكرر عبر الأجيال. أحد الاستعدادات الوراثية المدروسة جيدًا للإصابة بسرطان الثدي والمبيض ينشأ عن طفرات في جين BRCA1. استخدم الباحثون البيانات الموجودة على BRCA1 لتحديد احتمالية إصابة الشخص بطفرة BRCA1 نظرًا لتاريخ عائلي للإصابة بسرطان الثدي أو المبيض.

تتطلب نظرية بايز عدة احتمالات معروفة لتحديد الاحتمال المطلوب. على سبيل المثال ، يجب أن يكون اختراق الطفرة معروفًا. يمكن تبسيط الاختراق باعتباره احتمالية الإصابة بالسرطان إذا كان لديك طفرة. تم حساب الاحتمالات الأخرى أيضًا ، مثل تواتر الطفرة في السكان واحتمال الإصابة بسرطان الثدي أو المبيض ليس بسبب طفرة BRCA1. باستخدام هذه البيانات ، تمكن الباحثون من إنشاء نموذج باستخدام نظرية بايز يمكنه التنبؤ باحتمالية حدوث طفرة BRCA1 من التاريخ العائلي للشخص. يمكن أن تتراوح احتمالات حدوث طفرة من 100 في المائة إلى 5 في المائة ، اعتمادًا على مدى قوة نمط تاريخ العائلة. يمكن الآن استخدام هذه البيانات في عدد من الطرق الاستباقية وزيادة الكفاءة.

التطبيق الأول لهذه البيانات هو الفحص الجيني الأكثر كفاءة. إذا كانت الطفرة نادرة (0.2-0.04٪) ، فليس من العملي فحص المجموعة السكانية بأكملها ، ولكن إذا كان من الممكن تحديد مجموعة فرعية من السكان ذات احتمال أعلى بكثير (5-100٪) ، فيمكن إجراء الاختبار بشكل أكثر كفاءة. تعني القدرة على الاختبار أنه يمكن للمرضى معرفة حالتهم ويمكن التخطيط لمزيد من الاختبارات الوقائية والتشخيصية لحمايتهم من المرض. جزء كبير من هذه الطريقة ، كما تم التلميح في الورقة ، هو أنه يمكن تطبيقها على أي طفرة ، بمجرد تحديد المتغيرات المناسبة. على سبيل المثال ، تم العثور أيضًا على طفرات BCRA2 تسبب سرطان الثدي والمبيض ، وبمجرد اكتشاف انتشار الطفرة وتكرارها بشكل عام ، يمكن أن يصبح الفحص عمليًا باستخدام نظرية بايز.


الشبكات

المفهوم الرئيسي الذي يحكم نظرية بايز هو أنه يمكن للفرد تعديل الاحتمالية الحالية لحدث يحدث بناءً على الملاحظات. بمعنى آخر ، إذا تم إعطاؤك احتمال وقوع حدث وبعد مرور بعض الوقت ، تتغير بعض المعلمات. يمكنك بعد ذلك توقع الاحتمال الجديد لحدوث هذا الحدث في ضوء المعلمات الجديدة. استخدم جون إم ماكنمارا وريتشارد ف. جرين وأولا أولسون في مقالتهم نظرية بايز وتطبيقاتها في سلوك الحيوان ، الأفكار الأساسية من نظرية بايز لتحليل سلوكيات الحيوانات لمعرفة ما إذا كانت الحيوانات تستخدم المعرفة السابقة ودمجها في حياتهم اليومية. مصطلح مهم تم طرحه في هذه المقالة هو الاستدلال الإحصائي ، والذي يأخذ الاحتمال السابق (الاحتمال الأصلي لحدوث حدث ما) لإبداء الملاحظات وتعديل الاحتمال السابق عن طريق إذا كان قانون بايز ومن ثم إجراء استنتاجات للحدث على أساس من الاحتمالات الجديدة.
هناك طريقتان رئيسيتان تستخدم فيهما الحيوانات المعرفة السابقة في حياتها اليومية. أولهما هو التكيف. إن التكيف مع المواقف والأشياء المحيطة أمر متجذر في التطور. إذا كان أحد الأنواع لديه القدرة على التكيف مع التغيرات في بيئته ، ونتيجة لذلك من خلال الانتقاء الطبيعي ، فمن المرجح أن يبقى على قيد الحياة ويمرر هذه السمة إلى الجيل التالي. على عكس المهارة المكتسبة ، فإن هذه السمة فطرية ولا تترك عادة مجالًا لتحسين الذات بشكل إبداعي. تشير المقالة إلى أن الحيوانات التي تستخدم هذا السلوك قد تستمر في القيام بهذا الإجراء حتى لو تبين أن ما توقعوه غير صحيح. يقيد التكيف بعدة طرق من قدرة الحيوان على التعلم. التجربة على الجانب الآخر من الطيف وتعتمد على قدرة الحيوان على التعلم من بيئته. هذه قرارات يتخذها الحيوان بناءً على تجاربه السابقة. ومع ذلك ، يمكن للبيئة أيضًا أن تلعب دورًا في التأثير على قرارات الحيوان.
تقدم المقالة ثلاثة أمثلة توضح استخدام الحيوانات للمعرفة السابقة للتنبؤ بالنتائج المستقبلية بطريقة تستخدم النهج النظري لقاعدة بايز. المثال الأول هو البحث عن الطعام. أثناء بحث الحيوان في بقعة معينة عن الطعام ، سيلاحظ مدى تكراره عبر الطعام. عند الانتقال إلى رقعة أخرى ، إذا كانت تشبه تلك التي لم تعثر فيها على طعام ، فسوف تتخطى الرقعة التي كانت مشابهة لتلك الموجودة. في هذا المثال ، تستخدم الحيوانات التجربة السابقة للتنبؤ بنتائجها إذا كانت ستبحث في رقعة مماثلة. المثال الثاني هو اختيار رفيقة خلال موسم التكاثر السنوي. في هذا المثال ، تختار الإناث الذكر عن طريق الفحص. كل عام ، هناك مجموعة جديدة من الذكور للاختيار من بينها ، لذلك لا تعرف الإناث نطاق الاختيار في بداية الموسم. ومع ذلك ، فهم يعرفون من التجربة السابقة ما يمكن توقعه. يتعامل المثال الأخير مع النمو في بيئة بها مخاطر مفترسة معينة. الاحتمال السابق هو كيف تمكن أسلاف الحيوان من البقاء على قيد الحياة. الآن مع الأخذ في الاعتبار مدى تكيف الحيوان الحالي مع البيئة ومجموعة مهارات الحيوان الحالية بالإضافة إلى تواتر الحيوانات المفترسة ، يمكن تعديل الاحتمال السابق لنمذجة الوضع الحالي. توضح هذه الأمثلة الثلاثة كيف يمكن استخدام نظرية بايز لنمذجة سلوك الحيوان.

عنوان المقال: نظرية بايز & # 8217 وتطبيقاتها في سلوك الحيوان


نظرية بايز والاستدلال

بالنظر إلى العلاقة البسيطة بين القيم التنبؤية والترددات ، إذا شعرت أن ما سبق مضيعة للوقت ، فلنحاول شرح سبب عدم حدوث ذلك.

  • إذا افترضت أن هذا الاختبار موثوق به بنسبة 100٪ ، فستفعل ذلك المخاطر هذا ، مهما كانت النتيجة ، ستفعل أعرف أنك بخير أم لا.
  • بالطبع منذ ذلك الحين لا يوجد اختبار موثوق به بنسبة 100٪ على الإطلاقمهما كانت نتيجة هذا الاختبار ، يجب أن يكون سؤالك التالي ما مدى احتمالية هذه النتيجة

لاحظ أنك ستحتاج فقط إلى الإجابة على واحد من هذه الأسئلة. بعبارة أخرى ، الأسئلة هي الشرط بناءً على نتيجة اختبارك ، وكذلك إجاباتهم - بافتراض أنك لا يمكن أن تصاب بالعدوى وغير مصاب في نفس الوقت ، ولا يمكن أن يجد اختبار واحد أنك إيجابي وسلبي.

هذه القضايا مهمة لأن الإجابات على هذين السؤالين قد تكون مختلفة للغاية. على سبيل المثال ، قمنا بتحديد أبعاد ما يلي لإظهار حقيقية حالة الإصابة و ملاحظ نتائج الاختبار n حيث 28.42% أصيبوا ، ولكن 28.42% من المصابين وجد (خطأ) سلبيين ، و 24.69% من غير المصابين وجد (خطأ) إيجابيين.

  • لو قمت باختبارها إيجابي ، احتمالية عدم إصابتك بالعدوى ب /أ + ب
  • لو قمت باختبارها نفي ، احتمالية إصابتك ج /ج + د

نادرا ما يعمل هذا الترتيب البسيط في الممارسة لأنه ، مع معدل الإصابة ( أ + ج /ن) من عموم السكان ، حساسية الاختبار ( أ /أ + ج) وخصوصية ( د /ب + د) باستخدام مجموعة فرعية من تلك المجموعة السكانية.

تمكّنك نظرية بايز من دمج هذه المعلومات ، كنسب أو احتمالات ، للعثور على احتمال أن يكون السبب المحدد مسؤولاً عن نتيجة محددة - سواء كانت n و N متطابقتين أم لا.

يختلف الاستدلال البايزي إلى حد ما عن معظم أشكال الاستدلال الأخرى في هذه الدورة التدريبية - مثل "الأخطاء المعيارية" أو "فترات الثقة" أو "اختبارات الفرضيات" - في الواقع ، غالبًا ما يُعتبر هذا الفرع الضخم من الإحصائيات نهجًا بديلاً تمامًا للوصول إلى الاستدلال. نظرًا لأن هذه الدورة تركز على الإحصاء المتكرر الكلاسيكي ، فلا يمكننا أن نأمل بشكل معقول في تقديم أي شيء آخر غير الخطوط العريضة الموجزة هنا.

في جوهره ، يعتبر الاستدلال البايزي تطبيقًا فعالًا لنظرية بايز. من نواحٍ عديدة ، يتعلق الأمر بما تفعله بنتيجة الاختبار ، بدلاً من شيء تستخدمه بدلاً من الاختبار. يمكّنك الاستدلال البايزي من الاختيار بين مجموعة من التفسيرات المتنافية ، أو تحديد المعتقد. بافتراض أنك غير مهتم بـ "إثبات" جبري لهذه النظرية ، فلنحاول شرح بعض أسبابها - ونقدم بعض المصطلحات المفيدة.

  • الحزمة 1 تحتوي على 199 ملاحظة ، 76 منها عبارة عن فئة 100 دولار.
  • الحزمة 2 تحتوي على 469 ورقة نقدية ، 4 منها عبارة عن فئة 100 دولار.
  • الحزمة 3 تحتوي على 396 ورقة نقدية ، منها 44 ورقة من فئة 100 دولار.
    بافتراض أنك لا ترغب في سردها ، أي حزمة من المرجح أن تفتقد مثل هذه الملاحظة ، وهل يمكننا تحديد هذا التقييم كميًا?
  1. هذه الحزم الثلاثة هي فقط المصدر المحتمل لـ 100 دولار هذا الافتراض مهم ومحوري لما يلي - فهو يحدد "مساحة العينة" لجميع النتائج المحتملة.
  2. قبل بالنسبة إلى هذا الحدث ، كان من المرجح أن تفقد كل حزمة أحد الافتراضات.يمكننا هذا الافتراض من تقسيم مساحة العينة بنفس الطريقة مثل النسبة الإجمالية المصابة في المثال أعلاه.
  3. كان أي نوع من المذكرات عرضة للتراجع عن الافتراض الذي يمكننا من الحصول على احتمال محدد منح كل تفسير محتمل.
  • إذا كان P (A | B) هو احتمال ملاحظة A منح ب ، يمكننا بسهولة تقدير احتمالية فقدان ملاحظة بقيمة 100 دولار من أ منح باقة. لنفترض أن هذا هو احتمال خسارة 100 دولار ، وهو احتمال فقدان أي نوع آخر من
    • منذ 76/199 من الحزمة 1 كانت 100 دولار من الملاحظات ، فإن الشرط كان احتمال هذا الحدث 0.38
    • 4/469 من الحزمة 2 كانت 100 دولار من الأوراق النقدية ، لذا فإن احتماليةكان 0.01
    • كان 44/396 من الحزمة 3 عبارة عن 100 دولار من الأوراق النقدية ، لذا فإن احتمال أن يكون A = 1 منح ب = 3 تساوي ، أو 0.11
    • إذن ، بشرط ألا تأتي الملاحظة من أي مكان آخر ، يجب أن تساوي 1 ، وبالنسبة لهذه الحزم الثلاثة ، يجب أن يكون ملف قبل وبالتالي فإن الاحتمالات (متساوية) = 1/3.

    منذ أن نشأت هذه الملاحظة من حزمة معينة يعتمد عليها و قد نفترض بشكل معقول أن احتمالهما المشترك هو

    في هذه الحالة ، يكون الاحتمال الإجمالي لظهور ملاحظة بقيمة 100 دولار من أي من هذه الحزم ، هو مجموع تلك الاحتمالات المجمعة:

    لذلك ، فإن نسبة الأحداث التي تنشأ منها ملاحظة 100 دولار هي:

    • ل (ب = 1 منح أ = 1) = 0.7615
    • ل (ب = 2 منح أ = 1) = 0.0170
    • ل (ب = 3 منح أ = 1) = 0.2215

    نظرًا لصحة الافتراضات المختلفة ، فمن المحتمل أن تكون ملاحظة 100 دولار الخاصة بنا قد جاءت من الحزمة 1 - على الأقل هذا التفسير هو (0.7615 / 0.2215 =) احتمال 3.4 مرة بقدر احتمال ظهوره من الحزمة 3.

      على سبيل المثال ، قد تقرر أن احتمال خروج ملاحظة من الحزمة يرتبط ارتباطًا مباشرًا بعدد الملاحظات في تلك الحزمة.

      في ال أول حالة ، إذا نأنا هو عدد الملاحظات في iذ bundle ، و & Sigman هو العدد الإجمالي للملاحظات ، ثم قبل احتمالية نشوء هذه الملاحظة من iذ الحزمة ، P (B = i) هي نأنا /وسيغمان

    • ل (ب = 1 منح أ = 1) = 0.6129
    • ل (ب = 2 منح أ = 1) = 0.0323
    • ل (ب = 3 منح أ = 1) = 0.3549

    مرة أخرى ، نظرًا لصحة الافتراضات المختلفة ، فمن المحتمل أن تكون ملاحظة 100 دولار الخاصة بنا قد جاءت من الحزمة 1 - ولكن هذا التفسير هو (0.6129 / 0.3548 =) أكثر احتمالية بمقدار 1.7 مرة من احتمال ظهوره من الحزمة 3.

    • ل (ب = 1 منح أ = 1) = 0.1153
    • ل (ب = 2 منح أ = 1) = 0.0631
    • ل (ب = 3 منح أ = 1) = 0.8217

    لاحظ أنه على الرغم من أننا قمنا بتسمية هذه الحزم من الملاحظات 1 2 و 3 ، فإن هويتهم هي في الواقع متغير اسمي - ولكن نفس المنطق ينطبق إذا كانت أسبابنا المحتملة متغيرًا منفصلاً ، مثل نسب الأرجحية (مقسمة إلى فواصل زمنية) ) يمثل تأثير العلاج الكيميائي على سرطان البنكرياس. في هذه الحالة يمكننا اقتراح مختلف قبل توزيعات احتمالية ، إما عشوائية ، أو تلخيصاً للدراسات السابقة ، أو تمثل فرضية - سواء كانت متشائمة أو متفائلة.

    على الرغم من أنه مغر للغاية ، فإن استخدام الاستدلال البايزي للجمع بين الاحتمالات الذاتية والموضوعية ينطوي على مخاطر واضحة ، ويجعل بعض الإحصائيين متوترين بشكل مفهوم. عندما يكون للسبب المحتمل صفر قبل، إنه اللاحق هي أيضًا صفرية - بافتراض أنه من الواضح أن النتائج المستحيلة هي


    نظرية بايز للطفرات - علم الأحياء

    افترض أن اختبار الدم المستخدم للكشف عن وجود دواء محظور معين 99% حساس و 99% محدد. أي أن الاختبار سينتج 99٪ إيجابي حقيقي نتائج لمتعاطي المخدرات و 99٪ صحيح سلبي نتائج غير متعاطي المخدرات. لنفترض أن 0.5% من الناس متعاطي المخدرات. ما هو ملف احتمالا الذي - التي فرد تم اختياره عشوائيًا الاختبارات الإيجابية هو مستخدم?

    حتى لو كانت نتيجة اختبار الفرد إيجابية ، فمن المرجح أكثر من عدمه (1 - 33.2٪ = 66.8٪) أن يفعل ذلك ليس استخدم الدواء. لماذا ا؟ على الرغم من أن الاختبار يبدو دقيقًا للغاية ، عدد غير المستخدمين كبير جدا مقارنة بعدد المستخدمين. ثم عد ايجابيات مزيفة سوف تفوق عدد إيجابيات حقيقية.

    لرؤية هذا بالأرقام الفعلية ، إذا تم اختبار 1000 فرد ، نتوقع 995 غير مستخدم و 5 مستخدمين. من بين 995 من غير المستخدمين ، 0.01 × 995 × 10 إيجابيات كاذبة متوقع. من بين 5 مستخدمين ، 0.99 × 5 ≈ 5 إيجابيات حقيقية متوقع. من 15 نتيجة إيجابية ، 5 فقط

    أهمية النوعية في هذا المثال يمكن رؤيته من خلال حساب ذلك حتى لو حساسية تم تحسينه إلى 100٪ ، ولكن النوعية لا يزال عند 99٪ ، ثم يرتفع احتمال أن يكون الشخص الذي ثبتت إصابته هو متعاطي المخدرات فقط من 33.2٪ إلى 33.4٪. بدلا من ذلك ، إذا حساسية يبقى 99٪ ، لكن النوعية إلى 99.5٪ ، ثم ترتفع احتمالية أن يكون الشخص الذي ثبتت صحته هو متعاطي المخدرات إلى حوالي 49.9٪.


    جرونيولد ، أندرو د. المختبر القومي لأبحاث التعرض ، وكالة حماية البيئة الأمريكية ، تريانجل بارك ، نورث كارولينا.

    فاليرو ، دانيال أ. المختبر الوطني لأبحاث التعرض ، وكالة حماية البيئة الأمريكية ، Research Triangle Park ، نورث كارولينا.

    النظم الإيكولوجية معقدة بطبيعتها ، وعلى الرغم من الجهود المبذولة لتحديد ونمذجة السلاسل السببية التي تربط اضطرابات النظام الإيكولوجي باستجابة النظام الإيكولوجي ، هناك اختلافات حتمية بين الظروف المرصودة والمتوقعة في البيئة الطبيعية. يساهم عدم اليقين والتنوع والتغيير في هذه الاختلافات ، ومع ذلك يتم تجاهلها في كثير من الأحيان في التنبؤ بالمشاكل البيئية. تمثل تقنيات النمذجة الإحصائية تصنيفًا عامًا للأدوات التي يمكن أن تساعد في معالجة التناقضات بين التنبؤات والملاحظات ، وقد تم مؤخرًا إثبات أن إحصاءات بايز على وجه الخصوص أداة جديدة وفعالة للتنبؤ بمشاكل الملوثات البيئية نظرًا لنهجها الفريد في قياس عدم اليقين والتباين. .

    إحصائيات بايزي

    في عام 1763 ، نُشر مقال بقلم القس توماس بايز بعنوان "مقال نحو حل مشكلة في عقيدة الفرص" في المعاملات الفلسفية للجمعية الملكية في لندن. بعد أكثر من 200 عام ، تشكل العناصر الأساسية لهذا المقال ، بما في ذلك إدخال علاقة احتمالية يشار إليها عادةً باسم نظرية بايز (الموصوفة بالتفصيل لاحقًا في هذه المقالة) ، أساس التحليل الإحصائي البايزي ، فئة من الرياضيات القوية نهج لحل مشاكل الاحتمال العكسي.

    يمكن تقسيم الاستراتيجيات الشائعة لحل المشكلات الإحصائية إلى ثلاث فئات ، يتضمن كل منها نهجًا مختلفًا لتقدير احتمالية وقوع حدث ما بالنسبة لمجموعة من الأحداث المحتملة. يمكن التفكير في النهج الأول على أنه استخدام معتقدات مسبقة ، والتي ، في حالة لفة واحدة من زهر من ستة جوانب ، قد تعكس توقعًا بأن النرد عادل ، وبالتالي أن احتمال كل من الستة الممكنة النتائج (أي 1 ، 2 ، ... ، 6) تساوي بالضبط 1/6. يعتمد النهج الثاني على الأدلة التجريبية ، حيث يعتمد فهمنا للاحتمال الأساسي للأحداث بالكامل على البيانات. في حالة القالب ذي الجوانب الستة ، قد يتضمن هذا الأسلوب دحرجة القالب بشكل متكرر وتقدير احتمالية كل نتيجة على أنها تواترها النسبي المرصود. في حل المشكلات البيئية ، بالطبع ، غالبًا ما يتم إعاقة هذا النهج بسبب البيانات المحدودة والعوامل المعقدة الأخرى. توفر إحصائيات بايز ، وهي الطريقة الثالثة ، آلية للجمع بين المعتقدات المسبقة والأدلة التجريبية النادرة المحتملة لاشتقاق توزيع احتمالي لاحق. نصف هذا النهج في سياق نظرية بايز في القسم التالي.

    مبرهنة بايز

    يمكن كتابة نظرية بايز كـ Eq. (1),

    أين ص(أ) و ص(ب) تمثل الاحتمالات الهامشية للأحداث أ و ب، على التوالي ، بينما ص(أ|ب) و ص(ب|أ) تمثل الاحتمالات الشرطية للحدث أ بالنظر إلى هذا الحدث ب حدث وحدث ب بالنظر إلى هذا الحدث أ حدث ، على التوالي. احتمال ص(أ|ب) ، في إطار بايزي ، يُشار إليه على أنه الاحتمال اللاحق للحدث أ، بالنظر إلى هذا الحدث ب قد حدث. في هذا السياق ، تنص نظرية بايز على أن الاحتمال اللاحق للحدث أ (أي احتمال وقوع حدث أ بالنظر إلى هذا الحدث ب قد حدث) تساوي الاحتمالية [المكتوبة ص(ب|أ)] مرات التوزيع الاحتمالي السابق للحدث أ [هذا هو، ص(أ)] مقسومًا على التوزيع الهامشي للحدث ب. وبهذه الطريقة ، فإن التوزيع الاحتمالي السابق ، والاحتمالية ، وتوزيع الاحتمال اللاحق يوفر إطارًا ويعمل كعناصر ضرورية لمشكلة إحصائية بايزي.

    تطبيقات نظرية بايز

    من الناحية العملية ، تسمح نظرية بايز للعلماء بدمج المعتقدات المسبقة حول احتمال وقوع حدث (أو حالة بيئية ، أو مقياس آخر) مع دليل تجريبي (أي قائم على الملاحظة) ، مما يؤدي إلى ظهور جديد وأكثر قوة. التوزيع الاحتمالي اللاحق.

    فهم أداء البنية التحتية لإزالة الملوثات

    شكل 1 يقدم مثالاً على كيفية تطبيق نظرية بايز لحل المشكلات البيئية. في هذا المثال الافتراضي ، نحاول تحسين فهمنا لمدى فعالية أنظمة البنية التحتية لإدارة مياه الأمطار في إزالة الرواسب من جريان مياه الأمطار. في حين أن الرواسب غالبًا ما تحمل المغذيات والمعادن والملوثات الأخرى ، فإن الرواسب نفسها تعد أيضًا ملوثًا في العديد من النظم البيئية. في هذه المشكلة ، نمثل جزء الرواسب الذي تمت إزالته بواسطة نظام إدارة مياه العواصف كـ θ. شكل 1 يقدم تطور هذا الفهم في إطار عمل بايزي ، بدءًا من تطوير توزيع احتمالي سابق. يعتمد توزيع الاحتمالية السابقة لـ على قيم معدل إزالة الملوثات في قاعدة بيانات منشورة توثق مئات الدراسات ، ويتم التعبير عنها في رسم بياني 1 أولاً كرسم بياني للقيم التاريخية (رسم بياني 1أ) ، ثم كخط متقطع يقارب معدل إزالة الملوثات التوزيع الاحتمالي المسبق (رسم بياني 1ب). ثم يتم إدخال معدلات إزالة الرواسب الافتراضية من موقع دراسة جديد من خلال دالة الاحتمال (الخط الصلب في رسم بياني 1 ج) ، وأخيرًا يتم حساب التوزيع الاحتمالي اللاحق باستخدام نظرية بايز (ويمثلها خط منقط في رسم بياني 1د).

    رياضيا ، رسم بياني 1 يقارب الرسم البياني الأساسي كتوزيع احتمالي بيتا (θ | α، β) بمتوسط ​​α / (α + β) والتباين αβ / (α + β) 2 (α + β + 1) ، مع مجموعة المعلمات α و إلى 11 و 4.6 على التوالي. يتم اشتقاق الاحتمالية من خلال نمذجة معدلات إزالة الرواسب الافتراضية من موقع دراسة جديد باستخدام توزيع احتمالي ذي الحدين Bi (x|ن، θ) بمتوسط نθ والتباين نθ (1 - θ) أين x، بشكل عام ، يمثل عدد النتائج الإيجابية من ن التجارب ، و هو احتمال نتيجة إيجابية في كل تجربة. في هذا المثال، x يمثل إجمالي كتلة الملوثات التي تمت إزالتها بواسطة البنية التحتية لإدارة مياه الأمطار في موقع دراسة جديد ، و ن يمثل إجمالي كتلة الملوثات التي تدخل الموقع. عندما يتم التعبير عنها كدالة للمعامل غير المعروف θ ، فإن الاحتمال [Eq. (2)] هو بيتا بي (θ |x + 1, نx + 1) توزيع الاحتمالات بالمعلمات ن و x ضبط على 8 و 4 ، على التوالي. باستخدام نظرية بايز ، نقوم بدمج التوزيع السابق واحتمال اشتقاق التوزيع اللاحق لـ على النحو التالي في المعادلات. (2) و (3),

    حيث مكافئ. (3) هو توزيع احتمالي بيتا Be (α ′، β ′) مع α ′ = α + x و β ′ = + (نx). لاحظ أن الجانب الأيمن من المعادلة. (2) لا يتضمن المقام ، والذي قد نتوقعه بناءً على نظرية بايز [Eq. (1)] ، لأنه ببساطة ثابت تناسب ولا يؤثر على حساب التوزيع اللاحق. ضع بشكل مختلف ، بمجرد أن ندرك أن المعادلة. (3) هو توزيع بيتا ، قيم α ′ و β ′ هي المعلومات الوحيدة التي نحتاجها لصياغة التوزيع اللاحق لـ θ.

    التنبؤ بظروف جودة المياه

    غالبًا ما تُقاس جودة المياه بتركيز واحد أو أكثر من الملوثات الموجودة في الموقع (مثل العناصر الغذائية والبكتيريا والمركبات العضوية) ، ومدى ملاءمة جسم مائي معين للاستخدام المقصود (مثل مياه الشرب أو الترفيه أو الاستخدام الزراعي ) يعتمد على ما إذا كانت تركيزات الملوثات المقاسة تتجاوز الحدود الرقمية المعيارية لنوعية المياه أم لا. نظرًا لأن هذه الملوثات غالبًا لا يمكن قياسها بشكل مباشر ، فإن العلماء يقيسون عادةً المؤشرات التي تعمل كبديل محتمل للملوثات محل الاهتمام. تختلف قوة العلاقة بين تركيز المؤشر وتركيز الملوث الذي يُفترض أنه يمثله اختلافًا كبيرًا اعتمادًا على نوع الملوث. على سبيل المثال ، في المياه الترفيهية ومياه جمع المحار في جميع أنحاء الولايات المتحدة ، تعتمد جودة المياه على تركيز بكتيريا المؤشر البرازية غير الممرضة (FIB) مثل القولونيات البرازية و الإشريكية القولونية. تُستخدم هذه البكتيريا كمؤشر محافظ للتلوث البرازي ولاحتمال وجود مسببات الأمراض الضارة المنقولة بالمياه ، والتي ، على الرغم من ارتباطها المباشر بصحة الإنسان والبيئة ، إلا أنها أيضًا أكثر صعوبة وتكلفة في القياس. بغض النظر عن الملوث المحدد والمؤشر المرتبط به ، من الواضح أنه ليس فقط علاقة الملوثات بالمؤشر ، ولكن أيضًا التردد المكاني والزماني لأخذ العينات وعوامل أخرى قد تساهم بشكل جماعي في عدم اليقين والتنوع في تنبؤات الظروف البيئية. هنا ، نقدم طريقة بايز لتقييم ظروف جودة المياه باستخدام قياسات تركيز القولونيات البرازية (المبلغ عنها في الكائنات لكل 100 مل) في منطقة حصاد المحار كمثال.

    مثل العديد من الملوثات الأخرى ، يُفترض عادةً أن تركيزات FIB تتبع توزيع احتمالي LN (μ ،) غير طبيعي مع متوسط ​​تركيز لوغاريتمي (ميكرومتر) والانحراف المعياري للتركيز اللوغاريتمي (σ). في حين أن نموذج الاحتمال الشائع هذا يعترف بالتغير المكاني والزماني الطبيعي في أنماط تشتت FIB ، فإنه (مثل نماذج الاحتمالية البسيطة الأخرى) غالبًا ما يفشل في الاعتراف صراحة بمصادر التباين الأخرى الأكثر دقة ، بما في ذلك المصادر الجوهرية الناشئة عن قياسات تركيز FIB وكيف تكون تركيزات FIB محسوب ، وكل ذلك يمكن أن يؤدي ليس فقط إلى عدم اليقين في تنبؤات تركيز FIB ، ولكن إلى عدم اليقين في معلمات توزيع الاحتمالات (أي ، μ و) أيضًا. في إطار عمل بايز ، يمكننا الاعتراف صراحةً بأوجه عدم اليقين هذه عن طريق وضع توزيع احتمالي سابق أولاً على معلمات السكان μ و (والتي قد تفسر معتقدات مسبقة حول قيمها المحتملة) ، ثم تطوير دالة احتمالية لـ μ و بناءً على الدليل التجريبي (في هذه الحالة ، استخدام عينات جودة المياه) ، وأخيراً اشتقاق توزيع احتمالي خلفي مشترك لكليهما. يتم عرض نتائج هذا الإجراء في الصورة 2، والذي يتضمن مخططًا كفافيًا ناعمًا لكثافة الاحتمال الخلفي المشترك لمتوسط ​​تركيز اللوغاريتم القولوني البرازي (μ) والانحراف المعياري (σ) لموقع العينة في شرق ولاية كارولينا الشمالية.

    توجيه قرارات الإدارة البيئية

    ربما يكون فهم كيفية انتشار حالة عدم اليقين هذه في قرارات الإدارة القائمة على جودة المياه لا يقل أهمية عن عكس عدم اليقين في تنبؤات جودة المياه. في سياق الإدارة ، قدمت الظروف المتوقعة في الصورة 2 يمكن استخدامها لتوجيه المعتقدات حول احتمالية أن تشير العينات المستقبلية إلى انتهاك المعايير المناسبة وتهديد محتمل لصحة الإنسان والبيئة. على سبيل المثال ، تشير معايير جودة المياه لمياه حصاد المحار إلى أنه من غير الآمن حصاد المحار عندما يتجاوز متوسط ​​تركيز القولون البرازي ، أو المتوسط ​​الهندسي ، أو النسبة المئوية التسعين لما لا يقل عن 30 عينة من جودة المياه 14 و 14 و 43 (جميعها في الكائنات الحية لكل 100 مل) ، على التوالي. عندما تتجاوز تركيزات عينات جودة المياه هذه الحدود الرقمية ، يتم إغلاق المنطقة المقابلة لحصاد المحار ، وغالبًا ما يتم وضع علامات تحذر الجمهور من المخاطر الصحية المحتملة (تين. 3).

    لفهم عدم اليقين في تنبؤات تركيز القولون البرازي بشكل أفضل ، يتم ترجمة هذه الحدود الرقمية إلى مجموعات مقابلة الحد الأقصى المسموح به لمتوسط ​​تركيز اللوغاريتم القولوني البرازي (μ) والانحراف المعياري للتركيز اللوغاريتمي (σ). هذه الأزواج القصوى المسموح بها μ ، ، عند إسقاطها على مساحة الاحتمال الخلفي للمفصل ثلاثي الأبعاد (μ ، σ) (الخط المنقط في الشكل 4) ، قدم مؤشراً لمدى احتمالية أن تسفر ظروف جودة المياه عن عينة من نوعية المياه في انتهاك للمعايير المحددة. بعبارة أخرى ، يمكننا تخيل الخط المنقط الشكل 4 "تقطيع" جزء من مساحة الاحتمالية المشتركة ثلاثية الأبعاد إلى أسفل يسار الشكل ، ويمكن اعتبار الحجم النسبي لهذا الجزء ، الذي يُسمى أحيانًا ثقة الامتثال ، على أنه درجة الثقة التي يمكن للمرء الحصول عليها سوف يمتثل الجسم المائي لمعايير جودة المياه. في هذا المثال ، تبلغ ثقة الامتثال حوالي 0.03 (أو 3٪).

    لمقارنة نتيجة الثقة القائمة على أساس نظرية بايز مع الإستراتيجيات غير البايزية الأكثر شيوعًا ، يتم رسم نقطة في الشكل 4، تمثل تقديرًا نقطيًا محتملاً للتوليفة الأكثر احتمالية من μ و. من المحتمل أن يعتمد التنبؤ الحتمي لظروف جودة المياه فقط على تقديرات النقاط هذه ، وهو نهج يتجاهل بوضوح الكثير من التباين المحتمل في تركيزات القولونيات البرازية المستقبلية ، وقد يؤدي إلى تقييم إداري مبسط لا يعتمد على الثقة في الامتثال ، ولكن ببيان بسيط عما إذا كان الجسم المائي ينتهك المعيار أم لا. في حالة نتائج التقييم المقدمة في الشكل 4، فإن النهج الحتمي من شأنه أن يقودنا إلى الاعتقاد بأن الظروف المستقبلية ستنتهك المعيار المحدد. تم تقديم ملخص لنتائج تقييم المراقبة للمحطة في تين. 2 و 4، جنبا إلى جنب مع غيرها من محطات مراقبة جودة المياه المجاورة ، ويرد في طاولة. توضح هذه النتائج كيف أن نهج بايز للتنبؤ بالظروف البيئية وتوجيه قرارات الإدارة يوفر نهجًا قويًا نسبيًا لقياس المخاطر وحماية صحة الإنسان والبيئة.


    طريقة أسهل

    لماذا الرياضيات عندما لا تحتاج إليها؟ - يي شوين ليم

    دعنا نلقي نظرة على البديل المحتمل لحل نظرية بايز ، وهي طريقة عندما تراها من خلال ، ستسمح لك بفهم جميع جوانب المشكلة. سنستخدم مشكلة حصلت عليها في فلاتيرون لأنني لست مدرسًا للرياضيات ولا يدفع لي أحد مقابل حل مسائل الرياضيات.

    توماس يريد الحصول على جرو جديد.

    يمكنه اختيار الحصول على جروه الجديد إما من متجر الحيوانات الأليفة أو من الجنيه الاسترليني. احتمال ذهابه لمتجر الحيوانات الأليفة هو 0.2.

    يمكنه اختيار الحصول على جرو كبير أو متوسط ​​أو صغير.

    إذا ذهب إلى متجر الحيوانات الأليفة ، فإن احتمال حصوله على جرو صغير هو 0.6. احتمال حصوله على جرو متوسط ​​هو 0.3 ، واحتمال حصوله على جرو كبير هو 0.1.

    إذا ذهب إلى الجنيه ، فإن احتمال حصوله على جرو صغير هو 0.1. احتمال حصوله على جرو متوسط ​​هو 0.35 ، واحتمال حصوله على جرو كبير هو 0.55.

    1. ما هو احتمال حصول توماس على جرو صغير؟

    2. إذا كان لديه جرو كبير ، ما هو احتمال أن توماس ذهب إلى متجر الحيوانات الأليفة؟

    3. بالنظر إلى أن توماس حصل على جرو صغير ، فهل من المرجح أنه ذهب إلى متجر الحيوانات الأليفة أم إلى الجنيه؟

    لذلك بالنسبة لهذه المشكلة ، سنستخدم طريقة بديلة لقصف الصيغ. سنقوم ببناء الأشجار. الأشجار رائعة ، فهي تساعدنا في حل المشكلة وإعادة صياغتها في تنسيق واضح وسهل الفهم. فلنبدأ الرسم! أول شيء سنفعله هو رسم الفروع الأساسية لشجرتنا.

    فقاعة. لقد قمنا بتفكيك هذه المشكلة اللفظية بشكل فعال إلى مكوناتها الهيكلية ووضعناها في صيغة سهلة الفهم. نبدأ مع توماس وقراره بالذهاب إما إلى متجر الحيوانات الأليفة أو المأوى ، ثم مرة واحدة في متجر الحيوانات الأليفة أو المأوى ، نقوم بتقسيم القرارات الأخرى إلى كلاب صغيرة أو متوسطة أو كبيرة. الخطوة التالية هي إدخال احتمالاتنا.

    انظر ماذا فعلت؟ الآن أخذنا الاحتمالات المعطاة لنا في هذه المسألة ووضعناها على شجرتنا. نعلم أن لدى توماس احتمال 20٪ للذهاب إلى متجر الحيوانات الأليفة ، وعندما يصل إلى هناك ، يكون لديه احتمال 60٪ في الحصول على كلب صغير ، واحتمال 30٪ للحصول على كلب متوسط ​​، واحتمال 10٪ الحصول على كلب كبير. The same also applies for the 80% probability of him going to the Shelter and the associated probabilities for Small, Medium and Large Dogs. Note also that each of these probabilities at each junction totals up to 100%, because we can’t have more than a 100% probability, and having less than a total 100% probability implies there’s another choice. This is useful to know in the event you are given incomplete information on a word problem.

    Now, let’s look at the first question.

    What is the probability of Thomas getting a small puppy?

    Well to solve that, we need to determine all probabilities in which Thomas is going to get a small puppy, either at the Pet Store or at the Shelter. We simply need to multiply our probabilities together, then add them up, in the following fashion:

    By following the path of the red arrows, we traced the path of Thomas first going to the Pet Store or the Shelter, and then him getting a Small Dog at either. To find the probability of all possible Small Dog purchases we take the probability of Shelter or Pet Store, then multiplying it with the corresponding probability of buying a Small Dog. Then we add those together to find the answer to the probability of Thomas buying a Small Dog! By simply following the branches in the tree, we are able to track the necessary probabilities and combine them to find all cases of Small Dog.

    Let’s get ahead of ourselves now and finish calculating all the probabilities:

    Great! Now we have a proper framework of ready answers prepared to answer any questions on Thomas’ choices. What if we wanted to know the probability that Thomas will get a Large Dog? Well, let’s refer back to our tree. Pet Store Large Dog has a probability of .02, Shelter Large Dog has a probability of .44. We add those together, and the probability of Large Dog is .46!

    Now let’s move on to the second question.

    Given that he got a large puppy, what is the probability that Thomas went to the pet store?

    Well, this is truly more of a Bayesian question. If we were to write this formula out, it would look like this:

    Thanks to our tree, we don’t have to break our heads trying to figure out what probabilities need to be constructed for P(Large). Let’s refer back to our tree to find the components needed.

    Thus, our formula looks like this:

    Which gives us .04347!

    Now, on to the last question!

    Given that Thomas got a small puppy, is it more likely that he went to the pet store or to the pound?

    This one is a little bit trickier. Given Small Dog, which is higher, P(Pet Store|Small Dog) or P(Shelter | Small Dog)? Well in this case, we’ll have to repeat the formula, but twice, and determine which one is higher.

    To simplify things, I’ll give you the variables you need:

    For the P(Pet Store | Small Dog):
    P(Small Dog| Pet Store) = .60
    P(Pet Store) = .20
    P(Small Dog) = .20

    For the P(Shelter | Small Dog):
    P(Small Dog| Shelter) = .10
    P(Shelter) = .80
    P(Small Dog) = .20

    Now plug those into Bayes’ Theorem and see what numbers we get?

    P(Pet Store | Small Dog) = .60
    P(Shelter | Small Dog) = .40

    Since P(Pet Store | Small Dog) is larger than P(Shelter | Small Dog), given that Thomas got himself a Small Dog, it is more likely that Thomas went to a Pet Store to get his dog!


    Bayes theorem for mutations - Biology

    Conventional statistics rely on a احتمالية نموذج of events, such as the احتمالا (p) that one will draw an Ace from a deck of cards (ص = 4/52) or roll Boxcars with two dice (ص = 1/36). ال joint probability of drawing an Ace AND rolling boxcars in then simply p' = (1/13)(1/36) = 0.00214. This can be extended to biological situations, for example that the next hospital patient you see will be male and (or) have hemophilia, based on data that about half the population is male, and that a certain fraction of the population has hemophilia. The probabilistic model is already complicated by the recognition that hemophilia is typically (but not always) a male trait, and further that in a hospital ward, there will be a higher proportion of hemophiliacs than in the outside population. Note that the probabilistic approach will be different when applied to patients who are male and (or) color-blind. A probabilistic approach may fail under these circumstances.

    بدلا من ذلك ، فإن Bayes Model is concerned with the likelihood of events, which explicitly considers the co-occurrence of events, especially where those events are ليس مستقل. This is phrased as, What is the probability of event A, given that event B also occurs?

    Bayes’ Theorem is stated mathematically as

    where A & B are events, and p(ب) ≠ 0. An event is something that can be true or false, for example, that a person is color blind, or male.

    p(أ| ب) and p( B| أ) نكون الشرط الاحتمالات، ال likelihood of event أ occurring, given that B is true, and v.v. Read p(أ|ب) as the probability of أ given B. p(أ) and p( B) are the هامش الاحتمالات of observing أ و ب, independently of each other: for example, the proportion of color blind people, or males.

    Among other uses, Bayes’ Theorem provides an improved method of assessing the likelihood of two non-independent events occurring simultaneously.

    Suppose a urine test used to detect the presence of a particular banned drug is 99.9% حساس و 99.0% محدد. That is, the test will provide 99.9% true positive results for drug users, and 99% true negative results for non-users. Suppose further than 0.5% of the population tested are drug users (سقوط). We ask: What is the probability that an individual who tests positive is a user؟ Bayes’ Theorem phrases this as, what is p( User| +) ? Let p( A) = p( User) and p( B) = p( +)، من ثم

    Here, p(+| مستخدم) estimates sensitivity , that 0.999 of Users tested will be detected, and [1 - p(+|عدم- User)] incorporates النوعية , that only (1 – 0.99 ) = 0.01 of Non-Users will be reported (incorrectly) as Users.

    Then, p( +) estimates the total رقم ال إيجابي tests, including حقيقية إلى جانب خاطئة positives. These two components are

    Keeping the same number formats as defined above

    That is, even if an individual tests positive, it is twice as likely as not (1 – 33.42% = 66.58%) that s/he is ليس a User. لماذا ا؟ Even though the test appears to be highly “دقيق” (99.9% sensitivity & 99% specificity), the number of non-Users is very large compared to the number of Users. Under such conditions, the count of خاطئة positives exceeds the count of true positives. For example, if 1,000 individuals are tested, we expect 995 non-Users and 5 Users. Among the 995 non-Users, we expect 0.01 x 995 ≈ 10 false positives. Among the 5 Users, we expect 0.99 x 5 = 5 true positives. So, out of 15 positive tests, only 5 (33%) are genuine. The test cannot be used to screen the general population for Users.

    What are the effects of improving “accuracy” of the test? لو حساسية were increased to 100% , and النوعية remained at 99% , p(مستخدم| +) = 33.44%, a minuscule improvement. Alternatively, if sensitivity remains at 99.9% and specificity is increased to 99.5% , then p(مستخدم| +) = 50.10%, and half the positive tests are reliable. The test remains unreliable.

    What if test circumstances change? If sensitivity and specificity remain unchanged at 0.999 and 0.99 respectively, but in the population of interest the incidence of users increases to 0.1, p(مستخدم|+) = 0.91736, and the test is reasonably reliable (but not at a 95% criterion).

    HOMEWORK : Write an Excel spreadsheet program to calculate p(مستخدم| +) for various values of Sensitivity, Specificity, and Incidence. Us the base values above as a starting point. Under what circumstances is the test most “useful”? يشرح.


    Count Bio

    The Bayes's theorem helps us to compute the conditional probability for events. It is much more than a mere problem solving technique. The theorem paved the way for Bayesian Statistics , which is philosophically different from the frequentist method on which this whole tutorial is based. More on this in the next section. Though it looks complicated when it is stated formally, Bayes theorem (also called Bayes rule) is very easy to use for problem solving.

    In this section, we will first derive and state the Baye's theorem. Next, an example problem will be solved, which will clearly demonstrate the theorem and lead to the formal definition.

    Recall the multiplication rule of the conditional probability we learnt in the previous section. For two dependent events A and B in the sample space S, the multiplication rule states that,

    Instead of a single event A, consider a set of n mutually exclusive events (small< A_1, A_2, A_3, . A_k >) in the sample space S. Let B be any event in the sample space S.

    We can write, for any event (small< A_k >) in the sample space, the conditional probability of event (small) given the event B as,

    Since the contribution to the event B can come from the mutually exclusice events (small) to (small), we can write,

    Also, we can write the numerator ( small < P(A_k cap B) >) as,

    With this, the conditional probability ( small < P(A_k|B) >) becomes,

    The above formula is the statement of Bayes theorem . We can write it in a summation notation as,

    In order to understand the above theorem, we will solve an example problem and revisit the theorem after that:

    $ Box1 has 3 tablets of M1 and 4 tablets of M2. $

    $ Box2 contains 5 tablets of M1 and 3 tablets of M2. $

    $ Box3 contains 6 tablets of M1 and 3 tablets of M2. During a clinical trial, the probabilities of selecting these boxes are not same, but kept as, ( small< P(Box1) = frac<1> <3>>), (small <6>>) and (small <2>>)

    The experiment consists of drawing a box at random with the above probabilities and from the selected box, pick out a tablet at random.

    What is the probability P(M1) of picking up tablet M1 in such a draw?.

    To select M1, we must pick a box at random and then from the box we must randomly pick a tablet. Thus the probability of selecting M1 is deciced by the union of three mutually exclusive events (small ). وبالتالي،

    = P(M1|Box1) P(Box1) + P(M1|Box2) P(Box2) + P(M1|Box3) P(Box3)>) ( small<

    dfrac<6> <9> imes dfrac<1> <2>> ) (small<

    Suppose we know that the medicine M1 has been picked up, but we do not know from which box it came from. We wish to compute the conditional probability that the selected medicine M1 would have come from the box1 . We denote this probability by the symbol P(Box1|M1). We can use bayes theorem to get this probability.

    From the definition of conditional probability, we can write

    Since M1 could have come from any one of the three boxes, selection of M1 has three mutually exclusive possibilities, namely from Box1 or Box2 or box3. We then write

    With this, the expression for the conditional probability ( small) becomes,

    Subsituting the values, we get the probability that Medicine M1 would have come from box1 as,

    0.246 Similarly, we get the conditional probability that the medicine M1 would have come from Box2: (small< P(Box2|M1) = dfrac< P(M1|Box2) P(Box2)> >) (

    0.179 Next,we compute the conditional probability that the medicine M1 would have come from Box3: (small< P(Box3|M1) = dfrac< P(M1|Box3) P(Box3)> >) (

    The solutions to the set of problems shown above have to be carefully analysed.

    Note that the original probabilities of selecting the three boxes were given in the beginning as, (small <3>= 0.333>,

    small <2>= 0.5> ). However, once it was known that the medicine that was pulled out of the box was M1, these probabilities changed to (small<>

    This can be intuitively understood as follows: Before selecting a medicine, the three boxes had certain probability of being selected.The information that the medicine M1 has been chosen from the selected box has altered these probability of selection of Boxes, since different boxes have different fractions of M1. Once the medicine M1 has been selected, the probability that it would have come from Box3 is more than the probability that it would have come from Box1 or Box2, since the fraction of M1 in Box3 is more than that in Box1 or Box2.

    Thus, since (fraction of M 1 in Box1) < (f raction of M 1 in Box2) < (f raction of M 1 in Box3), we have, (small)

    The original probabilities (small), (small) and (small) are called the prior probabilities.

    The conditional probabilities (small), (small) and (small) are called ال posterior probabilities.

    Thus by employing Baye's theorem,the prior probabilities have been modifed to posterior porbabilities using the available information (data) on the fractions (small), (small) and (small).


    مراجع

    Gelman, A., Carlin, J.B., Stern, H.S. & Rubin, D.B. Bayesian Data Analysis (Chapman & Hall/CRC, Boca Raton, Florida, USA, 1995).

    MacKay, D.J.C. Information Theory, Inference, and Learning Algorithms (Cambridge Univ. Press, Cambridge, UK, 2003).

    Jaynes, E.T. Probability Theory: The Logic of Science (Cambridge Univ. Press, Cambridge, UK, 2003).

    Hacking, I. The Emergence of Probability (Cambridge Univ. Press, Cambridge, UK, 1975).


    شاهد الفيديو: اللغز الذي سوف يغير نظرتك في الحياة. الإحتمالات الشرطية ونظرية بايز (قد 2022).