معلومة

استخراج الطفرات من تسلسل فاستا

استخراج الطفرات من تسلسل فاستا



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لدي كمية كبيرة من تسلسلات البروتين بتنسيق .fasta وأود استخراج طفرات الأحماض الأمينية فقط من هذه التسلسلات ، بحيث في النهاية ، أريد الحصول على قائمة تبدو كالتالي: I456L، W675T ، وما إلى ذلك ، هل هناك برنامج أو طريقة للقيام بذلك؟ شاكرين


يتحول

أدوات الجينوم 2D (الدكتور. آن دي جونغ ، علم الوراثة الجزيئية ، جامعة جرونينجن ، هولندا) - هذا هو موقع الانتقال لجميع أنواع التحليلات. ضمن & quotGenome Tools & quot حدد & quotConversions. & quot هذا سيسمح لك بتحويل ملف GenBank المسطح (gbk) إلى GFF (تنسيق الميزة العامة ، الجدول) ، CDS (تسلسل الترميز) ، البروتينات (FASTA Amino Acids ، faa) ، تسلسل الحمض النووي (تنسيق Fasta) .

Galaxy عبارة عن نظام أساسي مفتوح قائم على الويب لإجراء أبحاث طبية حيوية حسابية يمكن الوصول إليها وقابلة للتكرار وشفافة. يجعل خادم الويب هذا أدوات التحليل والبيانات الجينومية والعروض التوضيحية التعليمية ومساحات العمل المستمرة وخدمات النشر متاحة لأي عالم. تتوفر وثائق مستخدم واسعة النطاق تنطبق على أي مثيل Galaxy عام أو محلي. يقدم مجموعة متنوعة من الأدوات للتحليل وتحويل الملفات.

تحويل التسلسل ( @ Bugaco ) - مجموعة ضخمة من أدوات التحويل.

تم تطوير Readseq بواسطة D.G. جيلبرت (جامعة إنديانا) يقرأ ويحول التسلسلات الحيوية بين مجموعة من تنسيقات التسلسل البيولوجي الشائعة ، بما في ذلك تنسيقات تسلسل EMBL و GenBank و Fasta المتاحة هنا.

يقوم EMBOSS Seqret بقراءة وكتابة (إرجاع) التسلسلات. إنه مفيد لمجموعة متنوعة من المهام ، بما في ذلك استخراج التسلسلات من قواعد البيانات ، أو عرض التسلسلات ، أو إعادة تنسيق التسلسلات ، أو إنتاج مكمل عكسي للتسلسل ، أو استخراج أجزاء من التسلسل ، أو تحويل حالة التسلسل ، أو أي مجموعة من الوظائف المذكورة أعلاه.

محول التنسيق - يأخذ هذا البرنامج كمدخل تسلسل أو تسلسلات (على سبيل المثال ، محاذاة) بتنسيق غير محدد ويحول التسلسل (التسلسلات) إلى تنسيق مختلف يحدده المستخدم. يحول أيضًا * .gbk إلى * .gff3.

ApolloRNA تحويل البيانات - تحويل TransTermHP ، CRISPRfinder ، MOSAIC ، PatScan ، DARN! (GFF) ، بيانات الإخراج GenBank في بيانات تنسيق GFF و GAME XML التي يمكن قراءتها بواسطة Apollo.

يقبل GenBank Trans Extractor ملف GenBank كمدخل ويعيد كل ترجمة البروتين الموضحة في الملف بتنسيق FASTA. يجب استخدام GenBank Trans Extractor عندما تكون مهتمًا بترجمات البروتين المتوقعة لتسلسل الحمض النووي أكثر من اهتمامك بتسلسل الحمض النووي نفسه. جزء من مجموعة معالجة التسلسل.

FeatureExtract 1.2L (light) Server - يستخرج التسلسل والشروح التوضيحية للميزات ، مثل بنية intron / exon ، من إدخالات GenBank وملفات تنسيق GenBank الأخرى. (المرجع: R. Wernersson (2005) Nucleic Acids Res. 33 (مشكلة خادم الويب): W567 و ndashW569).

محرر التسلسل - يحول تسلسلات DNA و RNA. إنشاء متواليات متوازية ومكملة ومعكوسة.

تحويل التنسيق - (التسلسل الفردي ، مجموعة التسلسلات ، المحاذاة ، الشجرة ، المصفوفة ،.) والشكل يتم التعرف عليه تلقائيًا. الإخراج: FASTA، NEXUS، PHYLIP، Clustal، EMBL، Newick، New Hampshire).

GenBank 2 الترتر ( P. Lehwark & ​​amp S. Greiner ، معهد Max-Planck لفيزيولوجيا النبات الجزيئي ، ألمانيا ) - تم تصميم هذا البرنامج المفيد للغاية لتحويل إخراج GeSeq المنقح إلى تنسيق Sequin المطلوب لتقديم NCBI. ومع ذلك ، يمكن إعداد أي ملف GenBank مخصص لتقديم NCBI باستخدام GenBank 2 Sequin.

JaMBW (مختبر البيولوجيا الجزيئية الأوروبي في هايدلبرغ ، ألمانيا). عالم الأحياء الجزيئي القائم على Java & # 39s Workbench. حدد الفصل 1 لتحويل تنسيق التسلسل (الأحرف الكبيرة /> الصغيرة T /> U العكسي أو التسلسل التكميلي).

مدلك تسلسل الحمض النووي (شركة Allotron Biosensor) والذي بالإضافة إلى إزالة المواد الزائفة (الأرقام ، الفواصل ، HTML ، المسافات) يغير التنسيق (الأحرف الكبيرة إلى المنخفضة ، المكمل ، العكسي ، الحمض النووي الريبي إلى الحمض النووي ، وثلاثة توائم).

استخراج (أ. فيليجاس ، الصحة العامة في أونتاريو) - يأخذ Genbank flatfile (* .gbk) كمدخلات ويوزع من خلاله ولكل CDS يعثر عليه ، فإنه يستخرج طولًا محددًا مسبقًا من الدنا المنبع (الطول سيكون وسيطة وسيشمل 3 nt لكودون البدء). سيكون الإخراج ملف FFN لتسلسلات الحمض النووي المنبع هذه. ملحوظة. يعمل هذا فقط مع التسلسلات بدائية النواة لأنه لا يتعامل مع الانقسامات أو الوصلات الموجودة في حقيقيات النواة. يمكن بعد ذلك تحليل هذه البيانات باستخدام برامج مثل MEME. هذا البرنامج غير متاح مؤقتًا عبر الإنترنت ، على الرغم من أنه يمكن تنزيله من هنا.

تحويل GenBank إلى Fasta (ج. روكاب ، كلية علوم المحيطات ، جامعة واشنطن ، الولايات المتحدة الأمريكية) - حدد ملف GenBank بتنسيق يحتوي على جدول ميزات. حدد ما إذا كنت تريد استخراج تسلسل الببتيد المترجم ، أو تسلسل الحمض النووي لكل ميزة ، أو تسلسل الحمض النووي بالكامل للسجل بأكمله. إذا اخترت & quot تسلسل الببتيد & quot ، فيجب أن يحتوي جدول الميزات الخاص بك على & quott translation & quotsub-features.

FaBox (Palle Villesen Fredsted ، جامعة آرهوس ، الدنمارك) - مربع أدوات تسلسل Fasta عبر الإنترنت ، بما في ذلك محرر رأس Fasta ، وبديل رأس Fasta ، ومستخرج تسلسل Fasta ، وطرح تسلسل Fasta ، وموصل تسلسل Fasta ، ومقسم / مقسم مجموعة بيانات Fasta

FeatureExtract - تستخلص هذه الخدمة المفيدة للغاية التسلسل والتعليقات التوضيحية للميزات ، مثل بنية intron / exon ، من إدخالات GenBank وملفات تنسيق GenBank الأخرى. (المرجع: R. Wernersson. 2005. Nucl. Acids Res. 33 ( مشكلة خادم الويب): W567-W569). من الممكن أيضًا استخراج متواليات 5 & # 39 و 3 & # 39.

SIGENAE Fasta Clean - SIGENAE تعني نظام المعلومات لبرنامج AGENAE. برنامج AGENAE (تحليل تربية الحيوانات و rsquo الجينوم) هو برنامج وطني Inra يهدف إلى تطوير البحوث في مجال تربية الجينوميات الحيوانية - الخنازير والدجاج والسلمون المرقط والماشية والأرانب والأغنام.

SeqScrub - هو تطبيق ويب يقوم بتنظيف رؤوس ملفات FASTA وإلحاق المعلومات من قواعد البيانات الخارجية. (المرجع: Foley G et al. (2019) BioTechniques 67(2): 50-54).

PAL2NAL - هو برنامج يحول محاذاة تسلسل متعدد للبروتينات وتسلسلات الحمض النووي المقابلة (أو mRNA) إلى محاذاة كودون. يقوم البرنامج تلقائيًا بتعيين تسلسل الكودون المقابل حتى لو كان تسلسل الحمض النووي للإدخال غير متطابق مع تسلسل بروتين الإدخال ، أو يحتوي على UTRs ، ذيول polyA. يمكنه أيضًا التعامل مع تحولات الإطار في محاذاة الإدخال ، وهو مناسب لتحليل الجينات الكاذبة. يمكن أيضًا أن تخضع محاذاة الكودون الناتجة لحساب مرادف (دس) وغير مرادف (تن) معدلات الاستبدال. (المرجع: Suyama M et al. (2006) Nucl Acids Res 34: W609-W612).

يسمح خلط DNA و Sequence Randomizer لأحد بترتيب تسلسل عشوائيًا للمقارنة مع تسلسل واحد.


التعامل مع & # 8220big data & # 8221¶

المصطلح & # 8220big data & # 8221 غامض بعض الشيء. ولكن من الممكن بالتأكيد إنشاء ملفات تسلسلية أكبر من أن يتم تخزينها في ذاكرة الوصول العشوائي (ذاكرة الوصول العشوائي).

في هذه الحالات ، يحتاج المرء إلى أن يكون قادرًا على قراءة جزء من الملف وسجلات & # 8220yield & # 8221 أثناء معالجة الملف. بمعنى آخر ، لا يتم تخزين محتوى الملف بأكمله في ذاكرة الوصول العشوائي.

في الحالة المحددة لمعالجة ملفات FASTA ، يحتاج المرء إلى أن يكون قادرًا على & # 8220yield & # 8221 سجلات FASTA حيث يعمل المرء بطريقة واحدة & # 8217s من خلال الملف. هذا يعني أنه لا يمكن للمرء إنشاء وظيفة تنشئ قائمة كبيرة من سجلات FASTA وإرجاع تلك القائمة. بدلاً من ذلك ، يحتاج المرء إلى إنشاء وظيفة تسجلها & # 8220yields & # 8221 FASTA أثناء معالجة ملف FASTA.

يمكن تحقيق ذلك باستخدام الكلمة المفتاحية الإنتاجية.

لتوضيح هذا ، تخيل أن أحدهم لديه ملف نصي حيث كان عدد الأحرف في كل سطر مقياسًا رئيسيًا. يوجد أدناه دالة تأخذ اسم الملف كمعامل إدخال وتعيد قائمة من الأعداد الصحيحة التي تمثل عدد الأحرف في كل سطر.

ستواجه الوظيفة المذكورة أعلاه مشكلة إذا كان الملف كبيرًا حقًا. هذا لأن قائمة data_collection مخزنة في ذاكرة الوصول العشوائي. إذا كان الملف يحتوي على سطور أكثر من ذاكرة الكمبيوتر ، فإن استدعاء الوظيفة سيؤدي إلى خطأ في الذاكرة.

لماذا لا أحصل على & # 8217t "خطأ في الذاكرة" عند فتح ملفات كبيرة؟

وظيفة الفتح لا تقرأ الملف بالفعل. يقوم بإنشاء & # 8220handle & # 8221 إلى الملف (مؤشر إلى بداية الملف).

يحتوي مقبض الملف على وظيفة read () ، والتي تقرأ محتوى الملف بالكامل في الذاكرة. إذا اتصلت بهذه الوظيفة وكان الملف كبيرًا بما يكفي ، فستواجه خطأ MemoryError. هذا جزء من سبب ندرة استخدام هذه الوظيفة.

من الشائع أكثر استخدام وظيفة readlines () ، والتي تستفيد من بيان العائد إلى & # 8220yield & # 8221 سطرًا واحدًا في كل مرة ، ولهذا السبب يمكننا معالجة الملفات الكبيرة.

من الممكن أيضًا معالجة ملف سطرًا بسطر عن طريق وضع مقبض الملف في حلقة for. بعد ذلك ، يتصرف مقبض الملف باعتباره & # 8220iterator & # 8221 منظمًا جدًا ، مما ينتج عنه سطر واحد في كل مرة.

يوجد أدناه وظيفة تتغلب على هذه المشكلة من خلال & # 8220yielding & # 8221 أطوال الخطوط أثناء معالجتها ، مما يؤدي إلى التحايل على الحاجة إلى تخزين بنية البيانات بالكامل في ذاكرة الوصول العشوائي.

كيف يمكن استخدام هذا في الممارسة؟ سيكون التطبيق العملي هو كتابة النتائج في الملف. يمكن تحقيق ذلك باستخدام الكود أدناه.


الجمهور المستهدف

الخريجين وطلاب الدراسات العليا والباحثين الرئيسيين الذين يعملون مع أو على وشك الشروع في تحليل البيانات من منصات تسلسل الجيل التالي (تركيز Illumina). مطلوب جينوم مرجعي.

شروط الحضور:

الإلمام الأساسي ببيئة Linux و S أو R أو Matlab. يجب أن تكون قادرًا على إكمال وفهم دروس Linux و R البسيطة التالية قبل الحضور:

ستحتاج أيضًا إلى الكمبيوتر المحمول الخاص بك المزود بإمكانية الإنترنت اللاسلكي الحد الأدنى من المتطلبات: دقة الشاشة 1024 × 768 ، وحدة المعالجة المركزية 1.5 جيجا هرتز ، ذاكرة الوصول العشوائي 1 جيجا بايت ، الإصدارات الحديثة من Windows أو Mac OS X أو Linux (من المحتمل أن تلبي معظم أجهزة الكمبيوتر التي تم شراؤها في السنوات 3-4 الماضية هذه المتطلبات). إذا لم يكن لديك وصول إلى جهاز الكمبيوتر الخاص بك ، فيمكنك إعارة جهاز من CSHL. يرجى الاتصال بـ CSHL مسبقًا لطلب جهاز كمبيوتر محمول. "

يمكن العثور على محتوى إضافي على صفحة ورشة العمل.


استخراج الطفرات من تسلسل فاستا - علم الأحياء

وحدة Python قوية للوصول العشوائي السريع إلى التسلسلات من ملف FASTA / Q العادي والمضغوط

يعد pyfastx امتدادًا خفيف الوزن لـ Python C يمكّن المستخدمين من الوصول العشوائي إلى التسلسلات من ملفات gzipped ملفات FASTA / Q. تهدف هذه الوحدة إلى توفير واجهات برمجة تطبيقات بسيطة للمستخدمين لاستخراج seqeunce من FASTA والقراءة من FASTQ عن طريق المعرف ورقم الفهرس. سيقوم pyfastx بإنشاء فهارس مخزنة في ملف قاعدة بيانات sqlite3 للوصول العشوائي لتجنب استهلاك قدر كبير من الذاكرة. بالإضافة إلى ذلك ، يمكن تحليل معيار pyfastx (ينتشر التسلسل في عدة أسطر بنفس الطول) وغير قياسي (ينتشر التسلسل في سطر واحد أو أكثر بطول مختلف) تنسيق FASTA. استخدمت هذه الوحدة kseq.h الذي كتبهattractivechaos في مشروع klib لتحليل ملف FASTA / Q العادي و zran.c الذي كتبهpauldmccarthy في مشروع indexed_gzip لفهرسة ملف مضغوط للوصول العشوائي.

هذا المشروع مستوحى بشكل كبير من مشروع @ mdshw5's pyfaidx و @ brentp's pyfasta.

  • ملف واحد لامتداد Python
  • خفيف الوزن ، وذاكرة فعالة لتحليل ملف FASTA / Q
  • وصول عشوائي سريع للتسلسلات من ملف FASTA / Q المضغوط
  • قراءة التسلسلات من ملف FASTA سطرًا بسطر
  • احسب N50 و L50 من التسلسلات في ملف FASTA
  • حساب محتوى GC وتكوين النيوكليوتيدات
  • استخراج متواليات عكسية ومكملة ومضادة للمعنى
  • توافق ممتاز ودعم لتحليل ملف FASTA غير القياسي
  • دعم تحويل نقاط الجودة FASTQ
  • توفير واجهة سطر الأوامر لتقسيم ملف FASTA / Q

حاليًا ، يدعم pyfastx Python 3.5 و 3.6 و 3.7 و 3.8 و 3.9. تأكد من تثبيت كل من pip و Python قبل البدء.

يمكنك تثبيت pyfastx عبر فهرس حزمة Python (PyPI)

يوفر Pyfastx ارتباطًا بسيطًا وسريعًا للبيثون لـ kseq.h للتكرار عبر التسلسلات أو القراءة في ملف fasta / q. سيكتشف كائن FASTX تلقائيًا تنسيق تسلسل الإدخال (fasta أو fastq) لإرجاع مجموعة مختلفة.

عند التكرار عبر التسلسلات على كائن FASTX ، سيتم إرجاع مجموعة (الاسم ، التسلسل ، التعليق) ، التعليق هو محتوى سطر العنوان بعد أول حرف مسافة بيضاء.

عند تكرار القراءة على كائن FASTX ، سيتم إرجاع مجموعة (الاسم ، التسلسل ، الجودة ، التعليق) ، التعليق هو محتوى سطر العنوان بعد أول حرف مسافة بيضاء.

قراءة ملف FASTA عادي أو مضغوط وإنشاء فهرس ، ودعم الوصول العشوائي إلى FASTA.

قد يستغرق مؤشر البناء بعض الأوقات. يعتمد الوقت اللازم لإنشاء الفهرس على حجم ملف FASTA. إذا تم إنشاء الفهرس ، فيمكنك الوصول بشكل عشوائي إلى أي تسلسلات في ملف FASTA. يمكن إعادة استخدام ملف الفهرس لتوفير الوقت عند قراءة seqeunces من ملف FASTA في المرة القادمة.

أسرع طريقة لتكرار ملف FASTA عادي أو مضغوط بدون فهرس بناء ، سيعيد التكرار مجموعة تحتوي على اسم وتسلسل.

يمكنك أيضًا تكرار كائن التسلسل من كائن FASTA مثل هذا:

التكرار باستخدام build_index = كائن تسلسل إرجاع صحيح (افتراضي) يسمح لك بالوصول إلى سمات التسلسل. الجديد في pyfastx 0.6.3.2

حساب التجميع N50 و L50 ، والعودة (N50 ، L50) ، ومعرفة المزيد عن N50 ، L50

احصل على عدد المتتاليات التي طولها & gt = الطول المحدد

يمكن استرجاع اللاحقات من ملف FASTA باستخدام قائمة إحداثيات [البداية ، النهاية]

في بعض الأحيان ، يكون للفاستا الخاص بك رأس طويل يحتوي على معرفات ووصف متعددة ، على سبيل المثال ، "مكتبة بتلات الزهور contig1 cDNA & gtJZ822577.1 في شجرة الفاوانيا عن طريق قمع التهجين المطروح Paeonia Suffruticosa cDNA ، تسلسل الرنا المرسال". في هذه الحالة ، يمكن استخدام "JZ822577.1" و "contig1" كمعرف. يمكنك تحديد وظيفة المفتاح لتحديد واحد كمعرف.


استرجاع بيانات تسلسل الجينوم باستخدام SeqinR¶

بدلاً من الانتقال إلى موقع NCBI لاسترداد بيانات التسلسل من قاعدة بيانات NCBI ، يمكنك استرداد بيانات التسلسل من NCBI مباشرةً من R ، باستخدام حزمة SeqinR R.

على سبيل المثال ، تعلمت أعلاه كيفية استرداد تسلسل جينوم فيروس حمى الضنك DEN-1 ، والذي يحتوي على انضمام NCBI NC_001477 ، من موقع NCBI. لاسترداد تسلسل مع انضمام NCBI معين ، يمكنك استخدام وظيفة R & # 8220getncbiseq () & # 8221 أدناه ، والتي ستحتاج أولاً إلى نسخها ولصقها في R:

بمجرد نسخ ولصق الوظيفة getncbiseq () في R ، يمكنك استخدامها لاسترداد تسلسل من قاعدة بيانات NCBI Nucleotide ، مثل تسلسل فيروس حمى الضنك DEN-1 (الانضمام NC_001477):

المتغير dengueseq هو ناقل يحتوي على تسلسل النوكليوتيدات. يحتوي كل عنصر من عناصر المتجه على نوكليوتيد واحد من التسلسل. لذلك ، لطباعة تتابع معين من التسلسل ، نحتاج فقط إلى كتابة اسم المتجه dengueseq متبوعة بالأقواس المربعة التي تحتوي على مؤشرات تلك النيوكليوتيدات. على سبيل المثال ، يطبع الأمر التالي أول 50 نيوكليوتيد من تسلسل جينوم فيروس حمى الضنك DEN-1:

لاحظ أن dengueseq [1:50] يشير إلى عناصر المتجه dengueseq بمؤشرات من 1-50. تحتوي هذه العناصر على أول 50 نيوكليوتيد من تسلسل فيروس حمى الضنك DEN-1.


جودة تسلسل الحمض النووي - Phred - يوفر اتصالًا أساسيًا وعرض كروماتوجرام وتقييم عالي الجودة لمنطقة التسلسل والعرض التقديمي لما يصل إلى خمسة تسلسلات في وقت واحد.

تجميع التسلسل - لا تحتاج إلى برنامج التجميع الخاص بك عندما يمكنك استخدام:

EGassember - محاذاة ودمج أجزاء التسلسل الناتجة عن تسلسل البندقية أو نسخ الجينات (EST) من أجل إعادة بناء المقطع أو الجين الأصلي (المرجع: A. Masoudi-Nejad et al. 2006. Nucl. Acids Res. 34: W459-462).

مجمع CGE 1.2 - يجمع بيانات Illumina ، 454 ، SOLid و Ion Torrent (المرجع: Larsen MV ، وآخرون. J. Clin. Micobiol. 2012. 50(4): 1355-1361).
CGE SPAdes 3.9 - يجمع بيانات Illumina و Ion Torrent (المرجع: S. Nurk et al. Research in Computational Molecular Biology: pp 158-170).

CAP3 (PBIL، فرنسا ) ، (المرجع: Huang، X. & amp Madan A. 1999. Genome Res. 9: 868-877) وهنا.
مجمع CAP EST (Istituto FIRC di Oncologia Molecolare ، إيطاليا) - أقصى طول للتسلسل لكل سلسلة هو 30 كيلو بايت - أقصى عدد للتسلسلات 10 كيلو بايت

يوفر موقع الويب MicroScope (المستضاف في Genoscope) بيئة لتعليقات الخبراء وعلم الجينوم المقارن. مشروع الجينوم: الشرح والتحليلات المقارنة لتسلسل الجينوم النهائي أو المسودة. بالنسبة للتسلسلات المشروحة مسبقًا ، فإنها تدمج فقط التعليقات التوضيحية من قسم الجينوم الكامل NCBI RefSeq. مشروع Metagenome: الشرح والتحليلات المقارنة للتسلسلات الميتاجينومية المجمعة. حاليًا ، يمكنهم دمج مجموعات البيانات التي تقل عن 20 ميجا بايت من contigs لكل حاوية.

NanoPipe - تم تطويره مع مراعاة خصوصيات تقنيات تسلسل MinION ، مما يوفر معلمات محاذاة معدلة وفقًا لذلك. نطاق الأنواع / التسلسلات المستهدفة للمحاذاة غير محدود ، وتساعد صفحة الاستخدام الوصفية لـ NanoPipe المستخدم على النجاح في تحليل NanoPipe. تحتوي النتائج على إحصائيات المحاذاة وتسلسل الإجماع وبيانات تعدد الأشكال وتصور المحاذاة. (المرجع: Shabardina V et al. (2019) Gigascience 8 (2). بيي: giy169).


COV2HTML: أداة تصور وتحليل لبيانات تسلسل الجيل التالي البكتيري (NGS) لعلماء الحياة ما بعد الجينوم - تسمح بإجراء كل من تصور التغطية وتحليل محاذاة NGS التي يتم إجراؤها على الكائنات بدائية النواة (البكتيريا والعاقمات). فهو يجمع بين عمليتين: أداة تقوم بتحويل خرائط NGS الضخمة أو ملفات التغطية إلى ملفات تغطية خفيفة محددة تحتوي على معلومات عن العناصر الجينية وواجهة تصور تسمح بتحليل البيانات في الوقت الفعلي مع تكامل اختياري للنتائج الإحصائية. (المرجع: Monot M. et al. 2014. OMICS 18(3): 184-95).

DCA فرق وقهر محاذاة تسلسل متعددة ( جامعة بيليفيلد ، ألمانيا) - هو برنامج لإنتاج محاذاة متسلسلة متعددة ومتزامنة سريعة وعالية الجودة من الأحماض الأمينية أو الحمض النووي الريبي أو تسلسل الحمض النووي. (المرجع: Brinkmann، G. et al. البرمجة الرياضية 79: 71-97, 1997).

PhageTerm - عبارة عن حزمة برامج سريعة وسهلة الاستخدام والتي يمكن استخدامها لتحديد نهاية العاثية ووضع التعبئة والتغليف من بيانات NGS المجزأة عشوائيًا. إنه جزء من حزمة Galaxy ، ويمكن العثور عليه في الدليل & quotNGS: Mapping & quot. المثالي هو أنك تريد إجابة آلية. (المرجع: Garneau JR، et al. 2017. Sci Rep. 7(1):8292).

QUAST - أداة تقييم الجودة لتقييم ومقارنة مجموعات الجينوم. تعمل هذه الأداة على تحسين برامج مقارنة التجميع الرائدة بأفكار جديدة ومقاييس الجودة. يمكن لـ QUAST تقييم التجميعات مع كل من الجينوم المرجعي ، وكذلك بدون مرجع.تنتج QUAST العديد من التقارير والجداول الموجزة والمؤامرات لمساعدة العلماء في أبحاثهم وفي منشوراتهم. (المرجع: A. Gurevich et al. 2013. Bioinformatics، 29(8): 1072 و ndash1075). ملحوظة. هذا الخادم اعتبارًا من أبريل 2020 ، ولكن هناك آمال في إعادة الاتصال بالإنترنت (انظر هنا لتنزيلات البرامج).

أخطاء التسلسل: - إذا كان تسلسل الحمض النووي الخاص بك لا يتطابق مع تسلسل البروتين المتوقع ، يمكنك التحقق من وجود أخطاء في GeneWise (EMBL-EBI) الذي يقارن تسلسل البروتين بتسلسل الحمض النووي الجيني ، مما يسمح بإدخال أخطاء في الإنترونات وتحويل الإطارات. تشمل البرامج الأخرى:

FrameD (المرجع: T. Schliex وآخرون 2003. Nucl. Acids Res. 31: 3738-3741)
AMIGene - شرح توضيحي للجينات الميكروبية (المرجع: Bocs S et al. (2003) الدقة الأحماض النووية. 13(31): 3723-3726).
مسار :: الترجمة الخلفية للبروتين والمواءمة - يعالج مشكلة إيجاد تماثلات البروتين البعيدة حيث يكون الاختلاف نتيجة طفرات واستبدال الإطارات. بالنظر إلى تسلسلين لبروتين الإدخال ، تقوم الطريقة ضمنيًا بمحاذاة جميع الأزواج الممكنة من تسلسلات الحمض النووي التي تشفرها ، عن طريق معالجة تمثيلات الرسوم البيانية الفعالة للذاكرة لمجموعة كاملة من تسلسلات الحمض النووي المفترضة لكل بروتين. (المرجع: G & icircrdea M et al. 2010. خوارزميات البيولوجيا الجزيئية 5:)

In-silico.com (د. جوزيبا بيكاندي وزملاؤه بكلية الصيدلة بجامعة إقليم الباسك) - يسمح في السيليكو التجارب بما في ذلك التضخيم النظري PCR ، AFLP-PCR ، تحليل التقييد والرحلان الكهربي للهلام النبضي [PFGE] مع الجينومات البكتيرية و archael الموجودة في قاعدة البيانات العامة.

NCBI بدائية النواة خط أنابيب التعليقات التوضيحية التلقائي. سيؤدي هذا إلى وضع تعليقات توضيحية على الجينوم البكتيري بالكامل وسيوفر لك ملف تقديم الترتر. ملحوظة. إن NCBI Phage Automatic Annotation Pipeline قيد التطوير.

RAST (التعليق التوضيحي السريع باستخدام تقنية النظام الفرعي) هي خدمة مؤتمتة بالكامل لتعليق الجينومات البكتيرية والأثرية. يوفر شروحًا عالية الجودة للجينوم لهذه الجينومات عبر شجرة النشوء والتطور بأكملها. يتطلب التسجيل. (المرجع: Aziz، RK et al. 2008. BMC Genomics 9:75.).

أداة BASys Bacterial Annotation Tool - تدعم هذه الأداة الرائعة التعليقات التوضيحية التلقائية المتعمقة للتسلسلات الجينومية البكتيرية. يقبل بيانات تسلسل الحمض النووي الخام وقائمة اختيارية لمعلومات تحديد الجينات (Glimmer) ويوفر تعليقًا توضيحيًا نصيًا شاملاً وإخراج صورة مرتبطة تشعبيًا. تستخدم BASys & gt30 برامج لتحديد 60 حقلاً فرعيًا للتعليقات التوضيحية لكل جين ، بما في ذلك اسم الجين / البروتين ، ووظيفة GO ، ووظيفة COG ، والمشابهات المحتملة وتقويم العظام ، والوزن الجزيئي ، والنقطة الكهربية ، وبنية التشغيل ، والتوطين تحت الخلوي ، وببتيدات الإشارة ، ومناطق الغشاء ، والبنية الثانوية ، هيكل ثلاثي الأبعاد وردود الفعل والمسارات. (المرجع: G.H. Van Domselaar et al. 2005. Nucl. Acids Res. 33(مشكلة خادم الويب): W455-W459).

MicroScope - (CEA ، Institut de G & eacutenomique - Genoscope ، فرنسا) عبارة عن نظام أساسي لتحليل الجينوم الميكروبي للتعليقات التوضيحية والتحليل الذي يوفر إمكانية الوصول إلى مجموعة واسعة من الأدوات بما في ذلك تحليل COG والجينوميات المقارنة. (المرجع: Vallenet D et al. (2017) Nucleic Acids Res. 45 (د 1): D517-D528). يتطلب التسجيل.

MAKER Web Annotation Service (MWAS) عبارة عن خط أنابيب لتعليقات الجينوم سهل التكوين ويمكن الوصول إليه عبر الويب. الغرض من ذلك هو السماح لمجموعات البحث التي تحتوي على كميات صغيرة إلى متوسطة من تسلسل الجينوم حقيقية النواة وبدائية النواة (أي استنساخ BAC ، والجينومات الكاملة الصغيرة ، وبيانات التسلسل الأولية ، وما إلى ذلك) للتعليق على بياناتها وتحليلها بشكل مستقل وإنتاج مخرجات يمكن تحميلها في قاعدة بيانات الجينوم. (المرجع: Holt، C. & amp Yandell، M. 2011. BMC Bioinformatics 12:491).

MITOS - تم تصميم خط أنابيب لتوفير شرح توضيحي متسق وعالي الجودة لتسلسلات جينومات الميتوكوندريا الميتازوان. نوضح أن نتائج MITOS تطابق RefSeq و MitoZoa من حيث تغطية التعليقات التوضيحية وجودتها. في الوقت نفسه ، نتجنب التحيزات والتناقضات في التسميات والأخطاء المطبعية الناشئة عن استراتيجيات التنظيم اليدوي. (المرجع: M. Bernt et al. 2013. علم الوراثة الجزيئي وتطور الأمبير 69:313-319).

جينساس - الجنرالome سمعادلة أملاحظة سerver - يوفر موقعًا إلكترونيًا شاملاً بواجهة رسومية واحدة لتشغيل العديد من أدوات التعليقات التوضيحية الهيكلية والوظيفية ، مما يتيح التصور والمعالجة اليدوية لتسلسلات الجينوم. يمكن للمستخدمين تحميل التسلسلات في حساباتهم وتشغيل برامج التنبؤ الجيني ، وعمليات البحث عن البروتين المتماثل ، وخريطة ESTs ، وتحديد التكرارات ، و ORFs و SSR مع إعدادات المعلمات المخصصة. يتم عرض كل تحليل على مسارات منفصلة للواجهة الرسومية مع مسارات تحرير مخصصة لتحديد التعليق التوضيحي النهائي للميزات وإنشاء ملفات gff3 للتحميل إلى متصفحات الجينوم مثل GBrowse. يمكن إضافة برامج إضافية بسهولة باستخدام هذا البرنامج القائم على دروبال.

الخامسإيرال جيenome االترددات اللاسلكية صرأس (VIGOR) - يدعم التنبؤ بميزة الإنتاجية العالية والتعليقات التوضيحية. تستخدم VIGOR استراتيجية خارجية وتتميز بحساسية وخصوصية أكبر من 98٪ لجينومات RNA الفيروسية التي اختبرناها. تشمل الميزات الخاصة بالجينوم التي حددتها VIGOR تغييرات الإطارات ، والانزلاق الريبوزومي ، وتحرير الحمض النووي الريبي ، وإيقاف قراءة الكودون ، والجينات المتداخلة ، والجينات المضمنة ، ومواقع الانقسام الببتيد الناضج. القدرة على التنميط الجيني للأنفلونزا والفيروسات العجلية مدمجة في البرنامج.
(المرجع: S. Wang et al. 2011. BMC Bioinformatics 2010، 11:451)

فلان (فلوريداش ANتدوين) هو خادم ويب NCBI للتعليق التوضيحي للجينوم لفيروس الأنفلونزا هو أداة يوفرها المستخدم لفيروس الإنفلونزا A أو تسلسل فيروسات الأنفلونزا B. يمكنه التحقق والتنبؤ بتسلسل البروتين المشفر بواسطة تسلسل إنفلونزا المدخلات. (المرجع: Y. Bao et al. 2007. Nucleic Acids Res. Web Server issue) 35: W280-W284.)

كبجافاس ( جمرحباصالاخير جيenome أنوتاتيون الخامسisualization أnalysis و GenBank سأداة ubmission) - تتيح شرحًا دقيقًا لجينوم البلاستيدات الخضراء ، وإنشاء خرائط دائرية ، وتوفير نتائج تحليل مفيدة للجينوم المشروح ، وإنشاء ملفات يمكن إرسالها إلى GenBank مباشرة. (المرجع: C. Liu et al. 2012. BMC Genomics 13: 715)

جيenome أملاحظة تيالفدية يوtility (GATU) يعلق على الجينوم بناءً على جينوم مرجعي وثيق الصلة. يتم تفجير البروتينات / الببتيدات الناضجة للجينوم المرجعي مقابل الجينوم ليتم شرحها من أجل العثور على الجينات / الببتيدات الناضجة في الجينوم المراد شرحها (المرجع: T. Tcherepano v et al. 2006. BMC Genomics 7:150.)

BioGPS (معهد سكريبس للأبحاث ، الولايات المتحدة الأمريكية) - عبارة عن بوابة للتعليقات التوضيحية الجينية وقفة واحدة تؤكد على قابلية المستخدم للتخصيص وقابلية التوسع في المجتمع ، وهي بوابة للتعليقات التوضيحية الجينية قابلة للتخصيص ومورد كامل للتعلم عن وظيفة الجينات والبروتينات.

باجل (معهد جرونينجن للعلوم الجزيئية الحيوية والتكنولوجيا الحيوية ، هارين ، هولندا) - سيحدد من ملف GenBank الموجود أو غير المقدم وجود البكتريوسينات بناءً على قاعدة بيانات تحتوي على معلومات عن البكتريوسينات المعروفة والجينات المجاورة المشاركة في نشاط البكتريوسين. موقع بديل للبكتريوسينات هو BACTIBASE وهو مستودع بيانات من الببتيدات الطبيعية المضادة للميكروبات البكتيريوسين. ارى . LABioicin إذا كنت مهتمًا بموضوع بكتيريا حمض اللاكتيك (LAB) وبكترياها.

ميكيك (MIجينوم كروبيال التحقق منer) - يتيح التحقق السريع من مجموعات الجينات المشروحة وتحولات الإطارات في الجينومات البكتيرية المنشورة مسبقًا ، أو الجينومات التي يمتلك المستخدم ملفًا بها * .gbk. يمكن اعتبار هذه الأداة كخطوة أولية قبل خطوة إعادة التعليق التوضيحي الوظيفية للتحقق بسرعة من الجينات المفقودة أو المشروحة بشكل خاطئ. لقد عملت بشكل جيد مع جينومات الملتهمة من 43-135 كيلو بايت. (المرجع: S. Cruveiller et al. 2005. Nucl. Acids Res. 33: W471- W479).

WebGeSTer - Geنوم ستعليب ل تيرminators - تم تمكين برنامج البحث المفضل لدي في النهاية على الويب. يرجى ملاحظة أنه إذا كنت ترغب في تحليل البيانات من ملف * .gbk ، فأنت بحاجة إلى استخدام برنامج التحويل الخاص بهم & quotGenBank2GeSTer & quot أولاً. يتم إنتاج وصف كامل لكل فاصل بما في ذلك رسم تخطيطي بواسطة هذا البرنامج. هذا الموقع مرتبط بقاعدة بيانات واسعة النطاق من المحطات النصية في الجينوم البكتيري (WebGeSTer DB) (المرجع: Mitra A. et al. 2011. Nucl. Acids Res. 39 (إصدار قاعدة البيانات): D129-35).

ريبكس: ضلعأوسويتش السابقplorer - المسح الضوئي و lt40kb DNA للجينات المحتملة (المرتبطة بـ BLASTP) وعدة مئات من العناصر التنظيمية ، بما في ذلك المحولات الريبية. إذا نقرت على & quotsearch عن المخففات & quot ، فستجد مواد إنهاء ومضادات. يعرض الجينات المتراكمة وتحليل بلاست في NCBI (المرجع: C. Abreu-Goodger & amp E. Merino.2005. Nucl. Acids Res. 33: W690-W692).

tRNAs: tRNAscan-SE - حساس بشكل لا يصدق ويوفر أيضًا مخططات هيكلية ثانوية لجزيئات الحمض النووي الريبي (المرجع: Schattner، P. et al. 2005. Nucleic Acids Res. 33: W686-689). بدلاً من ذلك ، استخدم ARAGORN (المرجع: Laslett، D. & amp Canback. 2004. Nucleic Acids Research 32:11-16).
تسلسل الاختبار.

LTR_Finder - هو برنامج فعال للعثور على retrotranspsons كامل الطول LTR في تسلسل الجينوم. يقتصر حجم ملف الإدخال الآن على 50 ميجا بايت (المرجع: Z. Xu & amp H. Wang. 2007. Nucl. Acids Res.35(مشكلة خادم الويب): W265-W268).
RTAnalyzer - يعثر على الينقولات العكسية ويكتشف تواقيع التحويل الرجعي L1 (المرجع: JF. Lucier et al. 2007. Nucl. Acids Res. 35(مشكلة خادم الويب): W269-W274

MG- راست (مetagenome صأبيد أاستخدام الملاحظات سubsystem تيechnology) هي خدمة مؤتمتة بالكامل لتعليق عينات الميتاجينوم. يوفر شرحًا توضيحيًا لشظايا التسلسل وتصنيفها النشئي وإعادة بناء التمثيل الغذائي الأولي. توفر الخدمة أيضًا وسائل لمقارنة تصنيفات النشوء والتطور وعمليات إعادة البناء الأيضية للميتاجينومات (المرجع: F.Meyer et al. 2008. BMC Bioinformatics 9: 386).

يمكن استخدام البرامج الأربعة التالية للتنبؤ ببروتينات الملتهمة:

PVPred (المرجع: Ding H et al (2014) Mol Biosyst 10(8): 2229-2235).
PHPred (المرجع: Ding H (2016) Computers Biol Med 71: 156 و ndash161).
PVP-SVM (المرجع: Manavalan B et al. (2018) Front Microbiol 9: 476).
PVPred-SCM (المرجع: Charoenkwan P et al. (2020) الخلايا 9 (2) بيي: E353.

أصل تكرار الكروموسوم:

يعد كل من Ori-Finder و Ori-Finder 2 - منصات مفيدة لتحديد وتحليل أصول النسخ المتماثل (oriCs) في الجينومات البكتيرية والأثرية ، على التوالي. (المرجع: Luo H et al. (2019) معلومات حيوية موجزة 20(4): 1114-1124). يرجى ملاحظة أنه تم استخدام هذه الأدوات لإنشاء DoriC - قاعدة بيانات لأصول النسخ المتماثل في جينومات بدائية النواة بما في ذلك الكروموسومات والبلازميدات. (المرجع: Luo H & amp Gao F (2019) Nucleic Acids Res. 47 (د 1): D74-D77).

تتمثل إحدى مشكلات GenBank في أن العلماء لا يقومون بتحديث بيانات الإرسال الخاصة بهم ولا يصححون الأخطاء. يرجع هذا جزئيًا إلى الكسل ولكنه أيضًا يرجع إلى حقيقة أن GenBank ، في معظم الحالات ، غير راغب في قبول إصدار جديد من ملف Sequin. Tbl2asn هو برنامج سطر أوامر يقوم بأتمتة إنشاء سجلات التسلسل لتقديمها إلى GenBank ولكن ، من وجهة نظري ، ليس من السهل استخدامه. البرنامج الوحيد عبر الإنترنت هو GenBank 2 Sequin الذي لا يقوم فقط بإنشاء ملف Sequin (* .sqn) ، ولكن أيضًا من خمسة أعمدة & quotAnnotation Table & quot (* .tbl). يمكن إرسال هذا جنبًا إلى جنب مع تسلسل الحمض النووي بتنسيق Fasta إلى GenBank عبر البريد الإلكتروني ([email protected]). في حالة عدم وجوده ، أوصي باستخدام البرنامج النصي perl gbf2tbl.pl للتنزيل هنا.


PlasmidFinder 1.3 - يتعرف على البلازميدات في عزلات البكتيريا المتسلسلة الكلية أو الجزئية. تستخدم الطريقة BLAST لتحديد النسخ المتماثلة للبلازميدات التي تنتمي إلى مجموعات عدم التوافق الرئيسية (Inc) المعوية. كمدخلات ، يمكن للطريقة استخدام كل من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة. انظر أيضًا pMLST (المرجع: Carattoli A et al. 2014. Antimicrob. Agents Chemother. 58: 3895-903)

يمكن استخدام PHACTS لتصنيف نمط حياة العاثية بسرعة (معتدل أو معتدل). كل ما هو مطلوب هو بروتينات العاثية المراد تصنيفها وستتنبأ PHACTS بنمط حياة تلك العاثية وتعيد قيمة الثقة لهذا التوقع. (المرجع: K. McNair et al. 2012. Bioinformatics 28: 614-618).

SpeciesFinder 1.0.0 تحديث (الجامعة التقنية الدنماركية) - يتنبأ بأنواع البكتيريا من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات متسلسلة قصيرة. يعتمد التنبؤ على جين 16S rRNA.

CSI Phylogeny 1.1 (استدعاء SNPs و amp Infer Phylogeny) - يستدعي SNPs ، يرشح SNPs ، يقوم بالتحقق من الموقع ويستنتج نسالة بناءً على المحاذاة المتسلسلة للجودة العالية * SNPs. (المرجع: Kaas، RS et al. PLoS ONE 2014 9: e104984.)

يتنبأ KmerFinder 2.0 & ndash بأنواع البكتيريا من الجينومات المجمعة مسبقًا ، الكاملة أو الجزئية ، وقراءات التسلسل القصيرة. يعتمد التنبؤ على عدد k-mers المتزامنة (سلاسل فرعية من النيوكليوتيدات في بيانات تسلسل الحمض النووي ، في هذه الحالة 16-mers) بين جينومات البكتيريا المرجعية في قاعدة بيانات والجينوم الذي يوفره المستخدم. (المرجع: Hasman H et al. 2013. J Clin Microbiol. 52:139-146)

VIOLIN: فحص اللقاحات وشبكة المعلومات عبر الإنترنت - تتيح سهولة المعالجة والمقارنة والتحليل للبيانات البحثية المتعلقة باللقاح عبر مختلف مسببات الأمراض البشرية ، ومن المتوقع أن يصبح VIOLIN مصدرًا مركزيًا لمعلومات اللقاح وأن يزود الباحثين في العلوم الأساسية والسريرية ببيانات منسقة و أدوات المعلوماتية الحيوية لبحوث اللقاحات وتطويرها. VBLAST: بحث مخصص لأبحاث اللقاحات يسمح بإستراتيجيات بحث متنوعة ضد 77 جينومًا لـ 34 من مسببات الأمراض. (المرجع: He، Y. et al. 2014. Nucleic Acids Res. 42 (مشكلة في قاعدة البيانات): D1124-32).

MLST 1.8 (MultiLocus Sequence Typing) - تعمل حاليًا فقط مع الجينومات المجمعة و contigs (المرجع: Larsen MV et al. 2012. J. Clin. Micobiol. 50: 1355-1361).

ECFfinder - عوامل سيجما للوظيفة خارج الهيولى (ECF) - أكبر مجموعة من عوامل سيجما البديلة - تمثل الآلية الأساسية الثالثة لنقل الإشارات البكتيرية ، مع حوالي ستة منظمات من هذا القبيل في المتوسط ​​لكل جينوم بكتيري. جنبا إلى جنب مع عوامل مكافحة سيغما المماثلة ، فإنها تمثل تصميمًا معياريًا للغاية يسهل في المقام الأول نقل إشارة الغشاء. (المرجع: Staron A et al. (2009) Mol Microbiol 74(3): 557-581).

BacWGSTdb - مصمم لرصد ظهور وانتشار مسببات الأمراض البكتيرية الهامة. بالتفصيل ، يخدم غرضين معينين: الكتابة وتتبع أمبير. يشير الأول إلى التنميط الجيني المتكامل في كل من الكتابة التسلسلية التقليدية متعددة المواضع (MLST) ومستوى كتابة تسلسل الجينوم الكامل (WGST). يشير الأخير إلى تتبع المصدر (أي العثور على عزلات متشابهة للغاية) وفقًا لنتيجة الكتابة ويعزل المعلومات المخزنة في BacWGSTdb. (المرجع: Z. Ruan 7 Y. Feng، Nucleic Acids Research. 2016 44 (د 1): D682-D687).

سيستر: سألمونيلا أنان سإليكو تييبينغ صesource - (وكالة الصحة العامة الكندية ، مختبر الأمراض الحيوانية المنشأ المنقولة بالغذاء) هو مورد للمعلومات الحيوية للترجمة السريعة في بيانات السيليكو لطرق فرعية متعددة للسالمونيلا من مسودة تجميعات الجينوم البكتيري. بالإضافة إلى إجراء التنبؤ المصلي عن طريق التنميط الجيني ، يدمج هذا المورد تحليلات الكتابة القائمة على التسلسل لـ: Multi-Locus Sequence Typing (MLST) و MLST الريبوسومي (rMLST) و MLST الجينومي الأساسي (cgMLST). يوصى باستخدام Google Chrome ، حيث يتم دعم Firefox أيضًا ولكن تصورات SVG داخل هذا التطبيق قد لا تكون سريعة الاستجابة. Internet Explorer غير مدعوم.

FSFinder2 (Fالتحول السريع سشرعي Finder) - تشارك عملية تغيير الإطارات الريبوزومية المبرمجة في التعبير عن جينات معينة من مجموعة واسعة من الكائنات الحية مثل الفيروسات والبكتيريا وحقيقيات النوى بما في ذلك الإنسان. في نظام تغيير الإطارات المبرمج ، يتحول الريبوسوم إلى إطار بديل في موقع معين استجابة لإشارة خاصة في الحمض النووي الريبي messanger. يلعب نظام Frameshift المبرمج دورًا في تكوين الجسيمات الفيروسية ، والتحكم الذاتي ، والأنشطة الأنزيمية البديلة. إن الانزياح العام للإطار هو انزياح إطار -1 ، حيث يزيح الريبوسوم نيوكليوتيد واحد في اتجاه المنبع. تتكون العناصر الرئيسية لـ -1 تغيير الإطارات من موقع زلق ، حيث يغير الريبوسوم إطارات القراءة ، وهيكل RNA محفز مثل العقدة الكاذبة أو الحلقة الجذعية الموجودة في عدد قليل من النيوكليوتيدات في اتجاه مجرى النهر. +1 تغيير الإطارات أقل شيوعًا من -1 تغيير الإطارات ولكن يتم ملاحظتها في الكائنات الحية المتنوعة.

InBase ، قاعدة بيانات وتسجيل Intein - يتم تعريف ربط البروتين على أنه استئصال تسلسل البروتين المتداخل (INTEIN) من طليعة البروتين والربط المصاحب لشظايا البروتين المرافقة (EXTEINS) لتشكيل بروتين مضيف خارجي ناضج و إينتين مجاني (بيرلر 1994). ينتج عن تضفير البروتين رابطة ببتيدية أصلية بين exteins المربوطة. هذا موقع قاعدة بيانات يسمح بتحليل بلاست. (المرجع: Perler، F.B. 2002. Nucleic Acids Res. 30: 383-384).

P2RP (البروتينات التنظيمية بدائية النواة المتوقعة) - يمكن للمستخدمين إدخال تسلسل الحمض الأميني أو الحمض النووي الجيني ، ويتم فحص البروتينات المتوقعة فيه لامتلاك مجالات ربط الحمض النووي و / أو مجالات النظام المكونة من مكونين. يتم تصنيف RPs المحددة بهذه الطريقة إلى عائلات ، مشروحة بشكل لا لبس فيه. (المرجع: Barakat M، et al. 2013. BMC Genomics 14:269).

P2CS (أنظمة بدائية النواة ثنائية المكونات) هي مورد شامل لتحليل الأنظمة ثنائية المكونات بدائية النواة (TCS). تتكون TCS من مستقبلات هيستيدين كيناز (HK) ومنظم استجابة شريك (RR) وتتحكم في سلوكيات بدائية النواة المهمة. يمكن البحث عنها باستخدام BLASTP. (المرجع: P. Ortet et al. 2015. Nucl. Acids Res. 43 (D1): D536-D541).

تحليل COG - جاللمعان ارثولوجي جيroups - تم إنشاء قاعدة بيانات بروتين COG من خلال مقارنة البروتينات المتوقعة والمعروفة في جميع الجينومات الميكروبية المتسلسلة تمامًا لاستنتاج مجموعات من أخصائيي تقويم العظام. يتكون كل COG من مجموعة من البروتينات التي وجدت أنها متعامدة عبر ثلاثة سلالات على الأقل ومن المحتمل أنها تتوافق مع مجال قديم محفوظ (CloVR). تشمل المواقع التي تقدم هذا التحليل ما يلي:

WebMGA (المرجع: S. Wu et al. 2011. BMC Genomics 12:444)، RAST (المرجع: Aziz RK وآخرون 2008. BMC Genomics 9:75) ، و BASys (بأكتيري أملاحظة سمرجع ystem: Van Domselaar GH et al. 2005. الأحماض النووية الدقة. 33(مشكلة خادم الويب): W455-459.) و JGI IMG (أناتكامل مميكروبي جيenomes المرجع: Markowitz VM et al. 2014. نوكل. الدقة الأحماض. 42: D560-D567. )

مواقع أخرى:

EggNOG - قاعدة بيانات للمجموعات المتعامدة والتعليق التوضيحي الوظيفي الذي ينشأ نتحت الإشراف ارثولوجي جيroups (NOGs) من الجينوم الكامل ، ثم يطبق خط أنابيب توصيف وتحليل شامل لعائلات الجينات الناتجة. (المرجع: Powell S et al. 2014. Nucleic Acids Res. 42 (D1): D231-D239

OrthoMCL - هي خوارزمية أخرى لتجميع البروتينات في مجموعات تقويمية بناءً على تشابه تسلسلها. تستغرق العملية عادة ما بين 6 و 72 ساعة (المرجع: Fischer S et al. 2011. Curr Protoc Bioinformatics الفصل 6: الوحدة 6.12.1-19).

KAAS (كبيضة أأوتوماتيكي أملاحظة سerver) شرحًا توضيحيًا وظيفيًا للجينات عن طريق مقارنات BLAST أو GHOST مقابل قاعدة بيانات KEGG GENES المنسقة يدويًا. تحتوي النتيجة على مهام KO (KEGG Orthology) ومسارات KEGG التي تم إنشاؤها تلقائيًا. (المرجع: Moriya Y et al. 2007. Nucleic Acids Res. 35(مشكلة خادم الويب): W182-185).

ResFinder (مكتشف الجينات المقاومة لمضادات الميكروبات المكتسبة) - يستخدم بلاست لتحديد جينات مقاومة مضادات الميكروبات المكتسبة في بيانات الجينوم الكامل. كمدخلات ، يمكن للطريقة استخدام كل من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة. تم اختباره باستخدام 1411 جينة مقاومة مختلفة مع هوية 100٪. (المرجع: Zankari E et al. 2012. J Antimicrob Chemother. 67:2640-2644)

ARG-ANNOT (أntibiotic صesistance جيENE-ANNOTation) هي أداة جديدة تم إنشاؤها للكشف عن جينات مقاومة المضادات الحيوية (AR) الموجودة والمفترضة في الجينوم البكتيري. يستخدم ARG-ANNOT برنامج انفجار محلي في برنامج Bio-Edit يسمح للمستخدم بتحليل التسلسلات بدون واجهة ويب (المرجع: Gupta، S.K. et al. 2014. Antimicrob Agents Chemother. 58: 212 & ndash220).

بطاقة ( جشامل أntibiotic صمقاومة دatabase) - مجموعة منظمة بدقة من محددات المقاومة المعروفة والمضادات الحيوية المرتبطة بها ، والتي نظمتها نماذج اكتشاف الجينات المقاومة للمضادات الحيوية (ARO) ونماذج اكتشاف الجينات AMR (المرجع: Jia، B. et al. 2017. Nucleic Acids Research، 45: D566-573).

MEGARes - عبارة عن قاعدة بيانات منظمة يدويًا لمقاومة مضادات الميكروبات وهيكل التعليقات التوضيحية التي توفر أساسًا لتطوير المصنفات الدورية عالية الإنتاجية والتحليل الإحصائي الهرمي للبيانات الضخمة (المرجع: Lakin، S.N .. وآخرون. 2017. Nucleic Acids Research، 45: D574-D580).

BacMet (مضادالبكالوريامبيد حيوي وأمبير التقىal Resistance Genes Database) - قاعدة بيانات للجينات المقاومة للمبيدات الحيوية والمعادن ذات المحتوى الموثوق به للغاية. في الإصدار 1.1 من BacMet ، تحتوي قاعدة البيانات المؤكدة تجريبياً على 704 جينة مقاومة ، بينما تحتوي قاعدة البيانات المتوقعة على 40556 جينة مقاومة (المرجع: Pal، C. et al. 2014. Nucleic Acids Research، 42: D737-743).

تعليق توضيحي متخصص - كريسبر (تكرارات متقطعة قصيرة متباعدة بشكل منتظم ومتباعدة):

CRISPRfinder - يتيح الكشف السهل عن CRISPRs في البيانات المنتجة محليًا والتشاور مع CRISPRs الموجودة في قاعدة البيانات. كما أنه يعطي معلومات عن وجود الجينات المرتبطة بـ CRISPR عندما يتم شرحها على هذا النحو. . (المرجع: I. Grissa et al.2007. Nucl. Acids Res. 35 (مشكلة خادم الويب): W52-W57).

توفر خريطة CRISPR نظرة ثاقبة سريعة ومفصلة حول الحفظ المتكرر والتنوع لكل من الأنظمة البكتيرية والأثرية. وهو يتألف من أكبر مجموعة بيانات لـ CRISPRs حتى الآن ، ويتيح تحليلات المجموعات المستقلة الشاملة لتحديد عائلات التسلسل المحفوظة ، والزخارف الهيكلية المحتملة للنيوكليازات الداخلية ، والعلاقات التطورية. (المرجع: S.J. Lange et al. 2013. Nucleic Acids Research، 41: 8034-8044).

CRISPI: قاعدة بيانات تفاعلية CRISPR - تتضمن مجموعة كاملة من الجينات المرتبطة بـ CRISPR (CAS). تتيح واجهة الويب سهلة الاستخدام مع العديد من الأدوات والوظائف الرسومية للمستخدمين استخراج النتائج ، والعثور على كريسبر في التسلسلات الشخصية أو حساب تشابه التسلسل مع الفواصل (المرجع: روسو سي وآخرون 2009. المعلوماتية الحيوية. 25: 3317 & ndash3318).

هدف CRISPR - الذي يتنبأ بالأهداف الأكثر ترجيحًا لـ CRISPR RNAs. يمكن استخدام هذا لاكتشاف الأهداف في البيانات الجينومية أو الميتاجينومية المتسلسلة حديثًا. (المرجع: Biswas A et al. 2013. RNA Biol. 10:817-827).

CRISPy-web - هي أداة ويب سهلة الاستخدام تعتمد على CRISPy لتصميم sgRNAs لأي جينوم ميكروبي يوفره المستخدم. يسمح CRISPy-web للباحثين باختيار منطقة من الجينوم الخاص بهم بشكل تفاعلي للبحث عن sgRNAs المحتملة. بعد التحقق من التطابقات المحتملة خارج الهدف ، يتم عرض تسلسلات sgRNA الناتجة بيانياً ويمكن تصديرها إلى ملفات نصية. (المرجع: K. Blin et al. 2016. Synthetic and Systems Biotechnology 1 (2): 118-121).

التعليق التوضيحي المتخصص - محددات الفوعة: هذا ذو أهمية خاصة لأولئك الذين يعملون على العاثيات للعلاج

VirulenceFinder (الجامعة التقنية الدنماركية) & - تحديد جينات الفوعة. تستخدم الطريقة بلاست لتحديد جينات الفوعة المعروفة في الإشريكية القولونية. يتم توسيع الطريقة لتشمل أيضًا جينات الفوعة لـ المكورات المعوية و المكورات العنقودية الذهبية. كمدخلات ، يمكن للطريقة استخدام كل من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة.

ClanTox: مصنف للسموم الحيوانية القصيرة - يتنبأ بما إذا كان كل تسلسل يشبه السموم ويوفر قائمة مرتبة بالمرشحين الذين تم توقعهم بشكل إيجابي وفقًا للثقة الإحصائية. لكل بروتين ، يتم تقديم معلومات إضافية بما في ذلك وجود إشارة الببتيد ، وعدد بقايا السيستين والتعليقات التوضيحية الوظيفية المرتبطة بها. (المرجع: G. Naamati et al. 2009. Nucleic Acids Res. 37 (مشكلة خادم الويب): W363 & ndashW368).

t3db قاعدة بيانات Toxin and Toxin Target - تجمع بيانات مفصلة عن السموم مع معلومات شاملة عن هدف السموم. تحتوي قاعدة البيانات حاليًا على 3053 سمًا مرتبطة بـ 1،670 سجلًا مستهدفًا للسموم المقابلة. يحتوي كل سجل للسموم (ToxCard) على أكثر من 50 حقلاً من حقول البيانات ويحتوي على معلومات مثل الخصائص والوصفات الكيميائية وقيم السمية والتفاعلات الجزيئية والخلوية والمعلومات الطبية. (المرجع: Lim E et al. 2010. Nucleic Acids Res. 38 (إصدار قاعدة البيانات): D781-786).

TAfinder 2.0 - هي أداة قائمة على الويب لتحديد مواقع مضادات السموم من النوع الثاني في الجينوم البكتيري (المرجع: Xie Y et al. (2018) Nucleic Acids Res. 46(D1): D749-D753).

قاعدة بيانات DBETH للسموم الخارجية البكتيرية للبشر هي قاعدة بيانات للتسلسلات والهياكل وشبكات التفاعل والنتائج التحليلية لـ 229 سمًا خارجيًا ، من 26 نوعًا مختلفًا من أنواع البكتيريا المسببة للأمراض البشرية. يتم تصنيف جميع السموم إلى 24 فئة مختلفة من السموم. الهدف من DBETH هو توفير قاعدة بيانات شاملة للسموم الخارجية البكتيرية المسببة للأمراض البشرية. (المرجع: Chakraborty A et al. 2012. Nucleic Acids Res. 40 (مشكلة في قاعدة البيانات): D615-620).

VFDB - قاعدة بيانات متكاملة وشاملة لعوامل الفوعة لمسببات الأمراض البكتيرية (بما في ذلك الكلاميديا ​​والميكوبلازما). (المرجع: L.H. Chen et al. 2012. Nucleic Acids Res. 40 (مشكلة في قاعدة البيانات): D641-D645).

PAIDB (بنسلفانياالنشأة أناافتراء دآتابase) - تعد جزر الإمراضية (PAIs) وجزر المقاومة (REIs) مفتاحًا لتطور مسببات الأمراض ويبدو أنها تلعب أدوارًا تكميلية في عملية العدوى البكتيرية. في حين أن العناصر المؤثرات العقلية تعزز تطور المرض ، فإن العناصر المتفاعلة (REI) تمنح ميزة اللياقة للمضيف ضد العديد من العوامل المضادة للميكروبات. يحدد برنامج ثانوي ، PAI Finder ، مناطق تشبه PAI أو مناطق تشبه REI في استعلام متعدد التسلسلات. (المرجع: S.H Yoon et al. 2015. Nucl. Acids Res. 43 (D1): D624-D630).

IslandViewer - يتضمن أداة تصور الجينوم التفاعلي الجديدة ، IslandPlot ، وعامل الفوعة الموسع ، وجين مقاومة مضادات الميكروبات ، وشروح الجينات المرتبطة بمسببات الأمراض ، بالإضافة إلى متماثلات هذه الجينات في الجينومات وثيقة الصلة. والجدير بالذكر أن الجينومات غير المكتملة مقبولة كمدخلات في IslandViewer 3 ، على الرغم من أنها تحث المستخدمين بشدة على استخدام جينومات كاملة كلما أمكن ذلك. (المرجع: B.K. Dhillon et al. 2015. Nucl. Acids Res. 43 (W1): W104-W108).

قاعدة بيانات الغجر - قاعدة بيانات مفتوحة قابلة للتحرير حول العلاقة التطورية للفيروسات والعناصر الوراثية المتنقلة (MGEs Ty3 / Gypsy و Retroviridae و Ty1 / Copia و Bel / Pao LTR retroelements و Caulimoviridae الفيروسات القهقرية للنباتات) والتكرارات الجينية الأخرى. مجهزة لعمليات البحث BLAST و HMM. (المرجع: Llorens، C et al. 2011. Nucl. Acids Res. 39(ملحق 1): D70-D74).

بانداوكس (مقلاة جينوم داتاباس للعناصر الجينية توكسic to Bacteria) - هي قاعدة بيانات للجينات والمناطق بين الجينات التي لا يمكن استنساخها في E. coli ، للمساعدة في اكتشاف المضادات الحيوية الجديدة والجينات الوظيفية المفيدة من الناحية التقنية الحيوية. إنه مصمم أيضًا لتحسين كفاءة هندسة التمثيل الغذائي. وشملت ميزة البحث بلاست. (المرجع: Mitai G & amp Sorek R. 2012. Bioengineered، 3: 218-221.)

مستكشف العوامل الممرضة (يتنبأ بإمكانيات مسببة للأمراض) & ndash استنادًا إلى جينومات كاملة من 513 بكتيريا تم شرحها على أنها غير مسببة للأمراض البشرية و 372 بكتيريا تم شرحها على أنها مسببات الأمراض البشرية ، وقد تم إنشاء قاعدة بيانات لعائلات البروتين ، والتي إما مرتبطة بشكل أساسي بمسببات الأمراض أو مع مسببات الأمراض. ثم يتم استخدام قاعدة البيانات هذه للتنبؤ بإمكانية البكتيريا المسببة للأمراض. كمدخلات ، يمكن للطريقة استخدام كل من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة. (المرجع: Cosentino S et al. 2013. PLoS ONE 8: e77302)

VirulentPred - هي طريقة تعتمد على SVM للتنبؤ بتسلسل البروتينات البكتيرية الفتاكة ، والتي يمكن استخدامها لفحص البروتينات الخبيثة في البروتينات. جنبا إلى جنب مع البروتينات الخبيثة التي تم التحقق منها تجريبيا ، تم التنبؤ بالعديد من متواليات البروتين المفترضة وغير المشروحة والافتراضية لتكون بروتينات خبيثة عالية الدرجات من خلال طريقة التنبؤ. (المرجع: Garg A & amp Gupta G. 2008. BMC Bioinformatics 9: 62).

يعد نظام إفراز النوع الثالث (T3SS) آلية أساسية للتفاعل بين المضيف والممرض في عملية العدوى. تُعرف البروتينات التي يتم إفرازها من خلال آلة T3SS للعديد من البكتيريا سالبة الجرام باسم مؤثرات T3SS (T3SEs). يمكن أن تكون هذه إما موضعية تحت الخلوية في المضيف ، أو تكون جزءًا من طرف إبرة T3SS الذي يتفاعل مباشرة مع الغشاء المضيف لإحضار مؤثرات أخرى إلى الخلية المستهدفة. يمثل T3SEdb مثل هذا الجهد لتجميع قاعدة بيانات شاملة لجميع T3SEs المحددة تجريبياً والمفترضة في موقع يمكن الوصول إليه عبر الويب. البحث بلاست متاح. (المرجع: Tay DM et al. 2010. BMC Bioinformatics. 11 ملحق 7: S4).

تأثير (جامعة فيينا ، النمسا وجامعة ميونخ التقنية ، ألمانيا) - إفراز البروتين البكتيري هو آلية الضراوة الرئيسية للبكتيريا التكافلية والممرضة ، ومن ثم يتم نقل البروتينات المستجيبة من العصارة الخلوية البكتيرية إلى الوسط خارج الخلية أو مباشرة إلى الخلية المضيفة حقيقية النواة. توفر البوابة الفعالة تنبؤات محسوبة مسبقًا على المؤثرات البكتيرية في جميع الجينومات المسببة للأمراض والتعايشية المتاحة للجمهور بالإضافة إلى إمكانية أن يتنبأ المستخدم بالمؤثرات في بيانات تسلسل البروتين الخاص.

خادم SIEVE هو أداة ويب عامة للتنبؤ بالمؤثرات المفرزة من النوع الثالث. يسجل خادم SIEVE المؤثرات المُفرزة المحتملة من جينومات مسببات الأمراض البكتيرية بأنظمة إفراز من النوع الثالث باستخدام نموذج تم تعلمه من البروتينات المُفرزة المعروفة. يتطلب خادم SIEVE فقط متواليات البروتين من البروتينات ليتم فحصها ويعيد احتمالية متحفظة بأن كل بروتين مدخل هو عامل إفراز من النوع الثالث. (المرجع: McDermott JE et al. 2011. Infect Immun. 79:23-32).

T3SE - توقع مؤثر نظام الإفراز من النوع الثالث (المرجع: L & oumlwer M، & amp Schneider G. 2009. PLoS One. 4:e5917. خطأ في: PLoS One. 20094 (7).

تم إنشاء Phage_Finder - لتحديد مناطق النبضة في الجينوم البكتيري المكتمل. باستخدام مجموعة بيانات اختبار مكونة من 42 جينومًا بكتيريًا تم التعرف على نواتجها يدويًا ، Phage_Finder وجدت 91٪ من المناطق ، مما أدى إلى 7٪ نواتج إيجابية كاذبة و 9٪ نبوءات سلبية كاذبة. توقع البحث في 302 جينوم بكتيري كامل وجود 403 منطقة نفاذية مفترضة ، تمثل 2.7 ٪ من إجمالي الحمض النووي البكتيري. كشف تحليل مواقع الارتباط المفترضة البالغ عددها 285 أن الحمض الريبي النووي النقال أهداف للتكامل بشكل متكرر أكثر (33٪) من المناطق الجينية (31٪) أو داخل الجين (28٪) ، بينما تم استهداف tmRNAs في 8٪ من المناطق. (المرجع: D.E. Fouts. 2006. Nucleic Acids Res. 34: 5839 & ndash5851).

Prophinder - هي الأداة المستخدمة للكشف عن العاثيات في الجينوم البكتيري. حدد ملف GenBank بتنسيق.

PHAST (PHAجنرال الكتريك سالبحث تيool) - تم تصميمه لتحديد وتعليق وعرض متواليات النبضة بشكل سريع ودقيق داخل الجينوم البكتيري أو البلازميدات. يقبل إما بيانات تسلسل الحمض النووي الخام أو البيانات المنسقة جزئيًا من GenBank وينفذ بسرعة عددًا من مقارنات قاعدة البيانات بالإضافة إلى خطوات تحديد ميزة phage & ldquocornerstone & rdquo لتحديد موقع وتعليق وعرض تسلسل Prophage و Prophage الميزات. بالنسبة لأدوات تحديد العقاقير الأخرى ، فإن PHAST أسرع بما يصل إلى 40 مرة وأكثر حساسية بنسبة تصل إلى 15٪. كما أنه قادر على معالجة كل من بيانات تسلسل الحمض النووي الخام وملفات Genbank والتعليق عليها ، وتوفير جداول توضيحية غنية حول ميزات Prophage و prophage & ldquoquality & rdquo والتمييز بين Prophage السليم وغير الكامل. ينشئ PHAST أيضًا رسومات تفاعلية وقابلة للتنزيل وعالية الجودة تعرض جميع مكونات العاثيات المحددة في كل من العروض الجينومية الدائرية والخطية. علاوة على ذلك ، تشير الاختبارات إلى أن PHAST دقيق أو أكثر دقة قليلاً من جميع أدوات اكتشاف العاثيات المتاحة ، مع حساسية 85.4٪ و القيمة التنبؤية الإيجابية 94.2٪. (المرجع: Zhou، Y. et al. 2011. Nucl. Acids Res. 39(ملحق 2): W347-W352).

PHASTER PHAجنرال الكتريك سالبحث تيأول همعزز صelease - هو ترقية مهمة لـ PHAST من أجل التحديد السريع والتعليق التوضيحي لتسلسل البروفاج داخل الجينومات والبلازميدات البكتيرية. العديد من التحسينات على البرامج والتحسينات الكبيرة للأجهزة جعلت PHASTER أسرع وأكثر كفاءة وجاذبية بصريًا وأكثر سهولة في الاستخدام. على وجه الخصوص ، أصبح PHASTER الآن أسرع بمقدار 4.3 مرة من PHAST. (المرجع: D. Arndt et al. Nucleic Acids Res. 2016 44 (W1):W16-21).

Prophage Hunter - يوفر خدمة ويب شاملة لاستخراج جينومات العاثيات من الجينوم البكتيري ، وتقييم نشاط العاثيات ، وتحديد العاثيات ذات الصلة بالتطور ، والتعليق على وظيفة بروتينات العاثيات. (المرجع: Song W et al. (2019) Nucleic Acids Res 47 (W1): W74 & ndashW80).

IslandViewer - يدمج طريقتين للتنبؤ بتكوين التسلسل GI SIGI-HMM و IslandPath-DIMOB ، وطريقة توقع GI مقارن واحدة IslandPick (المرجع: Langille et al. 2008. BMC Bioinformatics 9: 329).

PAIDB (السلطة الفلسطينيةالنشأة أناافتراء دآتابase) بذل جهد لجمع PAIs المعروفة واكتشاف مناطق PAI المحتملة في الجينومات الكاملة بدائية النواة. جزر الإمراضية (PAIs) هي عناصر وراثية متميزة لمسببات الأمراض التي تشفر عوامل ضراوة مختلفة. (المرجع: Yoon SH et al. 2007. Nucleic Acids Res. 35 (مشكلة في قاعدة البيانات): D395-D400).

يمكن لـ MTGIpick تحديد الجزر الجينومية من جينوم واحد ، بدون معلومات مشروحة عن الجينوم أو معرفة مسبقة من مجموعات البيانات الأخرى. في عمليات المحاكاة مع الأجزاء الغريبة من الجينوم الاصطناعي والحقيقي ، أبلغت MTGIpick عن نتائج قوية عبر تجارب مختلفة (المرجع: Dai Q et al. (2018) موجز Bioinform 19(3): 361-373).


SyntTax - هو خادم ويب يربط التركيب بالتصنيف بدائية النواة. يشتمل SyntTax على شجرة تصنيف هرمية كاملة تتيح الوصول السهل إلى جميع بدائيات النوى المتسلسلة بالكامل (العتائق والبكتيريا). يمكن اختيار الكائنات الحية المفردة أو المتعددة على أساس نسبها عن طريق اختيار عقد الرتبة المقابلة في الشجرة. هذا هو المفضل لدي من بين برامج synteny (المرجع: Oberto J. 2013. BMC Bioinformatics. 14:4). تم إنشاء النتائج أدناه باستخدام عامل سيغما الصدمة الحرارية (RpoH) من السالمونيلا التيفية ضد ال بسيودوموناداليس.

خادم Cinteny لتحديد Synteny وتحليل إعادة ترتيب الجينوم (A. U. Sinha & amp J. Meller ، جامعة سينسيناتي ، الولايات المتحدة الأمريكية) - يمكن استخدام هذا الخادم للعثور على مناطق مخلوطة عبر جينومات متعددة وقياس مدى إعادة ترتيب الجينوم باستخدام مسافة الانعكاس كمقياس. يمكنك إنشاء مشروع وتحميل بياناتك الخاصة أو العمل مع بيانات بدائيات النوى أو حقيقيات النوى المحملة مسبقًا.

SimpleSynteny - يوفر خط أنابيب لتقييم تركيب مجموعة محددة مسبقًا من أهداف الجينات عبر جينومات الكائن الحي المتعددة. تم التركيز على سهولة الاستخدام ، ولا يُطلب من المستخدمين سوى تقديم ملفات FASTA للجينومات والجينات التي تهمهم. ثم تقوم SimpleSynteny بتوجيه المستخدم من خلال عملية تكرارية لاستكشاف الجينوم وتخصيصه بشكل فردي قبل دمجها في شكل نهائي عالي الدقة. (المرجع: Veltri D et al. 2016. Nucleic Acids Res. 44 (مشكلة خادم الويب): W41 و ndashW45).

بوابة Synteny - يمكن لمستخدمي الجينوم حقيقية النواة بسهولة (1) إنشاء كتل تركيبية بين أنواع متعددة باستخدام محاذاة مسبقة الصنع في قاعدة بيانات مستعرض الجينوم UCSC ، (2) تصور وتنزيل العلاقات التخليقية كصور عالية الجودة ، (3) تصفح الكتل التركيبية باستخدام الجينات المعلومات و (4) تنزيل تفاصيل الكتل التركيبية لاستخدامها كمدخلات للتحليلات المستندة إلى المصب ، وكل ذلك في واجهة سهلة الاستخدام وقائمة على الويب. (المرجع: Lee J et al. 2016. الأحماض النووية Res 44 (W1): W35 و ndashW40).

AutoGRAPH هو خادم ويب متكامل للتحليل الجينومي المقارن متعدد الأنواع. تم تصميمه لإنشاء وتصور خرائط تركيبية بين نوعين أو ثلاثة أنواع ، وتحديد وعرض العلاقات الكبيرة والصغيرة بين الأنواع ، وتسليط الضوء على نقاط التوقف التطورية.
ينشئ خادم الويب خرائط تركيبية عن طريق المقارنة الزوجية لأوامر العلامة / المرساة بين كروموسوم مرجعي وواحد أو اثنين من الجينوم المختبرين. يسمح للمستخدمين بتصور وتمييز العديد من الميزات: الأجزاء المحفوظة (CS) ، والأجزاء المحفوظة المطلوبة (CSO) ونقاط التوقف. (المرجع: Derrien T et al. 2007. المعلوماتية الحيوية 23:498-499).

سيبيليا (جامعة كاليفورنيا سان دييغو ، الولايات المتحدة الأمريكية) - هي أداة للعثور على الكتل التركيبية في العديد من الجينومات الميكروبية وثيقة الصلة باستخدام الرسوم البيانية التكرارية لـ Bruijn. على عكس معظم الأدوات الأخرى ، يمكن لـ Sibelia العثور على الكتل التركيبية التي تتكرر داخل الجينوم وكذلك الكتل المشتركة بواسطة جينومات متعددة. إنه يمثل الكتل التركيبية في هيكل هرمي مع طبقات متعددة ، كل منها يمثل مستوى مختلف من الحبيبات.

يساعدك Kablammo على إنشاء تصورات تفاعلية لنتائج بلاست من متصفح الويب الخاص بك. ابحث عن المحاذاة الأكثر إثارة للاهتمام ، وقم بسرد المعلمات التفصيلية لكل منها ، وقم بتصدير صورة متجهية جاهزة للنشر. سهل الاستخدام بشكل لا يصدق - إليك نتائج مقارنة BLASTN بـ الإشريكية العاثيات T1 (استعلام) و ADB-2. (المرجع: Wintersinger JA et al. المعلوماتية الحيوية 31:1305-1306).


M1CR0B1AL1Z3R - هو متجر & # 39 وقفة واحدة & # 39 لإجراء تحليلات بيانات الجينوميات الميكروبية عبر واجهة مستخدم رسومية بسيطة.بعض الميزات التي تم تنفيذها في M1CR0B1AL1Z3R هي: (1) استخراج إطارات القراءة المفتوحة المفترضة وتحليل الجينوميات المقارن لمحتوى الجين (2) استخراج مجموعات تقويمية وتحليل توزيع حجمها (3) تحليل أنماط حضور وغياب الجين (4) إعادة بناء النشوء والتطور. شجرة بناءً على المجموعة المتعامدة المستخرجة (v) لاستنتاج اختلاف محتوى GC بين السلالات. يسهل M1CR0B1AL1Z3R استخراج وتحليل العشرات من الجينومات البكتيرية باستخدام تقنيات متقدمة. (المرجع: Avram O et al. (2019) Nucleic Acids Res. 47 (W1): W88-W92).

GeneOrder 4.0 (د. سيتو ، المعلوماتية الحيوية والبيولوجيا الحاسوبية ، جامعة جورج ميسون ، الولايات المتحدة الأمريكية) تم تصميمه بحيث يمكن استخدامه لمقارنة ترتيب الجينات بين اثنين من الجينومات البكتيرية (المرجع: Mahadevan P. & amp Seto D. 2010. ملاحظات أبحاث BMC 3:41).
CoreGenes (D. Seto & amp P. Mahadevan، Bioinformatics & amp Computational Biology ، جامعة جورج ميسون ، الولايات المتحدة الأمريكية) - إحصاء العدد الإجمالي للجينات المشتركة بين الجينومين اللذين تتم مقارنتهما يعرض القيمة المئوية للجينات المشتركة مع جينوم معين يحدد الجينات الفريدة الموجودة في زوج من البروتينات. CoreGenes 3.5 هو خادم CoreGenes الدفعي. لقد استخدمت على نطاق واسع هذه المجموعة من الموارد في تصنيف الفيروسات البكتيرية.

إذا كان لديك ملف gbk لعثة لم يتم إيداعها في GenBank بعد ، يمكنك استخدام هذه التعليمات لتحويل بياناتك إلى تنسيق CoreGenes لاستخدامها هنا.

WebACT - هذا هو إصدار الويب من ACT (أداة مقارنة Artemis) وهو عارض مقارنة تسلسل الحمض النووي المستند إلى Artemis (المرجع: 21: 3422 - 3423 قم بزيارة صفحة قاعدة بيانات EMBL-EBI وحدد EMBL و & quot نموذج الاستعلام القياسي & quot لتحديد رقم انضمام EMBL للتسلسل الذي تهتم به.

بانسيك (تشاد لينج ، وكالة الصحة العامة الكندية) - مجموعة أدوات لتحليل الجينوم & # 39pan & # 39 لمجموعة من المتواليات الجينومية. يتكون الجينوم الشامل للأنواع البكتيرية من الجينوم الأساسي ومجموعة الجينات الإضافية ، وهذا الأخير يسمح للمجموعات السكانية الفرعية للكائن الحي بالتكيف مع بيئات معينة. يتضمن ذلك Novel Region Finder ، والذي سيجد تسلسلات فريدة لسلالة أو مجموعة من السلالات فيما يتعلق بسلالة أخرى أو مجموعة سلالات. يحدد تحليل الجينوم الشامل الجينوم الشامل بين التسلسلات الخاصة بك ويجد تعدد الأشكال في الجينوم الأساسي ويحدد توزيع المناطق الجينومية الملحقة. يحدد محدد الارتباط المواقع التي تقدم أفضل تمييز بين مجموعة البيانات الخاصة بك. (المرجع: Laing، C. et al. 2010. BMC Bioinformatics. 11: 461).

PARIGA - يُمكِّن المستخدمين من إجراء عمليات بحث BLAST الكل مقابل الكل على مجموعتين من التسلسلات المحددة من قبل المستخدم. علاوة على ذلك ، نظرًا لأنه يخزن مخرجات BLAST في قاعدة بيانات كائنات متسلسلة بيثون ، يمكن تصفية النتائج وفقًا لعدة معايير في الوقت الفعلي ، دون إعادة تشغيل العملية وتجنب جهود البرمجة الإضافية. (المرجع: Orsini M. et al. 2013. PLoS One 8(5):e62224).

إدغار (همناسب دإطار atabase للمقارنة جيenome أnalyses باستخدام نقاط بلاست صatios) - تم تصميم EDGAR لإجراء مقارنات الجينوم تلقائيًا بأسلوب إنتاجي مرتفع ويمكن استخدامه في الجينوم الأساسي وتحليل الجينوم الشامل والمفرد وبناء مخطط Venn. (المرجع: Blom J. et al. 2009. BMC Bioinformatics 10: 154).

OrthoVenn - هو خادم ويب لمقارنة الجينوم على نطاق واسع والتعليق التوضيحي للمجموعات المتعامدة عبر أنواع متعددة. يوفر تغطية للفقاريات والميتازوا والطلائعيات والفطريات والنباتات والبكتيريا للمقارنة بين المجموعات المتعامدة ويدعم أيضًا تحميل تسلسل البروتين المخصص من الأنواع المحددة من قبل المستخدم. يتم عرض مخطط Venn التفاعلي والتهم الموجزة والملخصات الوظيفية للانفصال والتقاطع بين المجموعات المشتركة بين الأنواع كجزء من نتيجة OrthoVenn. يتضمن OrthoVenn أيضًا عروض متعمقة للمجموعات باستخدام أدوات تحليل التسلسل المختلفة. علاوة على ذلك ، فإنه يحدد مجموعات متعامدة من جينات نسخة واحدة ويسمح بالبحث المخصص عن مجموعات من جينات معينة من خلال الكلمات الرئيسية أو بلاست. (المرجع: Y. Yang et al. 2015. Nucl. Acids Res. 43 (W1): W78-W84). وجدت هنا أيضا.

BEACON هي أداة برمجية تقارن التعليقات التوضيحية لجينوم معين من طرق التعليقات التوضيحية المختلفة (AMs). يستخدم تنسيق GenBank كمدخلات ويستمد التعليقات التوضيحية الموسعة (EA) جنبًا إلى جنب مع سرد التعليقات التوضيحية الأصلية من AMs الفردية. (المرجع: Kalkatawi M، BMC Genomics .201516(1): 1-8).

العاني (أverage نأوكليوتيد أناdentity) الآلة الحاسبة - تقدر متوسط ​​هوية النوكليوتيدات باستخدام أفضل النتائج (ANI أحادي الاتجاه) وأفضل النتائج المتبادلة (ANI ثنائية الاتجاه) بين مجموعتي بيانات جينومية. عادةً ما تكون قيم ANI بين جينومات نفس النوع أعلى من 95٪ (على سبيل المثال ، Escherichia coli). لا يمكن الوثوق بالقيم التي تقل عن 75٪ ، ويجب استخدام AAI بدلاً من ذلك. تدعم هذه الأداة كلاً من الجينومات الكاملة والمسودة (mult-fasta). (المرجع: Goris J et al. 2007. Int J Syst Evol Microbiol. 57 (نقطة 1): 81-91).

متوسط ​​حاسبة هوية النوكليوتيدات (ANI) - تستخدم حاسبة ANI الخاصة بهم خوارزمية OrthoANIu ، وهي تكرار محسّن لخوارزمية OrthoANI الأصلية ، والتي تستخدم USEARCH بدلاً من BLAST (المرجع: Yoon، S.H et al. (2017). Antonie van Leeuwenhoek. 110:1281 و ndash1286).

فيريديك (فيرنحن أنانتيرجينوم ديموقف جالكولاتور C. Moraru ، معهد الكيمياء وبيولوجيا البيئة البحرية ، ألمانيا) - يتضمن المستوى الأول من تصنيف العاثيات بواسطة ICTV حساب هوية تسلسل الحمض النووي الشاملة بين فيروسين. تحسب هذه الأداة الجديدة المسافات / أوجه التشابه بين جينومات العاثيات. لتشغيله ، قم بتحميل ملف فاستا واحد به جميع جينومات العاثيات ذات الأهمية ، وأنشئ مشروعًا واضغط على تشغيل. احفظ معرّف المشروع الذي سيتم عرضه عند إنشاء المشروع. ستحتاج إليها للوصول إلى البيانات إذا كانت الحسابات تستغرق وقتًا طويلاً.

GGDC (جيenome-To-جيenome دistance جalculator) - يوفر طرقًا لاستنتاج مسافات الجينوم الكامل التي تكون قادرة جيدًا على محاكاة تهجين الحمض النووي DNA (DDH). القيم المحسوبة باستخدام GGDC تعطي ارتباطًا أفضل إلى حد ما مع قيم DDH للمختبر الرطب من الطرق البديلة مثل & quotANI & quot. يمكن أن تتعامل وظائف المسافات هذه أيضًا مع الجينوم المنخفض بشكل كبير ومناطق التسلسل المتكرر. كما أن بعضها قوي جدًا ضد الأجزاء المفقودة من المعلومات الجينومية (بسبب تسلسل الجينوم غير المكتمل). وبالتالي ، يمكن استخدام خدمة الويب هذه لتحديد الأنواع القائمة على الجينوم. (المرجع: Meier-Kolthoff JP et al. 2013. BMC Bioinformatics 14: 60).

POGO-DB - استنادًا إلى انفجارات الجينوم الكامل المكثفة حسابيًا ، يوفر POGO-DB العديد من المقاييس على الجينوم الزوجي: (أ) متوسط ​​هوية الأحماض الأمينية لجميع ضربات الانفجار ثنائية الاتجاه الأفضل التي غطت ما لا يقل عن 70٪ من التسلسل وكان بها 30 النسبة المئوية للهوية التسلسلية (ب) السيولة الجينية التي تقدر التشابه في محتوى الجين بين جينومين (ج) عدد أخصائيي تقويم العظام المشتركين بين جينومين (على النحو المحدد بمعيارين) (د) الهوية الزوجية لأكثر جينات الرنا الريباسي 16S تشابهًا (هـ) الهوية المزدوجة لـ 73 جينًا واصمًا إضافيًا محفوظًا عالميًا (تم تحديدها من قبلنا في 90 ٪ على الأقل من جميع الجينومات). (المرجع: Lan Y et al. 2014. Nucl. Acids Res. 42 (D1): D625-D632).

فيكتور (السادسروس جlassification و تيبناء ري اnline صesource Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen Gmب). تقارن خدمة الويب هذه بين الفيروسات البكتيرية والبدئية (& quotphages & quot) باستخدام تسلسل الجينوم أو تسلسل البروتينات. تضمنت النتائج أشجار النشوء والتطور التي تم استنتاجها باستخدام طريقة جينوم-بلاست للتطور عن بعد (GBDP) ، مع دعم الفروع ، بالإضافة إلى اقتراحات للتصنيف على مستوى الأنواع والجنس والأسرة. (يمكن تطبيق الخدمة على أنواع أخرى من الفيروسات أيضًا ، ولكن لم يتم اختبارها بعد في هذا الصدد.) قم بتحميل ملفات FASTA و / أو ملفات GenBank و / أو معرفات انضمام GenBank. (المرجع: JP Meier-Kolthoff & amp M G & oumlker. 2017. المعلوماتية الحيوية 33(21): 3396 و ndash3404).

VIRFAM مكرس للتعرف على وحدات الرأس والعنق والذيل وجينات recombinase في جينومات الملتهمة. يمكنك استخدام هذا الخادم للبحث عن متماثلات بعيدة لعائلات بروتينية معينة ضمن تسلسلات بروتينية للعاثيات. المدخلات: تسلسلات البروتين التي تقوم بها & rsquore الخاصة بك من الملتهمة تشمل شجرة النشوء والتطور مع وضع الفيروس الخاص بك. (المرجع: Lopes A et al. Nucleic Acids Res. (2010) 38(12): 3952-62).

الباحث - هو أداة التعلم العميق لتحديد تسلسل الملتهمة بدون مرجع. يسمح الباحث بالاكتشاف السريع للعاقمات في مجموعات البيانات المتسلسلة والتمايز النظيف لتسلسل العاثيات عن تلك البكتيرية ، حتى بالنسبة للعاقمات ذات التشابه البسيط في التسلسل مع عائلات العاثيات الراسخة. نحن نتحقق بشكل شامل من قدرة الباحث على التعرف على العاثيات غير المعروفة واستخدام الباحث للكشف عن العاثيات غير المعروفة ، وبعضها شديد الاختلاف عن عائلات العاثيات المعروفة. (المرجع: Auslander N et al. (2020) doi.org/10.1101/2020.04.04.025783)

VipTree - يولد & quot؛ شجرة بروتينية & quot؛ من تسلسل الجينوم الفيروسي استنادًا إلى أوجه التشابه في تسلسل الجينوم على نطاق واسع المحسوبة بواسطة tBLASTx. تم تطوير مفهوم الشجرة البروتينية الأصلية (على سبيل المثال ، & quotthe Phage Proteomic Tree & rdquo) بواسطة Rohwer and Edwards، 2002. الشجرة البروتينية هي مخطط شجر يكشف عن علاقات التشابه الجينومي العالمي بين عشرات ومئات وآلاف من الفيروسات. لقد ثبت أن المجموعات الفيروسية المحددة في شجرة بروتينية تتوافق جيدًا مع التصنيفات الفيروسية الراسخة. (المرجع: Nishimura Y et al. (2017) المعلوماتية الحيوية 33: 2379 و ndash2380).

ميغا (ميكروبيال جيالتعدادات أtlas) - خادم ويب يسمح بتصنيف تسلسل جينومي للاستعلام غير معروف ، كليًا أو جزئيًا ، مقابل جميع الأصناف المصنفة تصنيفيًا مع تسلسل الجينوم المتاح ، بالإضافة إلى مقارنات مع الجينومات الأخرى ذات الصلة بما في ذلك الجينوم غير المزروع ، استنادًا إلى متوسط ​​النيوكليوتيد الكلي للجينوم ومفاهيم هوية الأحماض الأمينية (ANI / AAI). (المرجع: Rodriguez-R et al (2018) أبحاث الأحماض النووية 46 (W1): W282-W288).

خادم CGView - هو أداة علم الجينوم المقارنة للجينومات الدائرية التي تسمح بتصور معلومات ميزة التسلسل في سياق نتائج تحليل التسلسل. يتم توفير تسلسل الجينوم للبرنامج بتنسيق FASTA أو GenBank أو EMBL أو تنسيق خام. يمكن أيضًا تقديم ما يصل إلى ثلاثة تسلسلات مقارنة (أو مجموعات تسلسل) بتنسيق FASTA. يستخدم خادم CGView BLAST لمقارنة تسلسل الجينوم بتسلسل المقارنة ، ثم يقوم بتحويل النتائج وأي معلومات ميزة متاحة (من GenBank أو EMBL أو ملف GFF اختياري) أو معلومات التحليل (من ملف GFF اختياري) إلى ملف عالي خريطة رسومية عالية الجودة توضح تسلسل الجينوم بأكمله ، أو عرض مكثف لمنطقة الاهتمام. تتوفر عدة خيارات لتحديد كيفية إجراء مقارنات بلاست ، وللتحكم في كيفية عرض النتائج (المرجع: Grant JR & amp Stothard P. 2008. Nucleic Acids Res. 36 (مشكلة خادم الويب): W181-184)

ياينا صبدائية النواة جيenome الخامسiewer (JPGV) - من ملف مسطح GenBank (* .gbk) يولد مخططات خطية أو دائرية بما في ذلك محتوى GC ، وانحراف GC ، وفائض البيورين ، وفائض الكيتو ، إذا كان ذلك مطلوبًا. يسمح أيضًا بتحليل بلاست مقابل الجينومات ذات الصلة. يتطلب التسجيل المجاني.

GenomeVx - يجعل خرائط جينومات الميتوكوندريا والبلاستيدات الخضراء والبلازميدات الكبيرة قابلة للتحرير وذات جودة النشر. توضح هذه الخرائط موقع الجينات والسمات الصبغية بالإضافة إلى مقياس الموقع. يأخذ البرنامج كمدخلات إما مواضع ميزة أولية أو سجلات GenBank. في الحالة الأخيرة ، يتم استخراج الميزات وتلوينها تلقائيًا ، ويتم تقديم مثال على ذلك. الإخراج بتنسيق Adobe Portable Document Format (PDF) ويمكن تحريره بواسطة برامج مثل Adobe Illustrator. (المرجع: G. Conant & amp K. Woolfe.2008. Bioinformatics 24:861-862).

myGenomeBrowser - هي بيئة قائمة على الويب توفر لعلماء الأحياء طريقة لبناء مستعرضات الجينوم الخاصة بهم والاستعلام عنها ومشاركتها. تم تصميم هذه الأداة ، المبنية على JBrowse ، لمنح المستخدمين مزيدًا من الاستقلالية مع تبسيط وتقليل تدخل مسؤولي النظام. لقد قاموا بتوسيع الميزات الأساسية لمتصفح الجينوم للسماح للمستخدمين بالاستعلام عن بياناتهم وتحليلها ومشاركتها. (المرجع: S. Carrere & amp J. Gouzy. المعلوماتية الحيوية (2017) 33 (8): 1255-1257).

DNAPlotter - هو تطبيق Java تفاعلي لتوليد تمثيلات دائرية وخطية للجينوم. من خلال الاستفادة من مكتبات Artemis لتوفير طريقة سهلة الاستخدام للتحميل في ملفات التسلسل (EMBL و GenBank و GFF) بالإضافة إلى البيانات من قواعد البيانات العلائقية ، فإنه يقوم بتصفية الميزات المهمة لعرضها على مسارات منفصلة يمكن للمستخدم تحديدها. يمكن استخدامه لإنتاج صور بجودة النشر للأوراق أو صفحات الويب (المرجع: Carver، T. et al. 2008. Bioinformatics 25:119-120)

جينويز (مركز تحليل التسلسل البيولوجي ، الجامعة التقنية الدنماركية) ينتج ارتفاعات جينومية خطية أو دائرية مثل الموجودة أدناه. لديهم أسماء جاهزة لمعظم البكتيريا ، ولكن عن طريق تحميل البيانات المخصصة بتنسيق GenBank (.gbk) ، يمكن للمرء أن يصنع رسمًا تخطيطيًا خاصًا يوضح الخصائص الجينية والفيزيائية للجينوم الخاص بك.

OrganellarGenomeDRAW - عبارة عن مجموعة من الأدوات البرمجية التي تمكن المستخدمين من إنشاء عروض مرئية عالية الجودة لكل من تسلسل الجينوم التوضيحي الدائري والخطي المقدم كملفات GenBank أو أرقام الوصول. على الرغم من قبول جميع أنواع تسلسلات الحمض النووي كمدخلات ، فقد تم تحسين البرنامج على وجه التحديد لتصوير ميزات الجينوم العضوي بشكل صحيح. يسهل الامتداد الأخير تخطيط بيانات التعبير الجيني الكمي ، مثل بيانات النسخ أو وفرة البروتين ، مباشرة على خريطة الجينوم (المرجع: Lohse M ، وآخرون. 2013. Nucleic Acids Res. 41(مشكلة خادم الويب): W575-81).

PlasmaDNA - بدءًا من تسلسل الحمض النووي الأساسي ، يبحث PlasmaDNA عن مواقع التقييد وإطارات القراءة المفتوحة وتسلسلات التلدين التمهيدي والمجالات الشائعة المختلفة. يمكن للمستخدم توسيع قواعد البيانات بسهولة لتلائم احتياجات الاستنساخ الأكثر شيوعًا. يمكن لـ PlasmaDNA إدارة متواليات متعددة وتمثيلها بيانياً في نفس الوقت ، وتحتفظ بالذاكرة المتراكمة في نهاية التسلسلات إن وجدت. هذا يعني أنه من الممكن هضم الأجزاء فعليًا ، وإضافة نواتج الهضم إلى المشروع ، وربط الأجزاء معًا بأطراف متوافقة لإنشاء التسلسلات الجديدة. حزمة ممتازة للبلازميدات. (المرجع: Angers-Loustau A et al. 2007. BMC Mol Biol.2007 8:77).

GSDraw (خادم رسم هيكل الجينات) هو خادم ويب لعائلة الجينات لرسم مخططات تخطيطية لبنية الجينات. يمكن للمستخدمين إرسال تسلسل الجينوم ، CDS والنسخ. يستخدم GSDraw هذه المعلومات للحصول على بنية الجينات ، والعنصر البروتيني ، وشجرة علم الوراثة ، ثم رسم مخطط لها. (المرجع: Wang Y، et al. 2013. Nucleic Acids Res. 41 (إصدار قاعدة البيانات): D1159-66).

GECA هي أداة سهلة الاستخدام لتمثيل منظمة exon / intron الجيني وتسليط الضوء على التغييرات في بنية الجينات بين أعضاء عائلة الجينات. يعتمد على محاذاة البروتين ، مكتملًا بتحديد الإنترونات الشائعة في الجينات المقابلة باستخدام CIWOG. تنتج GECA تمثيلًا رسوميًا رئيسيًا يُظهر المجموعة المتوافقة الناتجة من الهياكل الجينية ، حيث يتم قياس exons. الميزة المهمة والأصلية لـ GECA هي أنها تجمع بين هذه الهياكل الجينية مع عرض رمزي يبرز تشابه التسلسل بين الجينات اللاحقة. تجدر الإشارة إلى أن هذا المزيج من بنية الجينات مع مؤشرات التشابه بين الجينات ذات الصلة يسمح بالتعرف السريع على الأحداث المحتملة لكسب أو فقدان الإنترونات ، أو يشير إلى التعليقات التوضيحية الهيكلية الخاطئة. يتم إنشاء صورة الإخراج بتنسيق رسومات شبكة محمولة يمكن استخدامها في المنشورات العلمية. (المرجع: Fawal N، et al. 2012. Bioinformatics 28:1398-9).

GeneDesign - هو مورد ممتاز لتصميم الجينات الاصطناعية. يتضمن أدوات لتحسين الكودون وإزالة مواقع التقييد (المرجع: Richarson، S.M. et al. 2006. Genome Research 16: 550-556)

Orphelia - Orphelia هي أداة ميتاجينومية لإيجاد ORF للتنبؤ بجينات ترميز البروتين في تسلسل DNA بيئي قصير مع أصل غير معروف للتطور. تعتمد Orphelia على نهج التعلم الآلي المكون من مرحلتين والذي تم تقديمه مؤخرًا من قبل مجموعتنا. بعد الاستخراج الأولي لـ ORFs ، تُستخدم المميزات الخطية لاستخراج الميزات من ORFs. بعد ذلك ، تجمع الشبكة العصبية الاصطناعية بين الميزات وتحسب احتمال الجين لكل ORF في جزء. تحسب الإستراتيجية الجشعة مزيجًا محتملًا من ORFs عالية الدرجات مع قيود التداخل. (المرجع: K.J. Hoff et al.2009. Nucl. Acids Res. 37(مشكلة خادم الويب: W101-W105).

WebMGA هو خادم ويب قابل للتخصيص لتحليل ميتاجينومي سريع يتضمن أكثر من 20 أداة شائعة الاستخدام للتحليلات مثل استدعاء ORF ، وتجميع التسلسل ، ومراقبة جودة القراءات الأولية ، وإزالة القطع الأثرية والتلوثات التسلسلية ، والتحليل التصنيفي ، والتعليقات التوضيحية الوظيفية وما إلى ذلك. جميع الأدوات خلف WebMGA للتشغيل بالتوازي على مجموعة أجهزة الكمبيوتر المحلية الخاصة بنا. (المرجع: Wu S، et al. 2011. BMC Genomics. 12:444).

يعد خادم MG-RAST (خادم Metagenomics RAST) عبارة عن منصة تحليل آلية للميتاجينومات التي توفر رؤى كمية للمجموعات الميكروبية بناءً على بيانات التسلسل. يوفر الخادم في المقام الأول التحميل ، ومراقبة الجودة ، والتعليقات التوضيحية الآلية والتحليل لعينات بندقية الصيد بدائية النواة. (المرجع: Wilke A، et al. 2016. Nucleic Acids Res. 44 (د 1):D590-4).

يسمح التخصيص التصنيفي الشامل لـ MetaBin للتسلسلات الميتاجينومية (مختبر المعلومات الحيوية المتكاملة ، RIKEN ، اليابان) بخادم الويب والبرنامج المستقل بتعيين أسرع وأكثر دقة لقراءات التسلسل الفردي والمزدوج ذات الأطوال المختلفة (& ge45 bp) التي تم الحصول عليها من كل من Sanger والتالي منصات تسلسل الجيل. لديه برنامج تعليمي.

AmphoraNet - يستخدم 31 جينة ترميز بكتيرية و 104 بروتين أثرى من أجل التنميط الجينومي والجيني. معظم هذه الجينات عبارة عن جينات أحادية النسخ ، لذلك فإن AmphoraNet مناسب لتقدير التركيب التصنيفي للمجتمعات البكتيرية والأثرية من بيانات تسلسل بندقية ميتاجينوم. (المرجع: Kerepesi C، et al. 2014. جين. 533:538-40).

METAGENassist - يسمح للمستخدمين بأخذ بيانات التعداد البكتيري من مواقع بيئية مختلفة أو مضيفين بيولوجيين مختلفين ، وإجراء تحليلات إحصائية شاملة متعددة المتغيرات على البيانات. يمكن إجراء هذه التحليلات متعددة المتغيرات باستخدام تسميات النمط الظاهري التصنيفية أو المُنشأة تلقائيًا وتصور باستخدام مجموعة متنوعة من الأدوات الرسومية عالية الجودة. يمكن اشتقاق بيانات التعداد البكتيري من بيانات 16S rRNA أو تسلسل بندقية NextGen أو حتى تقنيات الزراعة الميكروبية التقليدية. يتضمن تعليمي. (المرجع: Arndt D، et al. 2012. Nucleic Acids Res. 40(مشكلة خادم الويب): W88-95).

في الوقت الحقيقي Metagenomics (دكتور روبرت إدواردز ، جامعة ولاية سان دييغو ، الولايات المتحدة الأمريكية) - هي الثورة القادمة في شرح الميتاجينوم: معالجة البيانات في الوقت الحقيقي وتحليلها.يمكنك أخيرًا إضافة تعليق توضيحي إلى metagenome في الوقت الفعلي ، دون انتظار. يمكنك تحميل البيانات الخاصة بك لتحليلها. يقبلون ملفات fasta أو fastq ، ويمكنك توفير بيانات مضغوطة بتنسيق zip أو gzip.

EBI Metagenomics (EMBL-EBI) - عبارة عن خط أنابيب آلي لتحليل وأرشفة البيانات الميتاجينومية التي تهدف إلى توفير رؤى حول التنوع الوراثي بالإضافة إلى الإمكانات الوظيفية والاستقلابية للعينة. يمكنك بحرية تصفح جميع البيانات العامة في المستودع. تحدد الخدمة تسلسلات الرنا الريباسي ، باستخدام rRNASelector ، وتجري التحليل التصنيفي على الرنا الريباسي 16S باستخدام Qiime. يتم تقديم القراءات المتبقية للتحليل الوظيفي لتسلسلات ترميز البروتين المتوقعة باستخدام مورد تحليل تسلسل InterPro. تستخدم InterPro نماذج تشخيصية لتصنيف التسلسلات في العائلات والتنبؤ بوجود المجالات والمواقع المهمة وظيفيًا. من خلال استخدام هذا المورد ، تقدم الخدمة بديلاً قويًا ومتطورًا لتحليلات الميتاجينوم الوظيفية القائمة على بلاست. يتم أرشفة البيانات المقدمة إلى خدمة EBI Metagenomics تلقائيًا في أرشيف النيوكليوتيدات الأوروبي (ENA). يتم توفير أرقام الدخول لبيانات التسلسل.

Kaiju - هو تصنيف تصنيفي سريع وحساس ل metagenomics يأخذ تسلسلات النيوكليوتيدات بتنسيق FASTA أو FASTQ المضغوط. يتم تعيين القراءات مباشرة إلى الأصناف باستخدام تصنيف NCBI وقاعدة بيانات مرجعية لتسلسلات البروتين من الجينوم البكتيري والبدئي والفيروسي. بشكل افتراضي ، يستخدم Kaiju إما الجينوم الكامل المتاح من NCBI RefSeq أو المجموعة الميكروبية الفرعية لقاعدة بيانات البروتين غير الزائدة التي يستخدمها NCBI BLAST. يترجم Kaiju القراءات إلى تسلسلات الأحماض الأمينية ، والتي يتم البحث عنها بعد ذلك في قاعدة البيانات باستخدام بحث رجعي معدل حول تنفيذ فعال للذاكرة لتحويل Burrows-Wheeler ، والذي يعثر على أقصى تطابق دقيق (MEMs) ، مما يسمح اختياريًا بعدم التطابق في محاذاة البروتين. (المرجع: Menzel P et al. 2016. (Nat. Commun. 7:11257)

PhyloPythiaS - عبارة عن مصنف سريع ودقيق قائم على التسلسل يعتمد على التركيب الذي يستخدم العلاقات الهرمية بين الكتل. يمكن إجراء التخصيصات التصنيفية مع خادم الويب باستخدام نموذج عام ، أو باستخدام نماذج خاصة بالعينة يمكن للمستخدمين تحديدها وإنشائها. تسمح العديد من أوضاع التصور التفاعلية وتنسيقات التنزيل المتعددة بتحليل سريع ومريح ومعالجة نهائية للتعيينات التصنيفية. (المرجع: Patil KR، et al. 2012. PLoS One. 7:e38581).

Virtual Metagenome - خادم ويب لإعادة بناء metagenomes من تسلسل 16S rRNA. طريقة جديدة لإعادة البناء السريع والفعال للميتاجينوم الافتراضي في المجتمعات الميكروبية البيئية دون استخدام التسلسل الجيني على نطاق واسع. نوضح هذا النهج باستخدام تسلسل الجينات 16S rRNA التي تم الحصول عليها من تغيير طبيعة تحليل الرحلان الكهربائي للهلام المتدرج ، المعين إلى الجينومات المتسلسلة بالكامل ، لإعادة بناء المنظمات الافتراضية التي تشبه الميتاجينوم. (المرجع: Okuda S، et al. 2012. Nat Commun. 3:1203.)

MetaPhlAn2 (الإصدار 2.0.0) - هي أداة حسابية لتحديد تكوين المجتمعات الميكروبية (البكتيريا والعتيقات وحقيقيات النوى والفيروسات) من بيانات تسلسل بندقية ميتاجينوم مع دقة مستوى الأنواع. كما أنه قادر على تحديد سلالات معينة وتتبع السلالات عبر العينات لجميع الأنواع. يسمح بتخصيصات تصنيفية لا لبس فيها ، وتقدير دقيق للوفرة النسبية للكائنات الحية ، ودقة على مستوى الأنواع للبكتيريا ، والعتائق ، وحقيقيات النوى والفيروسات. (المرجع: Segata N، et al. 2012. طرق الطبيعة 8: 811 و ndash814).

CoMet-Universe و [مدش] خادم ويب للتحليل المقارن للميتاجينوم على أساس تواقيع مجال البروتين. بدءًا من تحميل تسلسلات الحمض النووي الخاصة بك ، يقوم خط أنابيب CoMet بتنفيذ جميع الخطوات اللازمة لتحليل ميتاجينوم شامل بما في ذلك التنبؤ الجيني ، واكتشاف مجال البروتين باستخدام Pfam 27 ، والتنميط الأيضي بناءً على مسارات KEGG وتقدير وفرة الأصناف عبر جميع مجالات الحياة والفيروسات. (المرجع: A & szlighauer KP et al. Int J Mol Sci. 2014 15(7):12364-78).

16S Classifier - هي أداة لتصنيف تصنيفي سريع ودقيق لمناطق متغيرة للغاية 16S rRNA في مجموعات البيانات metagenomic. في مجموعات البيانات الميتاجينومية الحقيقية ، أظهرت دقة تصل إلى 99.7٪ على مستوى الشعبة ودقة تصل إلى 99.0٪ على مستوى الجنس. (المرجع: N. Chaudhary et al. 2015. PLoS One 10(2): e0116106). يمكن الوصول إليها أيضًا هنا

ديناتلاس (DNA2.0 Inc. ، الولايات المتحدة الأمريكية) - مكان لكل ما تبذلونه من التسلسلات. يمكنك استيراد جميع التركيبات بسهولة بما في ذلك Genbank و Gene Designer و Excel و Word وأي تنسيق مستند إلى النص تقريبًا. يقوم DNA Atlas على الفور بتحليل ملفات التحميل الخاصة بك واستنتاج ما إذا كان كل تسلسل عبارة عن ميزة أو بنية أو مادة أولية أو DNA أو حمض أميني. قم بتحميل الميزات والأدوات التمهيدية لتراها مشروحة في التسلسلات الخاصة بك. شاهد على الفور التركيبات التي تم شرحها من خلال قائمتنا المنسقة التي تضم أكثر من 1000 ميزة ، أو أضف خاصتك. استخدم بحث التسلسل المستند إلى BLAST لمحاذاة التسلسلات الخاصة بك ومقارنتها بسرعة. صنفهم باستخدام العلامات - من مواقع المجمد إلى بيانات التوصيف. (يتطلب التسجيل).

سوبرفي (تشاد لينج وأمبير فيك غانون ، وكالة الصحة العامة الكندية) هي أداة عبر الإنترنت للجينوميات التنبؤية لـ الإشريكية القولونية. تدمج المنصة أدوات التحليل وبيانات تسلسل الجينوم للجميع المتاحة للجمهور بكتريا قولونية الجينوم ويسهل تحميل تسلسل الجينوم الجديد من المستخدمين في ظل إعدادات عامة أو خاصة. يوفر SuperPhy تحليلات في الوقت الفعلي لآلاف تسلسلات الجينوم بناءً على البيانات الوصفية للسلالة ، بما في ذلك السياق الجغرافي المكاني والتطور.

تسمية العاثية: هذا ذو أهمية قصوى لأعضاء مجتمع الفيروسات البكتيرية لتسمية العاثيات المعزولة حديثًا بشكل مناسب. أفضل مكان للبدء هو & quot كيفية تسمية وتصنيف Phage: دليل غير رسمي. & quot (المرجع: Adriaenssens E & amp Brister JR. 2017. الفيروسات 9(4). pii: E70) التي سأضيف إليها النقاط التالية (أ) يرجى التحقق من أن الاسم الذي تقترحه لم يتم استخدامه بالفعل ، (ب) لا تقم بتسمية phage Enterobacter ia phage & oslash1234 أو Enterobacteria phage 2017 / ABC_567 منذ هذه الأسماء غير متوافقة مع إنشاء أنواع جديدة وأصناف أجناس من قبل اللجنة الدولية لتصنيف الفيروسات (ICTV). لمعرفة ما إذا كان اسمك المقترح فريدًا ، استشر:

التحقق من اسم Phage (ستيفن أبيدون ، جامعة ولاية أوهايو ، الولايات المتحدة الأمريكية) - لمعرفة ما إذا كان & # 39your & # 39 phage موجودًا حاليًا في الباحث العلمي من Google أو كتب Google أو PubMed أو حتى Bacteriophage Names 2000.

CPT Phage Name Search (مركز تقنية Phage في جامعة Texas A & ampM University)


قواعد بيانات بلاست

لا شك أن القراء المطلعين على بلاست كانوا فضوليين: ليس هناك قواعد بيانات من نوع ما تشارك في عمليات البحث بلاست؟ ليس بالضرورة. كما رأينا ، تكفي ملفات FASTA البسيطة لكل من الاستعلام ومجموعة الموضوع. ومع ذلك ، اتضح أنه من منظور حسابي ، لا يمكن البحث بسهولة عن ملفات FASTA البسيطة. وبالتالي ، يوفر BLAST + أداة تسمى makeblastdb تقوم بتحويل ملف FASTA للموضوع إلى نسخة مفهرسة وسريعة البحث (ولكن غير قابلة للقراءة البشرية) من نفس المعلومات ، مخزنة في مجموعة من الملفات ذات الأسماء المتشابهة (غالبًا ما تكون ثلاثة على الأقل تنتهي بـ .pin ، .psq و .phr لتسلسلات البروتين و .nin و .nsq و .nhr لتسلسلات النيوكليوتيدات). تمثل هذه المجموعة من الملفات "قاعدة البيانات" ، واسم قاعدة البيانات هو بادئة اسم الملف المشترك لهذه الملفات.

يعد تشغيل makeblastdb على ملف FASTA أمرًا بسيطًا إلى حد ما: makeblastdb -in & ltfasta file & gt -out & ltdatabase name & gt -dbtype & lttype & gt -title & lttitle & gt -parse_seqids ، حيث يكون & lttype & gt واحدًا من prot أو nuclable & title. من الضروري). تشير علامة -parse_seqids إلى أنه يجب تضمين معرّفات التسلسل من ملف FASTA في قاعدة البيانات بحيث يمكن استخدامها في المخرجات وكذلك بواسطة أدوات أخرى مثل blastdbcmd (تمت مناقشته أدناه).

بمجرد إنشاء قاعدة بيانات BLAST ، يمكن استخدام خيارات أخرى مع blastn et al:

  • -db & ltdatabase name & GT
    • اسم قاعدة البيانات المراد البحث عنها (على عكس استخدام-الموضوع).
    • استخدم نواة وحدة المعالجة المركزية & ltinteger & gt على نظام متعدد النواة ، إذا كانت متوفرة.

    عند استخدام الخيار -db ، ستبحث أدوات BLAST عن ملفات قاعدة البيانات في ثلاثة مواقع: (1) دليل العمل الحالي ، (2) دليل منزلك ، و (3) المسارات المحددة في متغير بيئة $ BLASTDB.

    يمكن استخدام الأداة blastdbcmd للحصول على معلومات حول قواعد بيانات BLAST - على سبيل المثال ، باستخدام اسم قاعدة البيانات blastdbcmd -db & ltd & gt -info - ويمكنها إظهار قواعد البيانات في مسار معين باستخدام blastdbcmd -list & ltpath & gt (لذا ، ستظهر blastdbcmd -list $ BLASTDB قواعد البيانات الموجودة في مسارات البحث الافتراضية). يمكن أيضًا استخدام هذه الأداة لاستخراج تسلسلات أو معلومات عنها من قواعد البيانات بناءً على معلومات مثل المعرفات الواردة في ملفات الإخراج. كما هو الحال دائمًا ، يوصى بشدة بقراءة التعليمات والوثائق الخاصة ببرامج مثل BLAST.


    تحويل تنسيق الملف

    لنفترض أن لديك ملف GenBank الذي تريد تحويله إلى ملف Fasta. على سبيل المثال ، دعنا نفكر في الملف cor6_6.gb الذي تم تضمينه في اختبارات وحدة Biopython ضمن دليل GenBank.

    يمكنك قراءة ملف مثل هذا باستخدام وظيفة Bio.SeqIO.parse ():

    لاحظ أن هذا الملف يحتوي على ستة سجلات. الآن بدلاً من طباعة السجلات ، دعنا نمرر مُكرر SeqRecord إلى وظيفة Bio.SeqIO.write () ، لتحويل ملف GenBank هذا إلى ملف Fasta:

    أو بشكل أكثر إيجازًا باستخدام وظيفة Bio.SeqIO.convert () (في Biopython 1.52 أو أحدث) ، فقط:

    في هذا المثال ، بدأ ملف GenBank على النحو التالي:

    ملف Fasta الناتج يبدو كالتالي:

    لاحظ أن كل ملف Fasta يمكن تخزينه هو المعرف والوصف والتسلسل.

    من خلال تغيير سلاسل التنسيق ، يمكن استخدام هذا الرمز للتحويل بين أي تنسيقات ملفات مدعومة.


    مواقع SNP: استخراج سريع وفعال من النيوكلوتايد من محاذاة متعددة لفاستا

    أدى الانخفاض السريع في تكاليف تسلسل الجينوم إلى زيادة متناسبة في عدد العينات المستخدمة في دراسات السكان بدائية النواة. يعد استخراج الأشكال المتعددة للنيوكليوتيدات المفردة (SNPs) من محاذاة الجينوم الكامل مهمة روتينية ، لكن الأدوات الموجودة فشلت في التوسع بكفاءة مع الحجم المتزايد للدراسات. هذه الأدوات بطيئة ، والذاكرة غير فعالة ويتم تثبيتها من خلال إجراءات غير قياسية. نقدم مواقع SNP والتي يمكنها استخراج SNPs بسرعة من محاذاة متعددة لـ FASTA باستخدام موارد متواضعة ويمكنها إخراج النتائج بتنسيقات متعددة لتحليل المصب. يمكن استخراج SNPs من ملف محاذاة بحجم 8.3 جيجا بايت (1842 تصنيفًا ، 22618 موقعًا) في 267 ثانية باستخدام 59 ميجا بايت من ذاكرة الوصول العشوائي و 1 وحدة معالجة مركزية أساسية ، مما يجعل من الممكن تشغيلها على أجهزة كمبيوتر متواضعة. من السهل تثبيته من خلال مديري الحزم Debian و Homebrew ، وقد تم اختباره بنجاح على أكثر من 20 نظام تشغيل. مواقع SNP تم تنفيذه في C ومتوفر بموجب ترخيص مفتوح المصدر GNU GPL الإصدار 3.


    استخراج الطفرات من تسلسل فاستا - علم الأحياء

    لدي قدر كبير من سلاسل البروتين المحاذاة في شكل فاستا ، وتسلسل مرجعي ، كل منها له نفس الطول. أرغب في استخلاص طفرات الأحماض الأمينية فقط من هذه التسلسلات ، بحيث ، في النهاية ، أريد الحصول على قائمة تبدو كالتالي: I456L ، W675T ، إلخ. هل هناك برنامج أو أي طريقة للقيام بذلك؟ شاكرين

    لدى Pierre حل كامل ولكن في حالة عدم نجاح ذلك ، يمكنك استخدام blastp مع -outfmt 3 والذي سيحدد الفرق ويخرجه كذلك.

    قد يكون محلل انفجار Biopython قادرًا على المساعدة في إنهاء الباقي.

    باستخدام bioalcidaejdk http://lindenb.github.io/jvarkit/BioAlcidaeJdk.html وملف fasta حيث يكون التسلسل الأول هو المرجع:

    بيير ليندنباوم لا أستطيع أن أجد تجزئة الطية و bioalcidaejdk.jar أيضًا. يوجد ملف يسمى bioalcidaejdk.java في مجلد bioalcidae.

    هل اتبعت تعليمات التثبيت:

    java compiler SDK 11. يرجى التحقق من وجود ملف java في الملف $. إعداد JAVA_HOME ليس كافيًا: (على سبيل المثال: https://github.com/lindenb/jvarkit/issues/23)

    شكرا لكما جينوماكس وبيير ليندنباوم. واجهت مشكلة مع مترجم JDK الخاص بي ، لقد قمت بحلها للتو ، وبدأت في العمل وسار كل شيء على ما يرام.

    تسجيل الدخول قبل إضافة إجابتك.

    يشكل استخدام هذا الموقع قبولًا لاتفاقية المستخدم وسياسة الخصوصية الخاصة بنا.


    شاهد الفيديو: الطفرات الكرموسومية والاختلالات الوراثية (أغسطس 2022).