داده ها در زمینه ژنومیک در حال رونق است. تنها در چند سال آینده، سازمانهایی مانند مؤسسه ملی بهداشت (NIH) میزبان بیش از 50 پتابایت یا بیش از 50 میلیون گیگابایت از دادههای ژنتیکی خواهند بود و برای در دسترس قرار دادن این دادهها به زیرساختهای ابری روی میآورند. به جامعه پژوهشی چگونه ابزارها و پروتکل های تحلیلی را برای دسترسی و تجزیه و تحلیل این حجم از داده ها در فضای ابری تطبیق می دهید؟
از طریق این کتاب کاربردی، محققان نحوه کار با الگوریتمهای ژنوم را با استفاده از ابزارهای منبع باز از جمله جعبه ابزار تجزیه و تحلیل ژنوم (GATK)، Docker، WDL و Terra یاد خواهند گرفت. Geraldine van der Oyera، نگهبان قدیمی جامعه کاربران GATK، و برایان اوکانر از مؤسسه ژنومیک UC Santa Cruz، شما را در این فرآیند راهنمایی میکنند. با انجام دادههای واقعی و الگوریتمهای ژنومیک از این زمینه، یاد خواهید گرفت.
- زمینه ژنومیک پایه و فناوری محاسبات
- عملیات اساسی محاسبات ابری
- شروع به کار با GATK و همچنین سه خط اصلی بهترین شیوه های GATK
- تجزیه و تحلیل خودکار با جریان های کاری برنامه ریزی شده با WDL و Cromwell
- مقیاس اجرای گردش کار در فضای ابری، از جمله موازی سازی و بهینه سازی هزینه
- تجزیه و تحلیل تعاملی در ابر با نوت بوک های Jupyter
- همکاری محاسباتی و بازتولید امن با Terra