Genomics in the Cloud: Using Docker, GATK, and WDL in Terra 2020
دانلود کتاب پزشکی ژنومیک در ابر: استفاده از Docker، GATK، و WDL در Terra
نویسنده |
Brian D. O'Connor, Geraldine A. Van der Auwera |
---|
تعداد صفحهها |
496 |
---|---|
نوع فایل |
epub |
حجم |
28 Mb |
سال انتشار |
2020 |
89,000 تومان
داده ها در زمینه ژنومیک در حال رونق است. تنها در چند سال آینده، سازمانهایی مانند مؤسسه ملی بهداشت (NIH) میزبان بیش از 50 پتابایت یا بیش از 50 میلیون گیگابایت از دادههای ژنتیکی خواهند بود و برای در دسترس قرار دادن این دادهها به زیرساختهای ابری روی میآورند. به جامعه پژوهشی چگونه ابزارها و پروتکل های تحلیلی را برای دسترسی و تجزیه و تحلیل این حجم از داده ها در فضای ابری تطبیق می دهید؟
از طریق این کتاب کاربردی، محققان نحوه کار با الگوریتمهای ژنوم را با استفاده از ابزارهای منبع باز از جمله جعبه ابزار تجزیه و تحلیل ژنوم (GATK)، Docker، WDL و Terra یاد خواهند گرفت. Geraldine van der Oyera، نگهبان قدیمی جامعه کاربران GATK، و برایان اوکانر از مؤسسه ژنومیک UC Santa Cruz، شما را در این فرآیند راهنمایی میکنند. با انجام دادههای واقعی و الگوریتمهای ژنومیک از این زمینه، یاد خواهید گرفت.
- زمینه ژنومیک پایه و فناوری محاسبات
- عملیات اساسی محاسبات ابری
- شروع به کار با GATK و همچنین سه خط اصلی بهترین شیوه های GATK
- تجزیه و تحلیل خودکار با جریان های کاری برنامه ریزی شده با WDL و Cromwell
- مقیاس اجرای گردش کار در فضای ابری، از جمله موازی سازی و بهینه سازی هزینه
- تجزیه و تحلیل تعاملی در ابر با نوت بوک های Jupyter
- همکاری محاسباتی و بازتولید امن با Terra
Data in the genomics field is booming. In just a few years, organizations such as the National Institutes of Health (NIH) will host 50+ petabytes—or over 50 million gigabytes—of genomic data, and they’re turning to cloud infrastructure to make that data available to the research community. How do you adapt analysis tools and protocols to access and analyze that volume of data in the cloud?
With this practical book, researchers will learn how to work with genomics algorithms using open source tools including the Genome Analysis Toolkit (GATK), Docker, WDL, and Terra. Geraldine Van der Auwera, longtime custodian of the GATK user community, and Brian O’Connor of the UC Santa Cruz Genomics Institute, guide you through the process. You’ll learn by working with real data and genomics algorithms from the field.
This book covers:
- Essential genomics and computing technology background
- Basic cloud computing operations
- Getting started with GATK, plus three major GATK Best Practices pipelines
- Automating analysis with scripted workflows using WDL and Cromwell
- Scaling up workflow execution in the cloud, including parallelization and cost optimization
- Interactive analysis in the cloud using Jupyter notebooks
- Secure collaboration and computational reproducibility using Terra