Genomics in the Cloud: Using Docker, GATK, and WDL in Terra 2020

دانلود کتاب پزشکی ژنومیک در ابر: استفاده از Docker، GATK، و WDL در Terra

نویسنده

Brian D. O'Connor, Geraldine A. Van der Auwera

تعداد صفحه‌ها

496

نوع فایل

epub

حجم

28 Mb

سال انتشار

2020

89,000 تومان

دانلود ۳۰.۰۰۰ کتاب پزشکی فقط با قیمت یک کتاب و ۹۹ هزار تومان !
توضیحات

داده ها در زمینه ژنومیک در حال رونق است. تنها در چند سال آینده، سازمان‌هایی مانند مؤسسه ملی بهداشت (NIH) میزبان بیش از 50 پتابایت یا بیش از 50 میلیون گیگابایت از داده‌های ژنتیکی خواهند بود و برای در دسترس قرار دادن این داده‌ها به زیرساخت‌های ابری روی می‌آورند. به جامعه پژوهشی چگونه ابزارها و پروتکل های تحلیلی را برای دسترسی و تجزیه و تحلیل این حجم از داده ها در فضای ابری تطبیق می دهید؟

از طریق این کتاب کاربردی، محققان نحوه کار با الگوریتم‌های ژنوم را با استفاده از ابزارهای منبع باز از جمله جعبه ابزار تجزیه و تحلیل ژنوم (GATK)، Docker، WDL و Terra یاد خواهند گرفت. Geraldine van der Oyera، نگهبان قدیمی جامعه کاربران GATK، و برایان اوکانر از مؤسسه ژنومیک UC Santa Cruz، شما را در این فرآیند راهنمایی می‌کنند. با انجام داده‌های واقعی و الگوریتم‌های ژنومیک از این زمینه، یاد خواهید گرفت.

  • زمینه ژنومیک پایه و فناوری محاسبات
  • عملیات اساسی محاسبات ابری
  • شروع به کار با GATK و همچنین سه خط اصلی بهترین شیوه های GATK
  • تجزیه و تحلیل خودکار با جریان های کاری برنامه ریزی شده با WDL و Cromwell
  • مقیاس اجرای گردش کار در فضای ابری، از جمله موازی سازی و بهینه سازی هزینه
  • تجزیه و تحلیل تعاملی در ابر با نوت بوک های Jupyter
  • همکاری محاسباتی و بازتولید امن با Terra
توضیحات(انگلیسی)

Data in the genomics field is booming. In just a few years, organizations such as the National Institutes of Health (NIH) will host 50+ petabytes—or over 50 million gigabytes—of genomic data, and they’re turning to cloud infrastructure to make that data available to the research community. How do you adapt analysis tools and protocols to access and analyze that volume of data in the cloud?

With this practical book, researchers will learn how to work with genomics algorithms using open source tools including the Genome Analysis Toolkit (GATK), Docker, WDL, and Terra. Geraldine Van der Auwera, longtime custodian of the GATK user community, and Brian O’Connor of the UC Santa Cruz Genomics Institute, guide you through the process. You’ll learn by working with real data and genomics algorithms from the field.

This book covers:

  • Essential genomics and computing technology background
  • Basic cloud computing operations
  • Getting started with GATK, plus three major GATK Best Practices pipelines
  • Automating analysis with scripted workflows using WDL and Cromwell
  • Scaling up workflow execution in the cloud, including parallelization and cost optimization
  • Interactive analysis in the cloud using Jupyter notebooks
  • Secure collaboration and computational reproducibility using Terra