الگوریتم‌ها و ساختارهای داده برای مجموعه‌داده‌های عظیم ۲۰۲۲
Algorithms and Data Structures for Massive Datasets 2022

دانلود کتاب الگوریتم‌ها و ساختارهای داده برای مجموعه‌داده‌های عظیم ۲۰۲۲ (Algorithms and Data Structures for Massive Datasets 2022) با لینک مستقیم و فرمت pdf (پی دی اف) و ترجمه فارسی

نویسنده

Dzejla Medjedovic, Emin Tahirovic

voucher (1)

۳۰ هزار تومان تخفیف با کد «OFF30» برای اولین خرید

سال انتشار

2022

زبان

English

تعداد صفحه‌ها

304

نوع فایل

pdf

حجم

14.2 MB

🏷️ قیمت اصلی: 200,000 تومان بود.قیمت فعلی: 129,000 تومان.

🏷️ قیمت اصلی: ۳۷۸٬۰۰۰ تومان بود. قیمت فعلی: ۲۹۸٬۰۰۰ تومان.

📥 دانلود نسخه‌ی اصلی کتاب به زبان انگلیسی(PDF)
🧠 به همراه ترجمه‌ی فارسی با هوش مصنوعی 🔗 مشاهده جزئیات

پیش‌خرید با تحویل فوری(⚡️) | فایل کتاب حداکثر تا ۳۰ دقیقه(🕒) پس از ثبت سفارش آماده دانلود خواهد بود.

دانلود مستقیم PDF

ارسال فایل به ایمیل

پشتیبانی ۲۴ ساعته

توضیحات

معرفی کتاب الگوریتم‌ها و ساختارهای داده برای مجموعه‌داده‌های عظیم ۲۰۲۲

مجموعه‌های داده‌ی عظیم امروزی باعث می‌شوند ساختارهای داده و الگوریتم‌های سنتی از کار بیفتند. این راهنمای سرگرم‌کننده و کاربردی، تکنیک‌های پیشرفته‌ای را معرفی می‌کند که می‌توانند به طور قابل اعتمادی حتی بزرگ‌ترین مجموعه‌های داده‌ی توزیع‌شده را نیز مدیریت کنند.

در الگوریتم‌ها و ساختارهای داده برای مجموعه‌های داده‌ی عظیم خواهید آموخت:

ساختارهای داده‌ی طرح‌واره‌بندی احتمالی برای مسائل کاربردی
انتخاب موتور پایگاه داده‌ی مناسب برای برنامه‌ی خود
ارزیابی و طراحی ساختارهای داده و الگوریتم‌های کارآمد روی دیسک
درک بده‌بستان‌های الگوریتمی در سیستم‌های مقیاس بزرگ
به دست آوردن آمارهای اساسی از داده‌های جریانی
نمونه‌برداری صحیح از داده‌های جریانی
محاسبه‌ی صدک‌ها با منابع فضایی محدود

الگوریتم‌ها و ساختارهای داده برای مجموعه‌های داده‌ی عظیم جعبه‌ابزاری از روش‌های جدید را آشکار می‌کند که برای مدیریت برنامه‌های کاربردی کلان داده‌ی امروزی عالی هستند. شما ساختارهای داده و الگوریتم‌های نوینی را بررسی خواهید کرد که زیربنای گوگل، فیس‌بوک و سایر برنامه‌های کاربردی سازمانی هستند که با مقادیر واقعاً عظیمی از داده‌ها کار می‌کنند. این تکنیک‌های مؤثر را می‌توان در هر رشته‌ای، از امور مالی گرفته تا تحلیل متن، اعمال کرد. گرافیک‌ها، تصاویر و مثال‌های عملی صنعتی، ایده‌های پیچیده را برای پیاده‌سازی در پروژه‌های شما عملی می‌سازند—و هیچ اثبات ریاضی پیچیده‌ای برای سردرگم شدن وجود ندارد. این راهنمای بی‌نظیر را دنبال کنید، و نقطه‌ی بهینه‌ی صرفه‌جویی در فضا را بدون قربانی کردن دقت داده‌های خود خواهید یافت.

درباره‌ی فناوری
الگوریتم‌ها و ساختارهای داده‌ی استاندارد ممکن است هنگام اعمال بر روی مجموعه‌های داده‌ی توزیع‌شده‌ی بزرگ، کند شوند—یا به طور کلی از کار بیفتند. انتخاب الگوریتم‌های طراحی‌شده برای کلان داده، باعث صرفه‌جویی در زمان، افزایش دقت و کاهش هزینه‌ی پردازش می‌شود. این کتاب منحصربه‌فرد، مقالات تحقیقاتی پیشرفته را به تکنیک‌های کاربردی برای طرح‌واره‌بندی، جریان‌دهی و سازماندهی مجموعه‌های داده‌ی عظیم روی دیسک و در فضای ابری تبدیل می‌کند.

درباره‌ی کتاب
الگوریتم‌ها و ساختارهای داده برای مجموعه‌های داده‌ی عظیم تکنیک‌های پردازش و تحلیل را برای داده‌های توزیع‌شده‌ی بزرگ معرفی می‌کند. این راهنمای دوستانه که مملو از داستان‌های صنعت و تصاویر سرگرم‌کننده است، حتی مفاهیم پیچیده را نیز به آسانی قابل درک می‌کند. شما نمونه‌های واقعی را بررسی خواهید کرد زیرا یاد می‌گیرید الگوریتم‌های قدرتمندی مانند فیلترهای بلوم، طرح‌واره‌ی Count-min، HyperLogLog و درخت‌های LSM را به موارد استفاده‌ی خود نگاشت کنید.

مطالب داخل کتاب

ساختارهای داده‌ی طرح‌واره‌بندی احتمالی
انتخاب موتور پایگاه داده‌ی مناسب
طراحی ساختارهای داده و الگوریتم‌های کارآمد روی دیسک
بده‌بستان‌های الگوریتمی در سیستم‌های مقیاس بزرگ
محاسبه‌ی صدک‌ها با منابع فضایی محدود

درباره‌ی خواننده
مثال‌هایی در پایتون، R و شبه‌کد.

درباره‌ی نویسنده
دزیلا مجدوویچ دکترای خود را در آزمایشگاه الگوریتم‌های کاربردی در دانشگاه استونی بروک، نیویورک دریافت کرده است. امین تاهیروویچ دکترای خود را در آمار زیستی از دانشگاه پنسیلوانیا دریافت کرده است. تصویرگر اینس ددوویچ دکترای خود را در موسسه تصویربرداری و بینایی کامپیوتر در دانشگاه RWTH آخن، آلمان دریافت کرده است.

فهرست مطالب

1 مقدمه
بخش 1 طرح‌واره‌های مبتنی بر هش
2 مروری بر جداول هش و هشینگ مدرن
3 عضویت تقریبی: فیلترهای بلوم و خارج قسمت
4 تخمین فراوانی و طرح‌واره‌ی Count-min
5 تخمین کاردینالیتی و HyperLogLog
بخش 2 تحلیل بی‌درنگ
6 داده‌های جریانی: گرد هم آوردن همه چیز
7 نمونه‌برداری از جریان‌های داده
8 کوانتیل‌های تقریبی در جریان‌های داده
بخش 3 ساختارهای داده برای پایگاه‌های داده و الگوریتم‌های حافظه‌ی خارجی
9 معرفی مدل حافظه‌ی خارجی
10 ساختارهای داده برای پایگاه‌های داده: B-trees، Bε-trees و LSM-trees
11 مرتب‌سازی حافظه‌ی خارجی


فهرست کتاب:

۱. عنوان

۲. حق نشر

۳. محتویات

۴. مطالب مقدماتی

۱ مقدمه

۶. بخش ۱ طرح‌های مبتنی بر درهم‌سازی

۲ مروری بر جداول درهم‌سازی و درهم‌سازی مدرن

۳ عضویت تقریبی: فیلترهای بلوم و خارج قسمت

۴ تخمین فراوانی و طرح حداقل شمارش

۵ تخمین تعداد و HyperLogLog

۱۱. بخش ۲ تحلیل‌های بلادرنگ

۶ داده‌های جریانی: گردآوری همه چیز

۷ نمونه‌برداری از جریان‌های داده

۸ چندک‌های تقریبی در جریان‌های داده

۱۵. بخش ۳ ساختمان‌های داده برای پایگاه‌های داده و الگوریتم‌های حافظه خارجی

۹ معرفی مدل حافظه خارجی

۱۰ ساختمان‌های داده برای پایگاه‌های داده: B-tree، Bε-tree و LSM-tree

۱۱ مرتب‌سازی حافظه خارجی

۱۹. مراجع

۲۰. فهرست

۲۱. داخل جلد پشتی

توضیحات(انگلیسی)
Massive modern datasets make traditional data structures and algorithms grind to a halt. This fun and practical guide introduces cutting-edge techniques that can reliably handle even the largest distributed datasets.

In Algorithms and Data Structures for Massive Datasets you will learn:

Probabilistic sketching data structures for practical problems
Choosing the right database engine for your application
Evaluating and designing efficient on-disk data structures and algorithms
Understanding the algorithmic trade-offs involved in massive-scale systems
Deriving basic statistics from streaming data
Correctly sampling streaming data
Computing percentiles with limited space resources

Algorithms and Data Structures for Massive Datasets reveals a toolbox of new methods that are perfect for handling modern big data applications. You’ll explore the novel data structures and algorithms that underpin Google, Facebook, and other enterprise applications that work with truly massive amounts of data. These effective techniques can be applied to any discipline, from finance to text analysis. Graphics, illustrations, and hands-on industry examples make complex ideas practical to implement in your projects—and there’s no mathematical proofs to puzzle over. Work through this one-of-a-kind guide, and you’ll find the sweet spot of saving space without sacrificing your data’s accuracy.

About the technology
Standard algorithms and data structures may become slow—or fail altogether—when applied to large distributed datasets. Choosing algorithms designed for big data saves time, increases accuracy, and reduces processing cost. This unique book distills cutting-edge research papers into practical techniques for sketching, streaming, and organizing massive datasets on-disk and in the cloud.

About the book
Algorithms and Data Structures for Massive Datasets introduces processing and analytics techniques for large distributed data. Packed with industry stories and entertaining illustrations, this friendly guide makes even complex concepts easy to understand. You’ll explore real-world examples as you learn to map powerful algorithms like Bloom filters, Count-min sketch, HyperLogLog, and LSM-trees to your own use cases.

What's inside

Probabilistic sketching data structures
Choosing the right database engine
Designing efficient on-disk data structures and algorithms
Algorithmic tradeoffs in massive-scale systems
Computing percentiles with limited space resources

About the reader
Examples in Python, R, and pseudocode.

About the author
Dzejla Medjedovic earned her PhD in the Applied Algorithms Lab at Stony Brook University, New York. Emin Tahirovic earned his PhD in biostatistics from University of Pennsylvania. Illustrator Ines Dedovic earned her PhD at the Institute for Imaging and Computer Vision at RWTH Aachen University, Germany.

Table of Contents

1 Introduction
PART 1 HASH-BASED SKETCHES
2 Review of hash tables and modern hashing
3 Approximate membership: Bloom and quotient filters
4 Frequency estimation and count-min sketch
5 Cardinality estimation and HyperLogLog
PART 2 REAL-TIME ANALYTICS
6 Streaming data: Bringing everything together
7 Sampling from data streams
8 Approximate quantiles on data streams
PART 3 DATA STRUCTURES FOR DATABASES AND EXTERNAL MEMORY ALGORITHMS
9 Introducing the external memory model
10 Data structures for databases: B-trees, Bε-trees, and LSM-trees
11 External memory sorting


Table of Contents

1. title

2. Copyright

3. contents

4. front matter

1 Introduction

6. Part 1 Hash-based sketches

2 Review of hash tables and modern hashing

3 Approximate membership: Bloom and quotient filters

4 Frequency estimation and count-min sketch

5 Cardinality estimation and HyperLogLog

11. Part 2 Real-time analytics

6 Streaming data: Bringing everything together

7 Sampling from data streams

8 Approximate quantiles on data streams

15. Part 3 Data structures for databases and external memory algorithms

9 Introducing the external memory model

10 Data structures for databases: B-trees, Bε-trees, and LSM-trees

11 External memory sorting

19. references

20. index

21. inside back cover

دیگران دریافت کرده‌اند

✨ ضمانت تجربه خوب مطالعه

بازگشت کامل وجه

در صورت مشکل، مبلغ پرداختی بازگردانده می شود.

دانلود پرسرعت

دانلود فایل کتاب با سرعت بالا

ارسال فایل به ایمیل

دانلود مستقیم به همراه ارسال فایل به ایمیل.

پشتیبانی ۲۴ ساعته

با چت آنلاین و پیام‌رسان ها پاسخگو هستیم.

ضمانت کیفیت کتاب

کتاب ها را از منابع معتیر انتخاب می کنیم.