چهار نسل یکپارچه‌سازی موجودیت ۲۰۲۲
The Four Generations of Entity Resolution 2022

دانلود کتاب چهار نسل یکپارچه‌سازی موجودیت ۲۰۲۲ (The Four Generations of Entity Resolution 2022) با لینک مستقیم و فرمت pdf (پی دی اف) و ترجمه فارسی

نویسنده

George Papadakis, Ekaterini Ioannou, Emanouil Thanos, Themis Palpanas

voucher (1)

۳۰ هزار تومان تخفیف با کد «OFF30» برای اولین خرید

سال انتشار

2022

زبان

English

تعداد صفحه‌ها

152

نوع فایل

pdf

حجم

4.4 MB

🏷️ قیمت اصلی: 200,000 تومان بود.قیمت فعلی: 129,000 تومان.

🏷️ قیمت اصلی: ۳۷۸٬۰۰۰ تومان بود. قیمت فعلی: ۲۹۸٬۰۰۰ تومان.

📥 دانلود نسخه‌ی اصلی کتاب به زبان انگلیسی(PDF)
🧠 به همراه ترجمه‌ی فارسی با هوش مصنوعی 🔗 مشاهده جزئیات

پیش‌خرید با تحویل فوری(⚡️) | فایل کتاب حداکثر تا ۳۰ دقیقه(🕒) پس از ثبت سفارش آماده دانلود خواهد بود.

دانلود مستقیم PDF

ارسال فایل به ایمیل

پشتیبانی ۲۴ ساعته

توضیحات

معرفی کتاب چهار نسل یکپارچه‌سازی موجودیت ۲۰۲۲

تطابق‌دهی هویت‌ها (Entity Resolution یا ER) در هسته‌ی اصلی یکپارچه‌سازی و پاکسازی داده‌ها قرار دارد، و از این رو، حجم عمده‌ای از تحقیقات به بررسی راه‌های بهبود کارایی و سرعت آن می‌پردازد. روش‌های اولیه‌ی ER عمدتاً «درستی» (Veracity) را در زمینه‌ی داده‌های ساخت‌یافته (رابطه‌ای) هدف قرار می‌دهند که توسط یک شمای با کیفیت و معنای مشخص توصیف می‌شوند. برای دستیابی به کارایی بالا، این روش‌ها از دانشِ schema، خبرگان و/یا دانش خارجی بهره می‌برند. بخشی از این روش‌ها برای پرداختن به «حجم» (Volume)، با پردازش مجموعه‌های داده‌ی بزرگ از طریق رویکردهای چند هسته‌ای یا موازی‌سازی گسترده، مانند الگوی MapReduce، توسعه یافته‌اند. با این حال، این رویکردهای اولیه‌ی مبتنی بر schema در مورد داده‌های وب، که مملو از اطلاعات حجیم، پرنویز، نیمه‌ساخت‌یافته و بسیار ناهمگن هستند، کاربرد ندارند. برای مقابله با چالش اضافیِ «تنوع» (Variety)، پژوهش‌های اخیر در زمینه‌ی ER یک عملکرد جدید و تا حدی آگاه به schema را اتخاذ کرده‌اند که بر مقیاس‌پذیری و مقاومت در برابر نویز تأکید دارد. یک مسیر دیگر از تحقیقات کنونی بر چالش اضافیِ «سرعت» (Velocity) متمرکز است و هدف آن پردازش مجموعه‌های داده‌ای با حجم دائماً در حال افزایش است. با این حال، جدیدترین پژوهش‌ها از پیشرفت‌های چشمگیر در یادگیری عمیق و برون‌سپاری جمعی (Crowdsourcing) بهره می‌برند و دانش خارجی را برای بهبود قابل توجه روش‌های موجود به کار می‌گیرند.

این درسنامه‌ی ترکیبی، روش‌های ER را بر اساس چالش‌های مطرح شده توسط این چهار V، به چهار نسل تقسیم می‌کند. برای هر نسل، گردش کار مربوط به ER را ترسیم می‌کنیم، روش‌های پیشرفته در هر مرحله از گردش کار را مورد بحث قرار می‌دهیم و مسیرهای تحقیقاتی فعلی را ارائه می‌دهیم. بحث در مورد این روش‌ها، دیدگاه تاریخی را در نظر می‌گیرد و تکامل روش‌ها را در طول زمان به همراه شباهت‌ها و تفاوت‌های آنها توضیح می‌دهد. این درسنامه همچنین ابزارها و مجموعه‌داده‌های معیار موجود ER را مورد بحث قرار می‌دهد که به کاربران متخصص و همچنین کاربران مبتدی اجازه می‌دهد از راهکارهای موجود استفاده کنند.


فهرست کتاب:

۱. روی جلد

۲. صفحه حق تکثیر

۳. صفحه عنوان

۴. فهرست مطالب

۵. پیشگفتار

۶. تقدیر و تشکر

۷. یکتا سازی موجودیت: گذشته، حال و آینده

۸. مقدمات

۹. نسل اول: پرداختن به صحت

۱۰. نسل دوم: پرداختن به حجم نیز

۱۱. نسل سوم: پرداختن به تنوع نیز

۱۲. نسل چهارم: پرداختن به سرعت نیز

۱۳. استفاده از دانش خارجی

۱۴. منابع برای یکتاسازی موجودیت

۱۵. مسیرهای احتمالی برای کارهای آتی

۱۶. کتابنامه

۱۷. شرح حال نویسندگان

توضیحات(انگلیسی)
Entity Resolution (ER) lies at the core of data integration and cleaning and, thus, a bulk of the research examines ways for improving its effectiveness and time efficiency. The initial ER methods primarily target Veracity in the context of structured (relational) data that are described by a schema of well-known quality and meaning. To achieve high effectiveness, they leverage schema, expert, and/or external knowledge. Part of these methods are extended to address Volume, processing large datasets through multi-core or massive parallelization approaches, such as the MapReduce paradigm. However, these early schema-based approaches are inapplicable to Web Data, which abound in voluminous, noisy, semi-structured, and highly heterogeneous information. To address the additional challenge of Variety, recent works on ER adopt a novel, loosely schema-aware functionality that emphasizes scalability and robustness to noise. Another line of present research focuses on the additional challenge ofVelocity, aiming to process data collections of a continuously increasing volume. The latest works, though, take advantage of the significant breakthroughs in Deep Learning and Crowdsourcing, incorporating external knowledge to enhance the existing words to a significant extent. This synthesis lecture organizes ER methods into four generations based on the challenges posed by these four Vs. For each generation, we outline the corresponding ER workflow, discuss the state-of-the-art methods per workflow step, and present current research directions. The discussion of these methods takes into account a historical perspective, explaining the evolution of the methods over time along with their similarities and differences. The lecture also discusses the available ER tools and benchmark datasets that allow expert as well as novice users to make use of the available solutions.


Table of Contents

1. Cover

2. Copyright Page

3. Title Page

4. Contents

5. Preface

6. Acknowledgements

7. Entity Resolution: Past, Present, and Yet-to-Come

8. Preliminaries

9. Generation 1: Addressing Veracity

10. Generation 2: Also Addressing Volume

11. Generation 3: Also Addressing Variety

12. Generation 4: Also Addressing Velocity

13. Leveraging External Knowledge

14. Resources for Entity Resolution

15. Possible Directions for Future Work

16. Bibliography

17. Authors' Biographies

دیگران دریافت کرده‌اند

چهار کتاب معماری ۲۰۱۳
The Four Books of Architecture 2013

🏷️ قیمت اصلی: 200,000 تومان بود.قیمت فعلی: 129,000 تومان.

✨ ضمانت تجربه خوب مطالعه

بازگشت کامل وجه

در صورت مشکل، مبلغ پرداختی بازگردانده می شود.

دانلود پرسرعت

دانلود فایل کتاب با سرعت بالا

ارسال فایل به ایمیل

دانلود مستقیم به همراه ارسال فایل به ایمیل.

پشتیبانی ۲۴ ساعته

با چت آنلاین و پیام‌رسان ها پاسخگو هستیم.

ضمانت کیفیت کتاب

کتاب ها را از منابع معتیر انتخاب می کنیم.