چهار نسل یکپارچهسازی موجودیت ۲۰۲۲
The Four Generations of Entity Resolution 2022
دانلود کتاب چهار نسل یکپارچهسازی موجودیت ۲۰۲۲ (The Four Generations of Entity Resolution 2022) با لینک مستقیم و فرمت pdf (پی دی اف) و ترجمه فارسی
| نویسنده |
George Papadakis, Ekaterini Ioannou, Emanouil Thanos, Themis Palpanas |
|---|
ناشر:
Springer Nature
۳۰ هزار تومان تخفیف با کد «OFF30» برای اولین خرید
| سال انتشار |
2022 |
|---|---|
| زبان |
English |
| تعداد صفحهها |
152 |
| نوع فایل |
|
| حجم |
4.4 MB |
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
🏷️
378,000 تومان
قیمت اصلی: ۳۷۸٬۰۰۰ تومان بود.
298,000 تومان
قیمت فعلی: ۲۹۸٬۰۰۰ تومان.
📥 دانلود نسخهی اصلی کتاب به زبان انگلیسی(PDF)
🧠 به همراه ترجمهی فارسی با هوش مصنوعی
🔗 مشاهده جزئیات
دانلود مستقیم PDF
ارسال فایل به ایمیل
پشتیبانی ۲۴ ساعته
توضیحات
معرفی کتاب چهار نسل یکپارچهسازی موجودیت ۲۰۲۲
تطابقدهی هویتها (Entity Resolution یا ER) در هستهی اصلی یکپارچهسازی و پاکسازی دادهها قرار دارد، و از این رو، حجم عمدهای از تحقیقات به بررسی راههای بهبود کارایی و سرعت آن میپردازد. روشهای اولیهی ER عمدتاً «درستی» (Veracity) را در زمینهی دادههای ساختیافته (رابطهای) هدف قرار میدهند که توسط یک شمای با کیفیت و معنای مشخص توصیف میشوند. برای دستیابی به کارایی بالا، این روشها از دانشِ schema، خبرگان و/یا دانش خارجی بهره میبرند. بخشی از این روشها برای پرداختن به «حجم» (Volume)، با پردازش مجموعههای دادهی بزرگ از طریق رویکردهای چند هستهای یا موازیسازی گسترده، مانند الگوی MapReduce، توسعه یافتهاند. با این حال، این رویکردهای اولیهی مبتنی بر schema در مورد دادههای وب، که مملو از اطلاعات حجیم، پرنویز، نیمهساختیافته و بسیار ناهمگن هستند، کاربرد ندارند. برای مقابله با چالش اضافیِ «تنوع» (Variety)، پژوهشهای اخیر در زمینهی ER یک عملکرد جدید و تا حدی آگاه به schema را اتخاذ کردهاند که بر مقیاسپذیری و مقاومت در برابر نویز تأکید دارد. یک مسیر دیگر از تحقیقات کنونی بر چالش اضافیِ «سرعت» (Velocity) متمرکز است و هدف آن پردازش مجموعههای دادهای با حجم دائماً در حال افزایش است. با این حال، جدیدترین پژوهشها از پیشرفتهای چشمگیر در یادگیری عمیق و برونسپاری جمعی (Crowdsourcing) بهره میبرند و دانش خارجی را برای بهبود قابل توجه روشهای موجود به کار میگیرند.
این درسنامهی ترکیبی، روشهای ER را بر اساس چالشهای مطرح شده توسط این چهار V، به چهار نسل تقسیم میکند. برای هر نسل، گردش کار مربوط به ER را ترسیم میکنیم، روشهای پیشرفته در هر مرحله از گردش کار را مورد بحث قرار میدهیم و مسیرهای تحقیقاتی فعلی را ارائه میدهیم. بحث در مورد این روشها، دیدگاه تاریخی را در نظر میگیرد و تکامل روشها را در طول زمان به همراه شباهتها و تفاوتهای آنها توضیح میدهد. این درسنامه همچنین ابزارها و مجموعهدادههای معیار موجود ER را مورد بحث قرار میدهد که به کاربران متخصص و همچنین کاربران مبتدی اجازه میدهد از راهکارهای موجود استفاده کنند.
فهرست کتاب:
۱. روی جلد
۲. صفحه حق تکثیر
۳. صفحه عنوان
۴. فهرست مطالب
۵. پیشگفتار
۶. تقدیر و تشکر
۷. یکتا سازی موجودیت: گذشته، حال و آینده
۸. مقدمات
۹. نسل اول: پرداختن به صحت
۱۰. نسل دوم: پرداختن به حجم نیز
۱۱. نسل سوم: پرداختن به تنوع نیز
۱۲. نسل چهارم: پرداختن به سرعت نیز
۱۳. استفاده از دانش خارجی
۱۴. منابع برای یکتاسازی موجودیت
۱۵. مسیرهای احتمالی برای کارهای آتی
۱۶. کتابنامه
۱۷. شرح حال نویسندگان
توضیحات(انگلیسی)
Entity Resolution (ER) lies at the core of data integration and cleaning and, thus, a bulk of the research examines ways for improving its effectiveness and time efficiency. The initial ER methods primarily target Veracity in the context of structured (relational) data that are described by a schema of well-known quality and meaning. To achieve high effectiveness, they leverage schema, expert, and/or external knowledge. Part of these methods are extended to address Volume, processing large datasets through multi-core or massive parallelization approaches, such as the MapReduce paradigm. However, these early schema-based approaches are inapplicable to Web Data, which abound in voluminous, noisy, semi-structured, and highly heterogeneous information. To address the additional challenge of Variety, recent works on ER adopt a novel, loosely schema-aware functionality that emphasizes scalability and robustness to noise. Another line of present research focuses on the additional challenge ofVelocity, aiming to process data collections of a continuously increasing volume. The latest works, though, take advantage of the significant breakthroughs in Deep Learning and Crowdsourcing, incorporating external knowledge to enhance the existing words to a significant extent. This synthesis lecture organizes ER methods into four generations based on the challenges posed by these four Vs. For each generation, we outline the corresponding ER workflow, discuss the state-of-the-art methods per workflow step, and present current research directions. The discussion of these methods takes into account a historical perspective, explaining the evolution of the methods over time along with their similarities and differences. The lecture also discusses the available ER tools and benchmark datasets that allow expert as well as novice users to make use of the available solutions.
Table of Contents
1. Cover
2. Copyright Page
3. Title Page
4. Contents
5. Preface
6. Acknowledgements
7. Entity Resolution: Past, Present, and Yet-to-Come
8. Preliminaries
9. Generation 1: Addressing Veracity
10. Generation 2: Also Addressing Volume
11. Generation 3: Also Addressing Variety
12. Generation 4: Also Addressing Velocity
13. Leveraging External Knowledge
14. Resources for Entity Resolution
15. Possible Directions for Future Work
16. Bibliography
17. Authors' Biographies
دیگران دریافت کردهاند
چهار سخنرانی که هر رهبری باید بداند ۲۰۱۹
The Four Speeches Every Leader Has to Know 2019
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
چهار رکن مدیریت پرتفولیو: چابکی سازمانی، استراتژی، ریسک و منابع ۲۰۱۸
The Four Pillars of Portfolio Management: Organizational Agility, Strategy, Risk, and Resources 2018
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
چهار دوراهی مدیرعامل: تسلط بر لحظات سرنوشت ساز در هر شغل مدیریتی ۲۰۱۷
The Four Dilemmas of the CEO: Mastering the make-or-break moments in every executive’s career 2017
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
چهار کتاب معماری ۲۰۱۳
The Four Books of Architecture 2013
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
چهار مرحله مدیریت بحران بسیار موثر: چگونه رسانه ها را در عصر دیجیتال مدیریت کنیم (۲۰۱۱)
The Four Stages of Highly Effective Crisis Management: How to Manage the Media in the Digital Age 2011
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
چهار گفتگو: ارتباطات روزانه که نتیجهبخش است ۲۰۰۹
The Four Conversations: Daily Communication That Gets Results 2009
🏷️ 200,000 تومان قیمت اصلی: 200,000 تومان بود.129,000 تومانقیمت فعلی: 129,000 تومان.
✨ ضمانت تجربه خوب مطالعه
بازگشت کامل وجه
در صورت مشکل، مبلغ پرداختی بازگردانده می شود.
دانلود پرسرعت
دانلود فایل کتاب با سرعت بالا
ارسال فایل به ایمیل
دانلود مستقیم به همراه ارسال فایل به ایمیل.
پشتیبانی ۲۴ ساعته
با چت آنلاین و پیامرسان ها پاسخگو هستیم.
ضمانت کیفیت کتاب
کتاب ها را از منابع معتیر انتخاب می کنیم.
