روش‌های آماری برای تحلیل حاشیه‌نویسی ۲۰۲۲
Statistical Methods for Annotation Analysis 2022

دانلود کتاب روش‌های آماری برای تحلیل حاشیه‌نویسی ۲۰۲۲ (Statistical Methods for Annotation Analysis 2022) با لینک مستقیم و فرمت pdf (پی دی اف) و ترجمه فارسی

نویسنده

Silviu Paun, Ron Artstein, Massimo Poesio

voucher (1)

۳۰ هزار تومان تخفیف با کد «OFF30» برای اولین خرید

سال انتشار

2022

زبان

English

تعداد صفحه‌ها

197

نوع فایل

pdf

حجم

8.6 MB

🏷️ قیمت اصلی: 200,000 تومان بود.قیمت فعلی: 129,000 تومان.

🏷️ قیمت اصلی: ۳۷۸٬۰۰۰ تومان بود. قیمت فعلی: ۲۹۸٬۰۰۰ تومان.

📥 دانلود نسخه‌ی اصلی کتاب به زبان انگلیسی(PDF)
🧠 به همراه ترجمه‌ی فارسی با هوش مصنوعی 🔗 مشاهده جزئیات

پیش‌خرید با تحویل فوری(⚡️) | فایل کتاب حداکثر تا ۳۰ دقیقه(🕒) پس از ثبت سفارش آماده دانلود خواهد بود.

دانلود مستقیم PDF

ارسال فایل به ایمیل

پشتیبانی ۲۴ ساعته

توضیحات

معرفی کتاب روش‌های آماری برای تحلیل حاشیه‌نویسی ۲۰۲۲

برچسب‌گذاری داده‌ها یکی از اساسی‌ترین فعالیت‌ها در علم است و دهه‌هاست که زیربنای عملکردهای مختلف، به‌ویژه در پزشکی، بوده است. همچنین، از زمان توسعه‌ی پیکره‌ی Brown، این فعالیت در تحقیقات زبان‌شناسی پیکره‌ای نیز نقش مهمی داشته است. با تغییر رویکرد به سمت یادگیری ماشین در هوش مصنوعی (AI)، ایجاد مجموعه‌داده‌هایی که برای آموزش و ارزیابی سیستم‌های هوش مصنوعی استفاده می‌شوند، که در هوش مصنوعی به عنوان پیکره نیز شناخته می‌شوند، به یک فعالیت اصلی در این حوزه تبدیل شده است. مجموعه‌داده‌های اولیه‌ی هوش مصنوعی به‌طور موردی برای حل مشکلات خاص ایجاد می‌شدند. با ایجاد مجموعه‌داده‌های بزرگ‌تر و قابل استفاده‌ی مجدد که نیازمند سرمایه‌گذاری بیشتری بودند، نیاز به یک رویکرد سیستماتیک‌تر برای ایجاد مجموعه‌داده‌ها به منظور اطمینان از افزایش کیفیت، به وجود آمد. طیف وسیعی از روش‌های آماری، اغلب (اما نه منحصراً) از علوم پزشکی، برای اطمینان از اینکه برچسب‌های استفاده‌شده ذهنی نیستند، یا برای انتخاب بین برچسب‌های مختلف ارائه‌شده توسط کدگذاران، اتخاذ شدند. در حال حاضر، تنوع گسترده‌ای از این روش‌ها به طور منظم مورد استفاده قرار می‌گیرد.

هدف این کتاب، ارائه مروری بر پرکاربردترین روش‌های آماری است که از عمل برچسب‌گذاری پشتیبانی می‌کنند. تا جایی که نویسندگان اطلاع دارند، این اولین کتابی است که تلاش می‌کند دو دسته‌ی گسترده‌تر از روش‌های مورد استفاده را پوشش دهد. دسته‌ی اول روش‌ها به توسعه‌ی طرح‌های برچسب‌گذاری و به ویژه اطمینان از این که چنین طرح‌هایی به گونه‌ای هستند که توافق کافی بین کدگذاران قابل مشاهده باشد، مربوط می‌شود. دسته‌ی دوم شامل روش‌هایی است که برای تجزیه و تحلیل خروجی کدگذاران پس از توافق بر سر طرح، توسعه یافته‌اند، به ویژه (اگرچه نه منحصراً) برای شناسایی محتمل‌ترین برچسب برای یک آیتم در میان برچسب‌های ارائه‌شده توسط کدگذاران.

تمرکز اصلی این کتاب بر پردازش زبان طبیعی، حوزه‌ای از هوش مصنوعی است که به توسعه‌ی مدل‌های تفسیر و تولید زبان اختصاص دارد، اما بسیاری (اگر نگوییم بیشتر) از روش‌های مورد بحث در اینجا، در سایر زمینه‌های هوش مصنوعی، یا در واقع، در سایر زمینه‌های علم داده نیز قابل استفاده هستند.


فهرست کتاب:

۱. روی جلد

۲. صفحه حقوق مولف

۳. صفحه عنوان

۴. تقدیم

۵. فهرست

۶. پیشگفتار

۷. سپاسگزاری

۸. مقدمه

۹. تحلیل توافق

۱۰. تحلیل و استفاده از حاشیه نویسی های جمعی

۱۱. کتابشناسی

۱۲. زندگینامه نویسندگان

توضیحات(انگلیسی)
Labelling data is one of the most fundamental activities in science, and has underpinned practice, particularly in medicine, for decades, as well as research in corpus linguistics since at least the development of the Brown corpus. With the shift towards Machine Learning in Artificial Intelligence (AI), the creation of datasets to be used for training and evaluating AI systems, also known in AI as corpora, has become a central activity in the field as well. Early AI datasets were created on an ad-hoc basis to tackle specific problems. As larger and more reusable datasets were created, requiring greater investment, the need for a more systematic approach to dataset creation arose to ensure increased quality. A range of statistical methods were adopted, often but not exclusively from the medical sciences, to ensure that the labels used were not subjective, or to choose among different labels provided by the coders. A wide variety of such methods is now in regular use. This book is meantto provide a survey of the most widely used among these statistical methods supporting annotation practice. As far as the authors know, this is the first book attempting to cover the two families of methods in wider use. The first family of methods is concerned with the development of labelling schemes and, in particular, ensuring that such schemes are such that sufficient agreement can be observed among the coders. The second family includes methods developed to analyze the output of coders once the scheme has been agreed upon, particularly although not exclusively to identify the most likely label for an item among those provided by the coders. The focus of this book is primarily on Natural Language Processing, the area of AI devoted to the development of models of language interpretation and production, but many if not most of the methods discussed here are also applicable to other areas of AI, or indeed, to other areas of Data Science.


Table of Contents

1. Cover

2. Copyright Page

3. Title Page

4. Dedication

5. Contents

6. Preface

7. Acknowledgements

8. Introduction

9. Analysing Agreement

10. Analysing and Using Crowd Annotations

11. Bibliography

12. Authors' Biographies

دیگران دریافت کرده‌اند

✨ ضمانت تجربه خوب مطالعه

بازگشت کامل وجه

در صورت مشکل، مبلغ پرداختی بازگردانده می شود.

دانلود پرسرعت

دانلود فایل کتاب با سرعت بالا

ارسال فایل به ایمیل

دانلود مستقیم به همراه ارسال فایل به ایمیل.

پشتیبانی ۲۴ ساعته

با چت آنلاین و پیام‌رسان ها پاسخگو هستیم.

ضمانت کیفیت کتاب

کتاب ها را از منابع معتیر انتخاب می کنیم.