Statistical Methods for Imbalanced Data in Ecological and Biological Studies 2019
89,000 تومان
دانلود کتاب پزشکی روش های آماری داده های نامتعادل در مطالعات زیست محیطی و بیولوژیکی
نویسنده |
Osamu Komori, Shinto Eguchi |
---|---|
انتشارات |
Springer Japan |
زبان |
English |
تاریخ انتشار |
2019-07-15 |
تعداد صفحهها |
59 |
نوع فایل |
|
حجم |
1 Mb |
سال انتشار |
2019 |
امکان مطالعه در اپلیکیشن کالیبو
توضیحات
این کتاب رویکردی تازه و جدید را ارائه میکند، زیرا مروری جامع و بهروز از مشکلات دشوار ناشی از دادههای نامتعادل در پیشبینی و طبقهبندی ارائه میکند و بسیاری از روشهای آماری مدرن را برای مقابله با این مشکلات ارائه میدهد. این کتاب ویژگی عدم تعادل داده ها را از دو دیدگاه مورد بحث قرار می دهد. اولین مورد عدم تعادل کمی است، به این معنی که حجم نمونه در یک جامعه به طور قابل توجهی بزرگتر از حجم نمونه در جامعه دیگر است. این شامل داده های حضور تنها به عنوان یک مورد شدید است، که در آن وجود یک گونه تایید می شود، در حالی که اطلاعات مربوط به عدم وجود آن نامشخص است، که به ویژه در بوم شناسی در پیش بینی توزیع زیستگاه رایج است. دوم عدم تعادل کیفی است، به این معنی که توزیع داده ها برای یک جمعیت به خوبی قابل شناسایی است در حالی که توزیع دیگر یک ویژگی بسیار ناهمگن را نشان می دهد. یک مورد معمولی وجود موارد پرت است که معمولاً در دادههای بیان ژن مشاهده میشوند، و مورد دیگر ویژگیهای ناهمگنی است که اغلب در گروهی از موارد در مطالعات مورد-شاهدی مشاهده میشود. توسعه مدل رگرسیون لجستیک، maxent و AdaBoost برای دادههای نامتعادل مورد بحث قرار گرفتهاند که چارچوب جدیدی برای بهبود پیشبینی، طبقهبندی و عملکرد انتخاب متغیر ارائه میکند. توابع وزن معرفی شده در روش ها نقش مهمی در کاهش عدم تعادل داده ایفا می کنند. این کتاب همچنین دیدگاه جدیدی را در مورد این مشکل معرفی می کند و برخی از کاربردهای روش های آماری جدید توسعه یافته را برای مجموعه داده های واقعی نشان می دهد.
توضیحات(انگلیسی)
This book presents a fresh, new approach in that it provides a comprehensive recent review of challenging problems caused by imbalanced data in prediction and classification, and also in that it introduces several of the latest statistical methods of dealing with these problems. The book discusses the property of the imbalance of data from two points of view. The first is quantitative imbalance, meaning that the sample size in one population highly outnumbers that in another population. It includes presence-only data as an extreme case, where the presence of a species is confirmed, whereas the information on its absence is uncertain, which is especially common in ecology in predicting habitat distribution. The second is qualitative imbalance, meaning that the data distribution of one population can be well specified whereas that of the other one shows a highly heterogeneous property. A typical case is the existence of outliers commonly observed in gene expression data, and another is heterogeneous characteristics often observed in a case group in case-control studies. The extension of the logistic regression model, maxent, and AdaBoost for imbalanced data is discussed, providing a new framework for improvement of prediction, classification, and performance of variable selection. Weights functions introduced in the methods play an important role in alleviating the imbalance of data. This book also furnishes a new perspective on these problem and shows some applications of the recently developed statistical methods to real data sets.
شناسه محصول:
2410989
دسته: آمار زیستی, پزشکی, عمومی
محصولات مرتبط
Basics of Bioinformatics: Lecture Notes of the Graduate Summer School on Bioinformatics of China 2013
89,000 تومان
Modeling Infectious Disease Parameters Based on Serological and Social Contact Data: A Modern Statistical Perspective 2012
89,000 تومان
New Developments in Statistical Modeling, Inference and Application: Selected Papers from the 2014 ICSA/KISS Joint Applied Statistics Symposium in Portland, OR 2016
89,000 تومان