Mathematik, Informatik und Statistik - Open Access LMU - Teil 02/03
Ludwig-Maximilians-Universität München
250 episodes
6 months ago
Die Universitätsbibliothek (UB) verfügt über ein umfangreiches Archiv an elektronischen Medien, das von Volltextsammlungen über Zeitungsarchive, Wörterbücher und Enzyklopädien bis hin zu ausführlichen Bibliographien und mehr als 1000 Datenbanken reicht. Auf iTunes U stellt die UB unter anderem eine Auswahl an elektronischen Publikationen der Wissenschaftlerinnen und Wissenschaftler an der LMU bereit. (Dies ist der 2. von 3 Teilen der Sammlung 'Mathematik, Informatik und Statistik - Open Access LMU'.)
All content for Mathematik, Informatik und Statistik - Open Access LMU - Teil 02/03 is the property of Ludwig-Maximilians-Universität München and is served directly from their servers
with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Die Universitätsbibliothek (UB) verfügt über ein umfangreiches Archiv an elektronischen Medien, das von Volltextsammlungen über Zeitungsarchive, Wörterbücher und Enzyklopädien bis hin zu ausführlichen Bibliographien und mehr als 1000 Datenbanken reicht. Auf iTunes U stellt die UB unter anderem eine Auswahl an elektronischen Publikationen der Wissenschaftlerinnen und Wissenschaftler an der LMU bereit. (Dies ist der 2. von 3 Teilen der Sammlung 'Mathematik, Informatik und Statistik - Open Access LMU'.)
Variable selection with Random Forests for missing data
Mathematik, Informatik und Statistik - Open Access LMU - Teil 02/03
12 years ago
Variable selection with Random Forests for missing data
Variable selection has been suggested for Random Forests to improve their efficiency of data prediction and interpretation. However, its basic element, i.e. variable importance measures, can not be computed straightforward when there is missing data. Therefore an extensive simulation study has been conducted to explore possible solutions, i.e. multiple imputation, complete case analysis and a newly suggested importance measure for several missing data generating processes. The ability to distinguish relevant from non-relevant variables has been investigated for these procedures in combination with two popular variable selection methods. Findings and recommendations: Complete case analysis should not be applied as it lead to inaccurate variable selection and models with the worst prediction accuracy. Multiple imputation is a good means to select variables that would be of relevance in fully observed data. It produced the best prediction accuracy. By contrast, the application of the new importance measure causes a selection of variables that reflects the actual data situation, i.e. that takes the occurrence of missing values into account. It's error was only negligible worse compared to imputation.
Mathematik, Informatik und Statistik - Open Access LMU - Teil 02/03
Die Universitätsbibliothek (UB) verfügt über ein umfangreiches Archiv an elektronischen Medien, das von Volltextsammlungen über Zeitungsarchive, Wörterbücher und Enzyklopädien bis hin zu ausführlichen Bibliographien und mehr als 1000 Datenbanken reicht. Auf iTunes U stellt die UB unter anderem eine Auswahl an elektronischen Publikationen der Wissenschaftlerinnen und Wissenschaftler an der LMU bereit. (Dies ist der 2. von 3 Teilen der Sammlung 'Mathematik, Informatik und Statistik - Open Access LMU'.)