Доброго времени суток! Проблемка с пакетом randomForest. Для начала, я разделил датасет на обучающую и тестовую выборку, но ошибка прогноза на тестовой выборке оказалась намного выше, чем на обучающей - то есть модель переобучена :( Как я понимаю, причина в том, что во-первых - маленькие группы, во-вторых - пердикторов больше, чем наблюдений...
(
Read more... )