Всё, автоматически сгенерились графики для всех танков
по этой методике. Больше 100 боёв на танке считаются как 100 боёв, если меньше, считается что игрок танк до конца не освоил и его влияние меньше пропорционально.
Картошкиных данных у меня нет, пришлось работать со временем создания аккаунта.
4 архива
1. Данные с начала времён.
http://ivanerr.ru/lt/images/the_beginning.zipВключают себя опытных и неопытных игроков (не путать со скиллом, скиллованый может быть неопытным и опытным).
Для старых танков как правило показывают неактуальную информацию (КВ-220, ИС-7).
Для современных танков показывают ОЧЕНЬ АКТУАЛЬНУЮ информацию (борщик, вафля, Т57хеви и прочих).
2. Данные с аккаунтов, созданных в 2012 и 2013 годах.
http://ivanerr.ru/lt/images/two_years.zipВключает в себя опытных и неопытных игроков.
Можно проследить за нерфом некоторых танков сравним с третьим архивом:
Синяя линия - общий процент побед, зелёная - на танке.
Т-50-2:
МТ-25
Луч добра отправляется в сторону принявшего решения забрать весёлый танк и заменить его говнищем.
Или убедиться что некоторые танки не нерфились:
E-75 старенький
E-75 новенький
Или убедиться что Маус как был уныл так и остался.
3. Данные с аккаунтов созданных до 1 января 2012 года. Включает как правило только опытных игроков.
Для танков которые сильно нерфились-апались работает хреново.
Для совеременных работает хорошо.
http://ivanerr.ru/lt/images/from_the_beginning_to_two_years.zip 4. Данные с аккаунтов, созданных в 2013 году. Как правило это неопытные игроки. Мало данных, многие графики кривые, после 56% можно не обращать внимания.
http://ivanerr.ru/lt/images/last_year.zip Теперь думаю строить то же самое, но не в зависимости от общего процента побед, а от РЭ wot-news.com
Вывод по этому методу:
Метод двух графиков без всяких вопросов хорош.
Не даром профессиональным статистикам часто не нужны всякие стандартные ошибки, проверка null hypothesis и тому подобное.
Им порой достаточно взглянуть на график, чтобы всё понять.
Однако, вопрос в том, какие данные мы скармливаем эти графикам.
Как стало очевидно после обработки данных, в WoT решает не только время реакции, пространственное мышление, но и опыт.
Другими словами, итоговый процент побед складывается как из опыта, так и из изначальных способностей человека.
Поэтому танки, которые прокачиваются первыми, в момент, когда у игрока отсутствует опыт, имеют худшие показатели чем те, которые прокачиваются опытными игроками.
Таким образом, часть предложенынх графиков не могут достоверны, ибо некоторые танки прокачиваются в первую очередь:
Так как большинство прокачивает ИС-7 первым, без достаточного опыта игры, процент побед на нём сильно хуже прочих танков 10 уровня.
То же самое можно отнести к популярным танкам типа БТ-7.
Для объективной оценки танка нужно составлять данные на основе равной пропорции - брать равные части игроков, игравших на танке не обладая достаточным опытом и игроков, которые набили свою стату на танке уже обладая опытом. Если пропорции крайне не равны, то получится график типа ИС-7. Ещё раз напомню, речь идёт не о скилле игрока, а его опыте.
Получить равную пропорцию опытных и неопытных игроков для анализа из открытых источников возможно, но крайне трудно, но они есть у КВГ.
Они могут посмотреть в какой момент своего пути игроком была набита стата на танке.
Возможно, wot-news в состоянии будет это сделать. Разумеется, данные должны быть после последнего патча, даже если танк не менялся - изменения других машин влияют на баланс танка.
Если такой возможности нет, то для сравнения одноуровневых танков можно брать данные только неопытных игрков - выбирать игроков у которых нет много танков, которые выше по уровню чем анализируемый танк. Таким образом эти танки гарантировано оказываются в равных условиях. У меня база ограничена 570000 игроков, что мало для такой узкой выборки.
Подытожив скажу, что этот метод радикально более правилен, чем метод "среднего процента побед на Маусе" от Злобного
КДПВ:
Видео из этого танка:
Click to view