Про вероятность выигрыша

Nov 12, 2015 22:17

Осторожно, математика.

Немного про мотивацию к задаче из предыдущего постаВсе знают, что у шахматистов бывают рейтинги в промежутке примерно между 1000 и 3000, но не все знают, что эти рейтинги означают. Рейтинг называется рейтингом Эло (Elo -- это фамилия, а не акроним) и вычисляется исходя из следующего предположения: если рейтинги двух ( Read more... )

Leave a comment

Comments 12

Ничья, порядок пересчёта bik_top November 12 2015, 21:41:24 UTC
> Ответ прост: ничью можно рассматривать как две половинки партии, в одной из которых выиграл первый, а в другой -- второй.

Не могу сказать, что прям сильно старался вникнуть в выкладки; но неочевидно: зависит ли рейтинг от порядка засчёта выигрыша или поражения?

Если мы засчитаем выигрыш первому (сильному) игроку, пересчитаем рейтинги, потом засчитаем победу второму (слабому) игроку, пересчитаем рейтинги с учётом первого пересчёта - изменится ли результирующая пара рейтингов, если сначала засчитать победу слабому над сильным, и после пересчёта - выигрыш сильного у слабого?

Reply

eterevsky November 12 2015, 21:48:38 UTC
В Ило -- да, зависит. В том что я описываю -- нет, не зависит, так как рейтинги вычисляются все разом, а не обновляются по результатам партий.

Reply

bik_top November 12 2015, 21:51:50 UTC
Ок.

(Вообще, он обычно «Эло», никогда не встречал написание «Ило».)

Reply

eterevsky November 12 2015, 21:53:26 UTC
Упс, сорри. Поленился посмотреть на стандартный перевод его имени. Сейчас поправлю в посте.

Reply


shurik_s November 12 2015, 23:39:17 UTC
Забавно, но пока я неспешно писал тебе комментарий про рейтинги в предыдущий пост, ты написал про них целый новый пост.

Мы с Сергеем как раз недавно подумали, что неплохо бы поиграться с рейтингами и сделать, что-то хорошее, благо наш фикс к TrueSkill в 2011 взяли на ICML.

Вообще, если тебе все это еще интересно, то можно попробовать поиграться вместе в этой песочнице. Чем больше будет заинтересованных участников, тем больше будет шанс что-то куда-то сдвинуть.

Reply

eterevsky November 13 2015, 06:57:44 UTC
Да, я за, конечно. Понятно, что тот метод вычисления рейтингов, который я описываю, не очень практичен -- запускать ML оптимизацию после каждой игры дорого. Но с помощью глобальной оптимизации можно достаточно точно определить форму той самой функции f, и придумать локальное правило обновления рейтинга.

Reply

shurik_s November 13 2015, 08:42:39 UTC
Ну в наше время не так уж и дорого. Люди из Microsoft создавшие Trueskill говорили, что у них очень быстро работает пересчет всей шахматной истории. И это 10 минут на P4 в 2008 году.
http://research.microsoft.com/pubs/74417/NIPS2007_0931.pdf
Тут их код на F#: http://blogs.msdn.com/b/dsyme/archive/2012/04/19/updated-version-of-quot-trueskill-through-time-quot-bayesian-inference-code.aspx

Reply

eterevsky November 13 2015, 11:06:59 UTC
У меня есть точно такой же код на питоне. Как я говорил, отлично справляется с миллионами партий.

Это скорее немного непрактично. Представь себе, что у тебя есть миллион игроков в онлайновую игру. И каждый сразу после окончания партии хочет видеть свой обновлённый рейтинг. Хотя, если обновлять рейтинги, скажем, раз в день, то проблемы нет.

Reply


Leave a comment

Up