Набросал кое-какие мысли о различных рейтингах, составляемых на основе оценок - на всевозможных музыкальных, кино- и прочих сервисах и не только:
1) В идеальном случае, согласно центральной предельной теореме, распределение оценок пользователя, основанное на множестве разнородных, чаще всего независимых (и даже не обязательно осознаваемых) факторов, стремится к нормальному. Та самая
гауссиана. На практике, впрочем, ввиду применения дискретной шкалы оценок получается "чуровиана" - с пиками на целых/круглых значениях и опционально с "задранными хвостами" с обеих сторон из-за конечности диапазона оценок (так называемый краевой эффект).
2) У разных пользователей есть привычки, предрасположенности к разным шкалам: например, 1..5, 0..5, 1..10, 0..10, 0..12, 0..100, -1..1, -3..3, -5..5, -10..10, да как угодно. И к разной детальности, шагам (1 / 0,5 / 0,1 и т.д.), в связи с чем "дружественным шагом" будет кастомизация настроек (каждый выбирает минимум, максимум и шаг как ему удобнее); для дальнейших подсчетов шкалы автоматически нормируются - допустим, до диапазона 0..1, в целом все равно, особенно учитывая следующий шаг.
3) Однако помимо привычки к разным шкалам, существуют привычки и к разным распределениям оценок - а именно к условной "средней" оценке и их кучности (дисперсии), которые могут у разных пользователей отличаться в разы. Кто-то принципиально не ставит низкие оценки, кто-то - наоборот, высокие, кто-то пытается контролировать равномерность с переменным успехом. В связи с этим для уравновешивания вклада каждой оценки в общий рейтинг необходима стандартизация (по канонам статистической обработки измерений) - набор значений сдвигается и растягивается так, чтобы приведенное среднее арифметическое равнялось 0, а стандартное (среднеквадратичное, СКО) отклонение - 1.
4) Наборы оценок стандартизированы, нужно выводить среднее. Арифметическое? Не совсем, пожалуй, средневзвешенное: по разным причинам имеет смысл учитывать активность пользователя (то есть общее количество проставленных оценок). И вновь статистические методы подсказывают, какие веса взять: известно, что точность измерения случайной величины (среднеквадратичная ошибка) пропорциональна квадратному корню из количества замеров. В данном случае - вес участника приравнивается к корню из числа проставленных оценок. На выходе получаем интегральный рейтинг со средним значением в нуле, а вот дисперсия может отклоняться от единицы из-за "ненормальности" - но чем больше оценок, тем ближе к ней.
5) Ну а помимо рейтинга (кстати, можно в дополнение к рейтингу рассчитывать и СКО, меру поляризации мнений) второй немаловажный показатель - индекс популярности. Тут всё просто - количество оценок делить на количество пользователей, которые вообще проставили хотя бы одну оценку. Тут, впрочем, тоже можно применить веса из предыдущего пункта.
Не удивлюсь, если эти принципы слово в слово уже где-то действуют.