Могли быть не фальсификации в смысле пририсовки несуществующих людей, а просто занесение списков, заранее поданых подневольными людьми. Правда против этой версии жестко говорит тот факт, что такие же скачки, просто меньшего размера, наблюдаются и в других инициативах.
И еще как то непонятно - Вы точки типа 0/0 чем заменяли? предыдущим значением?
Такие точки откидывались и не учитывались. Точки, где интервалы времени для соседних приростов разные, тоже откидывались. Средняя величина s_i равна 1 именно при условии откидывания точек 0/0. Если их заменять, например, на 0, то теоретическое среднее уже стало бы не 1.
> "Среднее этой величины в теории равно 1" - откуда вы взяли это?
Я численно посчитал, что для случайных величин d_1, d_2, которые должны получаться, если люди приходят независимо друг от друга в случайные моменты времени с постоянным средним потоком людей, получается 1. Точнее, 1 с точностью не хуже 0,001 -- а лучше тут и не требуется.
> Достаточно увеличить в 2 раза все значения di, чтобы значения si из этого списка также увеличились в 2 раза. Таким образом, при увеличении di и si тоже увеличивается, и вряд ли будет близко к единице для любых процессов.
Для процесса прихода людей независимо друг от друга разброс значений d_i пропорционален корню из среднего значения -- это известно из тервера. Так что если будет приходить в 2 раза больше, разброс должен увеличиться только в 1,4... раза. Что для любых процессов будет 1 я не говорю, только если приходят независимо друг от друга. Если за 10 минут будет приходить одинаковое число, показатель будет 0, а если всегда приходить будут парами (что эквиватентно удвоению d_i), будет 2. Но
( ... )
Да, и еще чисто технический вопрос: Что это за пологие места в обоих графиках (как зеленом, так и красном) перед значениями 30 и 60 по оси абсцисс? Я имею в виду "сглаженный" график si.
Вообще по оси X - какая единица измерения? Я имею в виду 30, 60 чего именно? Дней? То есть это что-то перед окончанием месяца, примерно, 29 апреля и 30 мая, причем на протяжении целого дня (если я правильно понимаю масштаб шкалы X).
Что бы это могло быть? Причем это график si, а не di. Чтобы переменная si не меняла значений в теч. дня, каждый интервал измерения di должна колебаться, например, 5,3,5,3,5,3... и так каждые 10 минут в теч. суток. Только в таком случае у di будет какое-то одинаковое значение (в случае этого примера - (5-3)^2/(5+3)=0.5)
Например, сайт перегружен. Или проблемы с инетом у тех, кто вытягивал данные. Для длинного периода без данных,-- например, какая-нибудь блокировка автоматического скачивания на сайте. Или скачивающий скпипт по какой-то причине завис/вылетел/комп сбросился.
Что там у них на самом деле было не знаю: данные не мои.
Comments 49
И еще как то непонятно - Вы точки типа 0/0 чем заменяли? предыдущим значением?
Reply
Reply
Reply
Я численно посчитал, что для случайных величин d_1, d_2, которые должны получаться, если люди приходят независимо друг от друга в случайные моменты времени с постоянным средним потоком людей, получается 1. Точнее, 1 с точностью не хуже 0,001 -- а лучше тут и не требуется.
> Достаточно увеличить в 2 раза все значения di, чтобы значения si из этого списка также увеличились в 2 раза. Таким образом, при увеличении di и si тоже увеличивается, и вряд ли будет близко к единице для любых процессов.
Для процесса прихода людей независимо друг от друга разброс значений d_i пропорционален корню из среднего значения -- это известно из тервера. Так что если будет приходить в 2 раза больше, разброс должен увеличиться только в 1,4... раза. Что для любых процессов будет 1 я не говорю, только если приходят независимо друг от друга. Если за 10 минут будет приходить одинаковое число, показатель будет 0, а если всегда приходить будут парами (что эквиватентно удвоению d_i), будет 2. Но ( ... )
Reply
Что это за пологие места в обоих графиках (как зеленом, так и красном) перед значениями 30 и 60 по оси абсцисс?
Я имею в виду "сглаженный" график si.
Вообще по оси X - какая единица измерения? Я имею в виду 30, 60 чего именно?
Дней? То есть это что-то перед окончанием месяца, примерно, 29 апреля и 30 мая, причем на протяжении целого дня (если я правильно понимаю масштаб шкалы X).
Что бы это могло быть? Причем это график si, а не di. Чтобы переменная si не меняла значений в теч. дня, каждый интервал измерения di должна колебаться, например, 5,3,5,3,5,3... и так каждые 10 минут в теч. суток. Только в таком случае у di будет какое-то одинаковое значение (в случае этого примера - (5-3)^2/(5+3)=0.5)
Reply
(The comment has been removed)
Reply
Что там у них на самом деле было не знаю: данные не мои.
Reply
(The comment has been removed)
Reply
Кроме того, сам критерий соответствия процессу пуассоновскому не сформулирован достаточно полно, как мне кажется.
Reply
Reply
а вот автор заглавного поста сомневается, что получится что-то дельное.
Reply
Leave a comment