Есть у меня хобби - делать мини-исследования разных направлений. Не смог пройти и мимо Евромайдана - для дальнейшего изучения начал собирать все публичные твиты, в которых упомянуты слова 'євромайдан,евромайдан,euromaidan'. Сбор идет круглосуточно, так что выборка относительно репрезентативна. Конечно не идеал - несколько раз пропадал инет, иногда ноут надо перегружать и т.д..., но, по сути, результат сбора близок к идеальному в условиях домашней машины и использования открытого АПИ.
Об окончании майдана пока говорить тяжело, поэтому за нормальное изучение пока и не берусь, но хочу поделиться некой текущей статистикой, местами достаточно интересной. Она, с некоторыми допущениями, описывает тематическую твитер-активность с 09.00 1.12.2014 по вечер 07.02.2014. Если помните именно ночью 11-го начались столкновения на Грушевского, а в 9.00 силовики предприняли попытку штурма КГГА.
Итак, за это время было собрано более 1520000 твитов, которые (ре)твитнуло чуть больше 169000 уникальных пользователей. Интересно, что распределение к-ва твитов из расчета на 1 человека очень неравномерное:
- сделан 1 (ре)твит - 94806;
- 2-10 - 59921;
- 11-100 - 12183;
- 101-1000 - 2067;
- 1001-2000 - 128;
- 2001-3000 - 29;
- 3001-4000 - 13;
- более 4000(!!!) - 6 пользователей.
А теперь самое интересное - я посчитал сколько рассчитал количество (ре)твитов в час и получил график твитер-активности:
Первым делом я попробовал поискать взаимосвязь между определенными событиями и резкими всплесками твитер-активности. Временная хронология событий Евромайдана взята с сайта
http://news.liga.net, на график нанесены наиболее важные, с моей точки зрения, новости, которые могли привести к всплескам. Правда, сложилось личное впечатление, что размер пиков не совсем отвечает важности новостей, да и резкие короткие скачки выглядят непонятно. Но об этом в следующем посте)