Я тут, как не говорится, облагоразумился на плоховатенько и решил запилить небольшое исследование про популярность постов в блогосфере. Точнее сказать, исследовал я только ЖЖ и только топ. За базис я принял такие гипотезы:
- Анамнез никогда не дает точных результатов. Про это ещё доктор Хаус говорил, мол, все лгут. Вообще, на проведение исследования меня сподвиг недавний опрос, размещенный в этом ЖЖ и два моих собственных поста после него - на темы, которые в опросе лидировали по популярности. Эти посты получили сравнительно небольшую реакцию, из чего я сделал предположение, что метод опросов не работает в том виде, в котором я пытался его применять.
- Популярность поста, выражающаяся в реакции на него, сведенной к количеству комментариев, зависит от темы этого поста.
- Популярность различных тем может меняться со временем. Точнее сказать, у нас нет доказательств обратного, а потому, мы не можем утверждать, что результаты, полученные сейчас, продолжат быть верными, скажем, через полгода.
Второй пункт был предположением в чистом виде: мне казалось, что это может быть так. Исследование должно было показать, прав ли я. Если да, я должен был обнаружить корреляцию между темой поста и его "успешностью". За корреляцией я решил пойти в топ блогеров по версии ЖЖ. Я понимал, что он весьма отдаленно показывает реальную популярность блогера, однако инструмента лучше для этой части исследования у меня не нашлось. Кроме того, эта выборка позволяла показать относительную популярность тем постов именно в топе ЖЖ, который читает довольно значительная часть ЖЖ-аудитории.
Для начала я взял 10 блогеров, занимающих наиболее высокие места в рейтинге и не препятствующих комментированию у себя в журнале. Последнее условие было важным, т.к. если комментариев нет, или они уходят на премодерацию, оценить реальный отклик на пост невозможно. Топ 9 в целом удовлетворял этим условиям, 10-й номер пришлось сменить 11-м.
Далее я взял у каждого из них по 20 постов, наиболее свежих, чтобы иметь актуальную информацию (условие 3), но удовлетворяющих следующим дополнительным условиям:
- В посте разрешено свободное комментирование. Пришлось выкинуть несколько постов у tema, потому что он периодически закрывает комментирование некоторых записей. Кажется, ещё были исключения, сейчас уже не помню. В любом случае, было взято по 20 постов у каждого из исследуемых авторов.
- Пост должен быть старше суток на момент забора информации. Это для того, чтобы исключить очевидные искажения результатов.
Исследование, которое я задумал, нельзя было автоматизировать в наиболее трудоемкой его части - сборе информации. Машина может попробовать определить тематику поста, однако сделает это очень неточно. Поэтому я вручную вбил в таблицу темы и количества каментов для 200 выбранных постов. Что касается тем, я, как мог, старался их обобщить. Например, я не указывал тему "коты" или "собаки" сведя её к общей - "животные". Кроме того, любой пост, призывающий читателей делать нечто активное в комментариях к нему, я относил к теме "движуха", подразумевая некое внутрижурнальное мероприятие, устроенное блогером для своих читателей. И не важно, какого рода. К рекламе я отнес любые посты промо-характера, независимо от их оплаченности. Т.е. пост, посвященный бесплатному пиару кого-то или чего-то тоже попадал в эту категорию.
В общей сложности вышло 30 тем. Некоторые встречались всего один раз, но тут я решил не предаваться перфекционизму и оставить всё, как есть. Итак, 10 блогеров вместе написали 200 постов на 30 тем. Для начала мне нужно было проверить гипотезу 2: наличие корреляции. Чтобы это сделать, я высчитал среднее количество каментов для каждого блогера (в рамках исследуемых постов), а затем их среднее количество, опять же для отдельного блогера, но уже внутри конкретной темы. Таким образом, были выявлены гипотетически успешные и неуспешные темы для каждого из авторов в отдельности.
Следующим шагом я решил посчитать, сколько раз одна и та же тема становилась успешной или неуспешной у разных блогеров. Учет велся поблогерно, т.е. если тема "проза" у какого-то автора, в среднем, была успешна, я ставил ей единичку в левый столбец. Неуспешна - в правый. Далее, предстояло отфильтровать результаты, оставив лишь значимые данные. Из 30 тем 12 имели только одно вхождение (т.е. на эту тему писал лишь один блогер из исследуемых, не важно, сколько раз), а потому были отброшены, как источник недостоверных результатов. Из оставшихся 18 я выбрал те, которые имели существенный перевес в сторону успешности, либо неуспешности. Конкретно, если я объявлял пост успешным, значит высчитанная мной и независящая (пока предположительно) от блогера вероятность успешности должна была составлять не менее 70%. То же самое касалось неуспешности.
Подобную корреляцию продемонстрировали 13 тем из 18. Учитывая фрагментарный характер исследования, я счел гипотезу 2 доказанной. В ЖЖ, по крайней мере в его топе, были темы, которые на дистанции получали больше каментов, чем другие. И были темы, получавшие, в среднем, меньше каментов. Прошу учесть, что успешность поста, являющаяся одним из промежуточных результатов исследования, считалась в рамках отдельного блогера. Т.е., чтобы считаться успешным, пост должен был получить больше каментов, чем в среднем получают посты именно у этого автора.
Результат исследования вы можете видеть на иллюстрации к посту. 3 темы продемонстрировали устойчивую популярность. Это "движуха", что логично, т.к. если мотивировать людей оставлять каменты, они оставят их больше, чем если этого не делать. С другой стороны, делать это постоянно, или даже чересчур часто тоже невозможно - популярных блогеров, занимающихся только "устройством у себя движухи" в топе нет. Также в топе ЖЖ отчетливо популярны посты про отношения - к ним я отнес всё, что касалось обсуждения моментов и случаев из личной жизни, но не принадлежало явным образом к сексуальной тематике. И ещё читатели ЖЖ любят прозу. То есть, если вы способны писать небольшие рассказы и хотите стать популярным блогером - стоит этим заняться. У некоторых авторов с самого верха рейтинга всё получилось именно так.
Ну и ещё я выявил десяток устойчиво непопулярных тем. Строго говоря, нельзя утверждать, что они именно непопулярны. Вполне возможно, что аудитория ЖЖ очень любит читать, например, про секс, но не очень любит комментировать такие посты. Самую устойчивую непопулярность продемонстрировала реклама, что, в общем-то логично. Рекламный пост не может работать на увеличение популярности, он лишь эксплуатирует полученную ранее.
Оригинал исследования доступен в гуглодоке по
этой ссылке. Там не указаны конкретные посты, послужившие материалом для исследования, однако, при желании, можно легко обнаружить, откуда взята информация, ориентируюясь на количество комментариев к каждому из них. Не думаю, что именно эти числа могли сильно измениться с вечера воскресенья, когда я делал забор информации.
Вот такой фигней иногда занимаются любопытные инопланетяне. Если что, готов ответить на любые вопросы. Как обычно, собственно.