Google Books Ngram и вопросы изучения литературных репутаций

Mar 06, 2011 22:13

 Осваивая этот отличный девайс, занялся составлением диаграмм по частотности упоминаний сочинителей
в интервале 1840-1860. Занятные картинки получаются.
К примеру, вот статистика упоминаний Тургенева, Достоевского, Островского и Писемского за указанный промежуток.
Отлично видно, как постарались Григорьев и компания в раскручивании нового гения
(Жалко, ( Read more... )

Leave a comment

Comments 10

kirillkirill March 6 2011, 20:27:53 UTC
печально, что Тургеневу помогает приписывание в конец твердого знака, а вот остальным троим и с точкой - хоть кириллическое, хоть латинское - по барабану

Reply

alex_vdo March 6 2011, 20:34:37 UTC
да, поэкспериментировав сейчас, понимаю, что любой результат поиска будет относительным. Понятно также, что поиск по генитиву дает совершенно иную картину

Reply


ka_o March 6 2011, 20:42:08 UTC
Была полемика в ФБ несколько месяцев назад, с участием аж корпусных лингвистов, не видел? Пик упоминаний слова Путин приходится на 1840-е, что ли, годы. Признано фигней, в общем ))

Reply

alex_vdo March 6 2011, 20:47:42 UTC
неа, не видал. Спасибо за инфу: я, чайник, только сегодня начал пользоваться.

Reply


r_l March 6 2011, 21:02:58 UTC
Там очень слабо и криво распознанные тексты. Так что близко к бессмысленности, увы, пока.

Reply

alex_vdo March 6 2011, 21:04:07 UTC
ага, жаль, что еще одна осечка

Reply

r_l March 6 2011, 21:06:00 UTC
Но со временем все заработает.

Reply

irina_gattara March 6 2011, 21:55:38 UTC
а на моих примерах картинка очень близка к действительности. С пиками в районе смерти, со взлетами после начала активного распространения в самиздате, ну и т.д.

Reply


r_l March 6 2011, 21:04:55 UTC
Вот тут хорошо видно, как меняется картинка просто с переходом на новую орфографию. Со старой машинка вовсе не справляется.

Reply

alex_vdo March 6 2011, 21:07:17 UTC
впечатляет

Reply


Leave a comment

Up