Частотный словарь как зеркало русской души

Sep 21, 2019 16:40

Много лет назад, когда я был любопытным школьником-ботаном, на глаза мне попалась статья одного лингвиста, который с помощью орфографического словаря пытался проникнуть в глубинные тайны русской души. Сейчас расскажу, как он это делал.


Read more... )

Язык - дом бытия

Leave a comment

Comments 26

lj_frank_bot September 21 2019, 06:41:45 UTC
Здравствуйте!
Система категоризации Живого Журнала посчитала, что вашу запись можно отнести к категориям: Наука, Общество.
Если вы считаете, что система ошиблась - напишите об этом в ответе на этот комментарий. Ваша обратная связь поможет сделать систему точнее.
Фрэнк,
команда ЖЖ.

Reply

admiral_hood September 21 2019, 06:47:24 UTC
А про душу хде?

Reply


(The comment has been removed)

admiral_hood September 21 2019, 11:35:05 UTC
А какие слова, по-вашему, лучше характеризуют русскую и англосаксонскую душу?

Reply

(The comment has been removed)

admiral_hood September 21 2019, 13:12:10 UTC
Я бы сказал «высокий болевой порог», потому что даже у русских терпение не безгранично. И лопается оно с катастрофическими последствиями :~)

Reply


miihaaiil September 21 2019, 10:59:45 UTC
Частотные словари представляют большой интерес. Сейчас больше возможностей создания этих словарей.

Reply

admiral_hood September 21 2019, 11:36:05 UTC
Ну да, скачиваешь из интернета «Войну и мир», пишешь программку на полстранички - и вуаля! :~)

Reply

miihaaiil September 21 2019, 11:44:02 UTC
Это не совсем так. В программе нужно идентифицировать слова независимо от их форм: падежей, склонений и т.д. Потом разделить слова с одинаковым написанием, но с разным значением, типа зАмок-замОк. И наверное ещё что-нибудь.
В старых советских словарях были тенденциозно подобраны тексты. Большая часть составляла произведения В.И. Ленина, потом классики, затем из газет.

Reply

admiral_hood September 21 2019, 11:54:23 UTC
Да, это правда, потрудиться таки придётся.
А тенденциозность ПМЛМ будет в любое время и при любом строе...
P.S. Сомневаюсь, что в частотных словарях различают пары типа зАмок-замОк. Но вот если одинаково выглядящие слова относятся к разным частям речи, то отличают, как ни странно...

Reply


newkos September 21 2019, 13:58:59 UTC
про части тела --- неправда ... другие части поминают чаще

и слова Как бы и Типа ... и Это самое и НУ это самое .... часто
хотя это должно быть отдельное исследование
даже два ... про мат и слова-паразиты

Reply

admiral_hood September 21 2019, 14:04:30 UTC
Слово «жопа», согласно частотному словарю, употребляется 12 раз на миллион. Более отвязных ругательств в частотном словаре, конечно, нет :~)

Reply

newkos September 21 2019, 14:08:16 UTC
Пред-Мат опаснее
Повтор
иногда вспоминаю про фильм *Человек-амфибия*
//Премьера фильма состоялась 28 декабря 1961 года, а 3 января 1962 года фильм вышел в широкий прокат.\\
и песенка
Нам бы, нам бы, нам бы, нам бы всем на дно.
Там бы, там бы, там бы, там бы пить вино.
Там под океаном
Мы трезвы или пьяны -
Не видно все равно.

так вот у меня, ещё тогда появилось чувство, что эти слова, ЧТО ТО ПЕРЕКЛЮЧИЛИ в мозгах Сов-людей (Совков)
.... все как то старались выглядеть культур-мультур, матом стали меньше разговаривать, про КОСМОС и Лазеры-транзисторы что то говорили
и ВДРУГ раз и переключились
НА ДНО

мне было 10 лет, в Ульяновске
и пришлось придумать, тайный мир, где строят коммунизм
и скоро нас позовут туда
ЖДУ

Reply

admiral_hood September 21 2019, 14:23:25 UTC
Я тоже этот фильм посмотрел в детстве и тоже помню эту песенку, но никакого шока от этого не испытал.

Reply


nataha4 September 21 2019, 18:48:43 UTC
Очень интересно, Спасибо. Отправила ссылку специалисту.

Reply

admiral_hood September 22 2019, 09:59:45 UTC
Не воспринимайте слишком серьёзно, это из цикла «квазинаучные досуги». Кроме того, не я это придумал, где-то прочитал лет 30-40 назад, только не помню где :~).

Reply

nataha4 September 22 2019, 15:27:32 UTC
Знаем мы, как в науке "квази" превращались в гипотезы. А если это все-таки квази, то значит интересная игра))

Reply


Leave a comment

Up