Лакх слов

May 21, 2014 11:53

Простой и быстрый тест русского словарного запаса. Важно только не поддаваться соблазну и не отмечать слова, которые встречал, знаю, как пишутся, даже понимаю примерно, откуда получились, но не знаю, что значат ( Read more... )

языки, ссылки

Leave a comment

Comments 48

nedosionist May 22 2014, 00:34:43 UTC
98К. Судя по обсуждению у Резонера, типично около 100К +- 10%.

Там же добрые люди подсказывают английскую версию. Типичный результат втрое ниже.

Reply

i_eron May 22 2014, 00:55:53 UTC
Для обсуждения у Резонёра типично 100k. А для обсуждения где-нибудь, скажем, на местном уральском радио было бы типично поменьше, наверное.

Да, по тому английскому тесту у меня на этот раз 22.7k. Странно это, мне кажется, что многие хитрые слова из второй части их теста - гораздо дальше по распространённости, чем третий десяток тысяч.

Reply

nedosionist May 22 2014, 01:33:10 UTC
А зачем же обсуждения там, где типично заметно меньше!? :))

С английским, насколько можно судить, это следствие разницы в структуре употребления, и видимо, построения словаря. Т.е. составители английской версии, кажется, исходят из того, что практически употребялется ок. 10% языка, а в русской - весь и еще сверх того. Интересно было бы посмотреть на такой тест на базе Гуугл-Нграм'а.

Reply

i_eron May 22 2014, 01:46:02 UTC
"Честно" просто взять большой словарь и считать на коленке по большой случайной выборке. Такие тесты могли бы ускорить процесс, если они там знают частоту употребления каждого слова, ранжируют слова по частоте и вместо общей выборки разбивают "хвост" распределения на несколько сегментов. Если же вместо такого простого "ускорения" они начинают делать всякие "предположения о структуре", картина может сильно исказиться. Зачем такие сложности, кроме как по глупости или для намеренного искажения - непонятно.

Reply


ballast_fm May 24 2014, 17:07:09 UTC
мне попадался этот тест, оба результата были за сотню
он ничего не измеряет, на самом деле, принимать всерьёз его довольно сложно:
в нём слишком много спецтерминов, и это даёт преимущество тем людям, кто (как я, например) в профессиональной жизни сталкивался с разными сферами и благодаря цепкой памяти вынес какой-то пассивный лексический результат.

у меня запросто больше сотни два раза подряд получилось. только по этой причине.

и причислять спецтермины к словарному запасу...

Reply

ballast_fm May 24 2014, 17:45:48 UTC
о боже мой
вот сейчас прошла ещё раз и вообще 113400 получилось
это уже совсем перебор)))))

Reply

i_eron May 24 2014, 18:53:35 UTC
Принимать его всерьёз ни в коем случае нельзя. Но, хоть это и сложно, нам тут удалось пообсуждать его с серьёзным выражением лица.

Конечно, этот тест далеко не идеален. Я попробовал выяснить его потолок, отметив все слова - вышло всего 137 тысяч. Это объясняет, почему разброс между образованными людьми, обсуждающими его в ЖЖ, такой небольшой. Вы наверняка и вправду знаете больше слов, чем я, и настоящая разница, думаю, больше, чем тут вышла.

Мне кажется, многие спецтермины - вполне слова, хотя и непонятно, где проводить границу, а ведь где-то её проводить надо.

Я из этого теста вынес, что в общем знаю русский язык ненамного хуже, чем мои замечательные ЖЖ-собеседники, хоть никогда не жил в России, а за последние пол-жизни мало читал по-русски. Для людей, которые в себе и не сомневаются, этот тест действительно мало что даёт - слишком близко к потолку получается. Но для детей или кого-то ещё, у кого словарный запас существенно меньше, это осмысленный тест, мне кажется.

Reply


Leave a comment

Up