норвежские частотные списки

Oct 04, 2010 08:09

На деньги Еврокомиссии частотный список норвежского был переведен на русский (русский был тоже переден в обратную сторону, но там пусть норвежцы удивляются).
Вот кусок, выдранный из середины (6.43 - условная частотность)
engelskmann n 6.43 англичанин ( Read more... )

Leave a comment

Comments 11

olesar October 27 2010, 17:48:24 UTC
с елью все понятно, они вместо елочки рыбными косточками поднимаются, если на лыжах в горку.
вообще-то возле МКАД бывают "зоны отдыха" с ровно тем же смыслом.
а в каком из Е-бургов ты был?

Reply

serendipitous_t October 27 2010, 18:06:23 UTC
В том, что Екатеринбург, а про какой еще так говорят? Гугл его просто как синоним подсказывает: http://www.google.it/search?client=opera&rls=en-GB&q=%D0%95-%D0%B1%D1%83%D1%80%D0%B3

Reply

olesar October 27 2010, 20:32:21 UTC
сама слышала в отношении места обитания русской общины (слэш шопинга) несколько севернее Лидса. Вариант Ёбург. А вот Э-бурга не встречала, кстати.

Reply

serendipitous_t October 27 2010, 18:08:18 UTC
да, а какой фрукт можно еще в Норвегии воровать, если не яблоки?

Reply


olesar October 27 2010, 20:35:57 UTC
а какие еще многословные переводы оказались в частотном списке, интересно?

Reply

serendipitous_t October 28 2010, 07:53:27 UTC
их полно. из 6000 самых частотных норвежских, получилось 950 многословных русских переводов. Самые частые

jo да наоборот
både как ... так и
samme тот же самый
fordi потому что
mens в то время как
heller тоже не
gjerne как правило
likevel всё равно
ute под открытым небом
ute не на месте
ute в деле
dermed таким образом

В нашем словаре я думаю, что самое главное упущение в отсутствии таких многословных.

Reply


evannka November 4 2010, 03:49:19 UTC
А откуда берется сам корпус, чтобы из него такие частотные списки строить?

Reply

serendipitous_t November 4 2010, 06:59:11 UTC
разные корпуса из разных мест. В данном случае использовался образ (snapshot) интернета (что для русского, что для норвежского, что для арабо-китайского, там девять языков всего). В таком подходе есть свои проблемы (с порнографией и текстами пере/недопредставленными на интернете), но во всяком случае никакой вкусовщины в подборке текстов.

Reply

evannka November 4 2010, 12:17:18 UTC
понятно.

Reply


Leave a comment

Up