Прогресс технологии

Dec 21, 2012 09:34

Google Translate наконец-то дошел до уровня, что может перевести текст, и даже не зная язык оригинала можно хотя бы понять, о чем там. И фразы в переводе, в основном, грамматически разумно построены. Плюс, показывает, где что и как переводит, так что даже исправить можно прямо на месте ( Read more... )

technology

Leave a comment

Comments 13

angerona December 21 2012, 14:43:42 UTC
подозреваю, что и то и другое (ну и статистический анализ ведет к хорошим predictive models). machine learning и много-много data and processing power.

Reply

inostranka December 21 2012, 14:50:28 UTC
Мне вот интересно, откуда много-много данных? Не так-то и много текстов, переведенных один к одному. Или я не права?

Reply

angerona December 21 2012, 14:57:37 UTC
нужны скорее предложения даже, а не тексты целиком. Мне кажется, что есть неплохая база, но "откуда" -- сложнее :).

Reply

prosto_tak December 21 2012, 16:28:32 UTC
Есть немало мест, где параллельные тексты на разных языках. Одно из главных, котороое они используют - это веб сайт ООН. Там этого добра много. Но есть и другие места.

Reply


meshko December 21 2012, 14:46:47 UTC
Я думаю, там NLP, который разбивает на лексические конструкции, а потом уже их переводит поиском. Т.е. и не слова, и не фразы, а что-то среднее.

Reply

inostranka December 21 2012, 14:49:33 UTC
Вот то-то и оно, что мне кажется, что NLP, как наука, очень слаб, и если бы его использовали (что раньше и делали), то совсем бы коряво получалось и куски бы пропадали. Особенно, когда исходный текст не полными предложениями. Ан нет, не пропускает, переводит и bullet points тоже. Хотя, может я отстала от жизни и NLP продвинулся далеко вперед? С другой стороны, speech recognition все еще очень плохо работает, сильно хуже, чем перевод.

Reply

meshko December 21 2012, 14:54:21 UTC
Ну так понять о чем речь NLP может быть и не может, а разбить фразу на куски должен быть в состоянии. Ясно, что он поймет не все, но сделать так, чтобы непонятое не пропадало тривиально.

Вообще NLP, надо думать, на что-то годится. У меня на работе им много чего делают, но у меня нет доступа к исходным данным, так что я не могу судить насколько он хорошо это работает :)

Reply

inostranka December 27 2012, 19:53:41 UTC
Я имела в виду, что text-to-speech (используемый в Google Voice) работает гораздо хуже.
Мне всё кажется, что NLP годится для развития чего-то, что будет использоваться лет через 10-30 ;) А какие реальные качественные приложения есть сегодня?

Reply


janya December 21 2012, 14:55:17 UTC
Переводчикам от приличного автоперевода работы становится больше, а не меньше - чаще возникает ситуация что вот текст, понятно о чем он, и нужен перевод. Когда текста нет (или вообще не понятен), то и перевод не нужен.

Reply


(The comment has been removed)

inostranka December 27 2012, 19:56:14 UTC
А что за курс? Что интересного сказали?

Reply


Leave a comment

Up