"Конец ABBYY - это конец большой мечты. .... Мечты о том, что лингвистическая теория - то есть все те способы моделировать язык, которые придумали ученые-лингвисты, - поможет сделать наиболее точные инструменты автоматической обработки языка. ..... На самом деле нет...."
_______________________________
А ведь эта ситуация -- в первую очередь приговор самой лингвистике.
Если реальный язык может быть промоделирован на основе обучения на большом количестве реальных текстов -- что это значит? Это значит, что реальный язык имеет внутреннюю упорядоченность, структуру, которая может быть выявлена, зафиксирована и воспроизведена. Ну, типа морозных узоров.
А дальше вот что: морозные узоры прекрасно объясняются термодинамическими процессами в неравновесных системах, с учётом стохастических эффектов. И мы можем обучить ИИ на картинках морозных узоров, и попросить нарисовать такой же. А можем запустить программу, визуализирующую решение системы уравнений, описывающей неравновесный термодинамический процесс при генераторе случайных чисел. И, о
( ... )
> Предположим - экзамен. Вы трудитесь, задача не решается. Вы вспоминаете, прикидываете - никак. На телефон звяк - за некую сумму будет выслано решение.
В этом смысле даром. Да, деньги вы потратите (если согласитесь). Не даром - по деньгам. Но по отношению к вашим усилиям выучить математику - даром. Вы учили зря. Могли и не учить, даром достался готовый ответ.
Не-а. Если я учил математику, я могу сделать фундаментально важную вещь -- я могу проверить ответ.
Предположим - автоматизация газораспределительного пункта. Вы трудитесь, задача не решается. Вы вспоминаете, прикидываете - никак. На телефон звяк - за некую сумму будет выслано решение. Можно использовать как есть. Одна беда: перед пуском остальная бригада укроется в складках местности, и включать будете лично вы, а не высылальщик решения. Боли не будет при любом исходе испытания, хе-хе. Вот он -- реальный экзамен, а не симуляция с бумажкой. Доверите телефону и звяку?
Лингвистика была направлена на отыскание закономерностей. И пока продвинулась недостаточно.
А может, не лингвистика продвинулась недостаточно, а просто нет более глубоких закономерностей? Я совсем профан, но из общих соображений - разве обязательно, чтобы язык был формализован до такой степени, чтобы его можно было описать системой относительно простых правил? И может, ответа в изучении только языка вообще нет, если его изучать в отрыве от субстрата (может дальнейший прогресс - синтез лингвистики, антропологии и физиологии...)?
А так, конечно, в интересную пору живем. Обычно в обществе роль науки понимают через практические задачи - вот как поймем, как оно устроено, так такого сделаем!... И вот оказывается, что для этих задач наука не нужна, а просто трясти надо. Хотя, конечно, это не новость - наука без практической задачи. Просто сейчас без задачи оказались отрасли, которые долгое время были в этом смысле легитимны.
Вы сказали примерно следующее. Существует программа, которая делает математические расчеты. Существует наука математика, которая достигла некоторых незначительных успехов. Вы говорите: а может, и нету в мире цифр никаких закономерностей? Они же выдуманные, в конце концов. Там вполне может ничего не быть. Не обязательно, чтобы мир числе был формализован до такой степени, чтобы его можно было описать системой относительно простых правил - так называемых аксиом и теорем.
Спасибо. Я, к сожалению, слишком профан, чтобы различать области лингвистики. Ваша аналогия, мне кажется, слишком общая. Мы же говорим о прикладном применении, о переводе - то есть аналогом будет не математика вообще, а, скажем, о метрология. И даже не метрология, а, например, френология. О Пирсоне помню, если что.
На всякий случай, я отнюдь не оправдываю подход "заткнись и считай".
Я тоже далек от лингвистики. Сказал не именно о переводе, а - о лингвистике. Можно ли отыскать "формулы" для перевода - не знаю. Как мне представляется, это не важно. По крайней мере мне не интересно, могли бы отыскаться такие формулы или нет
( ... )
Опять же, насколько я могу судить... Готовых переводов почти не существует. Я имею в виду - когда человек, знающий некий язык, получает задачу перевести фразу на другой, который он тоже так-сяк знает, - он выдумывает. Иногда хорошо, иногда совсем плохо. Потом это закрепляется и попадает как правильный перевод в словари. Но первый перевод - это набор ожиданий, фантазий, надежд и "ты ж понимаешь, нет?"
Да, конечно. Возможно, именно поэтому подход на основе статистических моделей и успешен. Проблема, конечно, в том, что успешный инструмент начинают впихивать там, где не следовало бы...
Да... Я когда пытаюсь что-то высказать или написать испытываю те же ощущения, что и когда перевожу. То есть вот есть мысль, и ее нужно перевести - подобрать подходящие слова. Почти никогда хорошо не получается. Именно "ты ж понимаешь, нет?"
> Стоит ли плакать о такой лингвистике? (Может быть, несите новую?)
Критерием хорошей, живой лингвистики, думаю, должна быть способность ногами придти. Впрочем, если внести сразу труп лингвистики, то потом уже и плакать по ней не будет нужно, все сделано заранее для нашего удобства.
"Конец ABBYY - это конец большой мечты. .... Мечты о том, что лингвистическая теория - то есть все те способы моделировать язык, которые придумали ученые-лингвисты, - поможет сделать наиболее точные инструменты автоматической обработки языка. ..... На самом деле нет...."
_______________________________
А ведь эта ситуация -- в первую очередь приговор самой лингвистике.
Если реальный язык может быть промоделирован на основе обучения на большом количестве реальных текстов -- что это значит? Это значит, что реальный язык имеет внутреннюю упорядоченность, структуру, которая может быть выявлена, зафиксирована и воспроизведена. Ну, типа морозных узоров.
А дальше вот что: морозные узоры прекрасно объясняются термодинамическими процессами в неравновесных системах, с учётом стохастических эффектов. И мы можем обучить ИИ на картинках морозных узоров, и попросить нарисовать такой же. А можем запустить программу, визуализирующую решение системы уравнений, описывающей неравновесный термодинамический процесс при генераторе случайных чисел. И, о ( ... )
Reply
> Предположим - экзамен. Вы трудитесь, задача не решается. Вы вспоминаете, прикидываете - никак. На телефон звяк - за некую сумму будет выслано решение.
В этом смысле даром. Да, деньги вы потратите (если согласитесь). Не даром - по деньгам. Но по отношению к вашим усилиям выучить математику - даром. Вы учили зря. Могли и не учить, даром достался готовый ответ.
Не-а. Если я учил математику, я могу сделать фундаментально важную вещь -- я могу проверить ответ.
Предположим - автоматизация газораспределительного пункта. Вы трудитесь, задача не решается. Вы вспоминаете, прикидываете - никак. На телефон звяк - за некую сумму будет выслано решение. Можно использовать как есть. Одна беда: перед пуском остальная бригада укроется в складках местности, и включать будете лично вы, а не высылальщик решения. Боли не будет при любом исходе испытания, хе-хе. Вот он -- реальный экзамен, а не симуляция с бумажкой. Доверите телефону и звяку?
Reply
>Просто готовый результат - на, бери, пользуйся.
тут другое еще важно. раньше получалось откупаться практическими результатами, а теперь так сложнее.
вот человек думает теорию относительности, но держат его для бомбы. а теперь можно не держать? хмм, сказали заказчики бомбы.
Reply
https://www.nature.com/articles/35014679
https://knigogid.net/books/73528-ted-chan-evolyuciya-chelovecheskoi-nauki/toread (перевод)
Reply
Тут не разные типы знания, а разница между деланием и говорением. Ирония в том, что делание также представлено говорением.
Reply
Лингвистика была направлена на отыскание закономерностей. И пока продвинулась недостаточно.
А может, не лингвистика продвинулась недостаточно, а просто нет более глубоких закономерностей? Я совсем профан, но из общих соображений - разве обязательно, чтобы язык был формализован до такой степени, чтобы его можно было описать системой относительно простых правил? И может, ответа в изучении только языка вообще нет, если его изучать в отрыве от субстрата (может дальнейший прогресс - синтез лингвистики, антропологии и физиологии...)?
А так, конечно, в интересную пору живем. Обычно в обществе роль науки понимают через практические задачи - вот как поймем, как оно устроено, так такого сделаем!... И вот оказывается, что для этих задач наука не нужна, а просто трясти надо. Хотя, конечно, это не новость - наука без практической задачи. Просто сейчас без задачи оказались отрасли, которые долгое время были в этом смысле легитимны.
Reply
Reply
Спасибо.
Я, к сожалению, слишком профан, чтобы различать области лингвистики. Ваша аналогия, мне кажется, слишком общая. Мы же говорим о прикладном применении, о переводе - то есть аналогом будет не математика вообще, а, скажем, о метрология. И даже не метрология, а, например, френология. О Пирсоне помню, если что.
На всякий случай, я отнюдь не оправдываю подход "заткнись и считай".
Reply
Reply
Опять же, насколько я могу судить... Готовых переводов почти не существует. Я имею в виду - когда человек, знающий некий язык, получает задачу перевести фразу на другой, который он тоже так-сяк знает, - он выдумывает. Иногда хорошо, иногда совсем плохо. Потом это закрепляется и попадает как правильный перевод в словари. Но первый перевод - это набор ожиданий, фантазий, надежд и "ты ж понимаешь, нет?"
Да, конечно. Возможно, именно поэтому подход на основе статистических моделей и успешен. Проблема, конечно, в том, что успешный инструмент начинают впихивать там, где не следовало бы...
Reply
Да... Я когда пытаюсь что-то высказать или написать испытываю те же ощущения, что и когда перевожу. То есть вот есть мысль, и ее нужно перевести - подобрать подходящие слова. Почти никогда хорошо не получается. Именно "ты ж понимаешь, нет?"
Reply
Reply
> Стоит ли плакать о такой лингвистике? (Может быть, несите новую?)
Критерием хорошей, живой лингвистики, думаю, должна быть способность ногами придти. Впрочем, если внести сразу труп лингвистики, то потом уже и плакать по ней не будет нужно, все сделано заранее для нашего удобства.
Культ мертвых, как обычно, живее всех живых.
Reply
Leave a comment