Теорема магического Котельникова

Feb 11, 2024 18:39

Знание сейчас выглядит где-то так: человек выучивает какой-то красивый термин и ту область, к которой он примерно относится. А потом любые свои суждения об этой области как бы обосновывает просто путём произнесения этого термина. Главное, чтобы звучало по-научному ( Read more... )

альтернативно одарённые, философия

Leave a comment

Comments 60

antroparium February 11 2024, 16:02:21 UTC

Непонятно, конечно, какая связь контрпримеров про векторную графику с теоремой Котельникова, описывающей возможность интерполяции непрерывного сигнала по точкам, взятым с заданной частотой дискретизации.

Ну или пример про синтезатор и звук: либо мы его записываем в параметрическом виде (о чем вы и написали), либо в виде уже готового синтезированного сигнала, и во втором случае теорема Котельникова объясняет, почему для сохранения звука, ограниченного частотой 20 кГц обычно используется частота 44.1 кГц или около того.

Reply

lex_kravetski February 11 2024, 16:35:25 UTC
> Непонятно, конечно, какая связь контрпримеров про векторную графику с теоремой Котельникова

Очевидно же, какая связь: в ней что-то про сигнал и в векторной графике тоже какой-то сигнал. Поэтому по теореме Котельникова векторная графика невозможно. И, кстати, просто графики тоже - а то эвон как, если этих неучей послушать, то десятью символами можно описать бесконечное количество точек, причём на произвольном диапазоне.

> либо мы его записываем в параметрическом виде (о чем вы и написали), либо в виде уже готового синтезированного сигнала,

А если мы его записываем, например, в виде готового сигнала, к которому можно потом применять эффекты, которые чем-то параметризованы, то что теорема Котельникова говорит?

Ну или мы записываем короткий готовый сигнал, а потом его повторяем много-много раз, на лету изменяя его частоту, амплитуду, фазу и т.д., накладывая на всё это спецэффекты?

Так можно сделать или не получится?

Reply

antroparium February 11 2024, 16:42:57 UTC

Да пожалуйста, делайте какую угодно обработку.

Грубо говоря, теорема Котельникова говорит о том, что по растровому изображению (дискретному звуку) не получится восстановить информацию об изменениях, происходящих между пикселями/отсчетами звукового сигнала. От этой информации пришлось отказаться в момент выбора шага дискретизации сигнала.

К векторным и другим параметризованным сигналам и изображениям эта теорема никаким боком не относится.

Reply

lex_kravetski February 11 2024, 17:01:13 UTC
> Грубо говоря, теорема Котельникова говорит о том, что по растровому изображению (дискретному звуку) не получится восстановить информацию об изменениях, происходящих между пикселями/отсчетами звукового сигнала ( ... )

Reply


strannik1 February 11 2024, 16:24:09 UTC
Ещё раз.
Вы подразумеваете наличие "раскодировщика". В синтезаторе или в компьютере.
Но его наличие и знание что надо применить именно его и есть "добавочная" информация без которой невозможно получить всю полную информацию.

Reply

lex_kravetski February 11 2024, 16:38:25 UTC
> Вы подразумеваете наличие "раскодировщика".

«Раскодировщика» чего именно? Что «раскодирует», например, синтезатор?

Хотя, постойте. Возможно, «раскодировщик» - это ещё одно красивое и научно звучащее слово.

> и есть "добавочная" информация без которой невозможно получить всю полную информацию.

А у нейросетей, часом, нет ли добавочной информации? Ну, после того, как они посмотрели на миллионы или даже сотни миллионов объектов из реального мира?

Reply

strannik1 February 11 2024, 17:41:18 UTC
1. Вы можете дать команду "сыграть ноту". В синтезаторе есть "раскодировщик", который этой команде сопоставит действие и запустит эту ноту.

2. В нейросети, разумеется, есть эта "добавочная информация" в закодированном виде. Проблема в том, будет ли там НУЖНАЯ ВАМ информация и сумеет ли нейросетка её восстановить. В частных случаях сможет, хотя всё равно очень приблизительно. В общем - нет. Если нейросетку не "учили" на нужных Вам ответах она ответ не даст.

Например. Вам надо улучшить размытую фотку Вашего прапрадеда. Если нейросеть учили на лицах похожих на него или, ещё лучше, на других его фотографиях, то результат будет очень хороший. Если нет - нет.
Но и в оптимальном случае, нет никаких гарантий, что конкретно перед этой съёмкой, на лицо Вашего прапрадеда не попал волос его любовницы, который был бы на качественном снимке, но на размытом его не видно, а "восстановить" этот факт по другим снимкам, разумеется, невозможно. И брать "улучшенное фото" как доказательство факта, что в тот момент волос любовницы на его лице не было -

Reply

lex_kravetski February 11 2024, 17:52:52 UTC
> 1. Вы можете дать команду "сыграть ноту". В синтезаторе есть "раскодировщик", который этой команде сопоставит действие и запустит эту ноту.

«Раскодировщиком» вы называете «замыкание контакта», я так понял?

> Проблема в том, будет ли там НУЖНАЯ ВАМ информация и сумеет ли нейросетка её восстановить.

На ваш взгляд в нейросети есть специальным образом закодированная база данных, из которой она извлекает информацию?

Что ж, такая версия не редкость.

> Если нейросеть учили на лицах похожих на него

Да. Точно. Эта самая версия. Нейросеть извлечёт из специальной базы данных лицо и что-то там с ним сделает.

Reply


crisis_killer February 11 2024, 16:26:48 UTC

теорема котельникова - она о другом.

она о том что если частота обновления вдвое превышает предельную частоту нашего восприятия - то мы не поймем в матрице мы или нет.

Reply

lex_kravetski February 11 2024, 16:38:52 UTC
Теорема Котельникова: теперь и в философии!

Reply


agordian February 11 2024, 17:16:16 UTC

В том споре, который не видел, была договоренность, о чем собственно спор? С появлением нейросетей теорема Котельникова работать не перестала, как не перестанет работать и когда нейросети вымрут, включая междуушное недоразумение. Ничто не вечно под Луной, и Луна не вечна, а теорема Котельникова - вечна, ибо истинна.

Короче говоря, на кадрах низкого разрешения часть информации потеряна навсегда. Котельников это доказал. Всего лишь. Единичный пиксель соответствует средней яркости по некоему участку наблюдаемого объекта. Из этого сырого кадра действительно невозможно получить подробности - что там в пределах этого участка (одного пикселя).

На практике выкручиваются, конечно. Еще до нейросетей была довольно сложная математика, как апскейлить (увеличить резкость, восстановить информацию и т.п.) по серии кадров. Что на одном пропало, на втором-пятом-десятом может и мелькнуло. В редких случаях это работало с некоторой вероятностью , но большей частью криво. Кстати, голливудское кино, где "покажи мне эту картинку подробнее" теоретически не ( ... )

Reply

lex_kravetski February 11 2024, 17:26:42 UTC
> Короче говоря, на кадрах низкого разрешения часть информации потеряна навсегда.

То есть, на ваш взгляд, если я получу картинку, где шрифтом Cambria набран текст и каждая буква имеет разрешение, скажем, 30*30, то никто и никакими способами не сможет получить картинку, где тот же текст набран тем же шрифтом с разрешением буквы 1000*1000?

И чего там шрифт - даже картинку, залитую одним цветом, никак нельзя увеличить в четыре раза?

Об этом нам говорит вечная теорема?

> Проблема в том, что это мультики.

Ну так в фотоаппарате тоже «мультики». И у нас в глазах они же.

Reply

(The comment has been removed)

lex_kravetski February 12 2024, 09:45:27 UTC
> Для его раскодировки требуется целая подсистема, включающая информацию о том, как это корректно сделать.

А звуковой файл в это время можно воспроизвести без плеера и каких-либо алгоритмов, я правильно понял?

> MIDI или МР3 кодирует непрерывный сигнал, но для его восстановления требуется соответствующий раскодировщик-интерпретатор.

А. Нет. Ну надо же! И тут тоже нужен алгоритм! Кто бы мог подумать!

Но зато слова красивые: «информация», «подсистема», «интерпретатор», вот это вот всё.

Reply


papon_ra February 11 2024, 17:56:28 UTC
(сдувая пыль с диплома) не, теорема Котельникова не про то. Она про произвольный сигнал, восстановить который возможно при дискретизации (телефон поправил на дискредитацию) с частотой в два раза выше наивысшей гармоники.
Шрифты здесь ни при чем. Тру тайп шрифты задаются заранее известными формулами. Другой случай.
Если бы сигнал был идеально гармоническим или все изображения состояли из одинаковых полосок, то также можно было бы написать sin(x) и закрыть тему.

Мне кажется, вы - автор темы - и ваши оппоненты говорите о разном.
Вы говорите о том, что НС с приемлемым результатом дополняет недостающую информацию. Т.е. чаще угадывает, имя багаж типичных паттернов.
Ваши оппоненты говорят, что исходная информация утеряна навсегда и именно ее восстановить никакой ИИ не сможет (сможет, но это совсем другая история).
В общем, и выи ваши оппоненты правы. Такое бывает.

Reply

papon_ra February 11 2024, 18:23:33 UTC
Придумал пример.
У человека на лице небольшая родинка. Но на единственном нечетком фото эту родинку не видно.
Ваши оппоненты говорят, что ИИ не сможет достоверно восстановить изображение этой родинки без дополнительной информации. Нужно переснять портрет с разрешением в два раза выше, чем размер родинки - как в плоскости изображения, так и в канале яркости/цвета.
С другой стороны, ИИ алгоритм сможет правдоподобно повысить детализацию фото. Но без родинки.

Как-то так.

Reply

ext_6505780 February 12 2024, 21:02:49 UTC
Не совсем так.

Есть еще опция.

Дообучить сеть на фотографиях этого конкретного человека.
Тогда и родинка тоже будет восстановлена.

А так-то да.

Reply

lex_kravetski February 12 2024, 21:09:41 UTC
≥ Нужно переснять портрет с разрешением в два раза выше, чем размер родинки

Эх. Магия Котельникова.

А художнику наверно обязательно надо с лупой родинку рассмотреть, чтобы «достоверно» её изобразить?

Reply


Leave a comment

Up