Comments | prof_afv: АльфаФолд и сходным программам еще многому надо обучиться

prof_afv

АльфаФолд и сходным программам еще многому надо обучиться

Nov 11, 2024 04:35

АльфаФолд это программный инструмент, в основе которого лежит нейросеть, обученная на огромном массиве данных о 3-D структуре белков, собранных в PDB (Protein Data Bank). Собственно, наличие PDB как общедоступной базы данных, явилось важным, если не решающим, фактором, обеспечившим «победный рывок» АльфаФолд 2 в решении проблемы предсказания 3-D ( Read more... )

дизайн белков de novo, 3D-конформация белка, АльфаФолд

Comments 25

evgeniirudnyi November 11 2024, 10:15:57 UTC

Надежда умирает последней.

Спасибо за ссылку.

abienscumvento November 11 2024, 11:26:21 UTC

С тем, что отсутствует в обучающей выборке, ничего не сделаешь при подходе не основанном на знаниях.

Сделать нейросеть, признающуюся в том, что она чего-то не знает, вполне возможно. Знакомые делали.

prof_afv November 11 2024, 12:02:43 UTC

Насколько можно судить из «показаний» специалиста по дизайну белков, использующему ИИ инструменты, о которых речь в посте, пока они этому не обучены:

The AI is “always trying to please”, says Mohammed AlQuraishi, a computational biologist at

Columbia University in New York City. “It never, ever says, ‘no, this is not doable’.”

abienscumvento November 12 2024, 10:16:25 UTC

“always trying to please” Ой как точно сказано!

prof_afv November 12 2024, 10:41:31 UTC

Образно - да. Точно?

Thread 6

raven128 November 11 2024, 18:30:51 UTC

"не умеют «признаваться» в том, что они чего-то не умеют"
во-первых, это общая беда всех больших языковых моделей.
во-вторых, это нежелание разработчиков признавать перед ЦА, что их продукты чего-то не умеют.
а ввиду того, что даже большие языковые модели, по сути, имитируют понимание постановки задачи, не говоря уже о понимании результатов, до получения действительно надежных помощников еще далеко...

prof_afv November 11 2024, 18:57:41 UTC

К этой "разводке" больших языковых моделей Ваш тезис 2) вряд ли относится, т.к. пользователи данных моделей - это сравнительно небольшая группа исследователей, многие из которых одновременно являются и их разработчиками

raven128 November 12 2024, 07:16:59 UTC

не в разработчиках дело, а в самой природе нейросетей, или, как минимум, нынешнего поколения нейросетей

prof_afv November 12 2024, 08:49:55 UTC

Я реагировал на "нежелание разработчиков признавать перед ЦА, что их продукты чего-то не умеют"

valerie_livina November 12 2024, 06:45:36 UTC

Это очевидно по построению.

prof_afv November 12 2024, 08:50:16 UTC

Что очевидно?

valerie_livina November 12 2024, 09:01:41 UTC

Комбинаторный перебор ведет именно к этому.

prof_afv November 12 2024, 09:02:40 UTC

К чему?

Thread 8

ext_5187709 November 12 2024, 17:09:16 UTC

Если экстраполировать опыт работы с языковыми моделями, то действительно моделям свертки белков есть вопросы. Потомуч-то сейчас так.

- Вот РНК последовательность, какой формы белок?

- Такой-то!

- А почему такой?

- Нутром чую!

prof_afv November 12 2024, 18:51:48 UTC

В шутках есть доля истины...

На вопрос "почему" ответа нет.

Но, то, что белок "такой формы" или нет, проверяемо. И доля правильных предсказаний наиболее стабильной конформации достаточно высока. Что касается предсказаний других реализуемых конформаций, то они (LLM AlphaFold et al) на это не способны (пока?).

Плюс экспериментальные проверки предсказаний конформации (в различных контекстах) это неустранимое узкое звено (по крайней мере, в обозримом будущем).

ext_5187709 November 12 2024, 18:57:45 UTC

Словом, если есть денатурированный вариант конформации - он и может быть выдан. Давно не слежу за темой, проверкой конформации так и остался рентгено-структурный анализ?

prof_afv November 12 2024, 20:20:58 UTC

Наиболее стабильная нативная конформация. Многие белки "в работе" меняют конформацию. Помимо рентгеноструктурного анализа есть и другие варианты. Сейчас популярна крио-электронная микроскопия. Это (при наличии оборудования), попроще, менее требовательно к образцам, разрешение - несколько ангстрем.

Thread 6