АльфаФолд и сходным программам еще многому надо обучиться

Nov 11, 2024 04:35


АльфаФолд это программный инструмент, в основе которого лежит нейросеть, обученная на огромном массиве данных о 3-D структуре белков, собранных в PDB (Protein Data Bank). Собственно, наличие PDB как общедоступной базы данных, явилось важным, если не решающим, фактором, обеспечившим «победный рывок» АльфаФолд 2 в решении проблемы предсказания 3-D ( Read more... )

дизайн белков de novo, 3D-конформация белка, АльфаФолд

Leave a comment

Comments 25

evgeniirudnyi November 11 2024, 10:15:57 UTC

Надежда умирает последней.

Спасибо за ссылку.

Reply


abienscumvento November 11 2024, 11:26:21 UTC

С тем, что отсутствует в обучающей выборке, ничего не сделаешь при подходе не основанном на знаниях.

Сделать нейросеть, признающуюся в том, что она чего-то не знает, вполне возможно. Знакомые делали.

Reply

prof_afv November 11 2024, 12:02:43 UTC

Насколько можно судить из «показаний» специалиста по дизайну белков, использующему ИИ инструменты, о которых речь в посте, пока они этому не обучены:

The AI is “always trying to please”, says Mohammed AlQuraishi, a computational biologist at

Columbia University in New York City. “It never, ever says, ‘no, this is not doable’.”

Reply

abienscumvento November 12 2024, 10:16:25 UTC

“always trying to please” Ой как точно сказано!

Reply

prof_afv November 12 2024, 10:41:31 UTC

Образно - да. Точно?

Reply


raven128 November 11 2024, 18:30:51 UTC
"не умеют «признаваться» в том, что они чего-то не умеют"
во-первых, это общая беда всех больших языковых моделей.
во-вторых, это нежелание разработчиков признавать перед ЦА, что их продукты чего-то не умеют.
а ввиду того, что даже большие языковые модели, по сути, имитируют понимание постановки задачи, не говоря уже о понимании результатов, до получения действительно надежных помощников еще далеко...

Reply

prof_afv November 11 2024, 18:57:41 UTC

К этой "разводке" больших языковых моделей Ваш тезис 2) вряд ли относится, т.к. пользователи данных моделей - это сравнительно небольшая группа исследователей, многие из которых одновременно являются и их разработчиками

Reply

raven128 November 12 2024, 07:16:59 UTC

не в разработчиках дело, а в самой природе нейросетей, или, как минимум, нынешнего поколения нейросетей

Reply

prof_afv November 12 2024, 08:49:55 UTC

Я реагировал на "нежелание разработчиков признавать перед ЦА, что их продукты чего-то не умеют"

Reply


valerie_livina November 12 2024, 06:45:36 UTC
Это очевидно по построению.

Reply

prof_afv November 12 2024, 08:50:16 UTC

Что очевидно?

Reply

valerie_livina November 12 2024, 09:01:41 UTC
Комбинаторный перебор ведет именно к этому.

Reply

prof_afv November 12 2024, 09:02:40 UTC

К чему?

Reply


ext_5187709 November 12 2024, 17:09:16 UTC

Если экстраполировать опыт работы с языковыми моделями, то действительно моделям свертки белков есть вопросы. Потомуч-то сейчас так.

- Вот РНК последовательность, какой формы белок?

- Такой-то!

- А почему такой?

- Нутром чую!

Reply

prof_afv November 12 2024, 18:51:48 UTC

В шутках есть доля истины...

На вопрос "почему" ответа нет.

Но, то, что белок "такой формы" или нет, проверяемо. И доля правильных предсказаний наиболее стабильной конформации достаточно высока. Что касается предсказаний других реализуемых конформаций, то они (LLM AlphaFold et al) на это не способны (пока?).

Плюс экспериментальные проверки предсказаний конформации (в различных контекстах) это неустранимое узкое звено (по крайней мере, в обозримом будущем).

Reply

ext_5187709 November 12 2024, 18:57:45 UTC

Словом, если есть денатурированный вариант конформации - он и может быть выдан. Давно не слежу за темой, проверкой конформации так и остался рентгено-структурный анализ?

Reply

prof_afv November 12 2024, 20:20:58 UTC

Наиболее стабильная нативная конформация. Многие белки "в работе" меняют конформацию. Помимо рентгеноструктурного анализа есть и другие варианты. Сейчас популярна крио-электронная микроскопия. Это (при наличии оборудования), попроще, менее требовательно к образцам, разрешение - несколько ангстрем.

Reply


Leave a comment

Up