АльфаФолд это программный инструмент, в основе которого лежит нейросеть, обученная на огромном массиве данных о 3-D структуре белков, собранных в PDB (Protein Data Bank). Собственно, наличие PDB как общедоступной базы данных, явилось важным, если не решающим, фактором, обеспечившим «победный рывок» АльфаФолд 2 в решении проблемы предсказания 3-D
(
Read more... )
Comments 25
Надежда умирает последней.
Спасибо за ссылку.
Reply
С тем, что отсутствует в обучающей выборке, ничего не сделаешь при подходе не основанном на знаниях.
Сделать нейросеть, признающуюся в том, что она чего-то не знает, вполне возможно. Знакомые делали.
Reply
Насколько можно судить из «показаний» специалиста по дизайну белков, использующему ИИ инструменты, о которых речь в посте, пока они этому не обучены:
The AI is “always trying to please”, says Mohammed AlQuraishi, a computational biologist at
Columbia University in New York City. “It never, ever says, ‘no, this is not doable’.”
Reply
“always trying to please” Ой как точно сказано!
Reply
Образно - да. Точно?
Reply
во-первых, это общая беда всех больших языковых моделей.
во-вторых, это нежелание разработчиков признавать перед ЦА, что их продукты чего-то не умеют.
а ввиду того, что даже большие языковые модели, по сути, имитируют понимание постановки задачи, не говоря уже о понимании результатов, до получения действительно надежных помощников еще далеко...
Reply
К этой "разводке" больших языковых моделей Ваш тезис 2) вряд ли относится, т.к. пользователи данных моделей - это сравнительно небольшая группа исследователей, многие из которых одновременно являются и их разработчиками
Reply
не в разработчиках дело, а в самой природе нейросетей, или, как минимум, нынешнего поколения нейросетей
Reply
Я реагировал на "нежелание разработчиков признавать перед ЦА, что их продукты чего-то не умеют"
Reply
Reply
Что очевидно?
Reply
Reply
К чему?
Reply
Если экстраполировать опыт работы с языковыми моделями, то действительно моделям свертки белков есть вопросы. Потомуч-то сейчас так.
- Вот РНК последовательность, какой формы белок?
- Такой-то!
- А почему такой?
- Нутром чую!
Reply
В шутках есть доля истины...
На вопрос "почему" ответа нет.
Но, то, что белок "такой формы" или нет, проверяемо. И доля правильных предсказаний наиболее стабильной конформации достаточно высока. Что касается предсказаний других реализуемых конформаций, то они (LLM AlphaFold et al) на это не способны (пока?).
Плюс экспериментальные проверки предсказаний конформации (в различных контекстах) это неустранимое узкое звено (по крайней мере, в обозримом будущем).
Reply
Словом, если есть денатурированный вариант конформации - он и может быть выдан. Давно не слежу за темой, проверкой конформации так и остался рентгено-структурный анализ?
Reply
Наиболее стабильная нативная конформация. Многие белки "в работе" меняют конформацию. Помимо рентгеноструктурного анализа есть и другие варианты. Сейчас популярна крио-электронная микроскопия. Это (при наличии оборудования), попроще, менее требовательно к образцам, разрешение - несколько ангстрем.
Reply
Leave a comment