Моделирование метаболизма: продолжаем работу

Jun 14, 2010 23:42

Работа над созданием базы данных метаболических и иных взаимодействий
http://community.livejournal.com/ru_transhuman/179055.html
понемногу движется. Основная трудоемкость состоит в ее наполнении.
И вот вчера удалось внедрить автоматизацию и в этот процесс.
В свободном доступе нашел базу 22000 (почти всех?) генов человеческого организма http://www.uniprot.org/downloads и на 95% сумел ее закачать (5% - пересечения в сокращенных названиях генов), впрочем, на данном этапе эти 5% несущественны, т.к. без других данных простой перечень генов практически бесполезен. Нужны и другие базы.
Основные требования:
- данные должны содержаться в одном или нескольких текстовых файлах
- данные должны быть не на естественном языке, а хоть как-то формализованы
- данные должны относиться к человеческому организму
- база должна быть бесплатной

Итак, требуются:
- генные сети
(неподходящий пример тут http://coxpresdb.jp/data/gene/55801.shtml
здесь даже есть различие в экспрессии по видам тканей, но не подходит из-за невозможности скачать файл целиком)
- база по заболеваниям (по классификации МКБ-10), этиология, симптомы, отклонения в результатах анализов, с указанием, что является причиной, а что следствием, что назначается для лечения
(неподходящий пример тут http://www.diseasesdatabase.com/
базу можно получить только за деньги, плюс, на мой взгляд, формализовано плохо)
- база по лекарствам (название, код ATX, действующее вещество, состав,
фармакологическая группа, при каких заболеваниях/симптомах назначаются, противопоказания, (желательно) формализованный принцип действия, побочные действия, взаимодействия с другими препаратами и т.д.)
- другие взаимодествия с организмом (нелекарственные субстанции, пища, психологические состояния, и т.д.)
Также в неспешном порядке (года через 3) понадобится:
- последовательности нуклеотидов в человеческих генах (с различными аллелями) - когда секвенирование генома станет более доступно, можно будет самостоятельно проводить анализ

Если Вам эта информация встречалась, прошу кинуть ссылки.

Ну и на закуску пример сформированного графа.
Картинка кликабельна.




Визуализация выполнена программой neato из пакета GraphViz
Исходное воздействие было задано: калорийно-ограниченное питание + снижение потребления пищи + нормальные физические нагрузки
Последовательность воздействий показана цветом (исходное воздействие - красные эллипсы, далее по цветам радуги до фиолетового).
Выглядит, возможно, красиво, но хочется еще и удобства восприятия, так что над визуализацией тоже придется работать.
Еще один пример (более информативный), визуализированный программой dot из того же пакета тут http://crocodile2010.livejournal.com/2287.html
Previous post Next post
Up