Выбор фона:
/ Новости сайта / Наука и Технологии / Ученые предложили новый алгоритм для быстрого и точного изучения ДНК
14.01.2016

Ученые предложили новый алгоритм для быстрого и точного изучения ДНК

Оценка: 0.0    1106 0 Наука и Технологии
08:09
Международная группа ученых из Германии, Америки и России, при участии заведующего кафедрой Московского физико-технического института (МФТИ) Марка Бородовского, предложила алгоритм, который автоматизирует и сделает более эффективным поиск генов , статью о своем исследовании ученые опубликовали в журнале Bioinformatics.

Разработка относится к области биоинформатики — дисциплины "на стыке наук". Биоинформатика — это набор методов математики, статистики и информатики, применяемых для исследования биологических молекул, таких как ДНК, РНК и белки. Одной из важных задач биоинформатики является аннотация генома — определение того, с каких именно участков молекулы ДНК синтезируются РНК и белки. Такие области — гены — представляют особый научный интерес. Для многих исследований нужна информация не обо всей ДНК (длина которой составляет 2 метра только для одной человеческой клетки), а о ее наиболее информативной части — генах. Выявление генных участков происходит на основе поиска сходства фрагментов последовательности с уже известными генами или путем обнаружения характерных для генов закономерностей чередования нуклеотидов. Этот процесс осуществляется с помощью предсказательных алгоритмов.

Найти генныe участки — нетривиальная задача, особенно в эукариотических организмах, к которым относятся практически все широко известные виды, кроме бактерий. Это происходит из-за того, что у таких клеток передача наследственной информация усложнена наличием "разрывов" в кодирующих областях (интронов) и отсутствием однозначных признаков для определения того, является ли область кодирующей или нет.

Алгоритм, предложенный учеными, определяет, какие области в ДНК являются генами, а какие — нет. Для этого можно использовать марковскую цепь (последовательность случайных событий, будущее которых зависимо от прошлого), обучаемую на уже известных генах.Состояниями цепи в данном случае являются либо нуклеотиды, либо нуклеотидные "слова". Алгоритм определяет наиболее вероятное разбиение генома на кодирующие и некодирующие области, наилучшим образом классифицирующую геномные фрагменты по их способности кодировать белки или РНК. Экспериментальные данные, полученные из РНК, дают дополнительную полезную информацию, на которой можно обучить модель используемую в алгоритме. Некоторые программы-предсказатели генов могут использовать эти данные для улучшения точности нахождения генов. Однако такие алгоритмы требуют обучающую выборку, на которой будет происходить видо-специфичная тренировка модели.Например, для программы AUGUSTUS, показывающей высокую точность, необходима тренировочная выборка из генов. Такое множество можно получить с помощью другой программы — GeneMark-ET — которая относится к категории само-тренирующихся алгоритмов. Эти два алгоритма и объединил алгоритм BRAKER1 предложенный совместно авторами AUGUSTUS и GeneMark-ET.

BRAKER1 показал высокую эффективность. Разработанную программу скачало уже более 1500 различных центров и лабораторий, пишет пресс-служба МФТИ. Тестирование алгоритма показывает его существенно более высокую точность по сравнению с другими алгоритмами. Примерный хронометраж BRAKER1 на одном процессоре составляет ∼17.5 часов для обучения и предсказания генов на геноме длиной 120 миллионов пар оснований. Это хороший результат, учитывая, что время может быть значительно уменьшено за счет использования параллельных процессоров а значит в перспективе алгоритм может работать еще быстрее и, в целом, эффективнее.

"Подобные инструменты помогают решать множество различных задач. Точная аннотация генов в геноме черезвычайно важна. Например, уже опубликованы первые результаты глобального проекта "1000 человеческих геномов", запущенного в 2008 году при содействии 75 лабораторий и компаний. В результате было обнаружено последовательностей редких генных вариантов — замен в генах, некоторые из которых приводят к болезням. При диагностике генетических заболеваний очень важно понимать, какие замены в участках генов приводят к возникновению болезней. В процессе проекта расшифровываются геномы различных людей, особенно кодирующие их части и выявляются редкие замены нуклеотидов. В будущем это поможет медикам диагностировать такие сложные заболевания, как болезни сердца, диабет и рак. BRAKER1 позволяет эффективно работать с геномами новых организмов ускоряя аннотацию геномов и получение критически важных знаний в науке о живой природе", — говорится в сообщении МФТИ.


 
Источник:  http://ria.ru


Поделитесь в социальных сетях

Комментарии 0

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Похожие материалы

Разговоры у камина
Календарь
Последние комментарии
Ученые нашли «мертвую звезду», которая вращается 716 раз в секунду
Ни хрена себе, мертвая!
Да она живее всех живых. (от topzz)

Ученые нашли ответ на давнюю загадку о «курице и яйце»
А на новую загадку "что подорожало раньше, курица или яйцо" они, случайно, ответ не искали (от alsm74)
Взгляд в бездну: Скала "Крутящийся дракон" на горе Тяньмэнь
Нравится некоторым всплеск адреналина.Нервы пощекотать. (от coka)
Российские ученые назвали главные источники канцерогенов в повседневной жизни
Туда же все вакцины и большая часть лекарств.Только хороший самогон всё смывает и очищает.Пейте люди (от coka)
Неандертальцы умели адаптироваться к любым трудностям — пока не встретили нас
Да неправда все это - мы адаптировались, когда вас встретили. Но, откровенно говоря, вы, кроманьонцы (от alsm74)