Выбор фона:
/ Новости сайта / Наука и Технологии / Ученые предложили новый алгоритм для быстрого и точного изучения ДНК
14.01.2016

Ученые предложили новый алгоритм для быстрого и точного изучения ДНК

Оценка: 0.0    1115 0 Наука и Технологии
08:09
Международная группа ученых из Германии, Америки и России, при участии заведующего кафедрой Московского физико-технического института (МФТИ) Марка Бородовского, предложила алгоритм, который автоматизирует и сделает более эффективным поиск генов , статью о своем исследовании ученые опубликовали в журнале Bioinformatics.

Разработка относится к области биоинформатики — дисциплины "на стыке наук". Биоинформатика — это набор методов математики, статистики и информатики, применяемых для исследования биологических молекул, таких как ДНК, РНК и белки. Одной из важных задач биоинформатики является аннотация генома — определение того, с каких именно участков молекулы ДНК синтезируются РНК и белки. Такие области — гены — представляют особый научный интерес. Для многих исследований нужна информация не обо всей ДНК (длина которой составляет 2 метра только для одной человеческой клетки), а о ее наиболее информативной части — генах. Выявление генных участков происходит на основе поиска сходства фрагментов последовательности с уже известными генами или путем обнаружения характерных для генов закономерностей чередования нуклеотидов. Этот процесс осуществляется с помощью предсказательных алгоритмов.

Найти генныe участки — нетривиальная задача, особенно в эукариотических организмах, к которым относятся практически все широко известные виды, кроме бактерий. Это происходит из-за того, что у таких клеток передача наследственной информация усложнена наличием "разрывов" в кодирующих областях (интронов) и отсутствием однозначных признаков для определения того, является ли область кодирующей или нет.

Алгоритм, предложенный учеными, определяет, какие области в ДНК являются генами, а какие — нет. Для этого можно использовать марковскую цепь (последовательность случайных событий, будущее которых зависимо от прошлого), обучаемую на уже известных генах.Состояниями цепи в данном случае являются либо нуклеотиды, либо нуклеотидные "слова". Алгоритм определяет наиболее вероятное разбиение генома на кодирующие и некодирующие области, наилучшим образом классифицирующую геномные фрагменты по их способности кодировать белки или РНК. Экспериментальные данные, полученные из РНК, дают дополнительную полезную информацию, на которой можно обучить модель используемую в алгоритме. Некоторые программы-предсказатели генов могут использовать эти данные для улучшения точности нахождения генов. Однако такие алгоритмы требуют обучающую выборку, на которой будет происходить видо-специфичная тренировка модели.Например, для программы AUGUSTUS, показывающей высокую точность, необходима тренировочная выборка из генов. Такое множество можно получить с помощью другой программы — GeneMark-ET — которая относится к категории само-тренирующихся алгоритмов. Эти два алгоритма и объединил алгоритм BRAKER1 предложенный совместно авторами AUGUSTUS и GeneMark-ET.

BRAKER1 показал высокую эффективность. Разработанную программу скачало уже более 1500 различных центров и лабораторий, пишет пресс-служба МФТИ. Тестирование алгоритма показывает его существенно более высокую точность по сравнению с другими алгоритмами. Примерный хронометраж BRAKER1 на одном процессоре составляет ∼17.5 часов для обучения и предсказания генов на геноме длиной 120 миллионов пар оснований. Это хороший результат, учитывая, что время может быть значительно уменьшено за счет использования параллельных процессоров а значит в перспективе алгоритм может работать еще быстрее и, в целом, эффективнее.

"Подобные инструменты помогают решать множество различных задач. Точная аннотация генов в геноме черезвычайно важна. Например, уже опубликованы первые результаты глобального проекта "1000 человеческих геномов", запущенного в 2008 году при содействии 75 лабораторий и компаний. В результате было обнаружено последовательностей редких генных вариантов — замен в генах, некоторые из которых приводят к болезням. При диагностике генетических заболеваний очень важно понимать, какие замены в участках генов приводят к возникновению болезней. В процессе проекта расшифровываются геномы различных людей, особенно кодирующие их части и выявляются редкие замены нуклеотидов. В будущем это поможет медикам диагностировать такие сложные заболевания, как болезни сердца, диабет и рак. BRAKER1 позволяет эффективно работать с геномами новых организмов ускоряя аннотацию геномов и получение критически важных знаний в науке о живой природе", — говорится в сообщении МФТИ.


 
Источник:  http://ria.ru


Поделитесь в социальных сетях

Комментарии 0

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Похожие материалы

Разговоры у камина
Календарь
Последние комментарии
Окаменевшее бревно возрастом 220 миллионов лет
Это был самый первый субботник!  b (от <a href=renmilk11)
Окаменевшее бревно возрастом 220 миллионов лет
Есть два пути развития ситуации эволюционный и катастрофический. Почему-то в геологии катастрофическ (от Везунчик)
Окаменевшее бревно возрастом 220 миллионов лет
Ученые нашли способ превратить кусок дерева в минерал всего за несколько дней, тогда как в естествен (от Везунчик)
Окаменевшее бревно возрастом 220 миллионов лет
Кто и как устанавили возраст  ?
Кто и как уст (от amateurbeer)

Предложена гипотеза существования черных дыр внутри планет
В основном " черные дыры" расположены в сером веществе у
ученых Университета Буффал (от topzz)