Пятая часть геномной базы данных содержит чужеродные элементы
Марк Лонго и Рейчел О`Нил из Университета штата Коннектикут (США) показали, что 18% базы данных бактериальных, растительных и животных геномов (то есть всех, кроме геномов приматов) загрязнены последовательностями ДНК человека.
Дэвид Хосслер из Калифорнийского университета в Санта-Крусе (США) отмечает, что генетики знают о присутствии артефактов человеческой ДНК в геномных сборках, но их количество до сих пор не подсчитывалось. Судмедэксперты и специалисты, работающие с древними ДНК, принимают особые меры для предотвращения контаминации, но большинство проектов по секвенированию геномов не столь строги, ведь в противном случае такой проект обойдётся слишком дорого.
Учёные решили выяснить степень загрязнения геномных баз данных, обнаружив человеческие последовательности в геноме рыбки данио. Для этого они провели поиск элементов Alu - короткого ретропозона приматов, в геномах неприматов. Эти последовательности оказались в 492 из 2 749 архивов. Контаминации были и в исходных данных секвенирования, и в окончательных сборках.
В большинстве случаев загрязнение состояло всего из нескольких сотен оснований ДНК. Более тысячи оснований встречалось очень редко.
Присутствие контаминаций в сырых данных не вызывает удивления у Роберта Уотерстона из Университета штата Вашингтон (США). По его мнению, это неизбежно, а вот компьютерные алгоритмы, которые осуществляют сборку, обязаны находить и удалять чужеродные артефакты. Увы, некоторые учёные безалаберно относятся к разработке соответствующих фильтров.
Г-н Лонго и его коллеги предполагают, что источником загрязнения служат кожа и волосы людей, работающих с образцами, а также данные из других библиотек ДНК, которые находятся на том же оборудовании. Исследователи обнаружили, например, доказательства того, что геном утконоса (Ornithorhynchus anatinus) содержит последовательности, в действительности принадлежащие таммару (Macropus eugenii).
Пока это в большей степени теоретическая проблема биоинформатики, но в скором будущем секвенирование геномов будет применяться в клинической практике, и тогда ценой контаминации может стать человеческая жизнь. Стоит отметить, что выделить в человеческом геноме элементы ДНК другого человека намного сложнее, чем найти их в геноме бактерии.
Результаты исследования опубликованы в журнале PLoS ONE.
Подготовлено по материалам Nature News.
|