Таксономическая база данных NCBI

Таксономическая база данных NCBI является частью базы GenBank, подразделения Национального центра биотехнологической информации США (NCBI). Она содержит более 165 000 организмов, которые представлены в базах данных как минимум одной нуклеотидной или белковой последовательности. Таксономический браузер (TaxBrowser) может использоваться чтобы просмотреть позицию организма или таксона в таксономической иерархии или чтобы получить данные с любого из основных баз данных системы Entrez для этого организма. TaxBrowser также позволяет доступ к системам «Map Viewer», «BLAST» и «Trace Archive» через внешние ссылки.
Поиск в базе данных может делаться по целому, частичной или фонетической названием организма. В дополнение к этому, ссылки на организмы, которые часто используют в биологических исследованиях, приведены отдельно. Система отображения способна показывать таксономические дерева выбранного пользователем фрагмента всей базы данных NCBI.
Созданная в 1988 году, NCBI стала домом базы данных нуклеотидных последовательностей GenBank. В то же время стала очевидной необходимость создания таксономической базы данных чтобы дополнить нуклеотидные базы данных. Проблемы с таксономии, которые используют такие базы данных, были давно известны: каждая из баз данных имеет свою собственную таксономию, каждая отличная от других, и ни одна не находятся в соглашении с текущими таксономическими соглашениями (даже если можно представить, что такая вещь существует), и все они содержат широкое разнообразие различных видов ошибок и несогласованностей. В результате, не всегда известно (даже в пределах той же базы данных), или две записи относятся к одному и тому же виду.
Чтобы предотвратить этих проблем, команда NCBI создала инструмент для интеграции нескольких известных таксономических баз как нуклеотидных баз данных, так и некоторых других, например международную систему ICTV для вирусов, USDA для растений и FlyBase для Drosophilidae. После этого была проведена конференция на базе морской биологии в Митч-Согин представителей таксономических баз данных и специалистов по систематике для унификации базы данных. Представители Европейской лаборатории молекулярной биологии (EMBL), Швейцарской базы данных белков (SwissProt) и Японской базы данных ДНК (DDBJ) согласились принять эту базу за таксономический стандарт.
Одной из особенностей системы NCBI есть возможность легкой модификации выданных данных пользователем, чтобы он мог расположить их согласно одной из классических систем. Второй – практически полный переход на филогенетическая таксономии.
В результате этого подхода, класичниа концепция таксономических категорий (рангов) исчезает. Например, при редактировании таксономической базы Протозоа, сотрудники NCBI заменили суффиксы ранга семьи (-idae,-ida,-iformes т.п.) на общие суффиксы (-ids), хотя предыдущие названия остались в базе как синонимы, так что пользователь может проводить по ним поиск.
Сотрудники NCBI также пытаются собрать статистику по использованию всех возможных названий организма или таксона и формализовать систему названий, приходя к единому стандарту.
База данных NCBI не была создана исключительно специалистами по систематике и следует несколько иным целям. Поэтому результирующая база данных несколько отличается от ведущих исключительно систематических баз, таких как «Рабочая группа по таксономическим базам данных» (TDWG), «Международная организация информации о растениях» (IOPI) и «Виды 2000» (Species 2000). Например, база NCBI несколько меньше из-за отсутствия молекулярных данных, необходимых для точной классификации (что является стандартом NCBI), для большого количества организмов (хотя она быстро пополняется).
Еще одним известным конкурентом является «Объединенная таксономическая информации» (ITIS). ITIS прежде всего использует таксономическую литературу, которая опирается на экологические данные. Система строится «сверху вниз», располагая организмы в известной системе таксонов. В отличие от нее, система NCBI должна найти место для каждого организма, которых попадает в молекулярных баз данных. Кроме того, как уже было упомянуто выше, система NCBI использует строго филогенетический подход, что иногда приводит к разногласиям с классическими системами. В результате система отличается значительным количеством «неклассифицированных» организмов и групп, хотя считается самой точной из филогенетической / кладистических точки зрения.

Дата: 11-03-2011

Таксономическая база данных NCBI

Euphyllophyta

OMIM

Medical Subject Headings

База данных

Генетическая информация

Национальный центр биотехнологической информации