Bazy danych

Jednym z najważniejszych obszarów bioinformatyki jest tworzenie i udostępnianie baz danych gromadzących i integrujących informacje z różnych dziedzin biologii. Współczesne metody badawcze, zwłaszcza sekwencjonowanie genomów i wielkoskalowe analizy ekspresji genów za pomocą mikromacierzy, generują ogromne ilości danych, których interpretacja nie byłaby możliwa bez wprowadzenia ich do powszechnie dostępnych baz danych posługujących się standardowym zapisem. Przy badaniach finansowanych ze środków publicznych i publikowanych w ogólnodostępnych czasopismach naukowych istnieje bezwzględny wymóg wprowadzenia uzyskanych sekwencji DNA do ogólnodostępnych baz danych. W takich pierwotnych bazach danych gromadzone są zatem sekwencje DNA (np. bazy GenBank i EMBL) i białek (np. bazy SwissProt i PIR), współrzędne atomowe struktur przestrzennych białek (baza PDB) i wiele innych informacji (np. dane bibliograficzne większości znaczących publikacji naukowych w bazie PubMed, informacje o chorobach genetycznych w bazie OMIM i inne). Na podstawie danych zgromadzonych w bazach pierwotnych budowane są wyspecjalizowane bazy łączące informacje z wielu różnych źródeł z dodatkowym opisem (annotacją) przez specjalistów z danej dziedziny. Takie wyspecjalizowane bazy danych tworzone są np. dla konkretnych genomów.