摘要:隨著現代計算機技術發展速度的不斷加快,與生物信息學的融合也在逐漸地加深,所以其在生物信息學數據庫中得到了良好的應用,建立和完善數據庫能夠促進生物信息學的發展。本文主要闡述了生物信息學數據庫的概念,分析了數據庫在生物信息學中的作用及其分類和特點,展望其發展前景,以期數據庫能夠在生物信息學中得到更加廣泛的應用。
關鍵詞:數據庫生物信息學作用前景
自二十世紀八十年代末人類基因組計劃啟動,由數學、化學、計算機科學以及信息科學等多種學科綜合而成的生物信息學獲得了迅猛的發展,眾多著名的科學家將生物信息學當做二十一世紀自然科學的重要研究領域[1]。生物信息學指的是在生物學實驗數據快速增長和計算機
網絡迅速發展的影響下所產生的生物學數據,再通過數據提取新知識的一門學科,它主要是對生物系統中的調控規律、信息流的相互作用以及信息現象進行研究,是一門實際應用與理論并重的學科。
一、生物信息學數據庫的概述
近幾年來,各種生物學的實驗數據不斷增多基礎生物信息學數據庫模型,生物學數據庫逐漸增加基礎生物信息學數據庫模型,這些數據庫對生物學實驗數據的處理和收集有各自的標準,可以提供相關的數據處理和查詢等服務[2]。生物學
數據庫幾乎涉及到了生命科學的各個領域,世界上有關DNA的數據庫主要包括EMBL的EBI,NCBI的,以及DDBJ等;有關蛋白質的數據庫主要包括PIR、MIPS、 以及等;有關于蛋白質結構分類的數據庫包括FSSP、CATH以及SCOP等。這些數據庫僅僅是簡單地對原始生物學實驗數據進行歸類和整理,是基本數據庫。隨著生物數據庫的數量和種類不斷地增多,也變得越來越復雜,這也使數據庫面臨著更大的挑戰。因此多種基本數據庫融合而成的二次數據庫應運而生了,使人們在查詢數據庫時變得更加便利。
二、生物信息學數據庫的分類及特點
一級數據庫。一級數據庫在生物信息學數據庫中主要包含生物大分子的三維空間結構數據庫、基因組數據庫以及蛋白質和核酸一級結構序列數據庫等,一般被稱作為基本數據庫。數據信息量較大是一級數據庫的優勢,其中存儲了大量的信息,而且數據量每天都在不斷地增加,數據中的信息也能夠及時更新。一級數據庫的用戶人數多,應用范疇也極為廣泛,所以,建立數據庫只有具備大容量、高性能的磁盤以及專門的計算機,才能夠對數據進行管理。
第1頁