百家秘籍
蛋白查詢數據庫EMBL-EBI
蛋白家族檢索數據庫:Pfam 33.1(2020年5月,18259個條目) [http://pfam.xfam.org/]。
Pfam數據庫是大量蛋白質家族的集合,每個蛋白質家族都由multiple sequence alignments 和hidden Markov models (HMMs)表示。
蛋白質通常由一個或多個功能區(通常稱為結構域)組成。域的不同組合產生了自然界中發現的各種蛋白質。因此,鑒定蛋白質中存在的結構域可以提供對其功能的了解。
Pfam還會生成相關條目的更高級別的分組,稱為“ 氏族”。氏族是Pfam條目的集合,這些條目通過序列,結構或配置文件-HMM的相似性相關。
為每個條目提供的數據均基于 UniProt參考蛋白質組, 但仍可通過輸入蛋白質登錄來找到有關單個UniProtKB序列的信息。通過搜索各種數據庫,可以提供Pfam完全比對,以提供不同的登錄名(例如,all UniProt and NCBI GI)或不同級別的冗余。
數據庫輸入
數據庫提供了多種輸入方式:
1)輸入序列來進行比對查看具體是哪個蛋白家族的;
2)可以輸入蛋白相關的結果:結構域;
3) 也可以通過檢測詞來檢索符合要求的蛋白家族信息;
4)同時可以基于物種來見來查找某一物種的所有蛋白家族信息。
應用舉例:
如果查詢想要使用和凋亡相關的有哪些蛋白,就在關鍵詞檢索里面輸入:apoptosis
由于我們這里是進行了關鍵詞的檢索,所以會出來很多相似的結果。如果靶定到一個具體的結構域上的話,那就可以直接到結果界面了。
在關鍵詞檢索完之后,我們會得到一個和這個關鍵詞相關的表格。在這個表格當中,可以看到每一個相關家族在數據庫當中都包括哪些信息。
以Bcl-2家族來進行結果說明。
基本家族信息匯總
在總的結果的界面,首先看到的是這個蛋白家族的基本信息,這些基本的介紹主要來自于維基百科。這里我們能看到這個蛋白家族基本的構造、功能、家族相關結構域以及可能相關的基因。
主要結構域匯總
由于這里能查找的一系列具有相似功能的蛋白家族,但是一個蛋白不可能只有一個結構域的情況。所以這個部分就匯總了包含bcl-2的所有的蛋白結構域情況。
不同物種蛋白相關進化情況
在進行基因研究的時候,我們經常要比較各個物種之間蛋白序列的保守型情況。這種比較的方式基本上是通過進化樹的方式來進行實現的。所以數據庫也進行了簡單的進化樹構建。當然這個只是基本的查看。想要構建好看的進化樹數據庫也提供的原始數據下載的地方,點擊下載。
相互作用關系
蛋白與蛋白不是單獨發揮作用的。所以我們經常也需要查看這些蛋白家族是和哪些蛋白有相互作用關系的。在這個部分,數據庫就提供了可能相互所有的其他蛋白
每個物種包括的相似蛋白結構域的蛋白名稱
以上都是基本的匯總,有時候我們想要知道到底哪些蛋白具有這個結構域。這個時候就可以在在結構當中查看了。這里提供了蛋白的PDB ID號。如果想要基因 名的話。就得轉換一下了。
以上就是這個數據庫的基本內容了。主要還是通過檢索某一個特定結構域來獲得相關的蛋白家族的信息。
Citing Pfam
If you find Pfam useful, please consider citing the reference that describes this work:
The Pfam protein families database in 2019: S. El-Gebali, J. Mistry, A. Bateman, S.R. Eddy, A. Luciani, S.C. Potter, M. Qureshi, L.J. Richardson, G.A. Salazar, A. Smart, E.L.L. Sonnhammer, L. Hirsh, L. Paladin, D. Piovesan, S.C.E. Tosatto, R.D. Finn
Nucleic Acids Research (2019) doi: 10.1093/nar/gky995
資料參考:醫學數據庫百科
資料啊