國家高速網路與計算中心
  國網中心     | 生物化學資料庫服務    
 
 
回首頁    | 好站連結    | SiteMap

 三維影像國際合作

 2005識之精微

 會議展示及參訪

 好站連結
最新消息
NGS分析平台
Olfactory DB
生物知識庫
知識庫服務說明
生技新知 
生物計算服務系統
生物計算服務說明   
生物序列分析     
軟體與資料庫 
結構生物軟體 
生醫影像軟體 
關於我們
認識生物計算小組
台灣生物資訊學會
聯絡我們
 
使用GCG/SeqWeb 進行生物資訊學研究與分析
    (9105 reads)   _FPRINT
謝昌煥c00chh00@nchc.gov.tw
國家高速網路與計算中心

使用GCG/SeqWeb 進行生物資訊學研究與分析PDF檔下載
一、說明
      GCG (Genetics Computer Group)是生物資訊界最廣為人知的分子序列分析軟體套裝。 最初是在美國威斯康辛大學麥迪遜校區(University of Wisconsin-Madison)內發展, 最後脫離出來成為一家公司, 其間曾經是Oxford Molecular 的分支機構, 在2000 年又由Pharmacopeia 所併購。

      GCG 套裝包括了超過130 個分析程式, 可以分成Sequence Comparison、Database Searching and Retrieval 、DNA/RNA Secondary Structure Prediction 、Editing and Publication、Evolutionary Analysis、Fragment Assembly、Gene Finding and Pattern Recognition、Importing and Exporting、Mapping、Primer Selection、Protein Analysis、 Translation 等弁遄C 除了分析程式外, GCG 同時也提供多種生物資料庫, 例如: 核甘 酸相關的GenBank (http://www.ncbi.nlm.nih.gov/) 、EMBL (http://www.ebi.ac.uk/) , 蛋白質相關的SWISS-PROT (http://www.expasy.ch/sprot/)、 PIR (http://www-nbrf.georgetown.edu/pir/)、SP-TrEMBL (http://www.expasy.ch/sprot/) 等資料庫。 使用者可以輸入自己實驗的分子序列, 或是從這些資料庫取得分子序 列, 再利用GCG 套裝分析軟體分析這些序列。

      GCG 提供服務的方式是, 安裝於使用UNIX 作業系統的伺服器, 目前可以安 裝的平台(platform)有SGI 的IRIX 作業系統, SUN 的Solaris 作業系統, 及Compaq 的Tru64 作業系統, 使用者經由網際網路連線的方法使用GCG 套裝分析軟體及 資料庫。

執行GCG 套裝分析軟體的方式有下列三種:

  1. 傳統的文字指令(text command)模式, 使用者需要熟悉程式指令執行程式。
  2. 透過SeqLab 的X 視 窗圖型使用者界面(graphical user interface, GUI), 指令經由下拉式表單執行, 就 像使用大多數的視窗軟體, 例如文書編輯器Word。 這兩種方法需要Telnet 連線 到伺服器主機, 使用者最好能瞭解一些UNIX 作業系統的指令。 使用SeqLab 時 個人電腦需要有X 視窗模擬器軟體, 例如X-Win32 或是Exceed 等。
  3. 1998 年 起GCG 推出經由網路瀏覽器Netscape、Internet Explorer 的界面SeqWeb, 透過這種方法, 使用者上網後可以很容易使用這些分析軟體, 不需要特別學習UNIX 作業系統及安裝特殊的輔助軟體。 雖然文字指令模式需要學習一些技巧, 但是對於使用GCG 的專家而言, 這反而是最快的方法, 因為可以將好幾個指令串起來, 進些批次包裹執行。

    在此, 我們將介紹SeqWeb 的使用方法。 首先, 需要從提供GCG 套裝分析的 機構取得使用帳號及密碼(註一), 由此進入系統使用GCG 分析程式。 輸入帳 號及密碼後可以得到如圖一的主畫面。 畫面中只有代表SeqWeb 的三角標誌, 點 選執行後, 便可以進入SeqWeb 的工作畫面(圖二)了。

      圖一:進入SeqWeb 後最先見到的網頁畫面。




      圖二:SeqWeb 的工作畫面。


      工作畫面分成四個區域, 左上方SeqWeb 三角標誌下的Contents 和Index 表示分析程式顯示的方法, Contents 是將相近弁鄋熊{式集合在一起;Index 則是將程式按照字母順序排列, 點選後程式列表會出現在左下方的區域中。

      點選執行程式後, 需要使用者輸入參數或關鍵字, 會出現右上方佔據最多畫面的部份(圖三)。 同時右下方會出現Run 及Reset 二個按鈕, 參數設定無誤後, 使用者按Run 之後, 會出現碼表顯示程式執行的狀態;如果參數需要重新設定參數, 就按Reset 按鈕。

最後右下方提供線上使用諮詢服務, Help 提供完整的使用手冊, 包括各程式的詳細使用說明。 Introduction 則提供快速使用SeqWeb 的入門手冊。 最重要的是提供了Sequence Maneger 處理使用者的分子序列的管理, 解決了以往最繁瑣的檔案管理的問題。



     
圖三:啟動分析程式後, 出現釵h輸入參數的欄位, 及執行按鈕。 視窗下方, Help 提供了完整的使用手冊, Sequence Maneger 提供了處理使用者的分子序列的管理系統。

      程式執行的結果都可以存成一般的文字檔─text, 或是HTML 的檔案格式, 因 此如果還連結到其他的生物資料庫, 在SeqWeb 的介面下所有相關的資料都可以 相關連在一起。

      利用SeqWeb 介面執行GCG 分析程式是件非常容易的事情, 只要手邊有一段 分子序列, 或是利用關鍵字找出一段分子序列後, 就可以利用SeqWeb 介面分析、 找出生物分子序列密碼背後可能執行的生物弁遄C

二、例題

  1. 小明想瞭解同一種蛋白質, 在不同物種間其胺基酸相似程度, 同時想知 道它們之間關係?

    在這個例題中, 我們先使用LookUp 這個程式, 在現有的生物資料庫中, 鍵入關鍵字, 例如Transcription Regulation, 可以得到一系列的結果表單。 從這些 蛋白質, 選出來自不同物種的同一種蛋白質, 我們再執行PileUp 這個程式, 進 行多重序列的排列(multiple sequence alignment), 便可以知道這些蛋白質之間的關
    係了。
  2. 小明從實驗中得到兩段mRNA, 他覺得可能是兩個相關的蛋白質, 他該 如何判斷呢?

    首先小明需要將mRNA 轉譯成蛋白質的胺基酸序列, 再進行兩段序列的比對。 小明可以先執行Map 指令, 這個指令會將mRNA 可能轉譯成蛋白質的六種開放嬝狀[構(ORF, Open Reading Frame)列印出來, 同時顯示出不同的限制酉每、或是蛋白質水解酵素, 切割核酸序列、或胺基酸序列的位置。

    接下來我們就可以利用BestFit 或Gap 來進行兩段胺基酸序列的比對。 如果我們只是想知道這兩段序列是否在弁鄐W有關聯, 我們選擇BestFit 這個使用Smith & Waterman 區域排列(local alignment)運算法找出它們之間的關係;若是兩段序列有演化的關聯, 我們便可選擇執行Gap 指令, 它採用Needelman &Wunsch 的全域排列(global alignment)的運算法。
  3. 小明在實驗室選殖(clone)到一個基因, 並且完成了定序的過程。 他很想知道這個基因可能的生理弁遄A 同時也想知道這個蛋白質家族的演化關係?

    小明可以將他的序列輸入, 進行已知生物資料庫的序列相似的比對搜尋, 找出這個基因可能有的生理弁遄C 最常用的程式是BLAST(Basic Local Alignment Search Tool), GCG 也提供了NetBLAST 經由網際網路查詢美國國家生物科技資訊中心(NCBI, National Center for Biotechnology Information)的生物資料庫, 搜尋未知生物序列的註解資料。 如果序列是核酸序列使用FastA 程式可以得到更佳的結果。

    查詢得到相似的序列後, 可以利用多重序列排列的程式PileUp, 得到多個序列之間的關係。 接下來小明就可以使用演化分析的程式, Distances 和Diverge可以計算序列之間的演化距離。 Growtree 是由演化距離重建同時畫出演化樹。 GCG 提供另外一組PAUP(Phylogenetic Analysis Using Parsimony)的程式分析演化關係, PAUPSearch 利用不同的計算方法分析序列並重建演化樹, PAUPDisplay 用來畫出同時分析PAUPSearch 重建的演化樹。
  4. 小明選殖到一個長序列的基因, 為了定序, 他將這個長基因分成小片段進行複製, 定序後得到這些有重複片段的DNA 序列。 他必需將這些片段重新組合成連續序列(contig), 找出基因的開放嬝狀[構(ORF), 同時找出它可能的弁遄H

    小明得到這些小片段的DNA 序列後, 可以使用GCG 提供的一組工具, GelStart、GelEnter、GelMerge、GelAssemble 等程式, 將序列重組成有意義的連續序列。 接下來他可以使用Map、Frames、TestCode、和CodonPreference 等程式, 得到相對應的蛋白質的胺基酸序列。 最後, 小明可以用BLAST 或是NetBLAST
    找出與這個基因相似的蛋白質, 得到這個基因可能的三級結構及其生物弁遄C
  5. 小明有一些蛋白質的胺基酸序列, 這些蛋白質彼此之間有相關, 他想知道這些蛋白質是否有段特定的一致序列(consensus region)在演化中成為保留區域, 如果有的話, 還有那些蛋白質也有這段特定的一致序列?

    小明可以先用多重序列排列的程式PileUp, 找到大家共有的一致序列。 然後再利用這一小段特定的一致序列, 使用FindPatterns 程式, 在資料庫中搜尋是否還有其它的蛋白質有這段特定的序列。 另外, 小明也可以使用Motifs 程式, 找出這些蛋白質的一致性模式(consensus pattern) , 同時可以超連結到SWISS-PROT 內的PROSITE 資料庫, 進一步說明這段特定序列弁遄C 或是使用MEME 程式找出它們的motif 後, 再用
    MotifSearch 程式在資料庫找出還有那些蛋白質也有這段特定序列的相似序列。
  6. 小明在實驗室得到了一個新的蛋白質, 他想多瞭解一點有關於這個蛋白質的物理化學性質, 例如, 電泳實驗時它的等電位點(Isoelectric)、 蛋白質是否有所謂親水性/疏水性的雙極性, 可能參與和細胞膜的相互作用、 蛋白質二級結構的分析、 是否有helix-turn-helix 的結構, 可能與DNA 作用等等的蛋白質性質。

    GCG 提供了一序列的蛋白質分析工具。 程式Isoelectric 會計算出蛋白質的滴定曲線(titration curve), 同時顯示出帶有正電、及負電的各種胺基酸的個數, 及計算出等電位點的pH 值。 有關於二級結構預測的程式有PeptideStructure 和PepPlot, 會畫出a-helix 和b-sheet 的預測位置。

    PeptideSort 計算出各種水解酵素, 對蛋白質水解後, 各片段的質量、胺基酸的組成、等電位點, 也可以預測出在使用高效率層析分析(HPLC, High Performance Liquid chromatography)分離時, 各片段出現的順序。 Map 程式則可以顯示出各種水解酵素, 對於蛋白質的水解位置。

    HelicalWheel 繪出蛋白質形成a-helix 結構時, 是否有雙極性的可能性。 HTHScan 會尋找出helix-turn-helix motifs , CoilScan 則找出coiled-coil 的部份, 有這二種特殊結構的蛋白質, 有可能是與DNA 作用的蛋白質。 有關於蛋白質的結構分析, 如果再使用一些分子檢視軟體, 例如Rasmol、Swiss-PdbViewer 的輔助,
    可以得到更好的分析成果。
  

[ Back to 生物資訊軟體介紹 | Sections Index ]