EMBOSS軟體包學習總結

2021-11-07 12:31:04 字數 2927 閱讀 2379

emboss是乙個開放源**的序列分析軟體包,它是一組為分子生物學家所設計的公開且免費軟體。通過前幾周的學習,已經掌握了一些emboss工具的基本用法,下面作一下簡要的總結,並學習幾個新的工具。

首先複習一下已經學過的工具。有序列排比分析的needle、water、dotplot,可以進行序列的兩兩排比與作圖。核酸分析工具有remap、sixpack、dan、einverted、infoseq、seqret、coderet、plotorf、getorf 、cpgreport。

remap用來顯示核酸序列的限制性酵切位點及翻譯等情況。sixpack是用6種閱讀框和開放與讀框翻譯dna序列。dan用來計算dna或dna與rna雜交鏈的熔解溫度。

einverted 可以找出dna中的反向重複序列。infoseq用來顯示序列的概要資訊。seqret命令是用來改變序列檔案的格式。

coderet可以把gb檔案中的cds、mrna、蛋白質序列提取出來,並且分別建立不同的檔案。plotorf用圖形的形式來**它的開放閱讀框。getorf可以直觀的以多種不同的方式顯示序列中的開放閱讀框,例如終止子之間、起始和終止子之間等。

cpgreport命令可以找出核酸序列中的cpg 順序。

蛋白質分析工具有tmap、pepwheel、pepnet、garnier、pepinfo、pepstats。tmap 用來檢視蛋白質是否具有跨膜區。pepwheel程式可以對一段鏈作螺旋狀輪圖,從而識別疏水和親水的區域。

pepnet與pepwheel功能類似,作的是縱切面的圖。garnier是乙個**蛋白質序列二級結構的工具,可以**鏈中螺旋、摺疊、轉角和捲曲的位置。pepinfo能以圖形方式顯示蛋白質序列中各種不同性質的氨基酸殘基的含量,能夠輸出兩張不同的圖。

pepstats統計蛋白質序列中各種氨基酸殘基的含量,結果列出了分子量、氨基酸數量、氨基酸殘基的平均分子量、等電點、電荷、280奈米波長下的吸光值等等資訊。

然後,又學習了topo工具,它能以圖形方式顯示蛋白質序列的跨膜拓撲結構。這個工具可以結合tmap程式使用。首先用tmap**鏈中的跨膜區,然後再用topo具體顯示分析結果。

topo命令的引數很多,下面學習幾個比較主要的:首先我們可以用引數給不同性質的氨基酸設定不同的顏色和形狀,氨基酸的主要型別有-cys半胱氨酸、-gly

為n醣基化位點、-acid酸性氨基酸、-basic礆性氨基酸、-amine 氨氨基酸、-ohaa 帶-oh的氨基酸、-araa芳香族氨基酸、-pro是脯氨酸、後面可以用兩個字母定義他們的顯示形狀和顏色,第乙個字母是形狀,c代表圓形(circle)、s代表方形(square)、h代表六邊形(hexagon)、u代表向上的三角(up arrow)、d代表向下的三角(down arrow);第二個字母表示顏色,g表示綠色(green)、r表示紅色(red)、y 表示黃色(yellow)、m表示粉色(magenta)、a表示淺綠色(aqua)、b表示藍色(blue),如果只定義乙個形狀的字母,則顏色預設為black。還有引數-mem,是來說明鏈是否從外面進入膜,後面接y或n。-signa也是乙個重要引數,是來定義是否有其他的區域需要標記。

-sigrange還可以定義序列中某片斷現實的顏色與形狀。-section是來指定要分析的片斷在序列中的位置。

我還是用ralstonia sp. xj12b 菌株的 aac蛋白作練習,首先用tmap找到跨膜區為5-32、274-293,然後具可以執行topo程式了。鍵入命令:

$ topo ra -prol=um -cys=dr -gly=sr -acid=cg -basic=db -ohaa=da -araa=dg -section 「5-32 274-293"-mem y -signa n -graph png

系統顯示

draw an image of transmembrane protein

created topo.1.png

created topo.2.png

created topo.3.png

命令的意思是顯示ra中5-32和274-293的跨膜蛋白,脯氨酸為粉色向上三角,半胱氨酸為紅色向下三角,酸性氨基酸為綠色圓圈,鹼性氨基酸為藍色向下三角,帶-oh的氨基酸為淺綠色向下三角,n醣基化位點為紅色方形,芳香族氨基酸為向下綠色三角。其中跨膜蛋白區topo.3.

png如圖所示:

topo.1.png和topo.2.png分別是膜兩側的肽鏈。這樣我們就可以很清楚的看出各種氨基酸的性質,以便進行更深入的分析。

接著,又學習了hmoment程式,功能是疏水性區域的計算,用它可以以圖形或文字的方式顯示蛋白質序列可能形成α-螺旋和β-摺疊的片段。hmoment程式是用eisenberg et al.的方法通過設定window值,每次移動一定距離來計算疏水區。

預設設定是氨基酸殘基的旋轉角為100度時為α-螺旋,160度時為β-摺疊,這個角度可以在高階設定中改變。

hmoment命令中也有幾個重要的引數,-window用來設定window的值,預設為10。-plot輸出圖形,如果不加這個引數,程式只輸出文字。-plot之後再加引數-double就可以輸出兩個圖形,乙個是α-螺旋,乙個是β-摺疊,如果不加這個引數,只輸出α-螺旋的圖形。

-aangle來改變α-螺旋的角度,預設100。-bangle 來改變β-摺疊得角度,預設160。

執行程式,我先直接輸入 $ hmoment ra 不加任何引數,這樣輸出乙個ra.hmoment的文字檔案,用more命令檢視,如圖(部分):

可以看到window為10,angle為100,最大uh為0.733,下面是每個氨基酸的詳細資訊。我又練習了輸出影象,在命令列下鍵入命令:

$ hmoment ra -plot -double -graph png -go rahmo

可以看到輸出兩張影象,縱座標為uh值,橫座標為氨基酸數,每次移動10個氨基酸,通過這張圖可以清楚地看出片段中容易形成α-螺旋和β-摺疊的區域。

這次在總結以前學過的emboss工具的基礎上,又學習了topo和hmoment 兩個程式的使用,著重學習了限制性的引數,是結果能更好切合實驗,而且提高效率。

張昊2006.11.28

用友軟體使用許可與服務合同軟體包

編號 甲方 乙方 天津用友軟體技術 鑑於 1.北京用友軟體股份 開發 生產相應的軟體產品,並擁有該等軟體產品的計算機軟體著作權 2.乙方是北京用友軟體股份 在天津地區設立的分公司,並已獲得充分的授權授予北京用友軟體股份 開發 生產的軟體的使用許可 3.甲方希望獲得北京用友軟體股份 開發 生產的軟體的...

linux系統網路配置 軟體包 自動化管理

實驗序號 03 浙江警官職業學院 linux伺服器配置與管理 實驗報告 實驗名稱 linux系統網路配置 軟體包 自動化管理 實驗日期 年月日 實驗地點 機房號機 區隊學號 姓名指導老師 簽名 浙江警官職業學院計算機網路教研室制 一 實驗目的 1 熟悉和實踐linux系統網路配置。2 熟悉和實踐li...

Linux下安裝RPM和TAR管理軟體包的方法

rpm是乙個功能十分強大的軟體包管理系統,它使得linux下的安裝,公升級和刪除軟體包的工作非常簡單易行,並且還有查詢,驗證軟體包的功能。與圖形化工具相比,使用命令的方式理靈活,更強大。下面介紹的內容都以 軟體包為例來介紹安裝,公升級,更新用查詢等操作和安裝使用。1 安裝 公升級和更新 安裝乙個新的...