Sequence Assistant ver.2.x 操作マニュアル


はじめに
Sequence Assistant の特徴
体験版の機能制限
ライセンス購入方法 
インストール方法とアンインストール方法
動作環境

簡単な使い方説明
ファイルの読み込み
塩基抽出を行う
各種解析を行う

各種機能の説明
制限酵素地図の作成
塩基の読み上げ
縮重記号表、コドン表の表示
文字列検索
セレクター
ギャップを考慮した相同配列検索
相同性検索で何をしているか?
プライマーに適した配列の検索
GC%法のパラメーターの変更
Tm 計算方法の選択
Complementarity Score とは
プライマーの評価
1 OD260 あたりの質量の算出方法
プライマーの分子量を求める 
表示フォーマットの調整
制限酵素データの編集
読み上げ音声の変更

その他
バージョンアップ履歴
謝辞
作者連絡先


Sequence Assistant の特徴

Sequence Assistant は主に遺伝子組み換え実験に必要十分な機能を盛り込みつつシンプルであることを目指した遺伝子解析ソフトで、現時点で次のようなことができます。

・塩基配列のアミノ酸配列への変換
・相補鎖配列・逆配列への変換
・制限酵素地図の作成
・プライマーに適した配列の検索
・プライマー配列の評価
・ギャップを考慮した相同配列検索
・塩基配列の読み上げ



体験版の機能制限

Sequence Assistant はシェアウェアです。未登録状態では体験版として動作します。
体験版では同封された 「sample.txt」 というファイルしか読み込めません。また、コピー、カットはできますが、セーブ、ペーストができません。その他の解析機能は完全版と全く同じです。



ライセンス購入方法

機能制限を解除するにはライセンスキーが必要です。ライセンスキーは株式会社ベクターのシェアレジサービスを通じて購入します。

ハードウエアキーを調べる

まず、次の操作により Seqence Assistant を使用するパソコンのハードウエアキーを調べます。メニューの [Help]-[Registration] を選択します。



すると次のようなウィンドウが現れます。
上段にハードウエアキーが表示されますので記録しておきます。



株式会社ベクターで購入する

Sequence Assistant のレジ作品番号は SR037984 です。
Sequence Assistant 購入ページへのリンクはこちらです。
https://sw.vector.co.jp/swreg/step1.reserve?srno=SR037984


調べたハードウエアキーを上記リンクの 「ライセンスキー作成に必要な情報」 のところに入力します。
その他必要な情報を記入して購入を申し込み、株式会社ベクターの案内に従って手続きを進めると、入力したハードウエアキーに対応したライセンスキーが送られてきます。

ライセンスキーを入力する

ライセンスキーを取得したら、再び上記ウィンドウを開き、ライセンスキーを下段に入力し、[OK] ボタンを押します。正しいライセンスキーが入力されると次のようなメッセージが現れます。
これで登録完了です。これ以降は Sequence Assistant のすべての機能がお使い頂けます。



ハードウエアキーは各パソコンに固有の値です。ライセンスキーはハードウエアキーを元に生成されます。
ライセンスはプログラムをインストールするパソコンの台数分購入する必要があります。
ハードウエア構成が変わるとハードウエアキーが変わることがあります。その場合は作者までご相談ください。



インストール方法とアンインストール方法

インストール方法

公開されている 「seq2x.exe」 をダウンロードして実行するとインストールが完了します。

アンインストール方法

アンインストールは Windows の 「コントロールパネル」 の中の 「プログラムの追加と削除」 から行って下さい。



動作環境

WindowsXP で動作確認しています。



簡単な使い方説明

ファイルの読み込み

まず、プログラムを起動してファイルを読み込むと次のようになります。

塩基抽出を行う

つづいて、塩基配列以外の文字を消去します。



つづいて、塩基抽出ボタン または を押します。この操作では単純にA,T,G,C および縮重記号の N,R,Y,M,K,S,W,H,B,V,D のみを残してそれ以外の文字を消去します。左下に塩基の長さと組成を表示します。



各種解析を行う

この後は、目的に応じて各種操作を行います。

次の操作はボタンを押すと実行できます。
: リセットボタンです。プログラムの起動直後の状態に戻ります。
: 塩基抽出ボタンです。左のボタンは大文字、右は小文字に変換します。
: 相補鎖に変換します (ATGC → GCAT)。
: 逆配列に変換します (ATGC → CGTA)。
: アミノ酸配列に変換します。
: 制限酵素地図を作成します。
: 塩基読み上げを行います。

これらのほかに、メニューの中から実行できる機能があります。
[Search]-[Primer Search] : プライマーに適した配列を検索します。
[Search]-[Primer Check] : プライマー配列の評価を行います。
[Search]-[Similarity Search with Gap] : ギャップを考慮した相同配列検索を行います。
[Search]-[Search] : 文字列検索を行います。縮重記号にも対応しています。
[Edit]-[Selector] : 指定範囲の塩基を選択状態にします。



制限酵素地図の作成

塩基抽出処理後に   ボタンを押すと制限酵素地図が作成されます。



画面上半分で制限酵素地図をグラフィカル表示します。右端の[]内の数字は制限酵素の認識部位の数です。マウスとともに縦線が動きます。縦線が示しているおよその位置がウィンドウ左下に表示されます。
画面下半分で制限酵素地図をテキスト表示します。デフォルトではリストの最後にdam methylase、dcm methylase、CG methylase によるメチル化配列を載せています。参考にして下さい。Sequence Assistant の制限酵素地図は、単に認識配列の位置を表示しているだけです。メチル化の影響はユーザー様でご確認下さい。


 
塩基の読み上げ

塩基の読み上げボタン を押すと次のような読み上げウィンドウが出てきます。



カーソル位置から塩基配列を音声で読み上げます。右が順方向に読み上げ、中央が読み上げ停止、左が逆方向に読み上げのボタンです。右のスイッチをスライドさせると読み上げスピードを変更できます。

読み上げ音声は変更することもできます。



縮重記号表、コドン表の表示

メニューの [Help] の中の [Ambiguous Code] および [Codon Table] を選択すると、それぞれ縮重記号表、コドン表が表示されます。







文字列検索

縮重記号にも対応しています。



メニューの [Search] の中の [Search] を選択すると上図のようなウィンドウが出てきます。ここで文字列検索を行うことが出来ます。



セレクター



メニューの [Edit] の中の [Selector] を選択すると上図中央のようなウィンドウが出てきます。これがセレクターです。指定した範囲を選択することができます。



ギャップを考慮した相同配列検索

相同性検索では縮重記号は考慮されません。



メニューの [Search] の中の [Similarity Search with Gap] を選択すると上図のようなウィンドウが出てきます。ここでギャップを考慮した相同配列検索を行うことができます。Query 配列を塩基抽出処理すると実行できるようになります。
Word Size を小さくすると、よりスコアが低い配列もヒットし検索結果の数が増えます。Word Size の Default は 11 ですが、ヒットが 0 だった場合は自動的に 1 ずつ低い値に設定しなおして再検索し、検索結果が 1 個以上になったところで結果を表示します。Word Size を 1 にしてもヒットが出なかった場合は Not Found と表示されます。



相同性検索で何をしているか?

相同性検索では縮重記号は考慮されません。

相同性検索では、以下のパラメータを使用して判断します。
・Penalty for Mismatch (default: -3)
・Reward for Match (default: 2)
・Word Size (default: 11)
・Dropoff for Extensions (default: 5)
・Penalty to Extend Gap (default: -4)

まず、Query 配列の先頭から Word Size の文字列を切り出します。そして、Subject 配列中にこの文字列がないか検索します。

もし文字列が見つかったら、この段階のスコアは [一致した文字列の長さ (= Word Size)] x [Reward for Match] の値となります。また、ここではこのスコアを [スコア0] と呼ぶことにします。続いて Query 配列上でこの文字列より 1 文字 3' 側にあたる文字を、Subject 配列中に見つかった文字列より 1 文字 3' 側の文字と比較します。

これらの文字同士が一致したらこの段階のスコアに [Reward for Match] を加算します。一致しなかった場合は、@ ミスマッチとして処理しこの段階のスコアに [Penalty for Mismatch] を加算する、A ギャップを形成してこの段階のスコアに [Penalty to Extend Gap] を加算する、の両方を検討します。

続いて、さらに 1 文字 3' 側の文字同士を比較し、[Reward for Match] か [Penalty for Mismatch] か [Penalty to Extend Gap] のいずれかを加算します。以上の操作をスコアが [スコア0] - [Dropoff for Extensions] よりも小さくなるまで繰り返します。

ミスマッチにするか、ギャップを形成するかは、最終的なスコアが高くなるほうを採用します。

続いて Query 配列の先頭から 1 文字ずらして Word Size の文字列を切り出し、同様の操作を繰り返します。これ以降は 3' 方向だけでなく、5' 方向も比較していきます。

以上の操作を sense 方向と anti-sense 方向について調べます。

判定パラメータを調整すると、より目的に合った相同性検索を行うことができます。

検索結果はスコアが高い順に表示されます。



プライマーに適した配列の検索



メニューの [Search] の中の [Primer Search] を選択すると上図のようなウィンドウが出てきます。ここでプライマーに適した配列を検索することができます。

Maximum Poly-X:
単一塩基種の最大連続繰り返し数を指定できます。

Complementarity Score (Comp.Score):
Comp.Score は 0 以上の値を取りますが、この値が低ければ低いほど、自己アニーリングやプライマーダイマーの形成を行ないにくいと予想されます。通常の PCR であれば 3 以下ならまず問題ありません。作者はプライマーダイマーを形成してしまうプライマーを合成してしまったことがありますが、このプライマーの Comp.Score は 10.0 でした。

Number of GC in the 5 bases from 3'end:
3' 末端の 5 塩基中に存在する G または C の塩基数を指定できます。



GC%法のパラメーターの変更

次のいずれかの操作を行うと下図のようなウィンドウが出てきます。
・メニューの [Option] - [Tm] を選択する。
・メニューの [Search] - [Primer Search] を選択し、Tm 設定の部分にある [Option] ボタンを押す。
・メニューの [Search] - [Primer Check] を選択し、[Tm Calc. Method] 設定の右にある [Option] ボタンを押す。



ここで Tm 計算方法のひとつである GC% 法のパラメーターを変更できます。よくわからない場合は初期値のままにしておきましょう。下図において、左下の [Default] ボタンを押し、さらに右下の [OK] ボタンを押すと初期値に戻ります。一般的な PCR バッファーの塩濃度は 0.05 [mol/L] であり、ホルムアミドは含まれていないので、それぞれの初期値は 0.05 [mol/L]、0 [mol/L] となっています。



Tm 計算方法の選択

以下のいずれかの操作を行うと下図のようなボックスが出てきます。
・メニューの [Search] - [Primer Search] を選択する。Tm 設定の部分に下図のような [Tm Calc. Method] を設定するボックスがあります。
・メニューの [Search] - [Primer Check] を選択すると出現するウィンドウの中央部分に下図のような [Tm Calc. Method] を設定するボックスがあります。



プライマー配列の一例: 5'-TTg CgC TgT CTC Tgg Tgg CTC C-3' の場合にどのような計算を行うか説明します。

AUTO:
おまかせモードです。よくわからない場合はこのモードにしておきましょう。まず、GC%法でTm値を計算します。計算の結果、Tm値が20℃よりも高かったらそのまま採用します。20℃よりも低かった場合には、GC=4℃、AT=2℃ として再計算し、この値を使用します。例にあげたプライマーの場合は GC% 法の結果である 63.3℃ を採用します。

GC= 4, AT= 2:
常にGC=4℃、AT=2℃ とした足し算で計算します。
例にあげたプライマーの場合、

Tm = 2+2+4+4+4+4+2+4+2+4+2+4+2+4+4+2+4+4+4+2+4+4
   = 72℃

になります。

GC%:
常に GC% 法で計算します。計算式は次の通りです。

Tm = 81.5 + 16.6 x log10 ([Na+] + [K+]) + 0.41(GC%) - 500/L-0.62 x F

ここで、

[Na+] + [K+] --- Na+ と K+ のモル濃度の合計 [mol/L]。
GC% --- G および C の割合 [%]。
L --- 二本鎖を形成する部分のプライマーの長さ。
F --- ホルムアミドのモル濃度 [mol/L]。

Tm オプションの設定が、

バッファー中の一価の陽イオン (Na+、K+) の濃度 = 0.05 [mol/L] (初期値)
バッファー中のホルムアミド濃度 = 0 [mol/L] (初期値)

に設定されている場合、例にあげたプライマーの Tm 値は、

Tm = 81.5 + 16.6 x log10 (0.05) + 0.41 x (63.6) - 500/22-0.62 x 0
   = 81.5 + 16.6 x (-1.3) + 26.1 - 22.7
   = 63.3℃

になります。



Complementarity Score とは

この機能では縮重記号は考慮されません。

Comp.Score は同一分子内での自己アニールのしやすさ (2 次構造の取りやすさ) やプライマーダイマーの形成のしやすさの目安となるスコアで 0 以上の値を取ります。この値が小さいほど、自己アニーリングやプライマーダイマーの形成を行ないにくいと予想されます。通常の PCR が目的であれば 3 以下の配列を選択すればまず問題ありません。プライマー検索機能や、プライマー評価機能で使用しています。

Comp.Score の算出方法

1 つの塩基配列について算出する場合

例えば、5'-ATCGGCTACTAGTCAATGTG-3' という塩基配列について計算する場合は、次のようなことを行なっています。まず、この塩基配列を次のように並べます。

5' ATCGGCTACTAGTCAATGTG 3'
3' GTGTAACTGATCATCGGCTA 5'

そして、左から順に互いに相補的になる塩基に印をつけます。

5' ATCGGCTACTAGTCAATGTG 3'
     |    ||||||    |
3' GTGTAACTGATCATCGGCTA 5'

ここで Comp.Score を計算します。左から順に見て行き、互いに相補的なら +1、そうでなければ -1 という足し算を行います。この場合は次のようになります。

-1-1+1-1-1-1-1+1+1+1+1+1+1-1-1-1-1+1-1-1 = -4

Comp.Score は最小値を 0 とします。マイナスの値が出ても 0 です。従って、この場合の Comp.Score は 0 となります。

次に、上側の配列を 1 塩基分右にずらして同様の計算を行ないます。

 5' ATCGGCTACTAGTCAATGTG 3'
    |                 |
3' GTGTAACTGATCATCGGCTA 5'

この場合の Comp.Score は次のような計算から 0 となります。

+1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1+1 = -15

続いて上側の配列をさらに 1 塩基分右にずらして Comp.Score を計算します。

  5' ATCGGCTACTAGTCAATGTG 3'
         |        |
3' GTGTAACTGATCATCGGCTA 5'

これを続けて行くと、最後はこうなります。

                   5' ATCGGCTACTAGTCAATGTG 3'
3' GTGTAACTGATCATCGGCTA 5'

ここまで来たら、また両端を揃えて、今度は下側の配列を 1 塩基分右にずらして Comp.Score を計算します。この場合の Comp.Score は 0 です。さらに続けます。

5' ATCGGCTACTAGTCAATGTG 3'
         |       |
 3' GTGTAACTGATCATCGGCTA 5'

これを続けて行くと、最後はこうなります。

5' ATCGGCTACTAGTCAATGTG 3'
                   3' GTGTAACTGATCATCGGCTA 5'

この配列の Comp.Score は、以上の一連の操作の計算結果のうちの最大値です。この場合は次の時の 7.0 となります。

   5' ATCGGCTACTAGTCAATGTG 3'
      || | ||| ||| | ||
3' GTGTAACTGATCATCGGCTA 5'


2 つの塩基配列について算出する場合

プライマー評価機能で使用しています。方法は基本的に 1 つの塩基配列について算出する場合と同じです。まず、2 つの塩基配列それぞれについて、Comp.Score を算出します。

続いて 2 つの塩基配列を並べ、1 つの塩基配列について行なったのと同様に 1 塩基分ずつずらしながら、Comp.Score を計算します。

以上の操作を全て行なった後、得られた Comp.Score の最大値を Comp.Score として表示します。

このようにして、2 つの塩基配列で形成され得るすべての組み合わせについて計算を行ないます。



プライマーの評価

この機能では縮重記号は考慮されません。



メニューの [Search] の中の [Primer Check] を選択すると上図のようなウィンドウが出てきます。ここでプライマー配列を評価することができます。ここでは、2 つの配列を評価した場合の例を示しています。
まず、評価したプライマー配列を 3 残基ごとに区切って空白を入れ 'A,T,C' は大文字で 'g' は小文字で表示します。続いてプライマーの長さ、GC含量、Comp.Score、プライマーの分子量、プライマーの 1 OD260 あたりの質量 [ug]、100uM 溶液に調製する場合のプライマーの濃度 [ng/uL] を表示します。
続いて Comp.Score の最大値を取るハイブリダイズのパターンを表示します。上図の Primer 2 はプライマーダイマーを形成することがわかります。

1 OD260 あたりの質量の算出方法

例えば、5'-ATCGGCT-3' という塩基配列について計算する場合は、次のようなことを行なっています。
まず、以下の式によりプライマーの分子量を計算します。

A 残基の数 x 313.2 + C 残基の数 x 289.2 + G 残基の数 x 329.2 + T 残基の数 x 304.2 - 61.9

例の塩基配列の分子量は 2096.50 となります。
続いて、次の表から隣接する塩基の Pairwise 吸光係数を求め、合計します。これを UV 値とします。

Pairwise 吸光係数


例の塩基配列の場合、

11.4 + 8.1 + 9.0 + 10.8 + 8.8 + 7.6 = 55.7 (UV 値)

続いて、次の表から両端の塩基を除いた全ての塩基の吸光係数を求め、合計します。これを Eb 値とします。

塩基の吸光係数


例の塩基配列の場合、両端の A および T を除く 5 塩基分の吸光係数を合計します。

8.7 + 7.4 + 11.5 + 11.5 + 7.4 = 46.5 (Eb 値)

次の計算式に上記の UV 値および Eb 値を当てはめます。この値が [ug/OD260] にあたります。

分子量 ÷ (2 × UV 値 - Eb 値)
= 2096.50 ÷ (2 × 55.7 - 46.5)
= 32.30 [ug/OD260]

となります。




表示フォーマットの調整

メニューの [option] の中の [view] を選択すると次のウィンドウが出現します。ここで、DNA/AminoAcid、DNA/Number、AminoAcid/Number の各ページの 1 行あたりの文字数を変えることができます。





制限酵素データの編集

制限酵素データのフォーマットに問題があると Sequence Assistant が誤動作する可能性があります。編集はユーザー様の自己責任で行ってください。

制限酵素データを編集する前にオリジナルデータをバックアップされることをお勧めします。

制限酵素データはテキストファイルで、Sequence Assistant の本体である「seq_20.exe」と同じフォルダにあります。ファイル名は「redata.dat」です。

デフォルトではリストの最後に dam methylase、dcm methylase、CG methylase によるメチル化配列を載せています。参考にして下さい。

「redata.dat」ファイルのフォーマットには次のような決まりがあります。

・行頭に「//」を付けることによりコメントアウトできます。
・行頭で改行しても問題ありません。
・「制限酵素名+コンマ+認識配列+改行」を空白を入れずに書きます。認識部位を「!」で表示しなければなりません。
・ファイルは「seq_20.exe」と同じフォルダに存在する必要があります。

以下に標準で添付されている 「redata.dat」の内容を示します。

------------------------- ここから -------------------------
//
// Restriction Endonucleases data for Sequence Assistant software.
//
AatII,GACGT!C
AccI,GT!MKAC
AccII(FnuDII),CG!CG
AccIII,T!CCGGA
AflII,C!TTAAG
AgeI,A!CCGGT
AluI,AG!CT
ApaLI,G!TGCAC
ApaI(Bsp120I),G!GGCCC
AseI,AT!TAAT
AvaII,G!GWCC
BalI,TGG!CCA
BamHI,G!GATCC
BclI,T!GATCA
BglI,GCCNNNN!NGGC
BglII,A!GATCT
BssHII,G!CGCGC
BstXI,CCANNNNN!NTGG
DraI(AhaIII),TTT!AAA
EcoRI,G!AATTC
EcoRII(MvaI),CC!WGG
EcoRV,GAT!ATC
FspI,TGC!GCA
HaeIII,GG!CC
HhaI,GCG!C
Hin6I,G!CGC
HindIII,A!AGCTT
HinfI,G!ANTC
HpaI,GTT!AAC
KpnI,GGTAC!C
MluI,A!CGCGT
MspI(HpaII),C!CGG
NarI(BbeI),GG!CGCC
NciI,CC!SGG
NcoI,C!CATGG
NdeI,CA!TATG
NdeII(MboI),!GATC
NheI,G!CTAGC
NotI,GC!GGCCGC
NruI,TCG!CGA
NsiI,ATGCA!T
NspV,TT!CGAA
PstI,CTGCA!G
PvuII,CAG!CTG
RsaI(Csp6I),G!TAC
SacI(SstI),GAGCT!C
SacII(SstII),CCGC!GG
SalI,G!TCGAC
Sau3AI,!GATC
ScaI,AGT!ACT
SmaI,CCC!GGG
SpeI,A!CTAGT
SphI,GCATG!C
SspI,AAT!ATT
StuI(AatI),AGG!CCT
StyI,C!CWWGG
TaqI,T!CGA
XbaI,T!CTAGA
XhoI,C!TCGAG
dam methylase,G!ATC
dcm methylase,C!CWGG
CG methylase,!CG
------------------------- ここまで -------------------------


読み上げ音声の変更

読み上げ音声のファイルに問題があると Sequence Assistant が誤動作する可能性があります。変更はユーザー様の自己責任で行ってください。

読み上げ音声を変更する前にオリジナルデータをバックアップされることをお勧めします。
塩基読み上げの声は wav ファイルで次の 5 種類からなり、Sequence Assistant の本体である 「seq_2x.exe」 と同じフォルダにあります。

・a.wav : a に対応します。
・t.wav : t に対応します。
・g.wav : g に対応します。
・c.wav : c に対応します。
・errror.wav : 上記以外に対応します。
これらのファイルをお好きな wav ファイルで置き換えれば読み上げ音声を変更することができます。ただし、次のような決まりがあります。

・ファイル名を変更してはいけません。
・5 種類のファイルがすべて揃っている必要があります。
・ファイルは 「seq_2x.exe」 と同じフォルダに存在する必要があります。



バージョンアップ履歴

ver.2.1 → ver.2.2
・プライマー検索機能を強化しました。
・右クリックメニューを付けました。
・プライマーの評価画面で、プライマーの分子量を表示する機能を付けました。
・プライマーの評価画面で、1 OD260 あたりの質量 [ug/OD] を表示する機能を付けました。
・プライマーの評価画面で、100uM 溶液に調製する場合のプライマーの濃度 [ng/uL] を表示する機能を付けました。
・ヘルプを html 形式にしました。

ver.2.0 → ver.2.1
・Tmの計算方法を改良しました。今まではGC=4℃、AT=2℃ とした計算のみしかできませんでしたが、GC% 法による計算もできるようにしました。計算に用いる対象バッファー中の塩濃度の値も変更することができます。

ver.1.5.3 → ver.2.0
・ギャップを考慮した相同性検索機能を付けました。
・[Selector] 機能を付けました。指定した範囲の塩基配列を選択状態にすることができます。
・[Primer Check] で、予想されるプライマー同士のハイブリダイズパターンを表示するようにしました。
・制限酵素地図をグラフィカルに表示するようにしました。
・逆配列への変換機能を付けました。
・読み上げ機能で読み上げスピードの変更ができるようにしました。
・[Search] 機能を改良し、前後いずれの方向にも検索できるようにしました。



謝辞

Seauence Assistant のインストールプログラムの作成に nobukichi 氏の「簡単インストーラ」を利用させて頂きました。この場を借りてお礼申し上げます。

nobukichi 氏のホームページ:
http://www5a.biglobe.ne.jp/~nobukich/



作者連絡先

作者のメールアドレスは haruta@mx3.mesh.ne.jp です。
ソフトに関するご質問やご要望などお気軽にお寄せ下さい。



2006/5/31
2009/5/17 修正