同じ配列断片から複数個所シーケンスする利点とは

 次世代シーケンサー(NGS)では、機種以外に機種ごとにシーケンスの手法を選ぶことができます。配列断片から単純に数百 base シーケンスするほかに、「同じ配列断片から複数個所シーケンスする」手法があります。有名なので例を挙げると Paired-End のことです。これに、どんな利点があるのかお話いたします。ここで挙げているものは一部で、様々な利用方法の開発が行われています。

マッピングの正確性を上げる

 ゲノムなどのリファレンスにマッピングを行う際に、同じ配列断片からシーケンスされた配列データは、近い位置に該当すると考えられます。例えば、類似配列により、リファレンス上の複数個所に該当しそうだった場合、もう片方の該当位置から、どちらがより正しいかの判断に使えます。
☞以前のマッピングの話題はこちら

de novo アセンブルでつなげた配列を長くできる

 de novo でよくある大まかな計算フローとして、1. アセンブル、2. スキャッフォールディング、3. ギャップクローズ、の流れがあります。このうちスキャッフォールディングで特に活躍します。
 スキャッフォールディングとはアセンブルでつなげた結果であるコンティグ配列同士をつなげる作業です。コンティグに対しマッピングを行った際に、同じ配列断片から得られた配列データが、それぞれ、異なるコンティグに該当したとします。そのコンティグ同士は近くにあったことがわかるため、間を塩基不明を意味する「N」で埋めてつなげ、長くします。

検出変異の種類が増える

 マッピングと同様に、同じ配列断片からシーケンスされた配列データは、マッピングすると近い位置に該当すると思われます。ただ、サンプルの配列はリファレンスと差があります。例えば、転座箇所から複数個所シーケンスした場合、これらは異なるクロモゾームにマップされます。また、シーケンスを行った配列断片の長さと断片上の位置がわかれば、通常のアライメント計算ではうまくマップできないような大きな InDel のある箇所も、またいでマッピングができる為、検出することが可能です。
☞以前のアライメントの話題はこちら

→次回「ペアシーケンス時の方向の情報はどう使うか」