BLSOMviewer の履歴ソース(No.1)

[[Bioinfomatics Laboratory]]
[[English version>BLSOM]]

-ゲノム配列データを対象にした連続塩基組成に基づく一括学習型自己組織化マップ(BLSOM)解析
我々は,ゲノムに潜む生物種固有の特徴を解明する目的で,大量かつ多次元データの2次元や3次元でのクラスタリングと可視化法として,コホネン博士らが開発した,教師なし学習アルゴリズム「自己組織化マップ(Self-Organizing Map, SOM)」に着目し,コホネンSOMの長所を生かしながら,再現性のある分類結果を得るアルゴリズムとして「一括学習型自己組織化マップ(Batch-Learning Self-Organizing Map, BLSOM)」を開発し,ゲノム配列解析に適用しています.
3連や4連塩基といった連続塩基(オリゴヌクレオチド)の出現頻度に着目することで,生物種の情報を計算の途中で一切与えずに,連続塩基の出現頻度の類似性だけを基に,ゲノム配列断片を生物種ごとに高精度に分離(自己組織化)させる強力なクラスタリング能力を持ち,その結果を容易に可視化できます.BLSOM法の詳細なアルゴリズムについては,著者らの他の解説書や原著論文を参照下さい.
本ページでは,ゲノム配列データから,ゲノム配列を断片化し,その配列断片の連続塩基組成の度数(もしくは,頻度)を計算し,BLSOM解析をLinux上で行うプログラム一式と,そのBLSOM解析結果を容易に閲覧可能なBLSOM Viewer(Windows or Linuxで利用可能)のダウンロードサイトとなります.