[[卒業研究テーマ]]
*マウスゲノムにおけるタンパク質をコードしないRNA類に対しての一括学習型自己組織化マップ (BLSOM)を用いた解析 [#f29b2d78]
近年、トランスクリプトームに対する網羅的解析により、タンパク質をコードしないRNA(Non-coding RNA, ncRNA) の存在が明らかになった。その数は非常に膨大であり、
未だ実験的に機能が特定されていないncRNAが大多数を占めている。
本研究では、マウスゲノム由来のncRNAを対象に、連続塩基頻度に基づく一括学習型自己組織化マップ法(Batch Learning Self Organizing Map, BLSOM)を用いて、実験の際に指針となるようなncRNAの機能推定法の確立を試みた。ncRNAを単独でBLSOMにかけた場合、入力データが単一である為に、得られるマップにて連続塩基出現傾向が大きく異なる領域を視覚的に確認することが困難であるので、ncRNAと[ncRNAの連続塩基頻度を反映させて作成したランダム配列]の2つの集合を入力データとして用いた。
今回は、ncRNAと[ncRNAの連続塩基頻度を反映させて作成したランダム配列]の比を1:1、1:2、1:3として1~5連塩基BLSOMを実行した。ここで、ncRNAと、《ncRNAのダイヌクレオチド頻度を反映させたランダム配列》を1:3の比で入力データとした5連塩基BLSOMの結果において、ncRNAクラスターが最も分離していた。各クラスターについて調べた処、通常、ゲノム全体では出現が低頻度となっているTAやCGを含む5連塩基の出現が高頻度となっているクラスターが1個存在した(以降これをAクラスターと呼ぶ)。次に、機能情報が付加されたncRNAのデータセットを”RNAdb(http://research.imb.uq.edu.au/rnadb/default.aspx)”から取得し、その連続塩基使用傾向が5連塩基BLSOM結果上のどの格子点と似ているかを尺度に、両者の重ね合わせを行った。Aクラスターに帰属した機能既知ncRNAを見たところ、Fox遺伝子やHox遺伝子といった転写制御因子遺伝子のアンチセンス鎖が大多数であった。本研究の結果、TATAボックスやCpGアイランドのような転写制御部位で特徴的な配列を高頻度に含むncRNAは5連塩基BLSOMにおいて独自のクラスターを形成している可能性が示唆された。
本研究を通して、ncRNAの中で5連塩基の使用傾向の違いが存在する事が5連塩基BLSOMにより分かったが、各クラスターに存在するncRNA配列群の機能的な類似性については明確な結論が得られなかった。