[[卒業研究テーマ]]
*tRNA遺伝子データベースの構築に向けた網羅的tRNA遺伝子の探索 [#i78e8aee]
本研究は、Complete genomeだけでなく、ゲノムショトガン配列決定で得られたcontig配列やメタゲノム配列を含めた大量ゲノム情報を対象に、専門研究者の協力を得て、tRNA遺伝子のデータベースを作成することを目標としている。今年度はComplete genome のtRNA遺伝子を網羅的に探索することによって、各プログラムの評価を行ない、網羅的な探索のプロトコルを確立し、tRNA遺伝子から見た微生物の特徴を検討した。
DDBJ内のGIB(Gene Information Broker, http://gib.genes.nig.ac.jp/)からBacteriaのComplete genome(541種(2007年7月11日時点))、ArchaeaのComplete genome(48種(2007年10月30日時点))を取得し、tRNA遺伝子の探索を行った。tRNA遺伝子の探索には、
ARAGORN1.1 (http://130.235.46.10/ARAGORN1.1/HTML/ARAGORNB.html)、
tRNAfinder1.0 (http://ei4web.yz.yamagata-u.ac.jp/~kinouchi/tRNAfinder/)、
tRNAscan-SE1.23 (http://lowelab.ucsc.edu/tRNAscan-SE/)
の3種類のtRNA遺伝子領域予測プログラムを使用した。
BacteriaのComplete genome配列に対して3種類のプログラムを実行した結果、ARAGORN1.1は28545件、tRNAfinder1.0は28014件、tRNAscan-SE1.23は28636件のtRNA遺伝子候補を検出した。3種類のプログラムで共通して予測されたtRNA遺伝子候補に加えて、専門研究者による偽tRNA遺伝子のマニュアルチェックの結果をあわせて、tRNA遺伝子とみなされたものは合計28395件となった。この結果から各プログラムの感度と精度を算出すると、ARAGORN1.1の感度は100.0%であり精度は99.4%、tRNAfinder1.0の感度は98.6%であり精度は100.0%、tRNAscan-SE1.23の感度は99.8%であり精度は99.0%となった。
ArchaeaのComplete genome配列に対して3種類のプログラムを実行した結果、ARAGORN1.1は2079件、tRNAfinder1.0は1626件、tRNAscan-SE1.23は2084件のtRNA遺伝子候補を検出した。このうちイントロンを含むtRNA遺伝子候補は、ARAGORN1.1は368件、tRNAscan-SE1.23は332件であった。tRNAfinder1.0はイントロンが検出できないため0件だった。
今回の結果から、本研究で採用した網羅的な探索のプロトコルは、イントロンを含まないtRNA遺伝子候補については、現在問題はない。しかしイントロンを含むtRNA遺伝子候補については改良の必要がある。