遺伝子発現量予測 の履歴差分(No.2)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[Ikemura Laboratory]]

個々の遺伝子の発現量を予測するとともに、物質生産のために遺伝子発現量を最適化することは、産業応用上重要な課題でありますが、この発現量予測技術は未成熟な段階にあります。ここでは、翻訳レベルと転写レベル、および発現制御に関わる情報科学的予測手法の開発も進めて参りました。今回はこの技術の概要の紹介を行います。

当研究室池村教授と奈良先端科学大学院大学金谷教授の共同研究にて、ゲノム大量情報処理技術の開発の一環として、線形写像法の主成分分析を中心とする多変量解析法を用いて、単細胞生物種(細菌および酵母)の種固有のコドン使用の不均一性(コドン使用多様性)をモデル化すること、および、種固有のコドン使用の偏りを利用した遺伝子の発現量の推定法の開発を行ってきました[3-12]。
実際には、細菌の遺伝子の性質をコドン使用相対頻度により61次元のベクトル(終止コドン除く)に表現し、61次元空間における遺伝子の分布を最大に拡げる軸(以下ではZ1軸と呼ぶ)を主成分分析により推定しました。
その結果、

   1. Z1軸の性質は国立遺伝学研究所・池村淑道教授が整理した最適コドン決定規則(tRNA量に基づいた翻訳効率と関わる最適コドンの決定法)により説明することができます[1-2,10-12]。したがって、最適コドン決定規則を用いることにより、情報科学的解析のみで種固有の最適コドンを推定することができます。
+Z1軸の性質は国立遺伝学研究所・池村淑道教授が整理した最適コドン決定規則(tRNA量に基づいた翻訳効率と関わる最適コドンの決定法)により説明することができます[1-2,10-12]。したがって、最適コドン決定規則を用いることにより、情報科学的解析のみで種固有の最適コドンを推定することができます。
+ゲノム全塩基配列が決定された17種の細菌(A. aeolicus、 A. fulgidus、 B. subtilis, B. burgdorferi, C. trachomatis, E. coli, H.influenzae, H. pylori、 M. jannaschii, M. thermoautotrophicum, M. tuberculosis, M. genitalium, M. pneumoniae, P. horikoshii, R. prowazekii, Synechocystis sp. , T. pallidum) についてこのような解析を進めたところ、リボソーム蛋白質遺伝子および翻訳伸長因子といういわゆる細胞内で常に発現量が高いと仮定される遺伝子のコドン使用が生物全体の遺伝子のコドン使用とは異なっていることがZ1軸における遺伝子の分布により観察することができました。

   2. ゲノム全塩基配列が決定された17種の細菌(A. aeolicus、 A. fulgidus、 B. subtilis, B. burgdorferi, C. trachomatis, E. coli, H.influenzae, H. pylori、 M. jannaschii, M. thermoautotrophicum, M. tuberculosis, M. genitalium, M. pneumoniae, P. horikoshii, R. prowazekii, Synechocystis sp. , T. pallidum) についてこのような解析を進めたところ、リボソーム蛋白質遺伝子および翻訳伸長因子といういわゆる細胞内で常に発現量が高いと仮定される遺伝子のコドン使用が生物全体の遺伝子のコドン使用とは異なっていることがZ1軸における遺伝子の分布により観察することができました。

以上の結果により、Z1における遺伝子の分布および細胞内で多量に存在するtRNAを組み合わせることにより、解析対象とした細菌の最適コドンを決めることができ、大まかではあるがコドン使用から細胞内で遺伝子の発現量(蛋白質生産量)を推定することができます。
以下に、Z1における遺伝子の分布の一例として、ゲノム全塩基配列が決定された3種の細菌 (E.coli, B.halodurans, H.influenzae)のZ1における遺伝子の分布図を全遺伝子、リボソーム遺伝子、外来性遺伝子(Transposase)の3種類別に表示いたします。この結果を見ると、リボソーム遺伝子がZ1において正に分布し、外来性遺伝子がZ1において負に分布していることがわかります。

#ref(PCA.PNG,center,nowrap,nolink,図1)

**参考文献 [#f086668d]
+Ikemura T., Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes., J. Mol. Biol., 146, 1-21, (1981).
+Ikemura T., Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the E. coli translational system., J. Mol. Biol., 151, 389-409, (1981).
+Kanaya S., Kudo Y., Assessment of species-specific codon usage by principal component analysis., Genome Informatics Series, No. 4, 231-238 (1993).
+Kanaya S., Ikemura T., Kudo Y., Relationship between gene function and codon usage in Escherichia coli on the basis of principal component analysis., Genome Informatics Series, No. 5, 186-187 (1994).
+Kanaya S., Kudo Y., Nakamura Y., Toshimichi Ikemura, Assessment of species-specific diversity of genes in codon usage., Genome Informatics Series, No. 6, 86-87 (1995).
+Kanaya S., Kudo Y., Nakamura Y., Ikemura I., Estimation of protein-production levels in Escherichia coli genes on the masis of multivariate diversity in codon usage., Genome Informatics Series, No. 6, 86-87 (1995).
+Kanaya S., Kudo Y., Suzuki S., Ikemura T., Systematization of species-specific diversity of genes in codon usage: comparison of the diversity among bacteria and prediction of the protein production levels in cells., Genome Informatics Series, No. 7, 61-71 (1996).
+Kanaya. S., Kudo Y., Abe T., Okazaki T., Carlos D. C., Ikemura T., Gene classification by self-organization mapping of codon usage in bacteria with completely sequenced genome., Genome Informatics Series, No. 9, 369-371 (1998).
+Abe T., Kanaya S., Kinouchi M., Kudo Y., Mori H., Matsuda H., Carlos D. C., Ikemura T., Gene classification method based on batch-learning SOM., Genome Informatics Series, No. 10, 314-315 (1999).
+Kanaya S., Kudo Y., Nakamura Y., Ikemura T., Detection of genes in Escherichia coli sequences determined by genome projects and prediction of protein production levels, based on multivariate diversity in codon usage, CABIOS, 12, 213-225 (1996).
+Kanaya S., Okumura T., Miyauchi. M, Fukagawa H., Kudo Y., Assessment of protein coding sequences in Bacillus subtilis genome using species-specific diversity of genes in codon usage based on multivariate analysis: comparison of the diversity between B. subtilis and Escherichia coli., Res.Comm. in Biochem. and Cell & Mol. Biol., 1, 82-92 (1997).
+Kanaya S., Yamada Y., Kudo Y. Ikemura T., Studies of codon usage and tRNA genes of 18 unicellular organisms and quantification of Bacillus subtilis tRNAs: gene expression level and species-specific diversity of codon usage based on multivariate analysis., Gene, 238, 143-155 (1999).