遺伝子発現量予測
個々の遺伝子の発現量を予測するとともに、物質生産のために遺伝子発現量を最適化することは、産業応用上重要な課題である。
長浜バイオ大学 池村淑道教授と奈良先端科学大学院大学 金谷重彦教授との共同研究にて、主成分分析を用いて、単細胞生物種(細菌および酵母)の種固有のコドン使用の不均一性(コドン使用多様性)をモデル化すること、および、種固有のコドン使用の偏りを利用した遺伝子の発現量の推定法の開発を行ってきました[3-12]。
実際には、細菌の遺伝子の性質をコドン使用相対頻度により61次元のベクトル(終止コドン除く)に表現し、61次元空間における遺伝子の分布を最大に拡げる軸(以下ではZ1軸と呼ぶ)を主成分分析により推定しました。
その結果、
- Z1軸の性質は長浜バイオ大学 池村淑道教授が整理した最適コドン決定規則 (tRNA量に基づいた翻訳効率と関わる最適コドンの決定法, 表1) により説明することができます[1-2,10-12]。したがって、最適コドン決定規則を用いることにより、情報科学的解析のみで種固有の最適コドンを推定することができる。
- ゲノム全塩基配列が決定された17種の細菌(A. aeolicus、 A. fulgidus、 B. subtilis, B. burgdorferi, C. trachomatis, E. coli, H.influenzae, H. pylori、 M. jannaschii, M. thermoautotrophicum, M. tuberculosis, M. genitalium, M. pneumoniae, P. horikoshii, R. prowazekii, Synechocystis sp. , T. pallidum) についてこのような解析を進めたところ、リボソーム蛋白質遺伝子および翻訳伸長因子といういわゆる細胞内で常に発現量が高いと仮定される遺伝子のコドン使用が生物全体の遺伝子のコドン使用とは異なっていることがZ1軸における遺伝子の分布により観察することができた。
以上の結果により、Z1における遺伝子の分布および細胞内で多量に存在するtRNAを組み合わせることにより、解析対象とした細菌の最適コドンを決めることができ、大まかではあるがコドン使用から細胞内で遺伝子の発現量(蛋白質生産量)を推定することができる。
以下に、Z1における遺伝子の分布の一例として、大腸菌K-12 MG1655のZ1における遺伝子の分布図を全遺伝子、リボソーム遺伝子、外来性遺伝子(Transposase)の3種類別に示す (図1)。この結果を見ると、リボソーム遺伝子がZ1において正に分布し、外来性遺伝子がZ1において負に分布していることがわかる。
表1 翻訳過程による最適コドン決定規則
- 規則1:コドン使用は細胞内のtRNA量による制約を受ける。最適コドンは、細胞内に多量に含まれるtRNAのアンチコドンと対応する。
- 規則2:アンチコドンの第1番目塩基のウリジンが化学修飾を受けメチルチオウリジン誘導体となった場合には、コドン第3番目の位置ではGよりもAを好む。
- 規則3:アンチコドンの第1番目塩基が化学修飾を受けイノシンとなった場合には、コドン第3番目の位置ではAよりもUあるいはCを好む。
- 規則4:(A/U)-(A/U)-ピリミジン型の二つのコドンからなるアミノ酸においては、 コドン第3番目の位置ではUよりもCにおいてコドン-アンチコドン間の相互作用が最適である。
- 規則5:二種のアミノ酸(ヒスチジンとアスパラギン酸)のコドンは、それぞれ一種のアンチコドン(GUGおよびGUC)を有するtRNAで対合し、アンチコドン第1位置とコドン第3位置の相互作用においてワトソン-クリック型塩基対合が最適な相互作用となる。
参考文献†
- Ikemura T., Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes., J. Mol. Biol., 146, 1-21, (1981).
- Ikemura T., Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the E. coli translational system., J. Mol. Biol., 151, 389-409, (1981).
- Kanaya S., Kudo Y., Assessment of species-specific codon usage by principal component analysis., Genome Informatics Series, No. 4, 231-238 (1993).
- Kanaya S., Ikemura T., Kudo Y., Relationship between gene function and codon usage in Escherichia coli on the basis of principal component analysis., Genome Informatics Series, No. 5, 186-187 (1994).
- Kanaya S., Kudo Y., Nakamura Y., Toshimichi Ikemura, Assessment of species-specific diversity of genes in codon usage., Genome Informatics Series, No. 6, 86-87 (1995).
- Kanaya S., Kudo Y., Nakamura Y., Ikemura I., Estimation of protein-production levels in Escherichia coli genes on the masis of multivariate diversity in codon usage., Genome Informatics Series, No. 6, 86-87 (1995).
- Kanaya S., Kudo Y., Suzuki S., Ikemura T., Systematization of species-specific diversity of genes in codon usage: comparison of the diversity among bacteria and prediction of the protein production levels in cells., Genome Informatics Series, No. 7, 61-71 (1996).
- Kanaya. S., Kudo Y., Abe T., Okazaki T., Carlos D. C., Ikemura T., Gene classification by self-organization mapping of codon usage in bacteria with completely sequenced genome., Genome Informatics Series, No. 9, 369-371 (1998).
- Abe T., Kanaya S., Kinouchi M., Kudo Y., Mori H., Matsuda H., Carlos D. C., Ikemura T., Gene classification method based on batch-learning SOM., Genome Informatics Series, No. 10, 314-315 (1999).
- Kanaya S., Kudo Y., Nakamura Y., Ikemura T., Detection of genes in Escherichia coli sequences determined by genome projects and prediction of protein production levels, based on multivariate diversity in codon usage, CABIOS, 12, 213-225 (1996).
- Kanaya S., Okumura T., Miyauchi. M, Fukagawa H., Kudo Y., Assessment of protein coding sequences in Bacillus subtilis genome using species-specific diversity of genes in codon usage based on multivariate analysis: comparison of the diversity between B. subtilis and Escherichia coli., Res.Comm. in Biochem. and Cell & Mol. Biol., 1, 82-92 (1997).
- Kanaya S., Yamada Y., Kudo Y. Ikemura T., Studies of codon usage and tRNA genes of 18 unicellular organisms and quantification of Bacillus subtilis tRNAs: gene expression level and species-specific diversity of codon usage based on multivariate analysis., Gene, 238, 143-155 (1999).