研究内容紹介

Bioinformatics Laboratory

一括学習型Self-Organizing Map (Batch-Learning SOM, BLSOM) の開発

  • BLSOMについて
  • スパコンでの超大量データ解析のための並列化と高速化
  • GPUによる高速化とGPUによる高速化に向けたアルゴリズムの改良
  • 教師なしと教師あり学習の評価
  • 距離尺度の計算方法のチューニング
  • 配列データからの数値化方法の検討
  • ランダム配列を用いた解析
  • BLSOMとLVQを組み合わせた半教師あり機械学習法の提案
  • BLSOM Viewerの開発
  • 新型コロナウイルスゲノム解析

SC-BLSOM (Self-Compressing BLSOM)の開発

  • SC-BLSOMを活用したメタゲノム配列に対する系統推定法の開発
  • 植物ゲノムからの微生物由来水平伝播候補遺伝子の網羅的な検出

BLSOMを用いたゲノム配列解析

コドン組成解析

ゲノム配列に潜む連続塩基組成の生物種によるゲノムサイン (Genome Signature) の解明

  • ゲノムサインとその生物学的な意味の解明
  • 微生物ゲノムの水平伝播からみた微生物間の進化過程の解明
    • プロピオン酸酸化共生細菌ゲノム解読と共生によるゲノム進化の解明
    • テーラーメードプロバイオティクスを目指したビフィズス菌属の俯瞰的ゲノム解析
  • ヒトや哺乳類動物に特有な特徴を持つゲノム領域の特徴抽出
    • ランダム配列を用いた機能領域の探索
    • マウスインプリンティング遺伝子のDMRに共通な特徴の探索
    • 複製の時期、複製の開始や休止、染色体や細胞核の組織構造を決めているシグナルの探索。
  • 遺伝子制御機構に関与する転写因子の特徴の解明と探索
    • 転写開始上流配列解析
    • non-cording RNAに対する機能分類
  • ウイルスゲノムの連続塩基組成に基づく宿主特異性の解明
  • インフルエンザウイルスゲノムに対する変異予測

環境中より取得されたメタゲノム配列に対する生物系統推定法の開発

地球環境システムプロジェクトへの参加

  • キルギス・グレゴリア氷河メタゲノム解析
  • 南極や北極の氷山・氷床コアに存在する微生物の多様性の解明
  • 南極湖底中のコケ坊主の微生物相の解明と生命システムの推定
  • 南極湖底中のコケ坊主より単離された微生物ゲノム解読とその比較ゲノム解析
    • 南極および北極由来Pseudomonas属の低温適応とゲノム組成との関係性について
    • 南極由来Sphingomonas属の低温適応と遺伝子水平伝播の関係について
    • 水平伝播遺伝子と低温適応との関係について

メタゲノム配列からの新規ゲノム検出法の開発

  • 塩基組成を反映させたランダム配列を用いた新規ゲノム検出法の開発

メタゲノム配列群集からのウイルスゲノムの検出と系統推定手法の開発

  • ダニメタゲノムからのウイルスゲノム検出とその由来推定

水平伝播候補遺伝子の検出とその由来系統の推定法の開発

  • 真核生物とその共生細菌との水平伝播候補遺伝子のやりとりの解明に向けて
    • ツェツェバエとその共生細菌
    • 原虫とその共生細菌
  • 環境内に生息する微生物叢での水平伝播候補遺伝子のやりとりの解明に向けて
  • 植物ゲノムからの微生物由来水平伝播候補遺伝子の検出に向けて

連続アミノ酸組成に基づくタンパク質アミノ酸配列解析

  • BLSOM解析によるタンパク質の機能別によるクラスタリングに基づく機能推定法の開発
  • 連続アミノ酸頻度の距離関係に基づくたんぱく質の機能分類法の開発
  • ウイルスタンパク質アミノ酸配列に対するShort Linear Motif検出法の開発

ウイルスゲノム配列解析

  • 宿主適応に関係したインフルエンザウイルスゲノムの連続塩基組成の解析
  • ウイルス種における連続塩基組成に基づく宿主特異性の解明
  • 新規ウイルス種に対する宿主域予測

比較ゲノム解析

  • 大腸菌ゲノム国際アノテーション会議に参加し、MG1655とW3110の遺伝子開始位置の同定を共同で担当
  • タイレリア原虫ゲノム解読プロジェクト
  • 次世代ゲノム解析によるタイレリアパルバ原虫遺伝的多様性の解明
  • 大気環境の物理化学的要因がヒトの環境適応能に及ぼす影響について
  • その他機械学習法や自然言語処理を用いたゲノム配列からの特徴抽出

ゲノムプロジェクトへの参加

  • Theileria orientalis
  • Theileria parva
  • Sarcoptes scabiei var. nyctereutisミトコンドリアゲノム
  • Acidithiobacillus ferridurans JCM 18981
  • Pelotomaculum thermopropionicum
  • Escherichia coli K-12 アノテーションプロジェクト

データベース構築

  • GIB (Genome Information Broker):ゲノムが完全解読された微生物ゲノムを網羅したゲノム情報のデータベース
  • GIB-V (Genome Information Broker for Virus):ゲムが完全解読されたウィルスゲノムのデータベース

立体視を含む先端的な映像技術を用いたゲノムやバイオデータの可視化

  • ゲノムデータの可視化
  • マウスのCT画像を対象としたマウスの3D画像の構築
  • 顕微鏡写真データを対象とした3D画像の構築

その他 (これまで参加したプロジェクトなど)