• Todo
    • 二種生物間のパスウェイ分類内の共通酵素反応数を算出し、各ドメイン内での標準偏差を求めるプログラム(Ruby)―pathscore.rb(完成)、それを用いてドメイン内標準偏差を用いてどの分類でばらつきが起こるかを探す
    • 二種生物間のパスウェイ分類内の共通酵素反応数を算出するtest.rbを用いて正解の系統樹の中で距離が近い生物と遠い生物種間で行い、比較。
    • ドメイン内で共通酵素反応数の平均値をとり、その平均値からどれだけ離れているかを見ればどこが肝心な部分か分かるのでは?
    • 階層的に標準偏差を求めるのもいいか
    • 違うマップにつながってるrelationはどうすんのさ?
    • 酵素にこだわるよりも基質と生成物に注目したほうがいいかも。一つの反応じゃなくてもパスの長さを重みにして同じ基質から同じ生成物を生み出せるパスを見つけ注目するほうがいいかな?
  • load pointやchoke pointに注目して何か見つけられないか?できればload pointやchoke pointを含む各生物特有のパスウェイ構造的な特徴。無ければload pointやchoke pointの酵素の配列で比べる。単一もしくはload pointやchoke pointを含むある程度の大きさの部分グラフでたんぱく質配列を比較する。
    • load pointやchoke pointを含む、ある程度の長さのパスの数は生物ごとに違うんじゃないか。
  • 目標
各ドメイン内でのより正確なクラスタリング手法を決める。

距離を求める要素は何にするか?極大頻出パタン使用?どんな要素が使える?パスウェイ特有の情報―形、接続性、ノードとエッジの情報(ラベル)、副産物、反応の種類等。SVMを用いて分類器を作成。正解の系統樹から訓練セットを選ぶ。
最終更新:2006年12月08日 16:53