見出し画像

7.iPS研究と癌の遺伝子データ解析(Theory2)の類似点 - 万能細胞の山中4因子(遺伝子)とLSDのBGSの同じ役割 –


#かなえたい夢 #山中4因子 #万能細胞とLSD #最適解を見つけるFS

自己紹介  
1971年から種々の判別データで4つの問題を見つけ、3つの事実で最小誤分類数基準の最適線形判別関数のRIPを開発した。そして4種の普通の線形分離可能データ(LSD)と169の高次元のMicroarayがLSDである事を世界で初めて実証研究で示した。そして3冊のSpringerから本を出版し、革新的な判別理論の骨子を分かり易く説明した。
 
目次
7.1 山中教授のiPS研究の2つの基本的な成功ポイント
7.2 逐次変数減少法(BS)の改良アルゴリズム
7.3 最後の類似性:万能細胞を作る3組の4因子
7.4 高校の生物の先生に期待すること
 
7.1 山中教授のiPS研究の2つの基本的な成功ポイント
 山中先生のノーベル賞受賞は、医学的な視点以外に次の重要で基本的な成功ポイントがある。
 第1の成功は、3万個以上と言われていた人の遺伝子の中に、「万能細胞を作る最小の遺伝子の組みがある」と考えた。これは、全てのLSDで最小次元のLSDであるBGSに対応する。
 人のES細胞で確認することは許されないので、ラットのES細胞で活性化する幾つかの遺伝子が、人間の多能性細胞を生成する遺伝子であるという大胆な仮説である。彼は、遺伝子データベースから活性化する24の遺伝子を特定した。即ち、3万変数から24変数を変数選択(FS)する困難を解決した。
第2の成功は、24個を同時培養するという医学の常識に反した多変量の培養実験で、「万能細胞の塊」ができることが分かった。これまでの伝統的な医学実験は、生物学的な知識に基づいて顕微鏡を使用した1変数の培養実験で、1変数の癌遺伝子(遺産癌遺伝子と呼ぶことにした)を見つけている。医師は既にこの方法で、多変数でない400個以上の遺産癌遺伝子を見つけた。この成功は、RIPで判別するだけでLSDであるSM1を見つけることと同じです。
一方、多くの理工学の研究はTheory2の3つの困難を指摘した。困難をならべ立てる研究者には、山中先生のような仮説は考えつかない。また筆者のようなRIPの判別のような幸運がこない。
1.Theory2のための高次元のデータ解析手法がない。これは高校数学で習う「連立方程式の解」を求める、横長データの知識が無いだけだ。
2.高次元遺伝子のFSはNP困難である。これは単なる妄想である。
3.高次元のノイズから癌遺伝子を見つけることは難しい。高次元のノイズと勝手に決めつけて、どうも発癌遺伝子の組みの信号は一組と勝手に決めつけている。
これらは単なる言い訳である。なぜなら革新的な研究は、難題を解決する積み重ねであり、多くの理工学研究は3つの困難を解決できずTheory2で失敗した大きな原因である。さらに、高次元のノイズと恐らく1組を想定した信号の具体的な定義を彼らはしていない。それはまるで枯れススキの幽霊に怯えているようです。私の研究は、高次元の遺伝子がType1(LSD)の多くのSMとBGS(信号)になり、Type2のLSDでない数組のSMとBGS(ノイズ)になることを示す。
第3の成功は、山中教授の4因子を、逐次変数減少法(BS)を改良したアルゴリズムで見つけたと考える。筆者は同じ方法でProgram4(BGS分割)を開発した。逐次変数減少法は単に満足解の一つを見つける。筆者の方法は、必ず最小の万能細胞を作り、Program4で最小のLSDという最適解を全ての組み合わせを行わず見つけることができる。これは既に6章で19変数の54万個以上の判別モデルから14変数の最もコンパクトでM2が最小の最適モデルを見つけた。
7.2 逐次変数減少法(BS)の改良アルゴリズム
彼の最初の博士課程の学生である高橋博士は、Program4と同じ次のBSアルゴリズムを使用した培養実験を行ったと考える。そして、BGSに対応する「山中の4因子」を見つけた。
1. 24個の遺伝子は多能性細胞を生成した。この発見はLSDとしてのSM1に対応する。
2. 24個から1個の遺伝子を省いた24組の23個の遺伝子を使った実験を行う。多能性細胞が生成される場合、省いた遺伝子は必要ないため省く。多能性細胞が生成されない場合、省いた遺伝子は必要なので残す。これは統計のBSでは、重回帰モデルの分散分析表の偏差平方和の一番大きな23変数を一組選ぶ事より革新的である。なぜなら複数の遺伝子が省かれる可能性がある。
3.この繰り返しは、24遺伝子から最小次元の4因子まで行う。このプロセスは、Theory2のStructure1(マトリョースカ人形の構造)と同じです。
4.停止規則は、4個の遺伝子の遺伝子から1個省いた4組の3変数の組み合わせで、多能性細胞が生成されないことを確認する。
単変量(遺産癌遺伝子)と多変量(多変量癌遺伝子候補)の違いは重要です。この医学実験は、多変数関係において多能性細胞が生成できるかどうかを基準とする。今まで、複雑な生物現象のために、多変量の医学実験は行われていないと考えている。癌研究は、生物学的知識と顕微鏡を使用して1変数の医学実験で400以上の癌遺伝子と腫瘍抑制遺伝子を見つけた。これらを、多変量癌遺伝子(BGS)に対して、遺産癌遺伝子と呼ぶ。
7.3 最後の類似性:万能細胞を作る3組の4因子
 山中4因子は、C-Mycと呼ばれる発がん性の遺伝子が含まれる。そこで他の研究員が種々研究し、発がん性の少ないL-Mycに置き換えた4因子でも万能細胞ができた。これは、多臓器をもつ生物の根源を制御するために、遺伝子の出す蛋白量の発現量が、精密機械よりも正確に制御し、さらに生命活動に必要な冗長性を持つことを示す。これはiPS細胞固有の機能と考えていた。
 しかし6章のCPDデータで鈴村教授はX12=X13-X14という等式で、X12という多重共線性の問題を起こす、新変数の必要性に気づいた。筆者は、X12かX13かX14のいずれかを省いた14変数の3組のBGSがある事に気づいた。そしてM2が最小モデルBGS1とした。これによって、3組の山中4因子と統計の厄介者の多重共線性に類似性がある事を見つけた。
7.4 高校の生物の先生に期待すること
 以上の結果から、遺伝子の出す蛋白量が精密機械より正確に生命現象を制御している人類が出会った最高品質の計測値であることが分かる。そこで高校の生物の先生に志ある高校生と一緒になって、人類の悲願の癌の撲滅に一役買ってほしい。
1)  有志の先生が、研究組織を立ち上げて志ある高校生に筆者の研究でした成果の良いMicroarrayの分析結果の整備を行う。できれば加筆した教材を作ってほしい。また筆者の統計分析の教材もいる。講談社のブルーバックスの「統計学とっておき勉強法」を修正すれば良い。
2)  各高校生が一つのBGSを担当し、筆者の開発した統計分析法を基礎に、学生独自の分析を行う。その結果が水準以上であれば、一定に規則を踏まえた基準で一般に公開する。
この試みは日本の癌研究者にとっても有意義な存在になることを願っている。

この記事が気に入ったらサポートをしてみませんか?