SCImates α2は機能を停止しています。

第1回へ戻る




覆されるDNAの常識

林崎世の中ゲノムネットワークという方向に動いている。なぜかというと、cDNAっていうのは、すべての生物が親から子に渡す遺伝情報の中で、機能をもっている部分をえりすぐって一個一個抽出しているもので今度それが一個一個のエレメントになっているわけですよ。今度、それがどのような順番で働いているかっていうのを全部解明したら、受精卵が個体になって、こんな人間になることの全てが解明できるはず。だからエレメントからシステムにうつるわけです。我々はちょうどここにいる。次どうなるんやろ。
それでちょうどでてきたのがFANTOM3なんですよ。この2つの論文。去年の9月、サイエンスが我々のために特集号を組んでくれた。nature1回、science2回、全部僕らの出したの、全部特集号になっている。RNA特集号に8本の論文がでたんですが、そのうち2本が我々の論文です。何が書いてあるかというと、3つのことが書いてあるんです。まず一つは、遺伝子の数が減少する。こういう現象があるんです。RNA集めて、新しいRNA一杯見つけていったら、遺伝子の数って増えると思うでしょ。新しいもの見つかるわけだから。違うんです、減っていくんです。何でだろう?っていうのは後でいいます。ゲノムの2パーセントしかRNAがなくて、他はほとんどジャンクだって書いてあったんです、昔。ところが違うんです。僕らずーっとどんどんあきらめないで続けて、RNAをどんどこやっていくと、7割読まれてる。実はもっとで、今は8割を超えてる。あともう一つは、高校の教科書に書いてあるのは、DNAがRNAになってタンパクになる。遺伝子って、タンパクをコードするものだと思われていた。その通りなんやけど、それは全体のほんの一部しか記述してないんですよ。現実は、ここで見つかっただけでも、全遺伝子数の半分以上はタンパクをコードしない遺伝子だったんです。そうすると、タンパクをコードする遺伝子がメインだとみんな常識的に思ってたんやけど、実はマイナーだったんです。
タンパクをコードする遺伝子は遺伝子の中で超マイナー。そういうふうに、考えをシフトしないと、これから間違います。タンパクをコードするものが、っていうんじゃなくて、タンパクをコードするものは遺伝子の中のごく一部である、こう考えたら正しい。
それでもう一ついくと、センスとアンチセンスというものがある。センスとアンチセンスっていうのはこういうことです。ゲノムって2重らせんでしょ。同じ箇所が両方から逆向きに読まれることがあるわけね。そうすると(転写されたRNAは)double-strand RNAを形成するわけ。そしたら何かが起きる。こういうふうにセンスとアンチセンスのような相手方があるのが、全体の遺伝子の72パーセントです。 実際、私たちは、ものすごい数のRNAをみました。CAGE法という新しい技術を作ったんです。
RNAの全長をcDNAにしようとしたら金かかるわけです。予算の都合もあるんで、少ないお金で大量のものを見たい。そしたら、始まる場所、それが一番重要です。後ろの、どこで終わるかも大事。これをcageと言います。cageのタグ数は、ちょっと古いんですがマウスで1千2百万個。おととし、ヒューマンゲノムコンソーシアムで、タンパクコーディングジーンが2万2千個って発表したんです。それに比べて、タグ数は1千3百万個、タンパクコーディングジーンの500倍の数がどっから始まるか。200あれば十分だろうと思ったけど、実はそうではなかった。もっとあるということが分かった。そういうものを確認しました。
そういうのをゲノムの配列の上にどんどん貼り付けていくとですね、砂漠のとこに新しい遺伝子が見つかるやろうし、スターティングサイトが違うとこに見つかったら、例えばここは神経スペシフィックとか、消化管スペシフィックとか、これで決定できるわけです。遺伝子の調節が研究できる。ものすごい重要なんですね。
それで実際マッピングしたらどうするかなんですけれども、ゲノムネットワークというプロジェクトを私たちは動かしているですけど。この絵はそれ(ゲノムネットワークの表紙)と同じなんですが。完全長cDNAなんですね。ここで始まって、ここで終わって。それをどっから始まってどっから終わってるのか、矢印でずーっと示したのがこれです。
スライド9
ゲノム全部のとこをこう見た。これ実は、このマップたりない。一杯僕らが書いてったら。この四角の部分ね、これが僕らのマップの全部なんですけれども、青の部分がこれ。
ゲノムの一箇所にものすごくマップしたわけ。そうするとほとんどの部分が読まれていることが分かる。それでありとあらゆるところから転写がスタートしていることが分かってきた。プロモーターって、18万個。遺伝子の数って4万4千個。1個の遺伝子に、スターティングが5個くらいある。5個別々に制御されてることが分かってきた。
実際これは全然ランダムでもなんでもない。今年の2006年、Nature Genetics(スライド10)っていう雑誌の表紙を飾った僕らの論文があります。これどういうことかというと、18万個のプロモーターで重要な、クラスタリング(スライド11)っていう概念をお教えしたい。
プロモーターごとに、肝臓とか腎臓とかでどのプロモーターがたくさんでてるかというのを示しています。赤だとたくさんでてる、黒が全然でてないということなんですけれども、そうするとこれとこれ入れ替える。こう並べるよりもこう並べたほうが似てますよね。つまり、似たもの同士を集めましょうというのがクラスタリングなんです。似たもの同士、同じ制御因子によって制御されていることが分かるわけ。18万個プロモーターみつけたんで、どういうふうに制御されているか調べるために、18万個のクラスタリングをやったりする。僕ら、膨大なデータ出し始めていまして、コンピュータ能力がなくなってきてるんですよ。昔はコンピュータの処理能力のほうが早かった。僕が始めたころは。今違うんです。データのほうがものすごいたくさんあって、コンピュータのほうが足りないです。で、今政府がものすごい金かけて、ペタコンピュータ作っています。僕ライフサイエンスちょこちょこってやっていますけど、このうようなことをやってほしくてしょうがないです。これ何が重要かと言ったら、このある遺伝子には3つのプロモーターがあるのですかが。同じ遺伝子なんですけど、このプロモータによって、発現するシグナルペプチド(分泌たんぱく質)がちがう。細胞外に出すタンパクを発現しようと思ったら、細胞はここ使います。細胞内にとめとこうと思ったら、こことここ使います。
で、要するに、細胞は同じ遺伝子でも、プロモーター使いわけるんですよ、目的によって。実際全遺伝子のクラスタリングやったら全部違うところにマッピングされます。

RNA大陸

林崎ここから今RNA大陸の話をします。遺伝子の概念ずいぶん変わりました。教科書にでてくるいわゆる遺伝子の概念っていうのは、ゲノムがあったら、エキソンとイントロンがあって、さっきの話に出たalternative splicing(選択的スプライシング)てのがあってエキソン1、2、3、4、5てある。ところがある組織では1,3,5ってつながったり、1、3、4、5ってつながったりする。こうなるとコーディングするタンパクも違うし、時にはncRNAになる。
そうすると、遺伝子の数の数え方が変わってくる。たとえばこれはレティノール脱水酵素なんですが、レティノールというのはビタミンAです。これはエキソンが三つある、alternative formですよね。この場合、遺伝子の数はいくつか? 遺伝子っていうのはもともとRNAの数じゃないんです。ゲノムの領域のことなんですよ。定義として遺伝子はゲノムの領域のことである。だからこの場合、ゲノムのここからここまでをゲノムの領域という。この遺伝子の数は1。(スライド12)ところが、遺伝子をどんどん解析して解読していくと、こんなRNAがでてくる。(スライド13上図)ここからスタートして、ここにとんでるようなものができる。この場合、ここからここまで1個ですよね。今まで2個と考えられているものが1個になる。
実際これをやっていった。2003年に、ヒトゲノムコンソーシアムがタンパクコーディングジーンズの数を2万2千個だっていったんです。それが赤の線です。(スライド13下図)RNAをどんどん解析していくと、遺伝子の数が減っていって、そのままで残ってるのが、今や2300です。
今まで砂漠って言っていた、何もないとこ。97パーセント。簡単に言うと砂漠の中に新しい遺伝子がでてきた。そうすると青の数になる。そんで、砂漠のとこに新しい遺伝子がでてきて、そのRNAがその遺伝子から既知の(今まで2万2千といわれていた)ということは新しく出現してきたRNAの塊と、今までヒトゲノムコンソーシアムがこれだ!っていってたものが融合したものがあります。それがピンク。全部たすと緑になる。遺伝子の数はちょっとずつ減っているんですけれども、これ元通りあるのが10分の1。中身が全然変わってきている。昔はこんな大きいゲノムの中にポツン、ポツンと遺伝子があったから勘定できた。ところがあっちこち生まれて全部、融合してきたら、減ってくるよね。砂漠の中のオアシスの数をかぞえるのは簡単だね。でも都会が融合したら、例えば、横浜と東京の間なんかない。田園都市風景なんてないじゃない。一個の都市だよね。そういうイメージです。中身をひもといてみたら、DNAがRNAになって、タンパクになりますよ。これ、タンパクのコーディングジーンは僕らがやってきたときは、2万2千個くらいだったんですね。(スライド14)それが、ncRNAが2万3千個くらい。これは翻訳されない。タンパクにならない。そうするとncRNAは半分以上だ。もうたぶん80パーセントになってますね。だからタンパクコーディングジーンはマイナーなんです、数としては。僕らがこれを発表する前はですね、ncRNAってのは、リボソームRNA(rRNA)、tRNAを除くと、ncRNAとして知られてる数なんて、100個以下やで。ところが、2万3千個一気にでてきたんや。それでしかもタンパクコーディングジーンよりでかい。これはもはや大陸だなと思った。
要はね、セントラルドグマと称して、ノーベル賞一杯でてるわけですよ。全然ちがう。RNAのまま効いている。人類の科学史は、今まで遺伝子の半分以上みないで、進化してきたわけです。これからはそれじゃいけない、ということだね。これみてください。縦軸-論分数、横軸-年度なんですけども、ここのときFANTOM1で僕ら発表したんです。そうしたらデータベース急にアクセス数が増えてきて、ncRNA論文数がぐーっとあがってきた。今、爆発してきている。そうこうしていると、中国人の研究者が論文をだした。ある日あるとき、nature誌から手紙が来て、こういう論文が投稿されたんやけど、お前反論を書けと言われてね、僕反論書きました。それでその人の論文見たら、僕らが書いたFANTOMでやっているncRNAなんて全部嘘や書いてあるわけ。どうしてかといったら、根拠はね、機能している遺伝子だったら、人とマウスの間で保存してるはずだと。ところが、インタージェネックリージョンという、かつて2パーセントといわれた遺伝子と遺伝子の間の領域にね、ヒトとマウスのホモロジーが大体55パーセントくらいなんですよ。ところが、僕らがncRNAをヒトとマウスで比べるとですね、50パーセントぐらい。そうすると、インタージェネックリージョンといっている部分と同じだから、機能してないんじゃないかと、ご批判をいただいた。ところがね、これ、典型的なncRNAなんです。(スライド15)ncRNAのエキソンになっている領域(RNAになった領域)が57パーセントなんですね。そしてプロモーターがコントロールしている。この遺伝子が、いつ発現するかを制御している。この領域は97パーセント。これ平均してみたら、ホモロジーをずっと見たら、タンパクコーディングジーンがここであがってる。ノンコーディング(RNA)はここでピークを迎えている。ホモロジーはほとんど変わらない。平均して70数パーセントぐらい。ものすごく制御がコントロールされてる。これは後で言いますども、それは正しいことが分かってきました。
そのうちの一つが、センスとアンチセンスという概念。(スライド16)ゲノムの70何パーセント読まれていれば、昔のインタージェネックリージョンと言われている部分が読まれてるわけ。そしたらホモロジーが50何パーセントいうの当たり前だ。もっとこれ考えたら、よく見たら、ここみて。double-strandのRNAのこっちの鎖とこっちの鎖が両方ともRNAになってる。そうするとここの部分注目すると、この2つのRNAがくっついてるはず。これがRNAiとかいろいろな機能をはたす。メカニズムがあるはずなんです。これがセンスとアンチセンスです。ほとんどの遺伝子がセンスとアンチセンスになっているわけです。72パーセント。
それでRNAの発現のレベルが制御されているかどうかを見るために、マクロファージが分化していく、活性化していくときにですね、そのときの分化状態を時間でおったときに、ncRNAがどのように変化するかを追ってるんです。そうすると本当に同じ遺伝子が同じように動いてるんですよ、不思議なことに。で、なんでだろうって。同じ今度はセンスとアンチセンス両方ともこれも再現性よく必ずそうなります。この2つが実際影響しあっているのか?たまたまそうなってるんですのか?影響しあっていることを証明するにはどうしたらいいか。片一方の発現をノックアウトしてやるんです。RNAを細胞の中でつぶしてやるんです。そうするともう一方のほうに影響があると、例えば、銀行の倒産と一緒です。銀行が倒産するでしょ。その銀行と関わっていたとこが一緒に倒産しますよね。それと同じで、関係のなかったとこは動かない。でも関係のあるやつだとつぶれる。それで片方をつぶすと片一方だけあがる。明らかに影響しあっているわけですね。今度これは逆で、over expressionでたくさん発現したときもう一個がどうなるか。たくさんの発現につられて、ちょっと発現するとか、そういうことになってくるわけです。で、実際このセンスとアンチセンスというのは細胞の中にちゃんハイブリッド(二重鎖)になっているかどうか、見つける方法があります。

多種多様なnc RNA

林崎RNAが二重鎖をとるとRNAiという分子機構が働きます。(スライド17スライド18)例えばmiRNAという一本鎖のRNAが自分自身で二重鎖になるものができたりする。こういう風に二重鎖のRNAがDicerというはさみで切られて、Discというコンプレックスに片方の鎖が抱き込まれて、相手方(の相補的な塩基対)を探します。もとのRNAの中から20ベースを見つけて切る。RNAをノックアウトするようなもの。これがRNAiで、たぶんノーベル賞に一番近いと思います。
センスとアンチセンスのマップをどの組織でどのゲノムの配列が、発生段階のいつどの時期に発現しているか、というデータベースができていまして、みなさんお使いになることができます。センスとアンチセンスが関わる病気にはインパクトのあるものがありまして、例えばcancer(ガン)とか。

RNA大陸があります。ncRNAって何をやってるのか。特に二重鎖。この辺の話は一番重要なんで、もう一度おさらいしますね。
RNA大陸というのは、ノンコーディングRNAの発見でできた。じゃあノンコーディングRNAってなにをやっているのと。(スライド19)例えば、二重鎖のノンコーディングRNAが作用して二重鎖のDNAのある部分をずばっと抜き去ることがせん毛虫で知られていたり、ヒストンがキュッと縮まってクロマチンの凝集がおきたり。あと、decoyっていうんですけど、おとりですね、さっきmicroRNAというのの作用で、ターゲットRNAが攻撃されてぷつっと切られるという話がありましたけど、そのターゲットに似た、偽遺伝子という、タンパクをコーディングしていないけど良く似たRNAがたくさんできてくることがあって、そうすると攻撃するほうが、どれを攻撃していいかわからないから、偽遺伝子ばっかり攻撃して、結果的にターゲットのRNAが守られるという、そういうメカニズムがある。実はこれは、去年のNatureに出たんですけど、僕の最初の学生だった広常君が、大阪市立大の教授やっているんだけど、彼が書いた。
それからあともう一つは、RNAがタンパクに直接引っ付くことがある。例えば、転写因子に引っ付くなんていうのは、そのscienceの特集号に載ってる論文と、同じ号に載ってます。さっきのmicroRNAが引き金になってRNAiが働く、とそういう話をしましたけど、肝臓で発現しているmiRNA122というのがあって、それがC型肝炎ウィルスの増殖に必須だという話も、同じ号に出てる。つまりC型肝炎を治そうと思ったら、そのmicroRNAの122をつぶしにいけばいいわけですよね。
だから、次から次へと、そういうのが出まくっていて、ものすごくホットなわけですよ。RNAiはすごいね、なんてみんないっているけど、僕らの見つけたRNA大陸の中では、RNAiはそのほんの一部だけだと思っている。他にもいっぱいそういうメカニズムがあるはず。今までの研究は、セントラルドグマを中心に全世界の研究が成立していたわけだけど、それよりもはるかに数の多いRNAワールドの遺伝子が、しかもRNAiだけじゃない、いっぱいある機構が、いままでのライフサイエンスの、何十倍もでかい未知の領域を形成していると。しかもそれが解明できたら、それといままでの分子生物学と引っ付けなきゃいけないわけよ。それで、システム生物学という話になって、糖尿病の原因遺伝子があって、ここがこうなってこうなって(スライド20参考)今までは、こういう原因となるかけらを見つけて、それをターゲットに攻撃すればいいとか特許をとろうとか、そういう風にイメージしていたんだけど、実はこれだけじゃなくて(画面にncRNAが加わる)、実はここにncRNAがいっぱいあるわけ。何が何を制御しているっていうメカニズムが今までの想定よりもいっぱいあるから、ターゲットがいっぱいあるわけね。だから、これからはncRNAを組み込んだシステムバイオロジーを考えていかなきゃいけない。まさに未来の。自分は退官する前に、こういうものを解析するその基礎を築いていかにゃならんと思ってる。
それで、じゃあ生命の起源というのは、原始の地球の中で元々どうやって生まれてきたのか。
一つには、生物は自分との同じものを作れなきゃいけない。分子構造を決定するインフォメーションがないとそれはできないんだけど、それは遺伝暗号ですよ、AGCT。でもそれだけだと、それだけだと生物にはなれない。それを実際にコピーするための酵素が必要だから、酵素活性ももってなければいけない。それにはタンパクが必要だけど、それはどこからできたのってはなしになるよね?だから、一つの分子が二つやらなきゃいけないわけですよ。DNAは酵素活性持ってないですよね、構造上、硬いから。ただの棒なんですよ。RNAはくしゃくしゃくしゃってなるから、酵素活性を持てる。RNAというのは、遺伝情報の維持ができて酵素活性を持てる、唯一の分子なわけですよ。だから、RNAが、生命の起源だと考えられた。その後、どんどん生物は進化したんですね。遺伝情報の維持という意味では、DNAのほうがはるかに安定なんですよ。逆に、複製のための酵素のほうは、アミノ酸は20種類あるわけだから、タンパク質に委譲したほうが、はるかにバラエティがあって、進化しやすいと。そうすると、DNAというのは外付けのハードディスクみたいなもので、コンピューターの指令に応答して最終的に働くプリンターみたいなのは、タンパク質。じゃあRNAは何をやっているのかというと、ただの伝達物質かと。そうではなくて、高等生物であるほど増大してくる遺伝子を、すごく正確に、かつフレキシブルに制御するシステムであると。
昔、森首相が、ヒトの遺伝子はハエの二倍か、って言ったことがあって、確かにタンパクをコードしている遺伝子で言えばそうなんです。ところが、タンパクというのは、一番末端で働く物質で、それが相手しているのは化学物質なんです。例えば糖を代謝している酵素というのは、糖の構造は変わらないんだから、ハエだろうとヒトだろうと、ものすごく安定していて保存しているはずですよね。だから、タンパクをコードしている遺伝子は保存しているんだろうけど、それを制御しているncRNAの部分は、保存されている必要はないんですよ。RNAはすべての生命の起源だったわけだけど、今我々のからだの中では隠れたRNAワールドというのがまだあって、DNAとタンパクをつないでいるだけではなく、実は全部を制御しているCPUそのものであると。それがだんだんわかってきたなと。それらを私たちが見つけてきた。
ノーベル医学生理学賞を選ぶ委員会というのがあるんですけど、その委員が出席する、年に一回のカンファレンスあるんです。どんな領域があるのかなぁ、と思って毎年聞きに行っているんだけど、開いたら結構そこからノーベル賞が出るんですよ。3年前にあったノーベルカンファレンスは、G protein受容体というのばっかりを集めたやつで、そのときにしゃべったのが、臭覚のレセプターのRichard Axelだったんだ。すごい研究ですわ。すごいなぁと思っていたら、おととしにそれがノーベル賞を取ったんですよ。その年に、僕はFunctional RNAというのをテーマとして出したわけ。そしたら、招待状とか出すと断るやつ一人もいない。忙しいとか言うて断るやついるけど、シンポジウムとかやと、でもコレばっかりはだれも断らない。だからトップだ、来ている人たちが、水準がめちゃめちゃ高い。三日間やって、だいたいその領域の代表者的な人が1日のしょっぱなに話すんやけど、一日目には僕が話して。2日目にncRNAの機能を調べた人たちの話がずーっと。まとめ的に話したのはQueensland大学のJohn Mattickという人で、これも有名な先生です。三日目にはRNAiの話(三日目の詳しい内容は良く聞こえず)。この領域からは、ノーベル賞一個と違うよ。セントラルドグマからはノーベル賞何個もでてるわけでしょう、だったら何個もでるよ、RNAの領域から。
じゃぁ、質問は?
学生Aいろいろ質問を用意してきたのですが、全部こたえられてしまいました。


レクチャー第二回へ戻る

このページに寄せられたコメントとトラックバック

*コメント*トラックバック

準備中

寄せられたトラックバックはありません。

このページについて