ゲノムコード(後半)
このセントラル・ドグマの図式の中で働いているRNAは、遺伝暗号の解読(転写・翻訳)過程で働くRNAである。それは言葉をかえていえば、タンパク質に向かう遺伝情報がコード化された世界で働くRNAだから、それを遺伝暗号コード化RNA(コーディングRNA)という(厳密に言えば、転移RNAもリボゾームRNAも、ノンコーディングRNAに含まれるのだが、話をわかりやすくするために、今回はコーディングRNAの範疇に含めることにする)。
それに対して、先の『蛋白質 核酸 酵素』の特集号に出てきた「ノン・コーディングRNA」というのは、そのような特定タンパク質を作るための遺伝情報とは無関係のRNAという意味である。つまりそれは、セントラル・ドグマとは無関係のRNAということなのである。
タンパク質のコードとは無関係のそのようなRNAがある程度あるということは、以前から知られていた。しかし、そのようなRNAは数量的にも少なく、生命活動の傍流でしかないと考えられていた。
生命活動の主流は、あくまでDNA・タンパク質過程にあり、その主軸をなすのがセントラル・ドグマであると考えられてきた。従って大切なのは、あくまで「コーディングRNA」で、「ノン・コーディングRNA」は脇役にすぎないと考えられていた。当然、研究する人もあまり多くないという状況にあった。
ところがここにきて、脇役だったはずの「ノン・コーディングRNA」が突然、主役におどり出てきて、研究も爆発的に進みはじめたというのが、最近の状況なのである。
何がそのような激しい状況変化をもたらしたのかというと、いちばん大きいのは、ポストゲノム計画という大状況だろう。
ヒトゲノム計画で、たしかに、遺伝情報を全部読み切るには読み切ったが、実はそれによって期待されたほどの成果はあがらなかった。計画がはじまったときは、遺伝暗号を全部読んでしまえば、生命の秘密とされてきたようなことは基本的にみんなわかってしまうのだと極論する人さえいた。それくらい、遺伝暗号解読に大きな期待がかけられた。
しかし、その期待はあまり満たされなかった。一つには遺伝暗号を解読したといっても、それは、遺伝暗号をATGCのアルファベットとして読んだというにすぎず、次の段階であるひとつながりのアルファベットがそれぞれ何を意味するのかという意味解析のほうが十分にできなかったからである。単語がわからず、文節も読みとけず、いわんや文章全体などはまるで読みとけなかった。
単語にあたるのは遺伝子だろう。ひとつひとつの遺伝子がコードしているタンパク質の構造がわかったら、単語の意味がわかったということになるのだろうが、なかなかそこまではいけない。いま研究が集中しているのは、タンパク質の構造解析だが、研究は遅々として進まないという状況だ。
遺伝子というのは、特有の形式的構造を持っているから、それがどういう遺伝子かという内容(どのようなタンパク質をコードしているか)は把握できなくても、遺伝子の数だけはかぞえあげることができる。それが先に述べたように約二万二千なのだが、これはあまりに少ないと考えられている。
二万二千といったら、ショウジョウバエの遺伝子一万三千よりは多いが、線虫(長さ数ミリのミミズのような虫)の遺伝子約二万とほとんど同じレベルである。シロイヌナズナという単純な植物の遺伝子二万五千とくらべるとそれより少ないのである。
人間のような高等生物が、そのような下等な生物(線虫はその細胞がわずか千しかない)と遺伝子の数においてあまりちがいがないというのは、どう考えてもおかしいのである。
遺伝子というのは、基本的にタンパク質をコードするものだから、人間の体内にあるタンパク質をできるだけかぞえあげたら、遺伝子の数も予測がつく。ゲノム計画がはじまる前にそういう手法で予測していた遺伝子数の推定は、約十万というものだった。それがなぜ、二万二千という少ない数字になってしまったのか。結果として出てきたこの遺伝子数の少なさに、多くの研究者たちはびっくりした。
それとともに、その裏に何かワンセットの遺伝暗号から複数のタンパク質が生まれてくるといった秘密のメカニズムがあるのではないかと考える人もおり、実際そのようなメカニズムが複数見つかりはじめている。しかし、それ以上の何かがないと、人間のような高等生物の複雑さの説明はつきそうもない。
ゲノム解読が終わったところで、遺伝暗号は結局タンパク質をコードしているのだし、現実の生化学反応の主役はタンパク質そのものなのだから、次の最優先研究課題はタンパク質の構造解析だという声があがり、「タンパク三〇〇〇」という大プロジェクトがスタートした。
タンパク質そのものは十万あっても、その基本構造は一万種類程度と考えられている。その主要なものは、その三分の一の三千程度と考えられるから、その構造と機能と遺伝子との関係を全部逐一調べあげてしまおうという壮大なプロジェクトで、これは現に進行中である。
ヒトゲノム計画もそうだったが、最近の大型研究プロジェクトは、調べられる対象すべてを完全に調べあげてしまうという、網羅的全解析が一つの特色になっているのだ。
ポストゲノム研究の一環として、もうひとつ行われた網羅的調査が、理化学研究所のゲノム研究班が行った、「マウスゲノム・エンサイクロペディア計画」である。これは、マウスのあらゆる発生段階で出現してくるmRNAをすべて集めてしまおうという計画である。先に述べたように、遺伝子が発現するとき、必ずその情報が転写されてmRNAができる。生物の発生段階では、実に多くの遺伝子が次々に働く。その多くが、ほんの短時間しか働かず、すぐに消えていく。生物の発生段階は、ごく短時間しか持続しないステージから次のステージへと次々に相転移していくのである。一つ一つの相でしか働かない遺伝子が沢山あって、そのmRNAは出現してもすぐまた消えていってしまう。そういうごく短時間だけしか働かない遺伝子のmRNAも全部集めてみないと、生物の発生過程の実相はつかめない。
これを相当丹念にやった結果、理研の研究チームは驚くべきことを発見した。
集められたRNAの約半分が、タンパク質を作らないノン・コーディングRNAであることがわかったのである。これはマウスの例だが、実は別の研究チーム(徳島大学ゲノム機能研究センター・塩見春彦教授のグループ)が多くの種のRNAでなされた同様の研究結果を精査していたところ、原始的な生物から高等生物へ進化していくその過程がそのままノン・コーディングRNAの多さ(全DNAに対するノン・コーティング領域の割合)に反映されるということがわかってきたのである。それを全部合わせると、第二図のようになり、進化の頂点にいるヒトでは、実に九八パーセント以上がノン・コーディングRNAであることがわかったのである。
塩見教授は次のように語る。
「かつてゲノム解読では、高等な生物も下等な生物も遺伝子の数がほとんど変わらないのが不思議といわれていたのですが、進化すればするほど、ノン・コーディングRNAの数がふえるのがわかってきたわけです。しかもそれらノン・コーディングRNAが遺伝子の発現を調節し、発現の仕方には微妙な影響を及ぼすものであることがわかってきたのです。つまり、高等動物の進化は遺伝子の数をふやす方向に進んだのではなく、遺伝子の発現を微妙に調節していく方向に進んだのではないかということです」
それを聞いて、私は、人間の言語世界を想起した。先に述べたように、遺伝子は言語世界の単語のようなものである。概念的な語彙をふやせばふやすほどいい文章、高等な内容の文章が書けるというわけではない。むしろ、概念語彙をふやすのはほどほどにして、助詞や助動詞をうまく使うことで、微妙な言いまわしに気を遣ったほうがいい文章、高等な文章が書ける。遺伝子そのもの(コーディングRNA)ではなくて、遺伝子の発現の調節にかかわることによって、ヒトを進化の頂点に押しあげていったノン・コーディングRNAの働きについて聞くうちに、私はそのような助詞、助動詞、あるいは、形容詞、副詞のような修飾語の世界を思い浮かべていた。
そういう感想をもらすと、塩見教授は、ノン・コーディングRNAはそういうものに近い性質があるといって、こんな話をしてくれた。
概念語彙の単語にあたるような大きな遺伝子というか、巨大分子たるタンパク質のコードの中には、遺伝暗号の数にして、数千どころか数万というような大きなものがある。ところが、ノン・コーディングRNAの中には、さまざまのスケールのものがあるが、中には、スモールという数百塩基のもの、マイクロと呼ばれる数十塩基のものが沢山あって、それがみな独特の働きをしているといことがわかってきたので、いま集中的にその研究がなされつつあるのだという。
(第三図・RNAによる制御)
さらに、塩見教授は、こんなことも述べている。
「高等な生物、特にヒトで顕著にあらわれてくる高度な精神活動の側面でも、ノン・コーディングRNAが大きな役割を果たしている可能性があります。あるいは病気でいえばいくつかの精神的な障害においてその発症の実態から遺伝性の高い疾患であると推定されるのに、いくら遺伝子を調べても、精神病の遺伝子が発見できないという例が少なくありません。それらのもので、ノン・コーディングRNAが関係しているらしいという予測がつきはじめたものがいくつかあります」
ノン・コーディングRNAの世界はまだ発見されたばかりで、そこから何がいえるかは、これからの研究をまつところが多いとはいえ、どうやらこれは新しい宝の山のようなのである。
最近RNAの研究が急速に盛り上がりはじめたもうひとつの理由は、RNA干渉(RNAi)という現象が発見されたことである。このような目的で使われるRNAも、もちろんノン・コーディングRNAの一種である。
これは何かというと、既知の遺伝子の一部の配列と同じ配列を含むRNAを人工的に作り、それを投入すると、それがその遺伝子の同じ配列のところに結びついて、その遺伝子の働きをとめてしまうという現象である。
これは現象としては九八年に線虫の研究の中で発見され、病原ウイルスなどが侵入してきたときに発動される生体防御機構ではないかと考えられた。もしそのようなものであるなら、これはヒトの病気にも臨床応用可能かもしれないということで、急速に研究が進んだ。何しろ、特定の遺伝子の働きをストップさせられるというのだからウイルス病のみならず、あらゆる遺伝子のかかわる病気に応用可能かもしれないというので、RNAiの研究は大ブームとなって今にいたっている。
まっ先に利用されたのは、実は遺伝子の研究分野である。遺伝子の研究で、ある遺伝子を見つけたはいいけど、その遺伝子がどういう働きをしているかよくわからないということがよくある。その場合、その遺伝子をつぶした動物モデル(ノックアウト・マウスなどと呼ばれる)を作って、何が起きるか観察するという方法がよく取られる。しかし、特定の遺伝子だけをノックアウトするのは意外にむずかしく、これはアイデアはよくてもなかなか成功しない方法だった。
ところが、RNAiを使うと、特定遺伝子のノックアウトが簡単にできて、しかも確実性が高いということで、いまや実験室では遺伝子研究の標準的な研究手法になりつつある。このようなプロセスを経て、いまやRNAi法は、沢山の遺伝子がかかわる病気の遺伝子治療として、世界中で、臨床応用の研究が進みつつある。
さまざまのガンですでに多くの実験が積み重ねられ、その効果も証明されつつある。しかし、ガン遺伝子のどの配列に結びつくRNAを作るといちばん効果的なのかがまだよくわかっていないとか、下手なものを作ってしまうと、めったやたらな部分に結びついてしまって、働きをとめてはいけない有用な遺伝子の働きをとめてしまうという「副作用」があるということで、いま世界中の医薬費会社で激烈な競争が展開されているところである。
問題は、この大量に発見されだしたノン・コーディングRNAがどこから生まれてきたかということだが、それがわかってみると、これまでの遺伝子の世界で最も大きな謎とされてきたことの本当の背景がどうやら解明されてしまったようだということなのである。
それは何なのかというと、ヒトをはじめとする哺乳類などの高等生物のゲノムで、タンパク質をコードしている部分は全体の三パーセント程度しかなくて、あとは、タンパク質を作らない、遺伝情報としてはゴミの山のような部分とみなされ、一括してジャンクと呼ばれていたのだが、なぜそんなにジャンクが多いのかがわからなかったのである。ジャンク部分は、図にあるように、「スペーサー」「偽遺伝子」などとされている部分もあるが、いずれにしても、遺伝情報として意味がない部分であるから、遺伝子が発現するときは、「スプライシング」と呼ばれるメカニズムで自動的に切り捨てられる部分と考えられていた。
DNAの上で、いずれタンパク質に翻訳されることになっている、遺伝的に有意味な遺伝暗号部分は「エキソン」と呼ばれ、エキソンとエキソンをつなぐ介在配列は「イントロン」と呼ばれる。DNAの遺伝情報がmRNAに転写されるとき、スプライセオームと呼ばれる一種のRNAの働きによって、イントロン部分だけが切り離されるのである。そして、図に見るように、エキソンとエキソンをつないでいくことで、mRNAが作られていく。
切り捨てられたイントロン部分(ジャンク)がどうなるか、誰も気にしていなかっただが、大量に見つかってきたノン・コーディングRNAの出所は、この捨てられたはずのジャンク部分だったのである。
どういうことかというと、ジャンクが実はジャンクでなかったということである。
ジャンクが切り捨てられたと思われていた部分も、ちゃんと転写されてRNAになり、それなりに機能していたということである。
ここまで読んでこられると、いまノン・コーディングRNAを中心とする、生命科学の世界の大革新がはじまろうとしているところだということがわかっていただけるかと思われる。いま徳島大の塩見教授は、
「ノン・コーディングRNAこそが、ヒトを頂点とする複雑な生命の『陰のプログラム』」
という認識のもとに、ノン・コーディングRNAの大量登場によってくずれたと見えるセントラル・ドグマは、くずれたのではなく、ノン・コーディングRNAを中心とする「新しいセントラル・ドグマ」にかきかえられようとしているところだと主張し、いま大きな共同研究グループを立ち上げようとしている。
私はしばらく前から、いまRNAこそが生命科学の世界で最も面白いと思って、東大駒場の「立花ゼミ」の学生たちを引きつれて、このフィールドの研究者たちを取材しているところである。まずは、研究者たちにさまざまな観点からこの問題をレクチャーしてもらって、それをどんどん学生たちといっしょにインターネット上に作っている科学メディアページ「サイ」(アドレス)の上に掲載していこうと思っている。この雑誌が出るころには、そのレクチャーが次々アップされる予定だ。この原稿は、それらレクチャーをちょっぴり先食いすることで書かれたものだ。
(注:本文中にでてくる図は月刊現代8月号に掲載されていたものを指します。)
Copyright(C)講談社
準備中