日本人ゲノム(1)

日本人ゲノムが解読された。幸いニュース報道にはなっているようだ。

http://headlines.yahoo.co.jp/hl?a=20101025-00000003-jij-soci
http://www.afpbb.com/article/environment-science-it/science-technology/2769507/6367918

AFPBBは今回の用語の使い方はしっかりしている。ところで今回の報道を見てわかるとおり、最初に解読されたアジア人のゲノムは韓国、次が中国であった。今回の解読はこれまでに読まれた他人種ゲノムとは違い、次世代シークエンス技術を主に用いている。

今回、本論文を読んでまとめてみる。読者のことを想定し、最初にこの解読のもたらす意味を考えてみる。

日本人ゲノム解読の意味とは

通常遺伝学的な準備的解析、特に大規模プロジェクトが何を意味しているのかというのは専門外の方には、いや専門ですらわかりづらい。ゲノム研究については、伝統的に日本の生命科学研究は冷淡である。国際ヒトゲノム計画がはじまったとき、国立遺伝研*1を始めとする日本のほとんどの遺伝学研究所は参加の意思を示さず、責任者であるジェームズ・ワトソン*2が榊先生にたびたび圧力をかけていたという噂も聞くものである。既存の研究所として慶應大学清水信義先生が素晴らしい貢献をなさったほかは、アメリカの圧力により新設されたと言われる東大医科研ヒトゲノム解析センターが行った。その後も、私もよく、「ゲノムなんてもう終わった領域でしょ、そんなことやって何の意味があるの」と嫌味を言われたものだ・・・

とはいえ近年は、東大臨床系の山本一彦先生、門脇孝先生を始めとして精力的にゲノム解析を行っておられるし、ずっと興味なさそうに振舞っていた関西でも、京大が大規模なゲノムコホート研究を開始しようとしており、風向きは変わっているとは思われる。それでもこれまでの冷淡な態度が、韓国・中国にゲノム解読で先んじられるという結果を招いたとは言えるだろう。

ところで今回の日本人ゲノム解読は、深遠な学問的な意味というよりは、ずっとプラクティカルな価値を持っている。

ゲノム解読とは何か

現在、人類は、自らの設計図が書き込まれているDNAを読む技術、「シークエンシング技術」*3を持っている。ところがサンガー法では、最大でも数千塩基を読むまでで、ヒトゲノム30億塩基を一気に読む技術というのは存在しない。そこで様々な工夫がなされてきた。

国際ヒトゲノム計画

アメリカNIHが主導する国際ヒトゲノム計画では、ヒトゲノムDNAを慎重に順番に細切れにして、細菌に組み込んでBACというものを形成し、一つ一つ読んでいた。この時国際共同研究で読んだのはジェームズ・ワトソンのDNAであることがわかっている*4

Celera社のゲノム解読

当初アメリカNIHでヒトゲノム計画に携わっていたクレイグ・ベンターがベンチャー企業を立ち上げてゲノム解読をはじめた*5。この時読んだ配列はクレイグ・ベンター自身のものである。セレラの方法は、ヒトゲノム計画とは違い「全ゲノムショットガン法」というもので、BACにいちいち組み込むということはせず、ヒトゲノムをばらばらに分解し全部読んだ。そして読んだ配列を、その後コンピュータでまとめあげたのである(「アセンブル」と言う)。この時使用したコンピュータはDECのAlphaをつんだCompaqのサーバで、大量に並列で使った成果だということも特筆すべきことである。彼らはスパコンを使用せず、人類最大規模のデータ解析を成し遂げた。

次世代シークエンシング

これまでの二つの方法は、いずれもサンガー法を用いているのだが、これがとてつもなくお金がかかってしまう。現代の大規模シークエンシングは「次世代シークエンシング技術」と言って、これらとはまた違った技術である。企業としては、Illumina社、Life technology(以前のABIなど)、Rocheが実用化している他、一部の人は本命だと思っているPacific Bioscienceなどのベンチャー企業の技術も投入されたか、投入されつつある。

技術的な詳細は省くが、より高速で、安く、かつより短い塩基を読む技術だと思ってもらえれば足りる。より一度毎の解読塩基(「リード」と言っている)が短いので、アセンブルのための計算機負荷はさらに強くなる。そこで、この技術を「デノボシークエンス」、つまり何も無い状態から1から読み上げるのではなく、「リシークエンス技術」、つまり既存のゲノム配列をもとにして、それと照らし合わせながらゲノム配列を組み立てていく方法で用いることが主流だ。

そういうわけでリシークエンスのためには照らし合わせるための元の配列、「テンプレートDNA」が必要となる。これが、日本人ゲノム配列が現在必要とされている実践的な理由である。

続きまた書きまーす。

*1:進化論の数学的探求にウェイトを置いてたのかもしれませんが・・・

*2:DNA二重らせんでノーベル賞をとったワトソン・クリックのワトソン

*3:この技術を開発したサンガーとギルバートはともにノーベル賞を受賞している

*4:ちなみにヒトゲノム計画の達成は、アメリカ大統領ビル・クリントンとイギリス首相トニー・ブレアの共同会見で行われたことは有名である。また、このときクリントンが、「アメリカ、イギリス、・・・、中国をはじめとする各国の貢献により・・・」とスピーチし、日本が省かれていた。実際にはアメリカ、イギリスに次いで三番目に多く貢献していたのに、である。わざとなのかどうなのか、まあわざとだろうとは思う。

*5:この理由についてはよくわからない。お金儲けになると考えたからというのが一番多い見方だが、結局金儲けにならず後年ベンターはセレラをやめさせられている。他の理由としては、遅々として進まないヒトゲノム計画に義憤を感じたとか、ただ単に自分のゲノムを読んでみたかったからとかがある。研究者としては、第三の理由は理解できなくもない