一卵性双生児の識別について

一卵性双生児はゲノムDNAが「基本的に同一」なので、DNA鑑定で見分けることは困難。しかし、それを見分ける技術が開発されたというニュースです。

http://japanese.engadget.com/2015/04/29/dna/

によると、

一卵性双生児を通常のDNA鑑定で区別することは困難でしたが、この技術を用いれば、たとえば一卵性双生児が関わる犯罪でも DNA 鑑定を用いた捜査が容易になります。

とある。これはDNAメチル化を利用した鑑定のようです。

DNAメチル化は、ゲノムDNAの上におこる修飾で、親から引き継ぐもののほか、成長の過程で獲得するものもあります。そこで、ゲノムDNAが「基本的に同一」な一卵性双生児間でも全ゲノムのメチル化プロファイルを取れば、違いがあるかもしれません。これは、現在の知識レベルからは自然な発想だと思います。

ただし、ブコメには「DNAでは不可能だがメチル化なら可能なのだ」と、このニュース記事を解釈しているようですが、そういうことではありません。

この素晴らしいニュース記事は論文へのリンクを貼っています。さらにその論文が引用している最初の論文は、

five single nucleotide polymorphisms (SNPs) present in the twin father and the child, but not in the twin uncle. The SNPs were confirmed by classical Sanger sequencing.

われわれは、双子父(双子1)とその子供には存在するが、双子叔父(双子2)には存在しない一塩基多型SNPs)を5個発見した。これらSNPsは、古典的Sanger法によって確認された。

http://www.sciencedirect.com/science/article/pii/S1872497313002275

とあって、こういったSNPs(本当はSNVと呼ぶべきですが)を検出することで、ゲノムDNAのシークエンスによって一卵性双生児の識別が可能である可能性が示されています。これはなぜ可能なのかというと、おそらくまったく同じゲノムを持って発生した一卵性双生児のそれぞれの細胞から、発生後の非常に初期に片方にだけ突然変異が生じたのでしょう。もちろん、もう片側にもそれだけが持っている突然変異があると思います。これらは「de novo突然変異」と呼ばれるものの一部であると思われます。

で、そういうわけだからゲノムDNAだけからも一卵性双生児の識別は可能であると思います。引用元論文も、この可能性を否定していることは全くありません。しかし、これを検出するためには30億塩基におよぶ全ゲノムシークエンスが必要であり(突然変異はどこに起きるかランダムであると想定されており、しかも数は非常に少ないので、全部調べるしかありません)、そのためのコストはようやく最近、いろいろなチート技を駆使して一人あたり1000ドルを切ったところですからコストが高いわけです。

それで、メチル化に着目すると、bisulfite sequencingとかいう方法だとやっぱり同じコストがかかるし、methylation chipでも数万円はするわけですが、今回本ニュース記事が引用している論文は、それらよりずっと安く、現実的なコストで一卵性双生児を識別できるかもしれないぞ、というところが主な主張なのです。

個人的には、メチル化の違いは一卵性双生児間で現れるだけでなく、一個人の組織間でも現れるはずですので、事件現場に残されたサンプルと個体から得たサンプルとの採取の違いによって現れるばらつきがどれだけ影響するのかという点に興味があります。

全ゲノムシークエンスはどんどん安くなっていっているので、そのうちそっちが安いということになりそうな気もします。

STAPについての感想

いやー終わった終わった・・・と、何回思ったかわからない本件なので、今後もまた何が起こるか、注視が望まれる。うそです。

WHAT問題

それがいったい何なのかという、ここではWHAT問題ということにすると、それは科学的に言えば2月〜3月の始めころでほぼ終わっていた案件で、大多数の良心的な科学者たちはその辺りでもう興味を失っていたことでしょう。それが科学的に本当かどうかを議論したい人というのが、科学者の中にいたとするとちょっと驚きかもしれない。分野によっては、科学としての感覚がだいぶ違うので3月以降も情報を欲していたようなものもあるかもしれない*1。それを含めても、納得するまでの期間に、事前情報の違いでばらつきが出る程度の話であろうと思います。

HOW問題

HOW問題も、まぁ、もうみなさんほぼ見当ついているんでしょう。僕もそう思いまっす。以前に書いたように、多分最終的に「真実」とかいうものが明らかになるかどうか、つまり捏造を企てたと断定できる証拠が得られるのかどうか自体がわからない。でもま、人生そんなもんだと思います。私はあまり興味ないのでそれはそれでいいです。

勉強になったことは、「どのようにしたか」にかかわらず、「それが何であるか」の時点で重大な科学への背信があったなら、その時点で研究者を断罪すべきこと。「悪意」というような、弁護士にいかようにでも転がされてしまうような不用意な言葉を、研究室規定に入れるべきではないこと、とかですかね。

あと、理研はこれだけの時間をかけておきながらこの点を明らかにしようという努力をほとんどしてない、のか?マジか。さっさと終わらせるか、ここ明らかにするか、どっちかにせいよ。まさかWHAT問題をまだ追いかけていたんですか。う〜む。。。

WHY問題

WHY問題のほうは、今もこれからも私は重大な関心を持ってはおります。

私にはひとつ気になっていることがあります。

CDBというのは日本のラボにありがちな、業績重視・年齢重視・男性偏重というピラミッド的システムに対してあえて挑戦するような面があったと思います。若手、(やや)業績不十分、などの積極的登用がとてもよく見られていたセンターだったと思う(すでに過去形で書いてしまった)。女性PIも比較的多かったでしょう。高橋政代先生だってそうですし。まあ、分野的には私は専門外なので、「ほかにも日本にはそういうところはある!」とかあるかもしれませんが・・(ただし、少なくともある程度の業績レベルがあるところにしぼって議論して欲しいですが・・・)

そこでつまり私が気になるのは、今回の事件を起こしたのはこの若手・業績不十分を性別を問わずに選抜するシステムそのものの問題なのか、それともそれとは関係ないところの問題なのか、ということを明らかにして欲しいということです。

前者ならば、CDBは驚愕するほどのレベルの業績を挙げてきたセンターですが、もはやその手法を捨てるしかない。つまり極普通に日本によくあるようなラボにすればいいでしょう。実際、CDB以外の日本によくあるラボは今回のような大捏造事件を起こしたことなんかないわけです(?)。今その方向性だと思いますが・・・

一方、後者だとするならば、CDBのこの特徴は、私としてはぜひそのままキープして欲しい。珍しいですからね。例えばですね、上田先生とか齋藤先生とかいうキラ星のような若手研究者がいたわけですけど、彼らの業績は(PI就任時点で言うと)不十分っていったってその不十分レベルが地方医大の教授(場合によっては帝大クラスでも)とかを凌駕するほどだったわけですけど、小保方さんはその程度の業績すらなくほぼゼロだった。でも私は外部の人間ですから、上記の二先生のように世界に名だたるような人しか知りませんが、ほかには小保方さんと同じくらいの条件で就任したPIもいた・・・のか??この辺りの状況が全く分からんです。そういう、うまくいかなかったフィルタがどれかをきちんと見極める作業をするとかですね。時折内部の人っぽい人から聞こえてくる、明らかに情実人事だったとする件。多分そうだったのでしょうけど、しかしそれもまた客観的に分解して、情実人事をシステムとして阻害するようにしなければいけませんでしょうね。

だいたい、冷静に考えると、小保方さんって、そもそもなんでPIだったのかわかんないです。あの研究内容は、通常は誰かボスの下で若手の研究員がやっているようなこと。この件は割と本質的ですよね。もし若山先生の下にいたころのようにボス - 研究員の関係なら、今回の小保方問題の多くの責任がボスのほうに行っていたと思われます。しかし、現実には小保方さんほかの登場人物がすべて独立に責任を負うPIだったということから、責任論がこじれている(いた)わけですけど。これもCDBがどう考えているのか、知りたいですね。こういうことが全く分からん。

結論

私はCDBの業績を剥ぎとってしまう改革になるようなのはできれば避けてほしいと思う。しかしもちろん、その業績を出していたシステムそのものが捏造事件を直接的に起こしていたなら、しょうがないがそのシステムは捨てるしかない。そこを見極めてほしいと思うのです。ダメだという判断が下った場合、今後理研にかかわらずほかの生命科学系ラボも、若手登用は見合わせるべきでしょう。

システムとしては、業績・年齢によるピラミッド型システム、権威ある研究者による若手選抜システムの他に、権威ある研究者の評価にかかわらず広く若手研究者に同等のチャンスと権限を与えるようなシステムも考えられる。

例えば、1番目・2番目のシステムは、現在の権威ある研究者(過去の偉大な研究をした人)が、新しい研究を理解できないという可能性がある、たとえば生物学分野が統計学・計算機科学を取り込むには、日本では結構時間がかかりました。3番目のシステムはこれに対してよいでしょう。

ちょうど2番目のシステムは小保方的人間に最も脆弱だとは言えます。しかし、1番目、3番目ももちろんそれぞれ問題はあるでしょう。1番目の問題が、新しいものが出なくなりがちになることは明らかでしょうし。例えば19世紀ドイツ・オーストリアの医学研究ってそういう印象。20世紀になって、ほとんど米英に取って代わられましたが、それがシステムの問題なのか、二つの大戦の影響に過ぎないのかは僕にはわかんないっす。そういう研究って、誰がやっているんだろう。

同じような問題意識をもってる人、いないかなぁ。小保方個人とかほんとどうでもいいんですけど。

*1:例えば数学などからは、そもそも「数学者」である時点で彼らは相当選抜された存在なので、そういう無能な人間が前面に出て活動しているような科学の分野があるということ自体がよく理解できないようであった

SNPで病気や体質の予測

下記エントリについて。

MYCODEとGenelifeの遺伝子検査結果を比較してわかったこと | 遺伝子と三角

ちょっと前に身長を予測する遺伝的因子の論文が出ていた。

http://www.nature.com/ng/journal/v46/n11/full/ng.3097.html

これによると、身長に影響する遺伝的因子はヒトゲノム上に697箇所あり、それによって身長の分散の15%程度が説明できるとのこと。これは「たった15%しか説明できない」、「これらの遺伝的因子で身長の予測はほとんどできない」と読む。

過去の双生児研究*1から、身長のうち80-90%程度は遺伝的情報によって説明可能と推定されている。これが本当なら身長はわりと正確に予測できそうなものなのだが。

ただし、この研究は線形混合モデルでDNAチップ(GenelifeとかMYCODEが使ってるのと同じもの)全体による説明分散を求めたところ、60%程度だったとのこと。現時点では15%まで説明できる因子しか判明していないが、残り45%ぶんを説明できるデータは、今手元にあるDNAチップの結果の中にあるらしい。

たぶん多くのありふれた疾患なども同じような状況であろうと思われている(数字はそれぞれ異なるが)。

現状としての世界的なレベルでの把握は

  1. ありふれた病気(2型糖尿病痛風など)の発症に影響する遺伝的因子は少なくとも数百、多分数千ある
  2. 現在の最先端の研究では、そのうち一部しか明らかにしていない
  3. 時間が経てば、例えば身長なら60%程度説明できるようになるかも。

という感触であろうと思われる。

ちなみ現行の「DTC」と呼ばれる商業ゲノム検査サービスは、通常一つの病気や体質について数個、多くて数十個の遺伝的変異を調べていると思われるが、その予測能については、まあとにかくこの文章を見て判断していただければ幸いである。

*1:一卵性双生児と二卵性双生児との違いから遺伝による影響を推定する研究

引用回数の多い論文

面白かったです

ノーベル賞受賞者の論文ですらランクインしない「世界で最も引用された論文トップ100」 - GIGAZINE
The top 100 papers : Nature News & Comment

適当にわかるものだけ、知ってるけど論文タイトルからはわからないので取り漏らしているものもあるかも、あと専門分野から離れるほど、その論文そのものの直接的貢献よりも大雑把なこと書いちゃってるかも

4位Sanger法 
6位ウェスタンブロッティング
11位カプラン・マイヤー法 
12位、14位BLAST 
17位MMSE 
19位サザンブロッティング
21位リアルタイムqPCR 
24位Cox比例ハザードモデル 
44位2D電気泳動
52位パッチクランプ法?
57位EMアルゴリズム 
58位メトロポリスヘイスティングス
59位Benjamini HochbergのFDR 
62位LDLのFriedwald法 
63位Taq
73位AIC 
86位焼きなまし法 
88位マルカート法
92位PDB


なるほど。。

(ヒトゲノム論文が入っていないとは・・・)

私自身は、生命科学の真に偉大な発見は、観察そのものよりは観察に用いられた科学的技術や解析法の開発のほうだと思う方の人なので、こうやって評価されるのはいいことだなぁと思いました

日本人の血筋を追っていったら・・・

日本で、ランダムに1000人くらいの血筋を追っていったときに、その先祖あっ..

分子生物学の知見ならびに遺伝学の法則の教えるところによると、父親または母親の持つ遺伝情報のうち子に伝わるのは半分である。祖父から孫に伝わる遺伝情報は1/4で、曽祖父からひ孫へは1/8である*1
。たった3代前について、「その代に偉大なる名家の血を継いだひいおじいちゃんがいたおかげで私が優秀なのである!」なる可能性について考える。二つの可能性があって、

  • 常染色体上のたった1つの遺伝因子+環境因子で優秀さが決まるとするならそれが自分に伝わる確率は1/8なのであって、自分の世代の兄弟・いとこのうちその優秀遺伝因子が影響するのは8人いたら1人しかいない。
  • もし常染色体上のN個の(少なくともN > 100くらいの)遺伝因子+環境因子によって決まるとするならば、遺伝的組換えが起こることを考えるとそのひいおじいちゃんの自分への寄与は1/8程度なのであって、残り7/8はその他のひいおじいちゃん・ひいおばあちゃんによるものである

ちなみに知能だとか運動能力だとか社会階層だとかについて、前者であるという可能性はほとんどない。これまで見つかっていないとかもあるけど、進化の理論からいってもちょっとありそうにない。

というような原則から考えるに、社会階層なるものに強い親子間の遺伝性があるとするならば、現実的にありえるのは、「血筋に『たくさんの』名家がいたのでいまでも社会階層が高い」「血筋に名家が『まったくいないので』低い」というようなことであって、ある特定の血筋が一本続いてえんえんと子孫に結びついていくというようなことは、現在の遺伝学が教えるところによるとないだろう。

織田信成君だって、本当かどうか知らないけど織田信長の子孫とのことだとして、織田信長と共有する遺伝情報はかなり少ないわけで、信成くんの顔が信長とそっくりであったとしたらそれは多分偶然だ。

・・・とも言えない部分はある。信長系の家系の人と、血の濃い結婚を繰り返していたとしたら、信長と共有する遺伝情報が相当多くなる可能性はなくもない。実際、ハプスブルク家はその中で同じような身体的特徴を共有していたのは確かだから。

とすると、このように「特定のある人」「特定の名家」「その先祖あってのその子孫」というような影響に興味があるとするならば、近親婚の度合いの強さを見ることになるかもしれないが、現在も続くような名家についてそれは倫理的にOKな課題なのか、疑問ではある。

現実的には、社会階層が高いと子によい教育資源を与えやすいという環境因子の伝達可能性が、家系図において社会階層の相関性を引き起こす可能性が高かろうと思う。それを確認するために研究し*2、それが確認されたことをもって、家庭環境にかかわらず教育資源を国民に平等に与えるための政策をとる、という方向に行くというなら良い研究だと思う。ただこのように結論ありきの研究って微妙ではあるけど(例えば私がやるとしたら、遺伝性がもし強いようだったら、科学的に許される範囲で極力主張を弱めた報告にしてしまいそうですな)。私はやりません。



ちなみに現時点でも確からしい精度で可能なのは、というか実際にそのようなデータが存在している(らしい)ところから言うと、「『普通の日本人』を遡ると、たった数世代前に中国人とか韓国人とかがわりと頻繁に見られる」というところであろう。もちろんここでいう「日本人」とか「中国人」とか「韓国人」とかいう集団は「いわゆる」とでもつけるべきもので、ゲノム情報で見ればだいたいほわっとした辺縁をもったクラスタとして観察されるくらいのものである。ビジネス上の理由から「なになに人」と分類してみました、とでも言うべきものだ。ちなみにヨーロッパ系の集団ではクラスタは互いに完全にオーバーラップしている。例えばフランスのブルターニュの集団はイギリスの南方系とほぼ同一だ。自分の乏しい歴史知識からすると、イギリスと一致するのはノルマンディーの方かと思っていたが、ノルマンディーはフランス系集団の中心の方に近くなる。アルザス地方はフランスとドイツの重なり部分に相当するようだ。アキテーヌはスペイン、ラングドックやプロヴァンスコート・ダジュールなどの方はイタリア北方系と重なっていた。ヨーロッパ系集団からアラブ系集団までオーバーラップは続いている。それと比較するとアジアは割りと現在の国ごとにわかれていて、「日本人」と「中国人」は独立したクラスタだが、中国人内の漢民族とそれ以外の民族はわりとオーバーラップしているようだ。東南アジアなどを見ると、中国人クラスタとインド人クラスタの中間に多く存在したりする。「インド人」なる集団がこれまた非常にbroadで・・・

23andMeはこういう情報を返すことで知られているが、当然それは何年もかけて世界的な規模でサンプルが集まっていることが理由なので、例のDeNAのやつがここまでできるかどうかはわからない。なにしろ主成分分析をもとに結果を出しているので、データが必要である。また、23andMeは当然アメリカがベースなので、「3世代前にイギリス人とドイツ人とイタリア人がいました」とか言ってもなんの社会的問題もないわけで、またアフリカ系住民に対して「3世代前はケニアにいて」・・・という情報は、アフリカ系アメリカ人はどちらかというとそういった情報を欲していることが知られているので、その枠組みで「日本人の3世代前に中国人がいて」とか言っているということなのだろうが、日本のサービスが日本人だけを対象にしてそれをやってしまうと、問題が起きることもありそうかもしれない。ビジネス上の賢明な判断としては、やらないかもしれませんね。少なくとも出来るようになるとしてもサンプルが集まってくる数年以上後ということになるだろうな。23andMeは、解析技術が向上すると、アップグレードした情報を提供してくれることが知られているが、DeNAのやつはどういう方向でやるのだろう。

*1:エピゲノムの影響については、特定の家系内でいうならば、一般的なゲノム因子と同じ振る舞いをすると考えられるが、一点だけ、数世代で家系図内でモザイク的になくなってしまうという可能性はある。そこでエピゲノムの影響についてはここでは無視したことをお詫びする(っていうかわからん)。ドミナンス・エピスタシスは親子では伝達されない。

*2:こういった研究は当然これまでやられているが、ゲノム科学の方の進歩も顕著なので、前提条件やデータの精度が異なる研究が今なら可能ではあるだろう

幼稚園での子供の写真

幼稚園で、カメラマンが撮影した写真の中から、自分の子のうつった写真を選ぶことで潰れている日曜の朝の時間である。むかしなら、写真は幼稚園や学校に掲示されているから選ぶのはお母さんや子ども自身の仕事だっただろうが、今となっては写真屋さんのサイトに鍵付きで掲示されるので、うちのようにお父さんの仕事になっている家も多いだろう(実情を述べているだけで、性差別を肯定する意図はありません)。

これがとにかく使いにくい。

サムネイルをクリックしたら(かなり粗い画像を)拡大表示する。まあそれはいいでしょう。右矢印キーを押す。なにも起こらない。なるほど、「X」ボタンを押して、サムネイルのリスト画面に戻って、またサムネイルを押して拡大表示せよと。・・・煩わしいなぁ。

というかそれ以前に、うちの子がうつっている写真と、年少さんとか年長さん、あるいは年中さんの他のクラスの写真とかあるわけじゃん。Tagとか付けてくれないかな。

ていうか顔認証してうちの子の写真だけサジェストしてくれないかなぁ。

これは日本のお父さんの貴重な土日の時間を単純クリック労働に潰すことで、ひいては日本国の生産性を落としているのではなかろうか。

どこかのIT系の会社さんでフレームワーク作って、町の中小のカメラ屋さんに売り込んでくれないもんでしょうか。

高橋政代先生が怒っていらっしゃった

STAP論文がリトラクトされました〜。長かった、と思われるかもしれませんが、感覚からすると、一般的な科学論文のリトラクトまでの時間で考えると早かったのでは?あの長寿GWASのScience論文とか、めちゃくちゃだったのに1年かかってたしなぁ。まあこっちは捏造とかではないけど。

ところで高橋政代先生が怒っていらっしゃいました。あとで方向修正されたそうではありますが。

http://www.riken.jp/pr/topics/2014/20140702_2/

高橋政代先生は常に、今回の世界初のiPS細胞臨床研究が、今後数十年に渡る(かどうかわかりませんが)iPS細胞の臨床応用のための研究発展の全てに重大な影響をあたえることを自覚していらっしゃる方です。

個人的に存じ上げているわけでもないのでわかりませんが、講演などでのご発言から考えるに、おそらく和田心臓移植を念頭に置いているのだろうかと思います。

和田心臓移植は、ご存じの方も多いでしょうが、国内初の脳死心臓移植でしたが、脳死判定など様々な点に疑問があり、国内初の心臓移植という名誉を得るために強行した人体実験だったのではないか、という重大な倫理的な問題が指摘されたため、脳死心臓移植そのものの信用性が完全に失われ、その後30年以上にわたって日本国での心臓移植件数がゼロとなったことの主要な原因であったとも言われる、有名な事件です。ちなみに欧米ではその間も活発に行われていた。「心臓移植」という医療行為自体はまっとうなものだったわけですけれども。

結果としては和田先生は刑事事件としては不起訴処分となり、その後女子医大に移って医者人生を全うされました。

小保方さんが本気で人をだますための捏造をしたかどうかが(ほとんどクロ判定に近いものの)未だ100%確実ではないことと同じように、和田心臓移植もあれが脳死ではないものを無理に脳死としたのかどうかは100%はわかりません。

しかし脳死判定の手続きをしっかりやらなかったことだけは確かです。

手続きの問題なわけです。

そしてそれは本質的な問題で、疑義を抱かれ、信用を失うには十分なわけです。今回の小保方さんと同様に。



であることから逆算すれば、今回の理研の対応ですが、和田心臓移植と対照させると、脳死判定をきちんと行わず脳死心臓移植をやったという重大な手続き上の問題があり、その他にもさまざまな疑問が噴出している(本当に今回の小保方さんの件と似てます)にも関わらず、「脳死だっかどうかは調べてみないとわからない」とか言ってるような状況だと考えられます。

そして、和田先生自身はそうやって刑事事件でも不起訴になりその後女子医大の教授になるような栄誉に服したとは言え、患者さんに行う心臓移植自体はストップしたわけですが、それと対照させるに、理研は小保方さんはまぁどうでもいいとして笹井先生や竹市先生の名誉をいささかなりとも回復させようと言う?対処をするあまり、CDBそのものの信用が失墜し、ついにはCDBがおこなった臨床試験であるiPS試験の信用性が失われることによってiPS臨床応用が数十年にわたって停滞する(日本だけで)・・・なんてシナリオが考えられなくもありません。

STAP細胞が存在したかどうか」は、再現性を中心に置く科学の世界では検証可能な仮説ではあるとは言えるものの、「小保方さんが捏造をしたかどうか」については、「和田心臓移植のドナーが脳死であったどうか」とほぼ同じレベルで、事実として完全に明らかになることはない可能性があると思われます。

しかし和田心臓移植の件において、「本当に脳死でなかったかどうか100%わからない」ことによって免責されることはなく、手続き上の重大な瑕疵により正当性を証明できなかったこととその他各種の疑惑をもって信用が失墜したことにより、心臓移植がストップした(とされる)わけです。

ですから手続きの問題それそのもの(+噴出する各種の疑惑)をもって、患者さんに医療行為ができなくなったという歴史を日本の医療はすでにもっているわけです。

心臓移植の場合は疑惑と信用が失われた医療とが同じ人でにより行われたのに対し、今回は、同じCDBではあるが、疑惑はSTAP、信用を失うかもしれないのはiPS臨床応用、ってことで、そこに少し飛躍はあります。とはいえ、その医療行為をストップさせるのは「信用の失墜」であるとした場合、小保方さんを手続きの問題のみを理由に確実に断罪できれば、信用失墜は小保方さんとSTAPにとどまりますが、現状では信用が失墜したのはCDBや理研であると考えるならばスジが通るとも言えるように思います。

私としては普通に理路整然としていると思いますが、理路がわからないとおっしゃっているブコメを読みましたので、ある視点からの説明を試みましたです。

理研の対応は相変わらずヘンですが、個人的には、前回の不正の件で裁判で理研が負けてしまったことを過剰に意識しすぎてるんじゃないかなぁと感じますかね。まあ、だからといってそれで不正に対する対応が緩くなったら、そんなことはしてはいけないわけだから、批難されてしかるべきだとは思いますけれども。