才能を予測する遺伝因子について（２）

才能と遺伝因子が「関連している」とはどういうことか

統計学的関連とはどういう事かということを話し始めると夜も更けてしまうわけだけども、ここでは簡単に次のことを指摘しておきたい。

まず第一に、これは''決定''ではない、ゼロか、イチか、ではないということである。遺伝因子と才能が「関連している」からと言って、その遺伝因子を持っていれば才能が発揮されるという1対1の関係ではない。後述する。
また、これは原因と結果の関係（因果関係）かどうかも、これだけでは決定できない*1。例えば、ある子どもが遺伝因子を持っているということは、その両親のどちらかもそれを持っているということである。その遺伝因子が「才能に関連がある」という結果が出た場合、もしかすると才能を発揮する遺伝因子というより、親が子供を教育して才能を発揮させる遺伝因子なのかもしれない。こういうのを交絡因子という。これは遺伝因子としての効果としては条件が全く同一ならば同等な効果であるけれども、実地に応用するにあたってはどちらの効果として発揮されたものなのかがわかっていなければ意味がない。

遺伝的関連というものをもう少しだけ専門的に定義する。例えば才能の研究に関して言うと、特定の才能を持った人たちの集団における遺伝因子の頻度が、一般集団あるいはそういった才能を持たない人たち*2におけるそれよりも、統計学的に偶然観察されうるレベルを越えて高い/または低いというデータが観察されたとき、遺伝的関連と言う。
初めてこれを読んだ人で、そんなんでいいの？そんなことで、遺伝因子によって才能が目覚めることがあると言っていいの？と、もし感じることがあったら、その人は科学的センスあるいは論理的思考能力があるほうだと思われる。これは本来もう少し説明が必要である。くどくどしい説明が面倒であれば飛ばしてください。「遺伝学者の考えていることを信じる」というのであれば飛ばして大丈夫*3。

まず才能を発揮する「遺伝因子」なるものは、もし存在するなら、きわめてまれな天才遺伝子以外はそれなりに多くの人が持っていると仮定する。
- 実は「きわめてまれな天才遺伝子」がもし存在するとするなら、それを検出する遺伝統計学的方法はすでに20世紀にあった。「連鎖解析」というものである。しかし少なくとも20世紀に天才遺伝子は検出されなかった。天才遺伝子は存在しないのかもしれないし、対象サンプルの問題で発見できなかっただけかもしれない。それはまだわかっていない。
- 一方、現在はそれよりも効果は小さいがより多くの人が持っている才能に関連する遺伝子、かりに「秀才遺伝子」とする、それが、もしあるなら検出する方法をわれわれはもっている。これが「連鎖不平衡解析」、よりよく使われている言い方では「ゲノムワイド関連解析」である。以下これについて説明する。
まずこの秀才遺伝子は頻度が高いというのがポイントである。たとえばずーっと前の前回に書いたように、クラスの40人のうち25人は遺伝的なタイプA、10人はタイプB、5人はタイプCであって、このタイプCが秀才遺伝子である、というようなくらいの頻度だと考える。逆に、このレベルの頻度でなければ、現在の方法では検出できない（これでも厳しいかも）。
- 頻度が高い遺伝的変異は、歴史が古いと考えられる。なぜなら同じ遺伝的変異をたくさんの人が持っているというのは、むかーしむかしある人のゲノムに突然変異が生じ、それがその子供たち、孫たち、...、に脈々と受け継がれ現代に至るということを意味している可能性が高いからである。基本的にゲノム上のいろいろな場所に突然変異が起こる可能性はほぼ同じで、同じ場所に同じように突然変異が起こる可能性はとても少ないと考えられている*4。
- また、「秀才」を引き起こす遺伝因子は複数あると仮定する。単一でもいいが複数でもいいように仮定しておこう。さらに環境因子の作用も考慮する。つまりとてつもなく素晴らしい教育が行われ、友人にもめぐまれれば、遺伝因子をもたなくても秀才になれるとしよう。これはとても自然で妥当な仮定であると考えられる*5。
それではこのような仮定のもとに、現代の人間社会ができあがっており、そこで「秀才」を評価するきわめて妥当な評価基準も用意されているとする*6。そしてある程度の人数、具体的には数千人レベルの「秀才サンプル」と、同様に数千人レベルの「一般人サンプル」を得たとする*7。
- 秀才になる遺伝因子は前述の方法で脈々と受け継がれている。この遺伝因子は秀才サンプルに当然存在すると考えられる。ただ全例が持っているわけではない。他の遺伝因子が作用して秀才になった人もいるし、環境のみでなった努力家もいるだろう。
- いっぽう一般人レベルにも秀才遺伝子は存在する。それは一般人として分類されたが実は秀才の人がもっている可能性もあるし、秀才遺伝子をもちながら一般レベルにとどまってしまった人かもしれない。
- このように秀才遺伝子は双方に存在することが可能であるが、それでもなお秀才サンプル群により多く存在するはずである。ちなみに秀才サンプル群にどれだけ多く存在するかによってその秀才遺伝因子の強さが推定できると考えられ、これは論文中では「オッズ比」として表される。オッズ比は（秀才遺伝因子を持っている人が秀才になる確率）/（秀才遺伝因子の有無に関わらず秀才になる確率）の推定値である。
ここで、ゲノム上のたくさんの場所について、秀才サンプルと一般人サンプルの遺伝子変異の頻度を比較してみよう。ほとんどの場合、両者はまったく同じではない。というかほぼすべてにおいて異なっている。その理由を説明する。
- もし人類集団の人数が無限であり、かつ調べたサンプル数も無限なら、これは同一になると予測される。
- しかしそんなのは夢物語で、地球上の人類の数は有限だし、調べたサンプル数もたかだか数千人である。しかし、その数千人のサンプルから得られる頻度がどれくらいばらつくかについての理論をわれわれは知っている。*8
- そこで、まず一般人サンプルの遺伝子変異の頻度を人類集団一般の頻度とおく。ついで秀才サンプルの遺伝子頻度が、その一般的な遺伝子頻度から予測される範囲内なのか、それとも逸脱しているのかを検定する。これがゲノムワイド関連研究である。
さて秀才サンプルにおける特定の遺伝マーカー、Aとする。これが一般集団から予測されるより多かった。それはなぜか？下記の可能性が考えられる。
- それが秀才遺伝因子だからである。
- それは秀才に関連した交絡因子である（本当は前述の、教育の才能に関連した遺伝因子であったりなど）。
- たまたま調べた秀才サンプルが、一般人サンプルとは違った遺伝的系譜を持っていた。極端な例では、秀才サンプルが日本人、一般人がドイツ人だとしよう。おそらく肌を黄色？くする遺伝因子や黒髪に関する遺伝因子が、そのような遺伝因子として検出されてしまう。このような誤りがおきないように厳重に一般人サンプルを選ぶ必要がある*9。ちなみに約束を守る遺伝因子はこの比較では検出されず、日本人対フランス人では超強力に検出されてしまうかもしれない。そんなこともある。
- 秀才サンプルと、一般人サンプルとで実験方法が違うので、違う結果になってしまった*10

長くなったのでこんなとこで。

*1:一般的な統計学的関連と比べると、遺伝的関連の場合「ゲノム」は生物の設計図であることが明らかなので、まだ単純な方ではあると思う

*2:よりP値を得やすいコントロールなのでスーパーコントロールなどと言われる

*3:実際には日本では生物研究者まで含めあまり信用されてないですけど（泣）

*4:「突然変異が定着する可能性」となるとタンパク質コード領域がどうこうとか難しい話になるが、これは別の話。今はあくまでマーカーの話をする。

*5:フィッシャーの相加的ポリジーンモデル

*6:本当に妥当か？と、この点がとっても問題ではあるが、本稿ではそこはおいておく。専門じゃないので。ここが批判可能なら、結果の解釈においてとても有力なものになろう。

*7:一般人サンプルは、わざわざ秀才を慎重に取り除く必要はない。秀才を含んでいてもいい。ただ実際に一般人レベルに存在する比率ではある必要がある。

*8:ばらつきについてのイメージは、ちょっと前に書いたメタ解析の記事の注釈がわかりやすいかも。ブクマにもわかりやすいって書いていただいた

*9:このようなことが起きているかいないかは検出可能である。「極少数の秀才遺伝因子以外のほとんどすべてのマーカーは、秀才サンプルと一般人サンプルでばらつきは同じはずである」という仮定を満たせばよい。具体的に論文ではGenomic inflation factorとして言及される

*10:実はこれが起きてしまったのが、かの有名なるScienceに掲載され大批判を食らっていたことがある。ごく基本的なことで、Nature geneticsだったら絶対にはねつけていた論文だと思うんだけど、Science誌の縁故主義で載ってしまったそうなhttp://d.hatena.ne.jp/hatehei666/20100709/1278641000