学業達成度に影響する遺伝因子

Genome-wide association study identifies 74 loci associated with educational attainment | Nature

(supplementary informationが134ページもある)

  • 30万人について930万箇所の遺伝的変異をスクリーニング
  • 74か所の遺伝的配列が学業達成度に統計的に関連していた
  • 11万人の独立したデータで確認、72か所において一致する関連を確認した。
  • 既存データベースで、胎児脳組織において遺伝子発現を調節していると考えられる部位(DHS)に有意に多く存在(enrichment)していた
  • 頭蓋内容量(≠頭の大きさ)と教育年数との遺伝的相関を発見した(P=1.2e-6)
  • ほかにも4つの形質(正の相関:認知機能、躁うつ病、負の相関:アルツハイマー病、神経症傾向)との有意な遺伝的相関を認めた。
  • 身長(正)や統合失調症(正)との遺伝的相関も有意であったが小さかった。
  • 独立したサンプルにおいて、発見した遺伝的変異により教育年数の予測を試み、それと実際の教育年数との相関をみたところ、R2=0.032くらいだった(P=1.18e-39)

この解析のフェノタイプは「教育を受けた年数」。日本でやるなら、中卒は9、高卒は12、大卒以上は16~という年数。留年したら長くなるんじゃないの?とも思うがそういう細かいことは気にしないのが大規模ゲノムワイド解析。欧州系集団のみを対象としている。

DHSというのはDNaseI Hypersensitivity Siteの略。それぞれの細胞内において核ゲノムはクロマチン構造を取り、ゲノムDNAはヒストンというタンパク質のまわりにグルグル巻きにされているので外からそのDNA配列にアクセスできないが、一部はヒストンにまかれていないところがある。そういうところには転写因子複合体などというタンパク質の塊がくっついて、遺伝子の発現を調整する。DHSは実験的にそういう箇所を同定する。そして、そういった場所は細胞によって違う。すると、今回教育年数に関連するとされた遺伝的変異が、胎児脳組織のDHSにたくさんあった。すなわち、胎児脳組織においてこれら遺伝的変異が機能を発揮しているだろう(ほかの組織・・・例えば筋肉などでは、遺伝的変異があってもヒストンにグルグル巻きされているので機能を発揮していないだろう)。胎児脳において遺伝的変異により遺伝子調節に違いが生じることが、最終的に教育を受ける年数に影響する・・・と、まあ「そうですね」というような解析結果である。そのほか本論文では一般的に中枢神経系組織に影響しているだろうという解析もいくつかしている。

「遺伝的相関」と書くとなにやら一般名詞のようにも見えるが、最近のゲノム解析で使っているなら普通GCTAとかLDSCとかの特定のソフトウェアの結果を指し、今回はLDSCによるもの。これの意味についてはいろいろな理解をする人がいるとは思うが、おそらく一致して理解可能なのは、「これら多因子遺伝性の形質は様々な遺伝子パスウェイにおけるいろいろな遺伝的配列の違いが影響している。遺伝的相関は、二つの形質がそういった遺伝子パスウェイを共有している割合を示している」ということ。そもそもわざわざ遺伝統計学者が「遺伝的相関」という言葉を使っているのだから、因果関係ではありませんよと注釈していることに等しい。

とはいえ、頭蓋内容量と教育年数が遺伝子パスウェイを共有していれば、その機能を起こす場所つまり脳であることが一致しているから、ある程度因果関係を示しているようにも思われる。一方躁うつ病においては、教育年数が長くなると躁うつ病をきたしやすいという交絡因子を反映している可能性もある。

統計学的因果推論をしたいというときにはMendelian randomizationをするということに(今のところ)なっている。