あなたがたばこを吸うのは、(ごく一部は)親から受け継いだDNAのせいである

なんかSNP論文が増えすぎてよくわかんなくなってきたのでここにまとめていこうかなと思う。あわせてnext generationの論文で何やってるかもちらと見てみたい。

今週のNG (Nature genetics)は、喫煙関連遺伝子特集のようだ。たばこを吸う吸わないは、意志の強弱だけではなくて、遺伝的にたばこを吸ってしまう人がいるということだ。これが明らかになれば、今後タバコを吸ってしまう遺伝的リスクをもともと持っている人には、より強化した禁煙アプローチを行ったり、あるいはそのような遺伝的リスクをもたらすレセプターなどに特異的な禁煙補助薬品をつくることにつながるだろう(そういうわけで欧米の製薬会社はSNP研究に多大な期待をいだいている。武田はそうでもないようだけど)。

Liu JZ et al. Meta-analysis and imputation refines the association of 15q25 with smoking quantity. NG 2010;42:436.

Smoking is a leading global cause of disease and mortality1. We established the Oxford-GlaxoSmithKline study (Ox-GSK) to perform a genome-wide meta-analysis of SNP association with smoking-related behavioral traits. Our final data set included 41,150 individuals drawn from 20 disease, population and control cohorts. Our analysis confirmed an effect on smoking quantity at a locus on 15q25 (P = 9.45 × 10−19) that includes CHRNA5, CHRNA3 and CHRNB4, three genes encoding neuronal nicotinic acetylcholine receptor subunits. We used data from the 1000 Genomes project to investigate the region using imputation, which allowed for analysis of virtually all common SNPs in the region and offered a fivefold increase in marker density over HapMap2 (ref. 2) as an imputation reference panel. Our fine-mapping approach identified a SNP showing the highest significance, rs55853698, located within the promoter region of CHRNA5. Conditional analysis also identified a secondary locus (rs6495308) in CHRNA3.

http://www.nature.com/ng/journal/v42/n5/abs/ng.572.html

メタ解析をMETAというソフトで行っている。この論文で同定されているCHRNA5-CHRNA3-CHRNB4というのはすでに報告済みの領域(http://www.nature.com/nature/journal/v452/n7187/full/nature06846.html)。そこでその領域に、集めた膨大なサンプルを利用して1000 genomeの結果を使ったimputationを行ったとのこと、最近話題になっているものだ。

方法としては、P値最低のSNPでconditional regressionを繰り返したり、BICベースのモデル構築を行ったりしてる。数理統計家が卒倒しそうなやり方だなあ。1000 genomeを初めて使いましたというのがNGに載った点?よくわからない。歴史がその正当性を証明することになるのだろう。

2番手の座位はゲノムワイド有意ではなかったが、CHRNA2 (8p21)。遺伝子的にどう考えても真の関連だと思うので、教科書的にはtype 2のエラーであろうということになるが、40000人も使ってもこれが起こるとは・・・どんだけ効果が小さいのだろうか。それでももちろん、集団全体に対する寄与リスクは十分大きい。実際の国民は数千万人から数億人いるわけだし。しかし個人レベルではあまり気にすることもないような気もする。国家の政策としては重要だろう(だから厚生労働省が興味持ってないのはアホ!文部科学省は協力しているが)。しかし個人レベルでは、「まあいろいろあるよね」をこえるものではないだろう。それはそれでいいんじゃないかと僕は思っていたりする。

Thorgeirsson TE et al. Sequence variants at CHRNB3–CHRNA6 and CYP2A6 affect smoking behavior. NG 2010;42:448.

これは最初にCHRNA5-CHRNA3-CHRNB4の関連の確実な証拠をNatureで発表したdeCODEグループ。replicationでは上記グループのデータを使用しているようだ。この領域の効果サイズは SNP rs1051730において0.8 cigarette par day/allele、つまりこのSNPのリスクアレルを一本もつ毎に一日喫煙本数が平均0.8増えているということ。そのほか2つ、新たにゲノムワイド有意な喫煙関連SNPを発見した。いずれも一日平均本数を平均0.3本増やす。三つあわせても平均1.4本増えるだけ(染色体が違うので独立した因子と考えることができる)。ただこれが完全に遺伝子だけで、環境因子を可能な限り排除した結果であること、またばらつきの中心の値であるにすぎないことを考えると、わりと効果大きいな?とも言えるかも。だって普通、自分が吸っているタバコはすべて自分の意思で吸っていると考えるのが当たり前だ。ところがあなたがあと一本吸ってしまうその一本は実はあなたの意思とは関係なく、遺伝子によって吸わされていると言うことだ。たった一本であるとはいえ、哲学的にもわりと挑戦的な結果だと思うのだ。第二位、第三位の座位はそれぞれCYP2A6-CYP2B6 (19q13)、CHRNB3-CHRNA6 (8p11)。またこれらはトップの座位と同様、肺癌についてのリスク効果もある(まあ交絡因子なわけだけど)。

The Tobacco and Genetics Consortium. Genome-wide meta-analyses identify multiple loci associated with smoking behavior. NG 2010;42:441.

ここは第一ステージの人数が70,000人!というわけで一番多い。また、結局今回紹介した3つの論文はたがいにサンプルを流通しあっているようだ。ま、だいたい現在のSNP研究はこんな感じ。また、一日喫煙本数と関連する座位だけでなく、喫煙開始と関連する座位も発見しており、8個あるが最強はBDNF!やっぱりねー脳が来たか。そうだよね。やはりこれらの研究は自由意志へのちょっとした挑戦だ。しかし幸いなことに、効果サイズの小ささからは(思ったよりは大きかったけど)、ゲノムも影響はするが、ほとんどの分散は環境因子と自由意志によっているともいえるのかも。

メタ解析はMETALで行われている。よく使われているやつだ。The Wellcome Trustはいつも先進的な解析法を提案し、前述METAはともかくIMPUTEなども開発しているが、なぜか広く使われているのはブロードのplinkだったりこのミシガン大学のmerlin、mach、metalだったりするのはなんでなんだろう。やっぱりアメリカ様の所業だからか。