論文情報
Comparative transcriptomics in human and mouse
Alessandra Breschi, Thomas R. Gingeras, and Roderic Guigó
Nature Reviews Genetics, 2017 July; 18(7): 425-440
doi: 10.1038/nrg.2017.19
PMCID: PMC6413734
著作権: HHS Public Access / Author Manuscript (Standard Copyright)
NOTE本論文は2017年の総説です。
NOTEこの論文の著作権は、出版社(Springer Nature)または著者に帰属します。翻訳および図の掲載は不可のため、要約に留めます。
なお、本文はPMC6413734 より、全文が無料で閲覧可能です。
概要 (Abstract & Introduction)
ヒトとマウスのゲノム、トランスクリプトーム、および遺伝子制御の種間比較は、かつてない解像度で可能になっており、マウスがヒトの生物学や疾患のモデルとしてどの程度適切かを分子レベルで理解するために不可欠です。
マウスは数十年にわたり医学研究の主要なモデル生物であり、ヒトと遺伝的背景が非常に似ていますが(約90%のゲノム領域でシンテニーが見られる)、炎症反応やがん研究などにおいて、マウスモデルの結果がヒトの臨床試験で再現されないケースも多く報告されています。
本レビューでは、ヒトとマウスの比較トランスクリプトミクスの主な知見を概観し、マウスがヒトの適切なモデルとなる条件を考察しています。
1. ヒトとマウスのゲノム (Human and mouse genomes)
- ヒトとマウスのゲノムサイズは類似しており、マウスのゲノムはヒトより約12%小さい
- 塩基レベルではヒトの40%がマウスにアラインメント可能
1.1 タンパク質コード遺伝子 (Protein-coding genes)
-
タンパク質コーディング遺伝子数: ヒト(19,950個)とマウス(22,018個)でほぼ同等
-
オーソログ: ヒトのタンパク質コード遺伝子の約80%は、マウスと1対1のオーソログ関係にある
- 相違点: 残りの20-30%は、種特異的な遺伝子ファミリーの進化、あるいは種特異的なオープンリーディングフレーム(ORF)を含んでおり、これらが疾患表現型の違いに寄与している可能性がある
1.2 長鎖ノンコーディングRNA (Long non-coding RNAs: lncRNAs)
-
アノテーションの差: lncRNAの数はマウスの方が少なく記載されているが(ヒト15,767に対しマウス9,989)、これはマウスのアノテーションが進んでいないため
-
保存性の低さ: lncRNAはタンパク質コード遺伝子に比べて配列の保存性が低く、オーソログの同定が困難
- 約1,000~2,000のlncRNAがヒト・マウス間でオーソログとして同定されている
- lncRNAオーソログの同定法が活発な研究分野となっている
1.3 低分子ノンコーディングRNA (Small non-coding RNAs)
-
miRNA: アノテーションされているmiRNA(ヒト約3,000、マウス約2,000)のうち、種間で明確なオーソログを持つのは一部(約300個)に留まる
-
その他: snoRNA遺伝子の約30%は異なる発現プロファイルを持つなど、種間で違いが見られる
2. トランスクリプトームの保存性 (Conservation of transcriptomes)
2.1 マイクロアレイ
-
組織ごとの類似性: 適切な正規化を行えば、「種の違い」よりも「組織の違い」の方が遺伝子発現パターンが似ている(例:ヒトの肝臓は、ヒトの心臓よりもマウスの肝臓に似ている)ことが示された
-
例外: 免疫応答や炎症反応に関しては、種間で転写応答が大きく異なる(相関が低い)という報告もあり、マウスが臨床モデルとして適切か議論が続いている
2.2 RNA-seq
-
ENCODEプロジェクト: マウスとヒトのENCODEデータの比較では、マイクロアレイと同様に、実験条件や正規化の手法によって結果が左右されることが明らかとなった
-
組織特異性: 脳、精巣、心臓など組織特異的な遺伝子が多い臓器では種間保存性が高い一方、脂肪組織などでは種の違いが際立つ傾向がある
-
遺伝子ごとの振る舞い: すべての遺伝子を一括りにするのではなく、「組織間で変動する遺伝子(種間で保存されやすい)」と「種間で変動する遺伝子」に分けて考える必要がある
- 前者の遺伝子群において、マウスはヒトの良いモデルとなりうる
- 組織間で変動する遺伝子のほうが、人疾患と関連する可能性が高い (78)
2.3 lncRNA発現の保存性 (lncRNA expression conservation)
-
進化の速さ: lncRNAの発現パターンはタンパク質コード遺伝子よりも進化が速い(変化しやすい)傾向がある
-
精巣特異性: 多くのlncRNAは精巣で特異的に発現しており、これは精子形成過程でのクロマチン構造の許容性が高いためと考えられている
2.4 発現と配列の保存性 (Expression and sequence conservation)
-
発現レベルの相関: 一般に、ヒトで高発現している遺伝子はマウスでも高発現する傾向がある
-
プロモーターの乖離: プロモーター配列の保存性は遺伝子本体よりも低いにもかかわらず、発現レベルは保存されている。これは、転写因子(TF)の結合位置が変わっても発現を維持するような補償メカニズムが働いているためと考えられている
3. 比較遺伝子制御 (Comparative gene regulation)
3.1 転写因子(TF)の結合 (TF binding)
-
モチーフは保存、結合部位場所は非保存: TFが認識するDNA配列(モチーフ)は種間で保存されていますが、実際にTFが結合しているゲノム上の位置は、10〜20%しか種間で一致しない
-
制御ネットワークの維持: 結合サイトの位置が変わっても、近くに別の結合サイトが生じることで、全体としての遺伝子制御ネットワークや回路は維持されている
3.2 マウス調節領域からのヒトSNP因果関係の推定
- GWASへの応用: マウスのエンハンサー情報は、ヒトのゲノムワイド関連解析(GWAS)で見つかった疾患関連SNPの機能を解釈するのに役立つ
- 例えば、ヒトの肝機能に関連するSNPは、マウスの肝臓特異的エンハンサー領域にマッピングされることが多い
4. 種内の発現変動 (Intraspecies expression variation)
-
ヒトの多様性とマウスの均一性: ヒトは個体間で高い遺伝的多様性を持ちますが、実験用マウス(近交系)は遺伝的にほぼ均一であり、ヒトの多様性を反映していない
-
解決策: Diversity Outbred (DO) miceのような、遺伝的多様性を持たせたマウス集団を使用することで、ヒトの遺伝的変異と表現型の関係(eQTLなど)をより良くモデル化できる可能性がある
5. 哺乳類臓器の細胞複雑性 (Cellular complexity of mammalian organs)
-
臓器は細胞の混合物: 従来の「臓器レベル」での比較は、臓器を構成する細胞タイプの比率の違いを見ているに過ぎない可能性がある
-
細胞構成の違い: 例えば、膵島(すいとう)において、マウスはβ細胞が80%を占めるが、ヒトでは50%程度であり、α細胞の比率が異なる
-
シングルセル解析の必要性: シングルセルRNA-seq技術を用いることで、細胞タイプごとの真の種間差を解明し、発生タイミングの違いなどを明らかにすることが期待される
結論と展望 (Conclusions and perspectives)
-
「マウスは良いモデルか?」への答え: これは二者択一で答えられる問いではなく、「対象とする表現型、関与する遺伝子、組織によって異なる」というのが本総説の結論となる
-
今後の方向性:
- シングルセル解析や空間的トランスクリプトミクスにより、細胞・組織レベルでの比較を精緻化すること
- lncRNAなどのノンコーディング領域の解析を含めること
- 発現データだけでなく、時間経過や外部刺激への応答など、動的なプロセス(4次元的なマトリックス)での比較を行うこと
-
個別化: 将来的には、個人のゲノムに合わせてカスタマイズされたマウスモデルが作られる時代が来るかもしれない
読後の感想
大学院生の頃に読んだ総説を、改めて読み返しました。約10年前の論文ではありますが、現在直面している課題にも通じる知見が多く、非常に示唆に富んでいました。
この10年でロングリードシークエンサーとシングルセル解析技術が飛躍的に進歩し、ゲノム・トランスクリプトームの比較研究がさらに深化しています。ENCODE4やCensusなどの大規模データも公開されており、今後もヒトとマウスの比較研究から多くの知見が得られることが期待されます。
私は、遺伝子経路における保存性解析と、多種実験動物のスプライシングアノテーションを進めていきたいです。