論文情報
タイトル:Computational identification of disease models through cross-species phenotype comparison
著者:Pilar Cacheiro, Diego Pava, Helen Parkinson, Maya VanZanten, Robert Wilson, Osman Gunes, the International Mouse Phenotyping Consortium, and Damian Smedley
雑誌:Disease Models & Mechanisms, 17, dmm050604 (2024)
DOI:10.1242/dmm.050604
ライセンス:CC BY 4.0
TIP本論文のメインはPhenodigmアルゴリズムの性能評価です。
参考:Phenodigm原著論文
- Smedley et al., “PhenoDigm: analyzing curated annotations to associate animal models with human diseases”, Database (2013)
10.1093/database/bat025
背景と目的
IMPC(International Mouse Phenotyping Consortium)は、全マウス遺伝子を対象として標準化されたノックアウトマウスの表現型データを生成する国際共同プロジェクトである。2023年時点で8,700遺伝子以上が解析され、統一的な表現型オントロジー(Mammalian Phenotype Ontology; MP)に基づいてアノテーションが付与されている。
本研究では、これらマウス表現型データとヒト疾患表現型(Human Phenotype Ontology; HPO)をPhenoDigmアルゴリズムにより比較し、マウスモデルがヒトのメンデル遺伝疾患をどの程度再現しているかを包括的に評価した。
NOTEIMPC(国際マウス表現型コンソーシアム)では、2025年10月26日時点で9,277遺伝子における表現型解析が完了している。
https://www.mousephenotype.org/
主要な実験手法 (Fig. 1)
データセット
IMPC Data Release 20.1(2023年12月)
- 表現型解析後の8,707遺伝子のうち、1,311遺伝子が解析対象。
これはヒトMendelian疾患に対応するオルソログ遺伝子のうち、PhenoDigm計算が可能でスコア>0を示した群である。
| 遺伝子数 | 内容 | 意味 |
|---|---|---|
| 8,707 | IMPCで表現型解析が完了したマウス遺伝子総数(DR20.1時点) | データ母集団 |
| 2,742 | ヒトMendelian疾患と1対1対応するオルソログをもつ遺伝子 | 解析対象集合 |
| 2,400 | MP(マウス)およびHPO(ヒト)の両方の表現型が揃い、PhenoDigm計算が可能な遺伝子 | 実際の計算対象 |
| 1,311 | PhenoDigmスコア>0を得た遺伝子(ヒト疾患表現型を部分的に再現) | 解析結果(マッチ群) |
比較分析(Fig. 2)
本研究のハイライト。
PhenoDigmスコアに影響する要因を3つの視点から体系的に検証している。
1. ヒト疾患の特徴とマウスモデルの再現性(A-C)
TIPFig2. A-Cは、「ヒト疾患側の特性」がPhenodigmスコアにどう影響するかを解析している
目的:どのような種類のヒト疾患がマウスで再現されやすいかを明らかにする
- A:疾患カテゴリー別のマッチ度(どの疾患領域でPhenoDigmマッチが多いか)
「どの疾患カテゴリーでPhenoDigmマッチが有意に多いか」を比較
→ 内分泌系疾患で最もマッチ率が高く、呼吸器疾患で最も低い傾向を示す
疾患カテゴリーごとに 2×2 の分割表を作り、オッズ比を計算
| PhenoDigmマッチあり | マッチなし | 合計 | |
|---|---|---|---|
| その疾患カテゴリーに属する遺伝子 | a | b | a+b |
| 他の全カテゴリーの遺伝子 | c | d | c+d |
WARNINGPhenoDigmマッチ率は疾患領域の測定カバレッジに依存している。
呼吸器疾患はIMPCでの測定項目が少ないためマッチ率が低く出る傾向がある。
- B:疾患カテゴリーごとのPhenoDigmスコア分布
マッチが得られた疾患について、PhenoDigmスコア(マウス–ヒト類似度%)の分布を疾患カテゴリー別に比較
→ 疾患領域によってスコア分布が異なり、内分泌・代謝系では高スコアが多い傾向を示す
- C:遺伝形式(顕性・潜性)別のマッチ率比較
疾患の遺伝形式(AD vs AR)によるPhenoDigmマッチ率を比較
→ とくに有意差はない
2. マウスとヒトの表現型数・一致度の関係(D-F)
TIPFig2.D-Fは、「表現型の記録の多寡」がPhenodigmスコアにどう影響するかを解析している
-
D:マッチあり・なしの間でのMP数・HPO数の比較
-
マウス側(MP項目数):マッチあり群で有意に多い
-
ヒト側(HPO項目数):マッチなし群で多い傾向
NOTE
- マウスで多くの表現型が記録されているほど、マッチしやすい
- ヒト疾患の症状が多すぎる(多面的すぎる)ほど、完全一致しにくい
-
E:PhenoDigmスコアとMP数・HPO数の相関分析
-
MP数とスコア:弱い正の相関(r > 0)
→ マウス表現型が多いほどスコアがやや高くなる。 -
HPO数とスコア:弱い負の相関(r < 0)
→ ヒト疾患のHPO項目が多いほどスコアが下がる傾向。
NOTE
- マウス側では「表現型が多い=多面的=ヒト疾患に似る確率が上昇」。
- ヒト側では「症候が多すぎる=完全一致が難しい」。
- この傾向は、PhenoDigmが「共通項の割合(intersection / union)」を基準にスコア化しているためである。
HPO項目数が多いほどスコアが低下する理由
-
PhenoDigmは“ヒト疾患のHPOセットに対して、マウスMPセットがどれだけマッチするか”を評価するため、HPO項目が増える=完全一致確率の減少=スコア低下という結果になる
-
例えば、以下のようなケース:
| 疾患 | HPO項目数 | マウス表現型とのマッチ数 | 類似スコア |
|---|---|---|---|
| 単一症候疾患 | 3項目 | 3項目すべてマッチ | 100 % |
| 極めて多症候疾患(例:多臓器先天異常症) | 50項目 | 10項目マッチ | 20 % |
-
したがって、スコアの低さを単に「モデルが悪い」と解釈するのは誤りであり、クエリ(ヒト疾患における表現型)の複雑さを反映した相対的スコアである点を理解する必要がある。
-
F:MP数とHPO数の相関分析
-
相関係数(r)は ほぼ0(非有意)。
→ ヒトの表現型の多さとマウス表現型の多さには関連がない。
NOTE
- つまり、「ヒト疾患の症状が多いからといって、対応するマウスモデルが多くの表現型を示すとは限らない」。
- これは、マウスで測定できる生理系(例:呼吸機能、行動、血液検査など)が限られていることや、ヒトHPO側に臨床的な細分化(皮膚症状・顔貌など)が多く含まれていることによる。
3. マウス遺伝型・表現型の網羅性とマッチ率(G-H)
TIPFig2.G, Hは、「マウス側の実験条件・データ量」がPhenodigmスコアにどう影響するかを解析している
- G:PhenoDigmマッチを説明するロジスティック回帰モデル
PhenoDigmマッチ(=マウス–ヒト間で類似スコア > 0)を二値変数とし、
それを説明する要因(マウスモデル・疾患・遺伝子の特徴)を統計的に定量化したもの。
| 説明変数 | 論文内の説明 |
|---|---|
| Disease categories | 疾患カテゴリーごとにPhenoDigmマッチの傾向が異なり、一部カテゴリー(例:発達・代謝系)ではマッチが多い。 |
| Human early lethal gene | ヒトで致死性が報告されている遺伝子は、多系統異常を示す傾向があり、マウスモデルでもマッチしやすい。 (この「Y」は「Yes」?) |
| Disease HPO terms | ヒト疾患のHPO項目が多いほど、すべてをマウス側で再現しにくく、スコアが下がる傾向にある。(Fig2.Eを参照) |
| Mouse model MP terms | 有意なMP項目が多いほど、ヒト疾患とのマッチ確率が高い。 (Fig2.Eを参照) |
| Mouse model zygosity | ホモ接合体では、ヘテロよりもマッチ率が高い傾向を示す。 |
| Successful procedures | 完了したフェノタイピング試験が多いほど、表現型情報が豊富でマッチしやすい。 |
-
H:完了した表現型試験数・有意な表現型数とマッチ率の関係
-
弱い正の相関
→ 試験数が多いほど表現型が多く検出される傾向はあるが、ばらつきが大きい。 -
多くの試験を完了しているマウスラインほど、当然ながら異常検出機会が多い。
しかし、単純に「試験数=表現型数」ではないため、表現型の検出には遺伝子固有の効果や測定系の感度も影響する。
NOTEHはあまりPhenodigmと関係ないかも…?
NOTEFig3はIMPCの紹介なので省略。
読後の感想
Phenodigmを使い始めた人間からすると興味深い論文でした。
IMPCのデータ測定の多寡や、もともと付与されているMP・HPO項目数がPhenodigmスコアに与える影響を定量的に評価しており、Phenodigmスコアの解釈に役立つ知見が得られたと思います。
Phenodigm2というリポジトリもあり、もしかすると上記のデータセット由来のバイアスを補正するような改良が加えられているかもしれません。
私は現在はユーザーの立場ですが、この手法の改良を考えてみるのも面白そうです😋