iPS細胞のドナーの祖先は、祖先集団の識別に使われる「EthSEQ」というデータベースをもとに、各iPS細胞株の全エクソーム配列(WES)データから算出します。EthSEQでWESデータのうち異なる一塩基多型(SNP)遺伝子型プロファイルに着目して解析します。このプロファイルには、祖先の遺伝形質の決定に重要な変異が含まれます。得られた各ドナーのプロファイルを、1000 Genomes Projectで照合した既知の祖先がもつ数千個の遺伝子型が含まれるデータベースと比較します。続いて、主成分分析(PCA)でデータベースと比較してドナーの祖先を特定し、各祖先の割合を算出します。
STEMCELL社の祖先決定ワークフローは、Simons Genome Diversity Project のWESデータから有効性が確認されています。WESデータには既知の祖先が持つ何百人もの個人からの遺伝子型データが含まれ、祖先をより包括的に予測できます。
【参考資料】
1. Romanel A et al. (2017) EthSEQ: ethnicity annotation from whole-exome sequencing data. Bioinformatics. 33(15): 2402–4
2. Mallick S et al. (2016) The Simons Diversity Project: 300 genomes from 142 diverse populations. Nature. 538(7624):201–6.
3. The 1000 Genomes Project Consortium (2015) A global reference for human genetic variation. Nature. 526(7571): 68–74.