许多序列变异与复杂的人类特征和疾病有关,但破译它们的生物学功能仍然具有挑战性,因为它们大多数存在于非编码DNA中。我们开发并使用SNP-SELEX(基于配体的系统进化指数富集)技术系统地评估了270个人类转录因子与人类基因组中95,886个糖尿病相关的非编码变异的结合。由此产生的转录因子- DNA 相互作用的8.28亿次测量可以解析这些转录因子对体外每种变体的相对亲和力,并评估当前预测非编码变体对转录因子结合影响的方法。我们发现大多数转录因子的位置权重矩阵缺乏足够的预测能力,而支持向量机与 gapped k-mer 相结合,在独立的SNP-SELEX实验结果中表现出更好的性能,涉及一组新的61,020个序列变体。最后,我们报告了94个人类转录因子的高度预测模型,并证明了它们在全基因组关联研究和理解涉及多种人类特征和疾病的分子途径中的实用性。相关结果发表在国际顶级期刊 Nature杂志上。我们开发的SNP-SELEX技术是国际上首个系统解析非编码区SNP变异位点功能的高通量技术,这是该成果最大的创新点。我们开发的SNP-SELEX已经成为各物种基因组非编码区功能的解析提供卓越工具。