本成果依据短时序基因表达数据,对基因进行聚类。把基因表达的变化趋势相似的基因聚为一类,同属于一类的基因有功能相似的趋势。对于每一个基因,相邻时间点的表达的变化可以计算出一阶的角度,连续三个时间点的表达可以计算出表达水平变化率。以任意两个基因的表达变化的一阶角度和表达水平变化率为特征,皮尔森相关系数作为相似性测度,相关系数越大,表示两个基因的表达越相似。然后用AP聚类,对于相似性矩阵,采用基因间的共调控信息来调整(目前还没有用共调控信息,如何用还在考虑之中)。聚类结果采用Gene Ontology做功能富集分析。
本成果采用酵母氨基酸挨饿时序基因表达数据,经过数据预处理之后得到700个表达变化较为显著的基因,然后用本成果的算法、STEM、ASTRO、PESTS分别聚类。聚类结果采用GO Term Finder进行分析。对于相同的GO Term而言,本成果得到的P-value普遍比PESTS更低。与STEM相比,STEM的聚类结果较为集中,本成果的算法得到的聚类结果较为均匀。STEM通过Permutation Tests确定的显著类,随着聚类数量的增加,被GO Term Finder确定为显著的比例逐渐降低。本成果的算法确定的显著类被GO Term Finder确定为显著的比率在80%以上。