1. 边缘生存时间分布之间的相关性分析

在癌症的临床研究中,会经常收集到患者的双重间隔时间(gap time)数据,例如:癌症患者的第一次和第二次癌症患发间隔时间,或者是术后的第一次和第二次原位复发时间。由于gap time均来自于同一患者,且前后紧密相连,所以gap time之间通常并非独立,忽略相关性而用常规方法进行分析会得到错误的结论。为了解决这个问题,我们开发了一个基于贝叶斯理论的survival copula model,可以准确的评估两个gap time所对应的边缘生存时间分布(marginal survival distribution)之间的相关性。该方法使用马尔可夫链蒙特卡洛(Markov chain Monte Carlo, MCMC)对边缘生存时间分布模型及相关性的系数进行估测,具有较高的灵活度,其估测准确性在模拟实验中得到了验证。详情请点击

2. 高维生存时间数据分析

随着科技发展,现代生物医学研究中可以生成大量的特征数据,比如次世代高通量测序(next generation sequencing, NGS)技术可以测量几乎所有基因的变异及表达水平信息,医学图像处理技术可从病理图像中提取成千上万种细胞形态学结构特征,因而在临床研究中,一位患者可以产生几十甚至百万个特征。但是,临床研究的样本量通常十分有限,会出现特征数量远超样本量的情况,即p>>n的高维生存时间数据(high-dimensional survival data),传统的分析方法由于不能施行有效的矩阵运算而无法使用。华嘉生物的技术团队在处理高维生存时间数据方面具有独到的经验,我们开发的方法既可筛选与survival显著相关的特征,也可从高维数据中构建最佳的生存时间预测模型。关于我们借鉴的基础框架方法,详情请点击