在Meta分析中最常用的是固定效应模型、随机效应模型。怎样理解这两种模型呢?举个简单的例子:让十个学生去测量操场中的同一根旗杆,旗杆长度的测量值 可以看作是一个固定效应模型;然而如果让一个学生去测量操场上长度不同的十根旗杆,旗杆长度的测量值则是随机效应模型。
一般来说,随机效应模型得出的结论偏向于保守,置信区间较大,更难以发现差异,带给我们的信息是如果各个试验的结果差异很大的时候,是否需要把各个试验合 并需要慎重考虑,作出结论的时候就要更加小心。从另一个角度来说,Meta分析本来就是用来分析结论不一致甚至是相反的临床试验,通过Meta分析提供一 个 可靠的综合的答案,如果每个试验的结果都一模一样,根本就没有必要作Meta分析,因此要通过齐性检验来解决这对矛盾。
一般来说判断方法是根据I2来确定。
1.就是根据I2值 来决定模型的使用,大部分认为>50%,存在异质性,使用随机效应模型,≤50%,用固定效应模型,有了异质性,通过敏感性分析,或者亚亚组分析,去探求 异质性的来源,但是这两者都是定性的,不一定能找到,即使你做了,研究数目多的话,可以做个meta回归来找异质性的来源
2.在任何情况下都使用随机效应模型,因为如果异质性很小,那么随即和固定效应模型最终合并结果不会有很大差别,当异质性很大时,就只能使用随机效应模型,所以可以说,在任何情况下都使用随机效应模型
3.还有一种,看P值,一般推荐P的界值是0.1,但现在大部分使用0.05,就是说P>0.05,用固定,≤0.05用随机效应模型。 但是这些都没有统一的说法,存在争议,如果你的审稿人是其中一种,你和他相冲突了,你只能按照他说的去修改,因为没有谁对谁错,但是现在你的文章在人家手里,如果模型不影响你的结果,你就遵照他们的建议
但是,也不必过度强调哪种方法,更重要的是找到异质性根源。meta分析中,异质性是天然存在的。如果异质性较小,选择固定效应模型更可靠;如果异质性较大,则建议选择随机效应模型,但仍然需要通过敏感性分析,寻找到异质性根据,以消除其影响。
有关异质性,齐性,下面再有一个例子进行说明:
Meta分析是汇总众多研究结果的一种定量分析方法,主要目的是为了得到比单一研究更精确的结果估计,以及分析影响研究结果间差异的因素。目前,Meta 分析主要根据研究的“效应尺度”(effect magnitude)的齐性检验结果,决定采用固定效应或随机效应模型合并每项研究的“效应尺度”,但一般未考虑到研究具有不同的特征以及相应的平均“效应尺度”的差异[2]。多水平模型是国外教育学界80年代中后期发展起来的一门多元统计分析新技术,是当前国际上统计学研究中一个新兴而重要的领域[1]。本文拟通过对“效应尺度”的选择以及具有协变量的两水平混合效应模型建模方法的探讨,估计总平均“效应尺度”以及具有不同研究特征的平均“效应尺度”及其可信区间。
Meta分析的数据具有两个水平的层次结构(two-level hierarchy),水平2为研究水平,水平1为个体水平。对于具有这种特征的数据,两个水平模型可将传统模型中单一的随机误差项分解到与数据层次结构 相对应的水平上,即分解出研究水平的变异。模型基本结构
为:
Yij=β0+u0j+eij
j=1,2,…,m,代表研究项目数;i=1,2,…,n,代表研究个体数;Yij为各项研究的“效应尺度”;β0为总平均“效应尺度”的估计;u0j和eij分别为研究水平和个体水平残差。 Meta分析一般只能得到各项研究的结果即“效应尺度”及其标准误以及样本含量等数据,研究个体的数据一般是不可得的,因此,这里拟合的两水平模型为聚集水平(水平2)模型,可表达为:
Y*j=β0+u.j+e*j Var(u.j)=σ2u Var(e.j)=σ2e/nj
总方差为σ2u+σ2e/nj,可通过对随机部分定义一个设计变量来拟合模型,即z.j=1/nj,相应的随机系数为e.j,nj为每项研究中的研究个体数。
本文首先拟合的无任何解释变量的“无效模型”(null model)为:
Y.j=β0+u.j+e.jz.j 在收集到的文献中,多数研究的“效应尺度”为OR值,有的为ln(OR)值,即通过logistic回归模型获得的β值,两者可相互转换。分别将OR值和ln(OR)值作为反应变量拟合两个“无效模型”,因此,式中Y.j分别表示两个模型中第j项研究的ORj值和ln(ORj)值,β0分别表示合并全部ORj和ln(ORj)的平均估计值,u.j为第j项研究的随机效应,e.j为与第j项研究有关的随机误差,结果见表1。
然后ln(OR)为反应变量,在模型中引入研究水平协变量国别x.j(国内研究取0,国外研究取1),将其效应β1拟合为固定效应,用一个随机成份拟合剩余的部分,结果见表2。混合效应模型为:
Y.j=β0+β1x.j+u.j+e.jz.j
另一种建模方式,即不拟合截距项,将国别转换为x1.j和x2.j两个哑变量引入模型,它们分别对应于国内与国外研究,仍将其效应β1和β2拟合为固定效应,同时用一个共同的随机成份u.j拟合剩余部分,结果见表3与表4。模型可表达为: Y.j=β1x1.j+β2x2.j+u.j+e.jz.j
表1 分别以OR和ln(OR)为“效应尺度”的拟合结果
以OR为“效应尺度”
估计值
固定参数β0 研究水平σ
随机参数
2u
以ln(OR)为“效应尺度” 估计值
1.4060 0.5392 1
标准误
0.1050 0.1094 0
标准误
0.6086 3.63200 0
5.1640 17.7900 1
个体水平
σ
2e
以OR为“效应尺度”,模型所估计的总平均“效应尺度”为5.1640,95%可信区间为3.9711~6.3569;以ln(OR)为“效应尺度”,根据ln(O)±uαSln(OR),可计算总平均“效应尺度”OR的估计为eβ0=4.0796,95%可信区间为4.0796×e±1.96×0.1050,即3.3208~5.0118。可见,总平均“效应尺度”下降了1.0844,可信区间亦变窄。此外,研究水平的方差估计从17.7900下降到0.5392,估计精度亦增加,标准误从3.6320下降到0.1094。
表2 引入研究水平协变量的拟合结果
固定参数 σ估计值 β0 β1 2u(研究水平) 2u(个体水平) 标准误 1.0370 0.6238 0.4453 1 0.1496 0.1943 0.0904 0 随机参数 σ 结果表明,“效应尺度”与国别有关,其参数估计为正,表明国外研究的OR值较大,经转换得国内研究的OR估计为e1.0370=2.8207,国外研究的OR值计为e1.6608=5.2635,相差甚大。研究间方差及其标准误估计分别从0.5392和0.1094下降为0.4453和0.0904,亦表明国别这一研究水平协变量解释了部分研究结果间变异。但从参数估计难以计算国外平均“效应尺度”的可信区间。
表3 引入研究水平协变量的拟合结果(不拟合截距项)
固定参数
σ估计值 β0 β1
2u(水平2) 2u(水平1)
标准误
1.0370 1.6600 0.4453 1
0.1496 0.1241 0.0904 0
随机参数
σ
根据
度”及其可信区间,见表4。
,可直接得到国内与国外研究的平均“效应尺
表4 根据表3的转换结果 国内研究 国外研究 研究数目 20 29 OR 2.8207 5.2593 95%可信区间 2.1039~3.7818 4.1237~6.7076 与表2转换结果比较,国内、外研究的OR估计基本一致,研究间方差及其标准误估计完全一致,但拟合国内外两个哑变量的固定效应,可直接得到其标准误的估计,国外略小。
在流行病学横断面调查和病例对照研究中,常采用比值比OR反映暴露与疾病的联系强度,即患者暴露比与非患者暴露比的比值,但其常不服从正态分布,而其对数转换值ln(OR)近似服从正态分布。多水平模型的基本假定是反应变量遵从正态分布,水平2和水平1残差遵从N(0,σ2u)和N(0,σ2e/nj)[1], 故在两水平混合效应模型中应以ln(OR)为分析的“效应尺度”,然后再将分析结果转换为OR值,否则平均“效应尺度”及其可信区间均不可靠。
通过采用的固定效应或随机效应模型可得到平均“效应尺度”及其可信区间的估计,但这些模型一般不能分析影响研究结果间差异的因素[2]。 两水平混合效应模型将研究水平协变量拟合为固定效应,用以解释研究结果间的差别,以一个随机成份拟合其剩余部分,从而正确评价研究水平的因素对研究结果的 影响。在Meta分析中,各面研究结果常具有很
大的不同一性,如本文国内外研究结果的估计分别为2.8207和5.2593,相差达2.4386,如不考 虑研究水平协变量的影响而直接合并的结果为4.0796,可见,固定或随机效应模型的合并是不适宜的。“无效模型”中研究水平的方差估计σ2u为 0.5392,亦提示研究结果之间存在较大的不同一性。混合效应模型表明,国别这一研究水平协变量解释了部分研究结果间的变异,研究水平方差下降为 0.4453,但仍遗留了较大的变异,提示尚存在其它因素导致研究结果间的差异,如果可得到这些研究水平的因素,则可通过两水平混合效应模型进一步评价其 对研究结果的影响。
因篇幅问题不能全部显示,请点此查看更多更全内容