第六课会探讨全模型 一个完整的模型 举例学生的兴趣、智力、自信对学生学业的影响、课外活动和服务热诚 研究共有500个学生 这儿会学一个新矩阵LY 以往只学LX,即X的题目跟X圆圈(因子)的关系 LY是同类的,只是Y的题目跟Y圆圈(因子)的关系 以往知道TD是X题目的误差及独特性部份 TE则是Y题目的误差及独特性部份 这儿还有个新矩阵GA GA是ξ(X的圆圈/因子对Y圆圈/因子的效应) 以往只探讨X圆圈对X圆圈的相关 如今GA是一个直线箭咀,指出因果关系的路径 GA是X圆圈对Y圆圈的效应 它的大小是NE × NK GA跟传统回归系数的意思是相近的 是预测/自变量对某个依变量的关系 另一个新的矩阵是Y圆圈/因子对Y圆圈/因子 刚才GA是X圆圈对Y圆圈 现在β是Y圆圈对Y圆圈的效应 跟上面的效应相同,都是表示圆圈/因子对圆圈/因子的关系 不同的是BE是Y圆圈对Y圆圈 而GA就是X圆圈对Y圆圈 PS跟PH相似 PH是两个X圆圈/因子的相关 PS则是Y圆圈的关系,属于残差之间的相关 这图共有6个因子,3个X,3个Y 整个模型可以全部用上Y因子 却不能全部用上X因子 因为X因子不容许被其他因子指着 只能成为关系中的"因" 所以右边的圆圈只能做Y因子,不能当成X因子 因为它们被其他路径指着 所以只能做Y因子 整个图内左边三个因子都指着其他因子 却没有被其他因子指着 所以它们是X因子 同时亦可以被视为Y因子 编码方面,只要使用同一个命名方式就可以 举例右边的圆圈由上而下称为ETAη1,2,3 或者由下而上称为η1,2,3亦可以 只要以后不论任何情况都把最下面的哪个称为η1就可以 所以编码次序从哪开始并不重要 只要过程中使用的编码一致就可以 先看看不同的路径 0.74、0.52、0.40是λlambda 是X圆圈指标跟圆圈的关系 所以它们是λ X (LX)lambda-X 它们的编码由上而下是LX 1,1 LX 2,1 LX 2,1代表去第二题由第一个因子 最底的是LX 3,1 由智力去X4就是LX 4,2 即去第四题由第二个因子 LX 5,2 LX 6,2是由智力去X5,X6 Y那边同样,去Y的第一题由Y第一个圆圈就是LY 1,1 去Y第二题由Y第一个因子就是LY 2,1 这是LY 3,1 下面的是LY 4,2去四由二 这些是LY 5,2 LY 6,2 下面是LY 7,3去第七题由第三个因子 这些是LY 8,3 LY 9,3 这也是我们探讨过的 是X因子和X因子的相关 就是PH 1,2,PH 1和2的相关 这个是PH 2和3的相关,所以是PH 2,3 这个是PH 1和3的相关,所以是PH 1,3 中间的路径从前没有探讨过 这路径是X圆圈去Y圆圈,即是GA 0.29的是GA 1,1 下面这个是去第一(因子)由第二(因子),所以是GA 1,2 至于这个是由第三个因子去第一个因子,去一由三,所以是GA 1,3 这个是去第二个由第三个,所以是GA 2,3 往下面走的是去第三个由第一个,是GA 3,1 它们都是X圆圈去Y圆圈 至于Y圆圈去Y圆圈就称为BETAβ 这就是β,由Y圆圈去Y圆圈 它是去二由一,所以是β 2,1 这个是PSI (Ψ),是余下的部份(残差) 即是自信和学业表现不能解释到课外活动表现的部份 所以如果能解释的部份越多 这儿余下的部份就越少 因为是第二个因子,所以这就称为PS 2,2 因此0.90这路径就是PS 2,2 0.93是PS 3,3 它们的数值是多是少 视乎被解释的有多少 能被解释的占多数,这残余数值自然很少 至于0.15这个相关 就是第二个因子的残差和第三个因子的残差的相关 要是两个因子间的残差有相关 这相关就会很高 再跟PH比较一下 PH是因子之间的相关 PS则是残差之间的相关 举例说,用自信解释课外活动 以及学业兴趣来解释服务热诚 未能解释的部份就是0.90和0.93 它们之间的相关就是0.15 举例如今换另一个研究 我们用语文能力来预测这两个因子 例如把这两个因子改成物理、化学 用语文能力来预测它俩 肯定能解释不多 因为根本这因子(语文)和因子(物理、化学)间关系不强 余下部份自然很大 这些残差可能有一个共同性 未被语文能力解释的部份可能很多 而物理和化学有着共同性 所以那残差之间的相关应该颇高 但要是用数学(替代语文)来预测两者(物理、化学) 物理和化学可能有大部份能被解释 余下的就很少 而且不再包括数学部份 因为数学部份已经被解释 已在前面的路径体现出来 那路径的数值会很大 余下的部份之间的相关 因为不再包括数学部份 所以那(残差)相关值应该很少 再比较一次 这部份跟PH不同 PS是残差部份的相关 残差以外的部份大多数是被预测、被解释的部份 所以余上的残差非常小 因此这两个残差之间要是没有共同性 这个PS 2,3就会很小 要是能被解释的部份很少 余下的残差很多 而且这两个因子间有很强的共同性 例如物理和化学 它们余下残差的部份(相关很高) 萤幕显示刚才的概念如何用LISREL编程写出来 DA NI=18代表18个变量 KM=SY,KM代表输入相关矩阵 MO NY=9,Y变量有9个 NE=3 NX=9,X变量有9个 NY=9 NE=3属于先除后舍 在MO指令次序如何写并不重要 但输入的矩阵KM SY 必须先放Y变量才放X变量 18个变量必定是先排Y再排X 再看看MO指令 NK=3代表3个X圆圈/因子 PH=SY,FR代表三个X因子都被容许相关 PS=SY,FI代表Y的残差部份互为对称 先把它们全都固定 下面再作修改 至于TD/TE,传统上TD和TE都写成TD=DI,FR和TE=DI,FR 这儿同样处理。= 至于刚才的GA就写成BE=FU,FI 同样可以不在这儿写出来,(设定方法)而在后面逐一提出 PA LY 3(1 0 0)代表首三题属第一个因子 LY和LX在这儿是完全相同 但这儿却没有选出要固定的因子 看上来像是用固定方差法 因为固定负荷法要在每个因子中选一个题来固定 但再看下去就看到FI LY 1,1 LY 4,2 LY 7,3 这句就是在因子中选一题来固定 后面VA指令再给予预设值 切记固定后还得赋予一个预设值 否则固定以后它会自动给予预设数值0 至于PA GA,首一行是1,1。那是GA 1,1 即去Y第一个因子由X第一个因子 第一行第二个是GA 1,2 即去Y第一个因子由X第二个因子 第三个是GA 1,3 即去Y第一个因子由X第三个因子 第二行最后一个是GA 2,3 即去Y第二个因子由X第三个因子 最后一行是GA 3,1 即去Y第三个因子由X第一个因子 然后是FR BE 2,1 BE是Y因子去Y因子 所以它是去Y第二个因子由Y第一个因子 PS的对角线通常是自由估计,它是残差 余下部份是自由估计 FR PS 2,3是Y第二个跟Y第三个因子的残差部份的相关 因为我们容许它们相关,所以FR PS 2,3 OU就是output指令 SS是标准化参数,SC是完全标准化参数 MI是修正指数的输出,ND=3就是答案要小数位后3位 这儿再看看拟合优度指数 RMSEA=0.05比0.08少 NNFI和CFI都大于0.90,整体都很好 BE 3,2和GA 3,3的修正指数都很大 说明它两者都是固定 要是容许它们自由估计,就可能改善拟合优度指数 但BE 3,2是去第三个因子由第二个因子 两个都是Y因子 切记Y的第二、三个因子已经有残差之间的相关 再新增一条路径就不合理 所以BE 3,2就不需再多加一个相关 亦不需让它自由估计 但GA 3,3是去Y第三个因子由X第三个因子 在它们之间新增路径在理论上很合理 而且可以改善拟合优度指数 所以我们放宽对GA 3,3的限制 放宽后,发现卡方从292变成270 GA 3,3是0.353说明相关颇强 所以新增路径GA 3,3是合适的 新增后需要删去其他路径吗? 通常在修正模型时都先加后减 因为删减路径没有特定时候 所以最后才作出删减 新增路径则在开始时新增 因为在模型内有多余的路径一般不太影响其他参数 因为多余的路径(参数)关系都很少 而且它们构成复杂的关系 虽然占用了自由度,但不会太影响其他路径的大小 所以我们可以押后处理它们,先新增一些路径 因此通常做法是先新增后删减 现在BE 2,1是0.011,标准差是0.052,t-值是0.215都很小 所以这些路径的存在根本不影响模型 所以我们认为这个效应不存在,代表不到因子之间的关系 可以把它删减,使M2变为M3 再复习一次 我们可以新增或减少参数 新增参数意思是原本路径是0 如今容许它们自由估计 多了估计,模型就变得复杂 卡方就会减少 因此越增多路径,虽然拟合得更好,但自由度就减少了 卡方减少了,代价却是自由度减少,但拟合得更好 相反删减参数,就是原本有路径 现在却删去一些路径并固定为0 删去路径模型变得简单,而且自由度增加 因为估计的路径少,自由度自然增多 我们期望自由度越大越好,这表示模型简单 但强逼这些路径为0,模型的卡方就会增大、变差 甚么时候要新增路径,甚么时候要删减? 要是新增自由估计的参数后,卡方明显地减少即拟合得很好 这种路径增加、这种容许参数自由估计的方法是恰当的 这样牺牲自由度是合理和可取的 再重温一遍 要是有一些模型加入自由估计的参数 让某些路径容许自由估计 放宽后整个模型的拟合优度指数改善了,卡方明显减少了 说明这种放宽是恰当的 纵然占用了一些自由度,这仍是一个可取的方法 相反,要是删去自由估计的参数 就是把某些路径固定为0,不容许它自由估计 整个模型就变得简单 如果卡方没有明显增加,只是增加少许 就说明把那路径强制为0是可取而有效的处理 再重温一遍 要是在模型中删去自由估计的参数,模型就变得简单 如果卡方没有明显增加,只是增加少许 就说明把那路径固定下来是可取而有效的处理