七、线性相关与回归(因变量为连续型变量)
线性相关: 研究两个(或多个)随机变量间相互联系的一种统计方法。 (proc corr) 为了了解变量间关系的密切程度及方向。 变量都正态分布时,用pearson相关系数r
有一个不正态,用 spearman等级相关系数rs (统计线性相关关系的存在,是由专业知识给出的,统计软件是根据数据找出具体的直线关系)
步骤:绘制散点图 计算相关系数
对样本的相关系数进行假设检验(原假设:不存在相关关系)
3
根据p拒绝原假设,所以存在相关关系,且为正相关。
线性回归: 研究变量与变量间是否存在线性依存关系。(原假设:不存在线性关系) (proc reg) 因变量为随机变量,自变量为随机、非随机变量。 要求资料满足线性、独立、正态、等方差(line条件)。
步骤:绘制散点图 计算回归系数
对样本回归系数进行假设检验 写出回归方程的表达式
方法:向前法,向后法,逐步回归法,全子集法 Model y=x/selection=stepwise sle=0.10 sls=0.15 cli clm
(值越小,选取变量的标准越严格) Clm总体均数?的置信区间 Cli 个体值?的置信区间 Clb 回归系数?的置信区间 Conf 总体均数?的置信带 Pred 个体值?的预测带 STUDENT.标准化残差
八、logistic回归(因变量为分类变量,医学研究中用的比较多)
原假设:模型无效
Model y=x/selection=stepwise sle=0.10 sls=0.15 stb(要求输出标准化偏回归系数)
非条件:
Descending因变量由大到小 Proc logistic des
OR>1 危险因素
条件:
Strata 分层变量(匹配变量) Model outcome(event=‘1’)=gall hyper(因变量=自变量)
(制定用gall hyper作为自变量,按outcomes=1即病例,拟合概率模型) Response profile
响应变量的主要信息 Model fit statistic 模型拟合统计量
九、生存分析
生存率的估计有寿命表法(LT)和乘积极限法(PL) 生存分析基本方法:统计描述
非参数统计检验(总体分布形式已知) 半参数模型回归分析(部分线性回归模型,经典线性模型和非参数回归
模型的一个混合体)
参数模型回归分析
Cox模型(比例风险模型)
Pdf probability denstiny function(概率密度函数)
Testing Homogeneity of Survival Curves for days over Strata 时间变量day分层曲线的一致性检验
The marked survival times are censored observations 标记的生存时间是删失观测值的生存时间