一、倾向得分匹配所属模块倾向得分匹配在SPSSAU中属于计量经济研究模块。二、方法概述倾向得分匹配常用于处理实验组与对照组在原始特征上不够可比的问题核心目的是先让两组样本尽量接近再比较处理效果。它常见于政策评估、项目效果评估、医学观察研究等场景尤其适合无法直接开展随机实验时使用。三、变量设置规则倾向得分匹配共需设置3类变量其中前2类为必填第3类为可选项。变量设置时既要注意变量类型也要注意可放入的数量范围。1. 研究变量设置1研究变量必须填入1个。2该变量只能是数字0和1用来区分实验组与控制组。通常可理解为是否接受处理、是否参加项目、是否暴露于某因素。3如果研究变量编码不规范后续匹配结果和效应比较都会受到影响因此正式分析前要先确认分组含义。2. 特征项设置1特征项必须填写最少放入1个最多可放入20个。2特征项用于刻画样本原始背景差异例如个体基本特征、行为特征、历史状态等。3这些变量的作用是帮助系统判断哪些实验组样本和控制组样本更接近因此特征项选得是否合理会直接影响匹配质量。3. 结果变量设置1结果变量为可选项最多可放入1个也可以不放。2当需要进一步比较处理效应时可以放入结果变量系统会输出ATT效应分析结果。3如果只想先看匹配是否成功、平衡性是否改善不放结果变量也可以完成匹配质量检验。四、参数设置及解释说明倾向得分匹配在SPSSAU中支持4项常用参数设置不同选项会影响匹配严格程度、样本利用方式以及最终保留的配对结果。1. 匹配方法1系统默认使用最近邻法也就是优先为每个实验组样本寻找最接近的控制组样本。2也可以选择半径匹配法并按不同阈值设置匹配范围。阈值越小说明要求越严格匹配到的样本通常更相似但可匹配成功的样本数可能会减少阈值越大匹配范围更宽成功率可能提升但样本相似程度可能下降。3如果研究更看重样本之间的接近程度可优先考虑较严格的设置如果更看重保留更多样本可适当放宽范围。2. 抽样方法1默认是放回抽样即同一个控制组样本可以被重复匹配给多个实验组样本。2也可以选择不放回抽样即一个控制组样本一旦被匹配后不再参与后续匹配。3放回抽样通常更容易提高匹配成功率适合控制组样本数量有限的情况不放回抽样更强调样本独立性但可能降低匹配成功比例。3. 匹配方式1默认是1:1匹配也就是1个实验组样本对应1个控制组样本。2还可以选择1:2到1:6匹配。匹配数量增加后通常有助于提高控制组信息利用率但也会提升匹配要求未必每个实验组样本都能完全达到目标匹配个数。3如果样本量充足且希望提高估计稳定性可以考虑多对一匹配如果样本条件一般1:1匹配通常更稳妥。4. 保存信息1勾选后系统会额外保存匹配关系和匹配分值等信息。2这些信息适合用于后续核查配对关系、了解样本被匹配的次数以及继续开展扩展分析。3如果当前目标只是快速完成结果解读可以不勾选如果后续还要做追踪检查或二次整理建议保留。五、分析结果表格及其解读倾向得分匹配完成后SPSSAU会根据分析内容输出PSM基本信息汇总、PSM平行假设检验、ATT效应分析以及样本缺失情况汇总等结果表。1. 表1PSM基本信息汇总该表用于整体说明本次匹配是如何完成的主要呈现匹配方式、匹配方法、抽样方法、需要匹配个数、匹配成功个数、匹配失败个数、匹配成功比例和匹配失败比例等信息。● 匹配方式表示每个实验组样本准备匹配几个控制组样本。它的作用是帮助判断本次分析采用的是1:1还是多对一方案。一般来说匹配方式本身没有好坏之分关键在于是否符合研究设计与样本条件。● 匹配方法用于说明采用最近邻法还是半径匹配法。它的作用是帮助理解样本是按最接近原则还是按阈值范围完成匹配。若研究更注重匹配精度通常会更关注严格匹配方法下的表现。● 抽样方法反映控制组样本是否允许重复使用。它的作用是帮助判断样本利用方式是否会影响匹配覆盖率。通常放回抽样更容易得到较高成功率不放回抽样更适合强调样本唯一性的研究。● 匹配成功比例是判断匹配完成度的关键指标表示实验组样本中有多少比例成功找到了可用对照。该指标越高说明样本保留情况越理想如果比例偏低说明当前匹配条件可能过严或实验组与控制组原始差异过大。● 匹配失败比例用于补充说明未成功匹配的样本占比。该指标越低越好若比例较高通常意味着样本之间可比性不足需要重新审视特征项或匹配参数设置。2. 表2PSM平行假设检验该表用于比较匹配前后实验组与控制组在各个特征项上的差异变化通常包含状态、实验组均值、控制组均值、标准化偏差、标准化偏差减少幅度、t值和p值等指标。● 状态一般分为匹配前和匹配后。它的作用是帮助直接对照平衡性是否改善解读时要重点看同一特征项在匹配后的变化。● 实验组与控制组反映两组在各特征项上的水平情况。它们的作用是帮助观察两组是否越来越接近。匹配后两组数值越接近通常说明平衡性改善越明显。● 标准化偏差是判断平衡性改善最核心的指标用于衡量实验组和控制组之间的差异程度。通常绝对值越小越好说明两组越可比如果匹配后明显低于匹配前说明匹配起到了平衡作用。● 标准化偏差减少幅度用于衡量匹配后差异被削弱了多少。该指标越大说明平衡改善越明显如果改善幅度很小说明匹配效果有限。● t值与p值用于辅助判断两组在各特征项上的差异是否仍然明显。通常更希望匹配后差异不再显著也就是p值不小如果匹配后仍有较多特征项差异明显说明平衡性还不够理想。3. 表3ATT效应分析当设置了结果变量后系统会输出ATT效应分析表。该表用于比较匹配前后的处理效果差异通常包含实验组、控制组、差值或ATT效应值、标准误、t值和p值等指标。● 差值/ATT效应值这是处理效果判断的核心指标用于表示实验组相对于控制组的净差异。若该值为正通常说明处理可能带来正向影响若为负则说明可能带来负向影响。数值大小反映影响程度但是否值得采信还需结合显著性一起看。● 标准误用于反映ATT效应值的稳定程度。一般越小越好说明估计更稳定如果标准误偏大说明结果波动较大解释时应更谨慎。● t值用于衡量效应值相对于波动水平的表现。通常绝对值越大越说明效应更清晰。● p值用于判断ATT效应是否具有统计意义。通常p值小于0.05可认为处理效应较为明显若p值不小于0.05则说明当前证据不足不能轻易认定处理产生了稳定影响。● 匹配前与ATT效应对比该对比有助于观察控制原始差异后处理效应是否发生变化。如果匹配前后结论一致通常说明结果更稳如果差异明显则说明原始样本不可比性较强匹配步骤非常关键。4. 表4样本缺失情况汇总该表用于说明原始样本中有多少被纳入分析、多少被排除通常包含有效样本、排除无效样本和总计3类信息。● 有效样本表示最终进入分析的数据量。该指标越高越有利于保证结果稳定性。● 排除无效样本表示因缺失、异常或不满足分析要求而被剔除的样本数。若占比偏高需要警惕样本代表性下降。● 占比用于帮助判断样本保留是否充分。通常有效样本占比越高越好若排除比例过高应先处理数据质量问题再解释匹配结果。六、分析结果图表及其解读倾向得分匹配会输出标准化偏差变化对比图用于直观展示各特征项在匹配前后平衡性的变化。标准化偏差变化对比图该图通常以柱形图或条形图展示各个特征项在匹配前和匹配后的标准化偏差。它的作用是把平衡性改善情况直接可视化便于快速判断匹配有没有发挥作用。1如果大多数特征项在匹配后的柱子明显低于匹配前说明匹配后两组差异缩小平衡性得到改善。2如果仍有部分特征项在匹配后偏差较高说明这些变量上的差异尚未被充分消除需要谨慎解释后续处理效应。3如果匹配前后差别不大往往意味着当前特征项选择或参数设置还不够理想可以考虑重新调整匹配方法、阈值或变量组合。以上就是SPSSAU倾向得分匹配方法的相关内容更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。
倾向得分匹配怎么做:SPSSAU操作步骤与结果解读
发布时间:2026/5/29 3:58:23
一、倾向得分匹配所属模块倾向得分匹配在SPSSAU中属于计量经济研究模块。二、方法概述倾向得分匹配常用于处理实验组与对照组在原始特征上不够可比的问题核心目的是先让两组样本尽量接近再比较处理效果。它常见于政策评估、项目效果评估、医学观察研究等场景尤其适合无法直接开展随机实验时使用。三、变量设置规则倾向得分匹配共需设置3类变量其中前2类为必填第3类为可选项。变量设置时既要注意变量类型也要注意可放入的数量范围。1. 研究变量设置1研究变量必须填入1个。2该变量只能是数字0和1用来区分实验组与控制组。通常可理解为是否接受处理、是否参加项目、是否暴露于某因素。3如果研究变量编码不规范后续匹配结果和效应比较都会受到影响因此正式分析前要先确认分组含义。2. 特征项设置1特征项必须填写最少放入1个最多可放入20个。2特征项用于刻画样本原始背景差异例如个体基本特征、行为特征、历史状态等。3这些变量的作用是帮助系统判断哪些实验组样本和控制组样本更接近因此特征项选得是否合理会直接影响匹配质量。3. 结果变量设置1结果变量为可选项最多可放入1个也可以不放。2当需要进一步比较处理效应时可以放入结果变量系统会输出ATT效应分析结果。3如果只想先看匹配是否成功、平衡性是否改善不放结果变量也可以完成匹配质量检验。四、参数设置及解释说明倾向得分匹配在SPSSAU中支持4项常用参数设置不同选项会影响匹配严格程度、样本利用方式以及最终保留的配对结果。1. 匹配方法1系统默认使用最近邻法也就是优先为每个实验组样本寻找最接近的控制组样本。2也可以选择半径匹配法并按不同阈值设置匹配范围。阈值越小说明要求越严格匹配到的样本通常更相似但可匹配成功的样本数可能会减少阈值越大匹配范围更宽成功率可能提升但样本相似程度可能下降。3如果研究更看重样本之间的接近程度可优先考虑较严格的设置如果更看重保留更多样本可适当放宽范围。2. 抽样方法1默认是放回抽样即同一个控制组样本可以被重复匹配给多个实验组样本。2也可以选择不放回抽样即一个控制组样本一旦被匹配后不再参与后续匹配。3放回抽样通常更容易提高匹配成功率适合控制组样本数量有限的情况不放回抽样更强调样本独立性但可能降低匹配成功比例。3. 匹配方式1默认是1:1匹配也就是1个实验组样本对应1个控制组样本。2还可以选择1:2到1:6匹配。匹配数量增加后通常有助于提高控制组信息利用率但也会提升匹配要求未必每个实验组样本都能完全达到目标匹配个数。3如果样本量充足且希望提高估计稳定性可以考虑多对一匹配如果样本条件一般1:1匹配通常更稳妥。4. 保存信息1勾选后系统会额外保存匹配关系和匹配分值等信息。2这些信息适合用于后续核查配对关系、了解样本被匹配的次数以及继续开展扩展分析。3如果当前目标只是快速完成结果解读可以不勾选如果后续还要做追踪检查或二次整理建议保留。五、分析结果表格及其解读倾向得分匹配完成后SPSSAU会根据分析内容输出PSM基本信息汇总、PSM平行假设检验、ATT效应分析以及样本缺失情况汇总等结果表。1. 表1PSM基本信息汇总该表用于整体说明本次匹配是如何完成的主要呈现匹配方式、匹配方法、抽样方法、需要匹配个数、匹配成功个数、匹配失败个数、匹配成功比例和匹配失败比例等信息。● 匹配方式表示每个实验组样本准备匹配几个控制组样本。它的作用是帮助判断本次分析采用的是1:1还是多对一方案。一般来说匹配方式本身没有好坏之分关键在于是否符合研究设计与样本条件。● 匹配方法用于说明采用最近邻法还是半径匹配法。它的作用是帮助理解样本是按最接近原则还是按阈值范围完成匹配。若研究更注重匹配精度通常会更关注严格匹配方法下的表现。● 抽样方法反映控制组样本是否允许重复使用。它的作用是帮助判断样本利用方式是否会影响匹配覆盖率。通常放回抽样更容易得到较高成功率不放回抽样更适合强调样本唯一性的研究。● 匹配成功比例是判断匹配完成度的关键指标表示实验组样本中有多少比例成功找到了可用对照。该指标越高说明样本保留情况越理想如果比例偏低说明当前匹配条件可能过严或实验组与控制组原始差异过大。● 匹配失败比例用于补充说明未成功匹配的样本占比。该指标越低越好若比例较高通常意味着样本之间可比性不足需要重新审视特征项或匹配参数设置。2. 表2PSM平行假设检验该表用于比较匹配前后实验组与控制组在各个特征项上的差异变化通常包含状态、实验组均值、控制组均值、标准化偏差、标准化偏差减少幅度、t值和p值等指标。● 状态一般分为匹配前和匹配后。它的作用是帮助直接对照平衡性是否改善解读时要重点看同一特征项在匹配后的变化。● 实验组与控制组反映两组在各特征项上的水平情况。它们的作用是帮助观察两组是否越来越接近。匹配后两组数值越接近通常说明平衡性改善越明显。● 标准化偏差是判断平衡性改善最核心的指标用于衡量实验组和控制组之间的差异程度。通常绝对值越小越好说明两组越可比如果匹配后明显低于匹配前说明匹配起到了平衡作用。● 标准化偏差减少幅度用于衡量匹配后差异被削弱了多少。该指标越大说明平衡改善越明显如果改善幅度很小说明匹配效果有限。● t值与p值用于辅助判断两组在各特征项上的差异是否仍然明显。通常更希望匹配后差异不再显著也就是p值不小如果匹配后仍有较多特征项差异明显说明平衡性还不够理想。3. 表3ATT效应分析当设置了结果变量后系统会输出ATT效应分析表。该表用于比较匹配前后的处理效果差异通常包含实验组、控制组、差值或ATT效应值、标准误、t值和p值等指标。● 差值/ATT效应值这是处理效果判断的核心指标用于表示实验组相对于控制组的净差异。若该值为正通常说明处理可能带来正向影响若为负则说明可能带来负向影响。数值大小反映影响程度但是否值得采信还需结合显著性一起看。● 标准误用于反映ATT效应值的稳定程度。一般越小越好说明估计更稳定如果标准误偏大说明结果波动较大解释时应更谨慎。● t值用于衡量效应值相对于波动水平的表现。通常绝对值越大越说明效应更清晰。● p值用于判断ATT效应是否具有统计意义。通常p值小于0.05可认为处理效应较为明显若p值不小于0.05则说明当前证据不足不能轻易认定处理产生了稳定影响。● 匹配前与ATT效应对比该对比有助于观察控制原始差异后处理效应是否发生变化。如果匹配前后结论一致通常说明结果更稳如果差异明显则说明原始样本不可比性较强匹配步骤非常关键。4. 表4样本缺失情况汇总该表用于说明原始样本中有多少被纳入分析、多少被排除通常包含有效样本、排除无效样本和总计3类信息。● 有效样本表示最终进入分析的数据量。该指标越高越有利于保证结果稳定性。● 排除无效样本表示因缺失、异常或不满足分析要求而被剔除的样本数。若占比偏高需要警惕样本代表性下降。● 占比用于帮助判断样本保留是否充分。通常有效样本占比越高越好若排除比例过高应先处理数据质量问题再解释匹配结果。六、分析结果图表及其解读倾向得分匹配会输出标准化偏差变化对比图用于直观展示各特征项在匹配前后平衡性的变化。标准化偏差变化对比图该图通常以柱形图或条形图展示各个特征项在匹配前和匹配后的标准化偏差。它的作用是把平衡性改善情况直接可视化便于快速判断匹配有没有发挥作用。1如果大多数特征项在匹配后的柱子明显低于匹配前说明匹配后两组差异缩小平衡性得到改善。2如果仍有部分特征项在匹配后偏差较高说明这些变量上的差异尚未被充分消除需要谨慎解释后续处理效应。3如果匹配前后差别不大往往意味着当前特征项选择或参数设置还不够理想可以考虑重新调整匹配方法、阈值或变量组合。以上就是SPSSAU倾向得分匹配方法的相关内容更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。