【读论文】Current Biology《当代生物学》个体差异揭示协和音的形成机理Individual Differences Reveal the Basis of Consonance 国标参考文献格式McDERMOTT J H, LEHR A J, OXENHAM A J. Individual Differences Reveal the Basis of Consonance[J]. Current Biology, 2010, 20(11):1035-1041.正文逐段译文《当代生物学》第20卷1035–1041页2010年6月8日 ©2010爱思唯尔有限公司 版权所有 数字对象标识符10.1016/j.cub.2010.04.019研究快报个体差异揭示协和音的形成机理乔希·H·麦克德莫特¹,*, 安德里亚娜·J·莱尔², 安德鲁·J·奥克瑟姆²¹美国纽约大学神经科学中心纽约州纽约市10003美国²美国明尼苏达大学心理学系明尼阿波利斯市55455美国摘要部分音符组合听感协和悦耳其余组合则不协和刺耳这一区分是音乐的核心要素。数百年来学界围绕协和音的成因展开争论相关假说分别从声学特征、听觉神经科学与后天文化熏陶三个维度进行阐释[1–12]。本研究借助听者个体差异对各类候选理论加以甄别。实验一方面测试受试者对各类和弦的偏好程度另一方面采用非音乐类声源分离出两类长期被视作协和音潜在成因的声学特征拍频现象与频谱谐波关联关系[2,3,10,13–20]。受试者普遍偏好无拍频、具备谐波频谱的声音在总计250余名受试中仅谐波频谱偏好度与受试者偏爱协和和弦、排斥不协和和弦的倾向稳定相关。同时受试者接触乐器的演奏年限越长对谐波频谱的偏好越强说明音乐环境的长期接触会依托谐波在音乐里的核心地位强化人对谐波频率的偏好。谐波频谱广泛存在于自然界声响中本研究结果证明谐波频谱是协和听觉感知的底层成因。研究结果图1A译文受试群体对不同音符组合悦耳度的平均评分。部分音组无论由哪种乐器演奏评分始终更高该现象即为协和性其起源在历史上长期存在争议[1–12]。古代学者认为协和性由音程的整数比值决定图1B而近现代研究将其与听觉系统敏感的声学属性相关联[10]。当下主流理论提出不协和感来源于不同频率分量叠加产生的拍频效应[2,13–15]。两个频率不同的正弦波叠加时便会生成拍频图1C随时间推移两个波形相位交替重合、错开叠加后的合成波形幅值随之周期性起伏。这种幅值调制形成的听觉质感被称作粗糙度大多受试者将其判定为刺耳难听[21,22]学界普遍认为该特征大量存在于不协和和弦、协和和弦中几乎不存在[13–15]。图1C下方两行两组双音音程二音和弦对应的频谱与波形。小二度是典型不协和音程其频谱包含大量频距极近但不重合的频率分量波形可见明显幅值波动拍频纯五度属于协和音程各分量频率间距大或精准成倍数重合几乎不产生拍频。但两类音程还存在另一处关键区别纯五度全部频率近似满足谐波关系均为同一个基频(F0F_0F0​)的整数倍图1C右上。该音程虽未囊括完整谐波序列但每个频率都隶属于该基频的谐波。从这一特征来看纯五度和单个乐音高度相似——常规单音频谱本身就是一组谐波序列基频决定单音音高。小二度则完全不满足谐波排布规律、属于非谐波结构。由此衍生另一种理论协和和弦的悦耳性并非源于拍频缺失而是和弦频谱和单音谐波频谱高度近似[3,17–20]。还有观点认为协和性和声学规律毫无关联完全是后天文化浸染的产物[23]听者仅是在长期聆听本土音乐的过程中习惯性偏爱本土乐曲高频出现的特定和弦。现代十二平均律音阶一定程度上佐证了该猜想平均律下的协和音程仅近似整数频率比图1B既无法实现完美谐波排布也不能彻底消除拍频。当然后天习得假说与声学成因假说并非互斥。若某一声学属性真正主导协和/不协和区分人在反复聆听乐曲时完全可以对该声学特征形成审美偏好。为厘清上述争议本研究依托受试者协和偏好的个体差异性展开实验探究受试者和弦偏好的个体波动能否用其对特定声学特征的偏好差异解释。实验选用人工定制的非音乐音源分别调控拍频、谐波两类声学参数测量受试者对应的声音偏好。通过「不含某特征音源评分 − 含该特征音源评分」构建单一特征偏好指标若拍频或谐波决定协和感知则对应的声学偏好指标需与和弦协和偏好显著相关。为保证结果稳健可复现实验分两批受试组第一批n142n142n142、第二批n123n123n123并针对不同乐器音色录制的和弦分别开展相关性检验。一、和弦协和偏好测量本研究依托和弦悦耳度打分测试量化协和偏好图1A。针对每种乐器音色分别构建两类偏好量化指标双音音程指标、三音三和弦指标。指标数值协和和弦均分−不协和和弦均分数值越高代表受试者越偏爱协和音响。不同受试者指标得分差异稳定同一名被试两次复测分数具备相关性即便对原始评分做Z标准化、消除受试者打分尺度差异后复测相关依然显著图1D第一批受试萨克斯音源复测散点图。全实验不同音色、受试组的复测相关系数音程指标rrr介于0.600.75三和弦指标$r$介于0.460.63全部满足p0.0001p0.0001p0.0001统计学显著。图1D译文第一批受试萨克斯音源经Z标准化评分得到的协和偏好指标两次测试结果散点分布图。音程协和指标5个高分协和音程平均分−5个低分不协和音程平均分三和弦协和指标大三和弦评分−增三和弦评分。单个圆点代表一名受试者数据全文rrr均为斯皮尔曼相关系数。二、声学特征偏好测量1.拍频偏好指标(B1)构建采用**同耳双音双耳同馈与分耳双音双耳分馈**两种播放模式呈现纯音对以此测算拍频偏好。已知双音分耳放送可大幅削弱人耳感知到的拍频但不会改变音源频谱、谐波结构与音高特征[24,25]。预实验证实仅当两个纯音频差落在同一耳蜗滤波带宽内时分耳播放的音对打分显著高于同耳播放图2A。图2A译文35名预实验受试者同耳/分耳播放纯音对的平均悦耳度评分误差棒为标准误同音0半音间距仅能同耳放送虚线代表拍频从可闻转为不可闻的临界频距依据耳蜗滤波器带宽估算。由于只有频差落在单耳蜗滤波区间的音对才能产生可闻拍频[2]因此「同耳−分耳」的打分差值可量化受试者对拍频刺耳程度的反感度。实验选取三个频段的窄距纯音对图2B用全部分耳音对均分 − 全部同耳音对均分得到无拍频偏好指标B1。图2B拍频测试音源频谱示意图音对间距为0.75或1.5个半音同耳播放时可产生明显可闻拍频。2.谐波偏好指标(H1、H2)构建指标H1对比谐波复音、失谐非谐波复音的悦耳评分图2C。谐波音源选用标准谐波序列的部分分量分量间距足够大以规避显著拍频非谐波音源仅对谐波音源各分量频率做微小偏移其余参数完全一致。H1谐波音源均分−非谐波音源均分H1\text{谐波音源均分}-\text{非谐波音源均分}H1谐波音源均分−非谐波音源均分。图2C谐波偏好测试音源频谱示意图非谐波复音由标准谐波各分量小幅频偏生成所有分量间距充足、无明显拍频谐波与非谐波音源除频率排布外其余参数完全一致频谱左侧数字用于对照图2D结果。指标H2规避B1音源仅含两个频点、和真实和弦频谱差异过大的缺陷。H2单纯音均分−低频分耳音对均分H2\text{单纯音均分}-\text{低频分耳音对均分}H2单纯音均分−低频分耳音对均分该组低频音对无谐波关联分耳放送几乎无拍频可复用拍频实验音源、同时排除互调失真带来的隐性拍频干扰[26]。整体受试群体平均层面受试者普遍偏爱谐波音源、无拍频音源图2D译文但个体对拍频、谐波的偏好存在明显分化图2E、2F为第一批受试B1、H1复测散点。两组受试所有声学偏好指标复测相关r0.41∼0.76r0.41\sim0.76r0.41∼0.76全部p0.0001p0.0001p0.0001显著。关键结果受试者拍频偏好(B1)与谐波偏好(H1)的个体得分无显著相关图2G译文各组二者相关系数在−0.09~0.17区间全部p0.05p0.05p0.05证明两套实验成功分离两个独立声学变量。图2D第一批受试各类声学测试音源平均悦耳评分误差棒为标准误。图2EB1指标两次Z标准化复测得分散点r0.76r0.76r0.76。图2FH1指标两次Z标准化复测得分散点r0.75r0.75r0.75。图2GB1与H1指标汇总得分散点r0.02r0.02r0.02。三、声学偏好与和弦协和偏好的相关性拍频指标和和弦协和偏好的相关系数整体偏低、跨音色/受试组结果不稳定图3A上栏补充附图S2佐证与之相反H1、H2两项谐波指标无论天然乐器音色还是人工合成音色均和音程、三和弦协和偏好呈稳定强正相关图3A中下栏越偏爱谐波频谱的受试者越偏好协和和弦。尽管人的和弦审美会受瞬时心境、近期聆听曲风等杂项因素干扰但谐波偏好可以解释协和偏好的大量个体方差拍频偏好的解释占比极低图3B。细化单和弦评分相关性全音色均值图3C拍频指标仅和大二度、小二度两类不协和音程呈现微弱负相关和其余所有不协和和弦无规律关联而两项谐波指标与本实验测试的全部不协和和弦均呈稳定负相关。值得注意H1、H2由两套物理结构完全无关的音源数据构建却呈现高度一致的相关分布规律进一步验证谐波的决定性作用。图3A拍频、谐波偏好分别与音程/三和弦协和指标的相关系数横轴标注音色S萨克斯、V人声元音、SV合成元音、C合成复音、P纯音误差棒95%置信区间星号代表p0.05p0.05p0.05显著。图3B声学偏好指标可解释的协和偏好方差占比%误差棒标准误星号代表谐波指标方差解释率显著高于拍频指标符号检验α0.05\alpha0.05α0.05。图3C各声学指标与单个和弦平均分的相关系数全音色平均蓝色竖线为本研究界定的不协和音程/和弦。四、乐器演奏阅历带来的审美差异将受试者乐器演奏年限分别与B1、H1、H2做相关图4A两项谐波偏好指标均和练琴年限显著正相关拍频B1无相关。演奏乐器年限越长受试者对谐波频谱的偏好越强。本实验声学测试音源无任何音乐属性、物理形态也刻意远离常规乐曲该结果有力证明谐波是音乐的核心声学要素人对谐波的审美偏好至少一部分由长期音乐熏陶习得。同时乐器练习时长也与和弦协和偏好强度正相关图4B再次佐证后天学习的作用。本研究仅用「练习年限」粗略量化西式音乐内化程度实际相关强度大概率被低估附图S4补充说明。图4A受试乐器练习年限与三类声学偏好指标的相关系数误差棒95%置信区间多比较校正后星号代表p0.05p0.05p0.05显著。图4B练琴年限和音程蓝、三和弦绿协和偏好指标的相关系数标注规则同前。讨论本研究依托个体差异实验厘清协和/不协和的底层成因和弦协和源于频率间的谐波排布不协和由非谐波的频率组合导致同时人对谐波频谱、协和和弦的审美偏好显著受后天音乐阅历塑造。研究证实后天文化熏陶深刻影响协和感知但并非让人随机偏爱某几组特定和弦而是让人习得对「谐波结构」这一共通声学属性的审美偏好。谐波结构是哺乳动物听觉系统进化中重点处理的自然声学特征[27,28]和弦审美本质是听觉系统解析音高、声源分组的谐波分析模块附带产生的好恶评判[29,30]。可闻拍频听觉粗糙度本身极易引发厌恶作曲家也常利用该效果营造乐曲紧张感[31–33]但该审美好恶不受音乐学习影响且无法决定和弦协和性。原因在于不协和和弦未必产生强拍频协和和弦也可能出现明显拍频两个音源的拍频强弱受各自频谱幅值配比影响同种音程换不同乐器演奏拍频强弱差异巨大[34,35]因此拍频无法稳定表征和弦协和属性仅作为独立于协和性之外的审美变量。反观谐波识别受分量幅值变化影响极小[36]能稳定锚定和弦的音乐属性。受限于缺少精准量化和弦实际谐波含量的感知标定算法本研究未直接测算和弦谐波占比转而采用纯谐波/失谐非谐波音源偏好的相关关系验证谐波的核心地位。协和性研究长久以来是音乐领域先天本能vs后天习得的经典论战。本研究证实后天学习的作用但同时提示相关研究需要拆分声学变量过往婴幼儿、跨文化族群的协和感知实验大多同时混杂谐波、拍频两个变量[5,7,9,11]未来需要分开验证两类因素的先天/后天属性。音乐阅历提升谐波偏好既可能是后天完全习得也可能是强化了人类先天自带的谐波偏好自然界哺乳动物鸣叫声普遍具备谐波谐波常作为健康、择偶吸引力的声学标识[37]该猜想仍需后续实验佐证。经典拍频决定论的来源是早期研究发现纯音对的不协和评分可预测复音音程的刺耳程度[13,14]研究者将该规律全部归因于拍频。但本研究证明窄距纯音对的难听感同时来自拍频非谐波排布过往被归为拍频的影响中隐藏大量非谐波的贡献。佐证来自H2指标构建H2的音对采用分耳放送、几乎无拍频但其依然和和弦协和偏好高度相关直接推翻过往结论。即便实验和弦采用十二平均律、无法实现完美整数倍谐波谐波偏好依旧可以有效预测和弦悦耳度说明人耳谐波检测机制容错性较高适配自然界天然音源普遍存在的微量谐波偏移特征[38]。谐波是否影响和弦进行、旋律的审美比如时域整合频率信息仍待探究[39]乐曲上下文环境会大幅改变单和弦的实际听感[40]声学规律在语境效应中的作用仍是开放性课题。本研究用全新个体差异法破解协和性百年争议过往各类假说预测结果高度重合、模型参数难以实测[10]而个体差异范式绕开该难点确凿证明谐波是协和听觉的核心基础。实验方法简述详细内容见补充材料受试与实验流程全部受试为明尼苏达大学本科生分两大队列队列1142人队列2123人人口统计学特征相近、仅测试细节版本略有区别。所有被试先完成拍频谐波两类声学打分测试再分批完成不同乐器音色的和弦打分测试同和弦换多种音源用于复测信度计算。所有测试音源随机播放声学测试每个音源重复3轮、和弦测试重复4轮每轮更换根音。和弦取自十二平均律常规根音集中在中央C上方一个八度萨克斯、人声元音音源受音域限制根音从升G₃起。受试者打分区间−3极度难听~3极度悦耳实验前简短练习熟悉全范围音源。拍频测试音对间距0.75/1.5半音同耳放送产生明显拍频非谐波复音通过两种方式生成各谐波分量同乘系数拉伸频率、或全部叠加固定频偏除此之外谐波/非谐波音源参数完全一致。数据分析音程协和指标前五高分音程平均分−后五低分音程平均分三和弦指标大三和弦均分−增三和弦均分。全分析采用斯皮尔曼相关系数、双侧显著性检验多组对比使用改良邦弗罗尼校正。单个和弦相关分析采用全音色均分数据。计算声学指标对协和偏好的方差解释率时依托两类指标各自复测相关做衰减校正相关系数平方后取全音色、全受试组均值。补充材料译文补充数据1.声学测试指标信度与个体方差附图S1附图S1统计两队列四项声学指标B1/B2/H1/H2的复测信度、个体间方差。信度即同一指标两次测试相关系数方差为合并两次得分后受试群体数据离散度表征个体偏好差异大小。信度、方差均由原始评分计算原始分用于和协和指标做相关Z标准化分数仅用于正文汇报复测信度排除打分尺度干扰。结果拍频(B1/B2)与谐波(H1/H2)指标的信度、个体方差水平基本持平。图S1A两队列四项声学指标复测信度误差棒95%置信区间图S1B两队列四项声学指标个体方差。2.备选拍频指标B2附图S2预实验显示高频纯音对的分耳/同耳打分差值最明显因此仅选用高频音对构建备选拍频指标B2高频分耳均分−高频同耳均分B2\text{高频分耳均分}-\text{高频同耳均分}B2高频分耳均分−高频同耳均分。B2和和弦协和偏好依旧相关性微弱、跨组不稳定方差解释率极低同时和乐器练习年限无显著相关和B1结论一致。图S2AB2与音程、三和弦协和指标相关系数图S2BB2对协和偏好的方差解释占比图S2CB2与各单和弦评分相关图S2DB2和练琴年限相关系数。3.未做Z标准化的重复分析附图S3去掉和弦评分Z标准化步骤、复现图3全部统计整体相关系数小幅升高源于受试者打分尺度习惯的混杂影响但全部核心变化趋势和原文一致证明Z标准化仅优化干扰、不改变实验结论。图S3A原始未标准化评分下拍频、谐波指标与协和指标相关图S3B原始分下方差解释率纵轴量程放大图S3C原始分下单和弦相关系数。4.偏相关分析谐波偏好与音乐阅历附图S4分别控制「练琴年限」或「谐波偏好」做偏相关任意变量被控制后剩余变量和协和偏好的相关系数下降但仍大多显著。说明谐波对协和偏好的作用一部分经由后天音乐阅历实现同时谐波存在独立于练琴时长的先天影响也可能是练琴年限指标本身过于粗略无法精准量化音乐熏陶程度。图S4A控制虚线/不控制实线练琴年限谐波指标与协和偏好相关图S4B控制点线/不控制实线谐波偏好练琴年限与协和偏好相关图S4C剔除练琴变量后谐波指标方差解释率下降幅度图S4D剔除谐波变量后练琴年限方差解释率下降幅度。补充实验细则受试信息两队列平均年龄20.2岁队列1143人女95平均乐器学习5.4年队列2122人女79平均5.7年。队列1依次完成萨克斯、人声元音、合成复音和弦测试95人额外完成合成元音测试队列2先做纯音/合成复音和弦85人后续补测天然/合成元音。音源参数三类非谐波音源改动方案①分量间距由12半音改为13半音②偶次谐波抬升0.5半音、奇次谐波降低0.5半音③仅队列1全部谐波统一30Hz频移。所有谐波/非谐波音源幅值每八度衰减14dB贴合自然声源特征。本研究频偏幅度拉伸6%19%、抖动3%、整体偏移1.5%10%远高于人耳失谐检出阈值约1%基频人耳可清晰分辨非谐波畸变。采用Praat测算谐波信噪比(HNR)谐波音源HNR≈44dB三类非谐波音源HNR介于1522dB差异超20dBH2配套单音HNR47.6dB、低频音对HNR20~28dB。现有HNR算法适配噪声-乐音区分不完美适配谐波/失谐复音对比后续需开发基于谐波筛的专用算法。声学测试基准音大部分音源基频取自中央C上方6半音区间拍频测试低频音对中央C上方1318半音中频1924半音高频25~30半音。和弦根音取自中央C上方8半音萨克斯/人声改用升G₃起音域。所有人工合成音源包络10ms汉宁半窗起音指数衰减包络衰减常数2.5 sec−12.5\ \text{sec}^{-1}2.5sec−1总时长截断至2s末尾线性淡出全音源播放声压65dB。萨克斯音源取自爱荷华大学乐器采样库使用Praat修音、剪辑真人元音(/a/、/u/)由专业演唱者录制150Hz四阶巴特沃斯高通滤波去除麦克风底噪队列1人声固定/a/、拉平音高队列1保留原始音高、/a/与/u/各半随机。合成元音将真人元音平均频谱包络叠加至标准谐波复音生成。实验流程隔音双墙舱内森海塞尔HD580耳机放音每组试次前2s、60dB白噪声掩蔽消除前后试次听觉残留。和弦测试额外包含大七、小七、属七和弦数据未纳入正文统计声学测试附带多余对照音源不参与数据分析。音源全随机声学重复3次、和弦4次每次换根音打分规则同正文。预实验纯音基准523Hz/740Hz35名被试重复3轮随机播放。数据分析细则指标均采用「两类音源平均分差值」计算附图S5译文全部斯皮尔曼双侧检验、改良邦弗罗尼多重比较校正95%置信区间由1000次自举抽样生成。单音色相关纳入全部完成对应测试受试者全音色平均相关仅选取四项音色全部完成打分的受试。为消除受试者打分尺度差异同一名受试者内部所有和弦评分做Z标准化声学指标原始分不标准化仅复测信度用Z分汇报。为验证标准化不改变结论分别测试四种标准化方案全不标准化、全标准化、仅和弦标准化、仅声学标准化所有方案结论一致非标准化结果见附图S3相关小幅抬升来自打分尺度混杂。图S5A协和指标计算公式示意图黑线为队列1全音色和弦均分音程指标高分5组−低分5组三和弦指标大三−增三。图S5B声学指标计算公式B1全分耳音对−全同耳音对B2高频分耳−高频同耳H1谐波复音−非谐波复音H2单纯音−低频同耳音对。参考文献原文原样保留Rameau, J.P. (1971). Treatise on Harmony (New York: Dover Publications)., Originally published in 1722.v Helmholtz, H. (1863). Die Lehre von den Tonempfindungen als Physiologische Grundlage fu¨ r die Theorie der Musik (Braunschweig: F. Vieweg und Sohn).Stumpf, C. (1890). Tonpsychologie (Leipzig: Verlag S. Hirzel). 4. Guernsey, M. (1928). The role of consonance and dissonance in music. Am. J. Psychol. 15, 173–204.Butler, J.W., and Daston, P.G. (1968). Musical consonance as musical preference: A cross-cultural study. J. Gen. Psychol. 79(1st Half), 129–142.Mathews, M.V., and Pierce, J.R. (1980). Harmony and nonharmonic partials. J. Acoust. Soc. Am. 68, 1252–1257.Zentner, M.R., and Kagan, J. (1996). Perception of music by infants. Nature 383, 29.Fishman, Y.I., Volkov, I.O., Noh, M.D., Garell, P.C., Bakken, H., Arezzo, J.C., Howard, M.A., and Steinschneider, M. (2001). Consonance and dissonance of musical chords: Neural correlates in auditory cortex of monkeys and humans. J. Neurophysiol. 86, 2761–2788.Trainor, L.J., Tsang, C.D., and Cheung, V.H.W. (2002). Preference for sensory consonance in 2- and 4-month-old infants. Music Percept. 20, 187–194.McDermott, J.H., and Oxenham, A.J. (2008). Music perception, pitch, and the auditory system. Curr. Opin. Neurobiol. 18, 452–463.Fritz, T., Jentschke, S., Gosselin, N., Sammler, D., Peretz, I., Turner, R., Friederici, A.D., and Koelsch, S. (2009). Universal recognition of three basic emotions in music. Curr. Biol. 19, 573–576.Bidelman, G.M., and Krishnan, A. (2009). Neural correlates of consonance, dissonance, and the hierarchy of musical pitch in the human brainstem. J. Neurosci. 29, 13165–13171.Plomp, R., and Levelt, W.J.M. (1965). Tonal consonance and critical bandwidth. J. Acoust. Soc. Am. 38, 548–560.Kameoka, A., and Kuriyagawa, M. (1969). Consonance theory. J. Acoust. Soc. Am. 45, 1451–1469.Hutchinson, W., and Knopoff, L. (1978). The acoustical component of western consonance. Interface 7, 1–29.Sethares, W.A. (1999). Tuning, Timbre, Spectrum, Scale (Berlin: Springer).Terhardt, E. (1974). Pitch, consonance, and harmony. J. Acoust. Soc. Am. 55, 1061–1069.Tramo, M.J., Cariani, P.A., Delgutte, B., and Braida, L.D. (2001). Neurobiological foundations for the theory of harmony in western tonal music. Ann. N. Y. Acad. Sci. 930, 92–116.Cariani, P.A. (2001). Temporal codes, timing nets, and music perception. J. New Music Res. 30, 107–135.Ebeling, M. (2008). Neuronal periodicity detection as a basis for the perception of consonance: A mathematical model of tonal fusion. J. Acoust. Soc. Am. 124, 2320–2329.Terhardt, E. (1974). On the perception of periodic sound fluctuations (roughness). Acustica 30, 201–213.Daniel, P., and Weber, R. (1997). Psychoacoustical roughness: Implementation of an optimized model. Acustica 83, 113–123.Lundin, R.W. (1947). Toward a cultural theory of consonance. J. Psychol. 23, 45–49.Rutschmann, J., and Rubinstein, L. (1965). Binaural beats and binaural amplitude-modulated tones: Successive comparison of loudness fluctuations. J. Acoust. Soc. Am. 38, 759–768.Bernstein, J.G., and Oxenham, A.J. (2003). Pitch discrimination of diotic and dichotic tone complexes: Harmonic resolvability or harmonic number? J. Acoust. Soc. Am. 113, 3323–3334.Feeney, M.P. (1997). Dichotic beats of mistuned consonances. J. Acoust. Soc. Am. 102, 2333–2342.Kadia, S.C., and Wang, X. (2003). Spectral integration in A1 of awake primates: Neurons with single- and multipeaked tuning characteristics. J. Neurophysiol. 89, 1603–1622.Lewis, J.W., Talkington, W.J., Walker, N.A., Spirou, G.A., Jajosky, A., Frum, C., and Brefczynski-Lewis, J.A. (2009). Human cortical organization for processing vocalizations indicates representation of harmonic structure as a signal attribute. J. Neurosci. 29, 2283–2296.Plack C.J., Oxenham A.J., Popper A.J., and Fay R.R., eds. (2005). Pitch: Neural Coding and Perception (New York: Springer).Darwin, C.J. (1997). Auditory grouping. Trends Cogn. Sci. 1, 327–333.Pressnitzer, D., McAdams, S., Winsberg, S., and Fineberg, J. (2000). Perception of musical tension for nontonal orchestral timbres and its relation to psychoacoustic roughness. Percept. Psychophys. 62, 66–80.Vassilakis, P. (2005). Auditory roughness as a means of musical expression. Selected Reports in Ethnomusicology 12, 119–144.Bigand, E., Parncutt, R., and Lerdahl, F. (1996). Perception of musical tension in short chord sequences: The influence of harmonic function, sensory dissonance, horizontal motion, and musical training. Percept. Psychophys. 58, 124–141.Kohlrausch, A., Fassel, R., and Dau, T. (2000). The influence of carrier level and frequency on modulation and beat-detection thresholds for sinusoidal carriers. J. Acoust. Soc. Am. 108, 723–734.Cook, N.D. (2009). Harmony perception: Harmoniousness is more than the sum of interval consonance. Music Percept. 27, 25–41.Ritsma, R.J. (1967). Frequencies dominant in the perception of the pitch of complex sounds. J. Acoust. Soc. Am. 42, 191–198.Bruckert, L., Bestelmeyer, P., Latinus, M., Rouger, J., Charest, I., Rousselet, G.A., Kawahara, H., and Belin, P. (2010). Vocal attractiveness increases by averaging. Curr. Biol. 20, 116–120.Fletcher, H., Blackham, E.D., and Stratton, R. (1962). Quality of piano tones. J. Acoust. Soc. Am. 34, 749–761.Parncutt, R. (1989). Harmony: A Psychoacoustical Approach (Berlin: Springer-Verlag).Steinbeis, N., Koelsch, S., and Sloboda, J.A. (2006). The role of harmonic expectancy violations in musical emotions: Evidence from subjective, physiological, and neural responses. J. Cogn. Neurosci. 18, 1380–1393.补充参考文献原文原样保留Moore, B.C.J., Glasberg, B.R., and Peters, R.W. (1986). Thresholds for hearing mistuned partials as separate tones in harmonic complexes. Journal of the Acoustical Society of America 80, 479-483.Grube, M., von Cramon, D.Y., and Rubsamen, R. (2003). Inharmonicity detection: Effects of age and contralateral distractor sounds. Experimental Brain Research 153, 637642.Boersma, P. (1993). Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound. IFA Proceedings 17, 97-110.Tramo, M.J., Cariani, P.A., Delgutte, B., and Braida, L.D. (2001). Neurobiological foundations for the theory of harmony in Western tonal music. Annals of the New York Academy of Science 930, 92-116.