非盲人的视觉皮层以层级方式解释视觉信号,从早期视觉皮层(EVC)中的简单视觉特征到高阶视觉区域中的复杂特征。盲人的视觉皮层已知会对触觉与听觉信息作出反应,但在处理这些信号时是否也使用相似的计算层级?在此,本研究表明盲人的视觉皮层以一种在时空上与非盲人视觉皮层处理视觉阅读所用层级惊人相似的层级结构来加工触觉阅读。耐人寻味的是,盲人的视觉皮层似乎还额外参与口语词的加工。我们的结果提示,尽管这些区域对跨模态输入的反应增强,但在感觉被剥夺的早期区域与高阶区域之间的计算梯度在很大程度上不依赖视觉经验。
摘要
高级知觉源自对逐步增加的特征复杂性作出反应的层级化脑系统之间的相互作用。阅读过程中,早期视觉皮层(EVC)对简单视觉特征进行初步评估,随后在腹侧枕颞皮层(vOTC)进行正字法与词汇层面的计算。尽管先天性盲人在触觉盲文阅读中也会动用类似的视觉区域,但该人群的视觉网络是否在阅读方面维持其层级结构或发生重组,仍不清楚。**结合 fMRI 与计时经颅磁刺激(TMS),**本研究揭示了非盲人与盲人(男女均包括)在其枕叶皮层如何在功能上支持阅读与言语加工方面的清晰对应关系。通过 fMRI,我们首先观察到,在两组及两种感觉通道中,vOTC 而非 EVC 对词汇信息相较于非词汇信息表现出增强反应。****通过 TMS,我们进一步发现,在两组中,对书写词与伪词的加工在早期与晚期时间窗内均会受到 EVC 刺激的干扰。相较之下,vOTC 刺激仅在晚期时间窗内干扰这些书写刺激的加工,同样在两组中均如此。在言语领域,我们仅在盲人参与者中观察到 TMS 效应,且仅针对有意义词。总体而言,本研究结果表明,尽管被剥夺的视觉区域的反应可能会将其功能反应扩展至其他感觉通道,但至少在阅读方面,早期与高阶枕叶区域之间的计算梯度仍被保留。
引言
先天性失明会增强枕叶区域对其他感觉通道(触觉、听觉)的反应,而这些区域在非盲人中主要加工视觉。然而,支配这种神经可塑性的原则,以及感觉经验在塑造皮层功能组织中的作用,仍存在争论。
一方面,研究者认为盲人视觉皮层的功能组织在很大程度上得以保留,因为来自多个领域的触觉与听觉加工会以与视觉加工相似的方式激活视觉皮层。这包括 V1 中对简单触觉纹理的加工、hMT+/V5 中对运动选择性的反应,以及在非盲人与盲人之间分布相似的、位于高阶联合的腹侧枕颞皮层(vOTC)中的类别选择性反应。****这些结果提示,视觉皮层可以在独立于视觉输入的情况下被组织起来。****另一种观点认为,在缺乏典型输入时,盲人的视觉皮层会发生层级反转,使早期视觉皮层(EVC)(主要界定为 V1,可能还包括其近邻区域)成为一个从事复杂加工的高阶计算单元,例如数学推理或口语句子加工。
视觉知觉通常被视为一个层级系统,其中"低水平"信息从初级视觉皮层中提取,并沿腹侧与背侧通路级联传递以进行更复杂的分析。除这种前馈加工方案外,复归加工还包括从下游区域返回 V1 的反馈环路。****因此,在初步评估并将信息传递至联合皮层之后,反馈信号会被送回 EVC,这凸显了其参与多种并行过程。****在此,我们探问这些计算梯度是否依赖视觉经验。
低水平与高阶皮层区域之间层级加工的一个典型模型是阅读。阅读需要并行操作,从符号识别到将字母串与相应的言语与意义单元建立联系。这些过程通常遵循一种时空上的分工:简单特征(字母的线条及线条交汇处)在 EVC 中加工,而正字法与词汇状态则在 vOTC 中确定,后者后来被称为"视觉词形区(VWFA)"。
尽管 EVC 与 vOTC 支持先天性盲人的盲文阅读,但我们并不知道非视觉信息在这些区域之间如何流动。****具有多个时间窗的经颅磁刺激(TMS)(计时式设计)已证明,非盲人的 EVC 在因果上参与触觉盲文字母的识别,且早于 vOTC。****在先天性盲人中,低水平与高阶枕叶区域之间的计算层级仍未得到探索。
**此外,既往研究显示,盲人的视觉皮层可能将其作用扩展到阅读之外,参与言语加工。**然而,言语也会激活非盲人的 EVC 与 VWFA。这使得盲人视觉皮层为执行新功能而发生重组这一点的性质受到质疑,因为观察到的活动可能源自在非盲人中同样存在的功能架构被"去遮蔽"或"放大"。在这一观点下,非盲人视觉皮层对言语的反应可能与盲人相似,但更弱。
在此,我们通过考察先天性盲人与非盲人枕叶皮层对阅读与言语的神经元反应来处理这些问题。我们首先使用功能性磁共振成像(fMRI)表征 EVC 与 VWFA 对词汇信息(词、非词)与非词汇信息的反应,这些信息以书写与口语两种通道呈现。随后,我们使用计时式 TMS 来探究这些区域是否、何时以及如何在因果上支持阅读与言语。
材料与方法
fMRI 实验
被试。 二十名右利手的先天性盲人成人(14 名女性,年龄均值 M = 36.6;标准差 SD = 7.6;受教育年限 M = 15.7 年;SD = 1.9 年)参加了 MRI 研究。**此外,20 名在人口学特征上匹配的非盲人成人作为对照组(14 名女性,年龄 M = 36.**5;SD = 7.7;受教育年限 M = 16.2 年;SD = 1.3 年)。随后,MRI 样本中的 13 名盲人(11 名女性,年龄 M = 37.7;SD = 8.6;受教育年限 M = 15.8 年;SD = 1.9 年)与 13 名非盲人(8 名女性,年龄 M = 34.6;SD = 8.7;受教育年限 M = 16.1 年;SD = 1.4 年)也参加了 TMS 实验。
**在两项实验中,两组在年龄(两独立样本 t 检验,两者 p 值均 > 0.358)、性别(卡方检验,两者 p 值均 > 0.**377)或受教育年限(两独立样本 t 检验,两者 p 值均 > 0.305)方面均无统计学差异。被试的详细特征见表 1。所有参与者均无任何神经系统疾病或脑损伤史,且均声明听力正常。所有非盲人视力正常或经矫正后正常。所有盲人被试的失明均由外周损伤导致。研究开始前收集了知情同意以及 MRI 与 TMS 安全筛查。表格在实验前以屏幕阅读软件可读取的格式发送给盲人被试,并在现场提供盲文版本。所有被试均获得参与研究的金钱补偿。本研究获得当地伦理委员会批准。
行为测验。在 fMRI 实验之前,通过计时参与者朗读来自标准化阅读障碍诊断测验的词与伪词来评估个体阅读速度。 对非盲人使用该测验的原始流程与材料。每次测验包含两组各 75 个、长度由 2 至 13 个字母逐渐增加的词,或 69 个伪词(2 至 10 个字母)。在每一组中,被试有 30 秒时间尽可能快地将刺激大声读出。对盲人被试而言,流程被调整以适应触觉盲文阅读较慢的节奏。在与该测验作者沟通后,所有刺激还被进一步拆分为长度相等的两半,每组分别包含 38/37 个词或 34/35 个伪词(进行平衡)。此举旨在避免对列表开头较短词的偏向,也即在保留刺激长度比例的前提下缩短所有列表。**将两组中正确朗读的刺激数相加,并采用 2(组别:盲人、非盲人)× 2(词汇性:词、伪词)的混合方差分析进行检验,并进行 Bonferroni 校正的事后检验。**在方差不相等时,对自由度应用 Welch 校正。所有被试在正式测验前均使用另一组示例刺激熟悉流程。
MRI 数据采集。 MRI 数据使用 Siemens Trio 3T 扫描仪(Siemens)及 12 通道头线圈采集。结构像为 T1 加权图像,共 176 层;回波时间 3.32 ms;重复时间 2,530 ms;体素大小 1 × 1 × 1 mm;翻转角 7°;视野 256 × 256 mm。功能像使用回波平面成像(EPI)脉冲序列采集,共 35 层;回波时间 3 ms;重复时间 2,000 ms;体素大小 3 × 3 × 3.85 mm;翻转角 80°;视野 64 × 64 mm。功能数据通过双回波梯度回波序列(场图)校正 B0 场不均匀性,场图序列共 186 层;回波时间 1 为 4.5 ms;回波时间 2 为 6.96 ms;重复时间 800 ms;翻转角 60°;视野 72 × 72 mm。场图序列在实验中段采集。
fMRI:任务与刺激。 扫描过程中,要求被试仔细加工词、伪词与控制刺激。所有刺激以每块 4 个的方式呈现,并以两种通道之一呈现:阅读(盲人为触觉盲文,非盲人为视觉字母表)或言语。触觉盲文刺激通过 NeuroDevice 触觉盲文显示器呈现,视觉刺激在 LCD 显示器上呈现,听觉刺激通过 MRI 安全耳机呈现。

表 1 被试特征

图 1. fMRI 研究的实验设计概览与行为结果。 A,触觉盲文(先天性盲人)、视觉(有视者)与听觉(两组)条件下的词、伪词与控制刺激以每次 4 个刺激为一组、以伪随机的交替顺序呈现。在切换感觉通道之前,被试会听到一个听觉提示音。有视者在言语加工期间被要求闭眼。被试执行 1-back 任务,即当连续出现相同刺激时需要按键反应(占 10% 试次,红色框为示例)。B,行为结果:用 d′ 统计量总结 fMRI 任务表现(右)。误差线表示均值的标准误。有视者在听觉词与听觉伪词条件下均达到 100% 正确率(因此无误差线)。每个条件上方的星号表示组间差异,连线上的星号表示组内条件间差异。刺激间隔(ISI);*p < 0.05;**p < 0.01,Bonferroni 校正(细节见材料与方法)。
所有词与伪词的长度均为 3--4 个字母(1--2 个音节),并在各条件之间对词频以及形容词、动词或名词的数量进行平衡。伪词通过字母调换或替换生成,从而形成无意义但可发音的刺激。控制刺激为重复的非语言字符链。在阅读条件下,非盲人的控制刺激为由 3、4 或 5 个井号(#)组成的字符串;盲人的控制刺激为不携带任何语言意义的完整六点盲文字符。对于听觉控制刺激,我们使用经声码器处理的语音,其由不同数量(2、3 或 4)的重复噪声爆发组成,并使用 Praat 软件制备(www. praat.org)。声码器处理将语音信号划分为三个频带,将原始语音的动态振幅轮廓施加于噪声源,然后再将这些频带重新合成为一个统一信号。**因此,声码器刺激保留了与语音相关的动态频率与振幅模式,但缺乏语音音素信息。**在此,由一个单音节词获得的声码器模式被复制,以得到与视觉与触觉控制条件相匹配的不同重复次数。实验前对被试进行了简短训练,以使其熟悉所有类型的刺激。
为确保被试对所有刺激保持注意,我们在整个实验中引入了一个简单的 1-back 任务。 当同一区块内连续两个刺激相同(例如,词条件下为"boy-boy",或控制条件下为"###-###")时,被试通过按键作出反应(图 1A)。每个条件中有 7 个伪随机化目标(占试次的 10%)。目标以及区块内试次顺序在被试间使用两套伪随机化集合 A 与 B 进行平衡;两套集合的刺激相同,仅目标(重复项)不同。
实验共分为 6 个 run。每个 run 进一步划分为顺序区块,每个区块包含来自各条件的 4 个刺激(阅读:词、伪词、控制;言语:词、伪词、控制)。为避免在感觉通道之间持续切换,条件顺序在每种通道内部随机化,但两种通道始终交替出现(例如,读:控制--伪词--词 → 听:伪词--控制--词 → 读:词--控制--伪词 → 听......)。**由于每个 run 内通道交替,我们未使用实体眼罩,因为反复佩戴与取下可能导致扫描中的头动增加。因此,在每次通道切换前,被试会听到一种独特的声音提示,告知即将到来的通道;有视组将其分别对应为"睁眼"(阅读)或"闭眼"(言语)。**起始通道在被试与刺激集合之间进行平衡,并在各 run 间交替。也就是说,在每个组内,被试被均等分配到四种情形:(1)集合 A 在奇数 run 以阅读开始、偶数 run 以言语开始;(2)集合 A 在奇数 run 以言语开始、偶数 run 以阅读开始;(3)集合 B 在奇数 run 以阅读开始、偶数 run 以言语开始;(4)集合 B 在奇数 run 以言语开始、偶数 run 以阅读开始。视觉刺激呈现 1 s,触觉盲文刺激呈现 3 s,听觉刺激呈现约 1 s。区块内所有试次之间以 1 s 的刺激间隔分隔,区块之间以随机化的 3--5 s 休息期分隔。在通道切换时,提示音与第一条件开始之间额外加入 2.5 s 的休息期(图 1A)。每个条件共呈现 18 个区块与 72 个刺激(6 个 run × 3 次重复 × 4 个刺激)。
1-back 任务的行为表现使用 d′ 统计量衡量,该指标可校正个体反应风格差异。首先,将所有被试、条件与通道下的反应划分为四类:(1)命中,针对目标的正确按键;(2)漏报,对目标未作反应;(3)虚报,对非目标刺激按键;(4)正确拒绝,对非目标未作反应。随后,命中率计算为命中数/(命中数 + 漏报数),虚报率计算为虚报数/(虚报数 + 正确拒绝数)。最后,d′ 计算为 Z(命中率)− Z(虚报率),其中 Z(x) 为累计高斯分布的反函数。为确保 d′ 值为有限值,对于命中率或虚报率等于 0 或 1 的被试--条件组合,我们分别使用 0. 01 或 0.99 进行替代。对所有实验条件的 d′ 统计量采用 2(组别:盲人、非盲人)× 2(通道:阅读、言语)× 3(条件:词、伪词、控制)的混合方差分析进行检验。必要时对非球形性采用 Greenhouse--Geisser 的 p 值校正。**事后检验采用 t 检验,并针对计划比较的数量对 p 值进行 Bonferroni 校正(即,各组内条件/通道之间的比较,以及各条件/通道内组间比较)。**在方差不相等时,对自由度应用 Welch 校正。组内比较进行 Bonferroni 校正(12 次比较)。为避免 II 类错误,组间比较不进行校正。
fMRI:数据分析。 来自所有 run 的 fMRI 数据先基于由场图计算得到的体素位移图进行去畸变,随后使用四阶 B-Spline 进行重对齐以校正头动,进行层间时间校正,与被试的 T1 加权结构像进行配准,通过估计的形变场以 2 mm 等方体素大小归一化到蒙特利尔神经影像研究所(MNI)空间,并使用半高全宽为 5 mm 的高斯核进行平滑。一名盲人被试在第 5 与第 6 个 run 之间要求休息,因而额外采集了一次场图。对该被试,第 6 个 run 的数据使用第二个体素位移图进行去畸变。其余预处理步骤完全相同。
随后,将所有 run 的预处理数据输入到被试特异的一般线性模型(GLM)中。两种感觉通道下所有实验条件区块的时间信息作为兴趣回归量输入。此外,提示即将到来的感觉通道的听觉提示音、1-back 目标,以及 6 个头动参数作为非兴趣回归量输入。 数据依据指定时间信息与经典血流动力学反应函数进行卷积,并使用 128 Hz 高通滤波。数据中的序列相关性在经典限制性最大似然参数估计过程中通过自回归(AR1)模型进行处理。
**为刻画早期视觉皮层(EVC)与视觉词形区(VWFA)中的神经反应特征,我们从两个感兴趣区(ROI)中提取所有实验条件的对比估计值。**EVC 定义为来自 visfatlas 的视网膜拓扑映射腹侧与背侧 V1 图谱的组合。视觉词形区定义为一个半径 5 mm 的球形 ROI,其中心位于既往报告的经典坐标,并通过 mni2tal 网络应用将 Talairach 坐标(X = −39;Y = −58;Z = −9)转换到 MNI 空间(X = −41;Y = −57;Z = −16)。
提取的数据分别输入到 ROI 特异的 2(组别:盲人、非盲人)× 2(通道:阅读、言语)× 3(条件:词、伪词、控制)的混合方差分析中。必要时对非球形性采用 Greenhouse--Geisser 的 p 值校正。神经反应的显著性通过与零进行单样本 t 检验评估,条件之间比较使用配对 t 检验,组间比较使用两独立样本 t 检验。 在方差不相等时,对自由度应用 Welch 校正。所有 p 值均针对所执行比较的数量进行 Bonferroni 校正(单样本 t 检验为 24 次,比 较 t 检验为 18 次)。
fMRI 数据使用在 MATLAB 2016b(MathWorks)上运行的 SPM12 软件进行分析。行为数据分析、ROI 分析与绘图使用 R(4.1.3)完成,并使用 tidyverse、rstatix、ez、cowplot、patchwork、ggpubr、RColorBrewer 与 marginaleffect 等 R 软件包。
TMS 实验
TMS:任务与刺激。 在 TMS 实验中,被试完成词汇判断任务,需要区分词与伪词。**之所以选择该任务,是因为它是一种成熟的 TMS 范式,已在既往 TMS 研究中成功用于考察视觉词形区(VWFA)在语言加工中的参与情况,并可在视觉、听觉与触觉感觉通道中诱发相关效应。**任务在每个 TMS 刺激部位分别以阅读(盲人为触觉盲文字母表,非盲人为视觉字母表)或言语加工的方式进行,且在不同 run 中完成。由此形成四个 run:EVC 阅读、EVC 言语、VWFA 阅读与 VWFA 言语。为避免感觉刺激疲劳(尤其是盲人触觉阅读),run 的顺序按 TMS 刺激部位编排,并在其中交替感觉通道。也就是说,被试不会在连续两个 run 中进行阅读或听取刺激。非盲人在言语 run 中使用实体眼罩遮眼;该眼罩在阅读 run 中放置于被试颈部,至言语 run 时抬起覆盖双眼。每个 run 开始前均检查神经导航配准的质量。
所有刺激均来自一个更大的词与伪词数据库,该数据库曾用于我们先前的实验。 简要而言,从 SUBTLEX-PL 数据库中筛选 4--6 个字母长的词,并限制其出现频率高于每百万 1 次。伪词通过在词中改变一个字母生成,从而形成在正字法与语音上合理但无意义的字串。在所有条件下,词在词频、长度、音节数与邻域大小方面进行匹配。对伪词采用相同流程,但不涉及词频匹配。总计 160 个词与 160 个伪词被划分为 8 个实验条件(4 个 TMS 时间窗 × 2 个 TMS 刺激部位 × 2 种感觉通道),从而每个条件包含 20 个试次(10 个词 + 10 个伪词)。**视觉刺激呈现在非盲人面前的屏幕上,触觉盲文通过 Active Star 显示器呈现。**所有听觉刺激均在隔音室录制,并以 16 bit 模数转换、44 kHz 采样率进行数字化处理,通过气动入耳式 ER1 耳机呈现,该耳机同时也用作防护以减弱 TMS 线圈噪声。
每个 run 以 10 s 注视开始,随后进入试次呈现。每个试次由词或伪词的呈现构成,TMS 脉冲在四个时间窗之一施加。词汇判断反应时间窗为 2 s,随后在下一试次前有 2--3 s 的随机化休息期。视觉刺激呈现 560 ms,以匹配听觉刺激的平均时长。由于触觉加工的复杂性,触觉盲文呈现 3,000 ms,并由被试自行选择的惯用阅读手进行阅读。各条件内刺激顺序对每名被试随机化。刺激集合在不同 TMS 刺激部位之间进行平衡。
实验前通过训练使被试熟悉流程,并要求其尽可能快速作答。刺激呈现与 TMS 脉冲时序由在 Presentation 21.0 环境中编写的程序控制。所有反应均通过 CEDRUS RB-540 反应盒作出。

图 2. TMS 研究的实验设计概览与刺激方案。 A,先天性盲人与有视者在阅读(触觉盲文/视觉字母)或言语加工条件下完成词汇判断任务。被试需要区分以随机顺序呈现的单个词或伪词。早期视觉皮层(EVC);视觉词形区(VWFA)。B,在阅读与言语加工的不同 run 中,分别对早期视觉皮层或视觉词形区施加脉冲刺激。图中可视化展示了盲人组(蓝色)与有视者组(橙色)在 MNI 空间下的平均标准化坐标。实验中的实际刺激在个体原始空间中进行,以控制个体神经解剖差异。红色线条标示早期视觉皮层中视网膜拓扑映射的 V1 边界(上图)以及文献报告的视觉词形区原始位置。V1 掩膜由 visfatlas 中左右侧腹侧与背侧 V1 区域合并得到。视觉词形区以半径 7 mm 的球体表示,球心为 X = −41,Y = −57,Z = −16。个体靶点坐标另见图 3。C,在每个试次中,以 40 ms 的脉冲间隔(25 Hz)施加两次经颅磁刺激脉冲,并在相对于刺激开始的四个时间窗之一进行:−40/0、60/100、160/200 或 260/300 ms。
TMS:刺激部位定位。 在 TMS 实验中,早期视觉皮层(EVC)与视觉词形区(VWFA)通过神经导航系统进行靶向刺激。实验前,所有 TMS 靶点均在 Brainsight 软件中标注于被试的解剖扫描上。EVC 靶点标注在距状皮层的后端终止处。线圈位置与距状沟垂直,从而确保脉冲轨迹沿着 EVC 方向。需要注意的是,与使用 visfatlas 提供的 V1 外部解剖掩模进行的 fMRI 分析不同,声称 TMS 特异性靶向 V1 并不直接,因为即便沿距状沟进行刺激,相邻的 V2 区也可能受到部分刺激。**因此,我们在此使用"EVC"这一术语。**VWFA 的定位基于文献中的经典坐标与个体在 fMRI 阅读任务中的脑活动模式的交汇。首先,分别在盲人与非盲人中计算 fMRI 1-back 任务中触觉与视觉通道下的阅读(词 + 伪词)> 控制对比(详见上文 fMRI:任务与刺激)。该流程使我们能够描绘 vOTC 对正字法加工的反应。随后,将位于经典 VWFA 位置的 10 mm 球形区域(MNI X = −41,Y = −57,Z = −16)通过由 SPM 分割步骤生成的逆形变场映射到每名被试的本征空间。接着,将这些球形区域与获得的脑活动模式进行重叠,从而得到在个体层面界定且在理论上受约束的 VWFA 阅读反应。最后,在个体调整后的 VWFA 球形区域内,选择这些阅读特异性激活的峰值作为 TMS 靶点。
此外,为确保所选部位在两组之间不存在系统性差异,将单被试数据归一化至 MNI 空间,并对所有坐标在参与者之间取平均。EVC 的平均(± 均值标准误)MNI 坐标(盲人 X = 0.9 ± 1.3;Y = −87 ± 0.8;Z = 1.2 ± 2.3;非盲人 X = 0.3 ± 1.3;Y = −88.7 ± 1;Z = 5.4 ± 3)在两组之间无差异,两独立样本 t 检验结果分别为 X、Y、Z:T(24) = 0. 31;p = 0.757,T(23) = 1.41;p = 0.**170,以及 T(22) = −1.**10;p = 0.28。同样,VWFA 的坐标也未发现组间差异(盲人 X = −39.9 ± 1;Y = −56.3 ± 1.5;Z = −13.4 ± 1.7;非盲人 X = −41 ± 0.7;Y = −56.6 ± 1;Z = −12.4 ± 1.8):对应 X、Y、Z 的检验为 T(22) = 0.93;p = 0.360,T(21) = 0.20;p = 0.846,以及 T(24) = −0.40;p = 0.691。每个 run 开始前都会检查配准质量,以排除携带神经导航传感器的头带发生意外位移。为进一步验证实验靶点位置,我们将归一化后的组水平坐标与近期视觉皮层图谱中视网膜拓扑映射的 V1 位置以及文献报告的 VWFA 坐标球形区域进行叠加,以确保靶点位于被刺激结构的边界之内。归一化后的靶点坐标用于可视化展示,见图 2B。此外,组平均与个体的归一化坐标见图 3。
预计 TMS 会在不同时间点影响被试在两个刺激部位上的表现。**因此,这两个部位可彼此作为内在对照。**在纳入控制时间窗后,本设计无需设置单独的控制部位。
TMS:方案。 刺激使用 MagPro X100 刺激器(MagVenture)与 70 mm "8"字形线圈完成。刺激通过 Brainsight 2 神经导航系统(Rogue Research)进行引导,并配合 Polaris Vicra 红外相机(Northern Digital)。在每个试次中,施加一组双脉冲 TMS,脉冲间隔为 40 ms(25 Hz),并在相对于试次开始的四个时间窗之一施加:−40/0、60/100、160/200 或 260/300 ms(图 2C)。在双脉冲刺激中,两次 TMS 脉冲的叠加相较于单脉冲会产生更大的效应。这进一步提高了在行为层面观察到 TMS 效应的可能性,并已在语言加工研究中成功使用。本设计改编自一项经过交叉验证的研究,该研究在场景知觉过程中对早期与高阶视觉皮层应用 TMS,但本研究在若干关键方面有所不同:(1)鉴于先天性盲人被试的获取受限,我们采用被试内设计,使每名参与者都在所有刺激部位接受刺激,而不是为每个刺激部位分别使用相互独立的样本;(2)为控制潜在的 TMS 副作用,我们加入了一个额外的控制时间窗(即 −40/0 ms),其在生物学上不太可能对感觉加工产生神经元贡献。由此,我们可以在每个刺激部位内部对实验时间窗进行比较。

图 3. 标准化到 MNI 空间的 TMS 靶点位置: 先天性盲人与有视者中早期视觉皮层与视觉词形区的组平均(上图)与个体(下图)坐标。实际刺激在每位被试的原始空间中进行,以控制被试间神经解剖变异。MNI 空间标准化在 Brainsight 软件中完成。TMS 靶点定位细节见材料与方法。
TMS 以基于静息运动阈值的个体化强度施加。运动阈值定义为在刺激对侧手区初级运动皮层时,在 10 次试次中至少 5 次可观察到明显手部抽动所需的最低刺激器输出。右侧初级运动皮层(M1)被标注为测量静息运动阈值的靶点。M1 位置通过解剖学标志确定,即右侧中央前回中的"omega knob",该处为 M1 中经典的手区位置。训练与正式实验的刺激强度设定为运动阈值的 110%,该运动阈值通过对右侧 M1 施加约 10 个脉冲中的一半可引发可见的左手抽动来测定。此前多项使用"虚拟损伤"方案的 TMS 研究已成功采用这种确定刺激强度的方法,以探究左侧 vOTC 在视觉阅读、触觉阅读与言语加工任务中的功能作用。盲人组的个体平均运动阈值(以最大刺激输出功率计)为 39.7%(SD = 8%;范围 28--54%),非盲人组为 36.7%(SD = 4.7%;范围 28--46%)。**两组在强度上无显著差异(两独立样本 t 检验 t(19.**4) = 1.16,p = 0.261)。在 EVC 刺激期间,被试未报告任何副作用。在 VWFA 刺激期间,由于靠近颈部肌肉,观察到轻微的头部抽动。多数被试注意到这些效应,但并不认为不适。一名盲人被试报告刺激令人不愉快,在该情况下,TMS 强度被降低至运动阈值的 100%。由于这些副作用与 TMS 时序无关,通过与同一刺激部位内的控制时间窗进行比较,可将这些外周效应纳入控制。
TMS 刺激部位与感觉通道的顺序在被试间进行平衡。**此外,在每一种感觉通道与 TMS 刺激部位的条件内,四个 TMS 时间窗的顺序在实验前对每名被试的每个条件进行随机化。**随机化遵循一条规则:相邻试次中,TMS 必须施加于相邻时间窗(例如 60/100 ms → 160/200 ms → 60/100 ms → −40/0 ms 等)。这种阶梯式程序在计时式 TMS 研究中被广泛使用,以降低被试区分不同时间窗刺激条件的概率,尤其是最早与最晚 TMS 起始时间之间的区分。
TMS:流程。 首先,要求被试提供知情同意并完成安全筛查。随后,使其熟悉 TMS 与神经导航系统的基本原理。接着,将被试与其包含已标注 TMS 靶点(EVC 与 VWFA)的结构性 MRI 扫描进行配准。之后,通过向右侧 M1 的手区施加单次 TMS 脉冲测量静息运动阈值。然后,分别针对阅读与言语加工进行两段简短的双脉冲 TMS 训练,以使被试熟悉任务与刺激。最后,实施实际 TMS 实验,分为四个 run,其间包含短暂休息。**此外,每个 run 开始前,我们会向靶点施加 TMS 以测试潜在副作用并确保被试舒适。**整个流程对盲人被试持续约 120 min,对非盲人被试持续约 90 min。
TMS:数据分析。 在数据分析之前,所有试次均被修剪,以排除异常过快或过慢的反应。对每名被试而言,这些试次被定义为在每个实验条件中按键反应快于或慢于 2.5 个标准差的试次(盲人占 2.6%,非盲人占 2.5%)。所有数据分析均使用 R(4.1.3)完成。
分析分为反应时与准确率两部分。对每一项指标,均使用线性混合效应模型对数据进行拟合。对盲人与非盲人两组分别建模时,用于预测准确率或反应时的固定因素由 TMS 刺激部位、词汇性与 TMS 时间窗的交互项表示。随机效应包含被试与刺激长度[模型方程:准确率/反应时 ∼ 刺激部位 * 时间窗 * 词汇性 + (1|被试) + (1|长度)]。**此外,为直接检验 TMS 刺激部位 × 时间窗 × 通道的交互作用,我们计算了将感觉通道作为固定因素并与其余因素交互的模型。最后,为检验盲人与非盲人两组之间的交互效应,我们使用 nlme R 软件包中的 lme 函数计算了包含组别因素的线性模型。**为处理阅读与言语之间的反应时差异,以及两组在阅读(触觉/视觉)上的差异,模型权重通过常数方差函数进行偏移,以允许组别 × 感觉通道的方差不等。然而,由于阅读与言语条件下的反应时差异,进一步的事后分析采用在组别与通道特异的模型内计算的估计边际均值,以便使用 emmeans 软件包对言语与阅读的标准误进行恰当估计。事后两两比较检验对所有执行的比较次数进行 Bonferroni 校正。具体而言,我们关注两类主要比较,这些比较在每个组别、受刺激部位与感觉通道内进行计算:(1)相对于控制时间窗的 TMS 效应(3 次比较);(2)所有"实验"时间窗之间的 TMS 效应(3 次比较,即早期 vs 中期、早期 vs 晚期、中期 vs 晚期)。因此,每个刺激部位(2)× 组别(2)× 感觉通道(2)共有 6 次比较,所有 p 值均乘以 24。之所以采用如此严格的流程,是为了在一定程度上抵消基于试次的线性混合效应模型这一更为稳健的方法所带来的影响;该方法相较于传统组水平统计会产生更多的自由度。我们未直接比较不同刺激部位与感觉通道之间的 TMS 效应,因为其中存在混杂因素,例如 TMS 脉冲的副作用,或每种感觉通道内加工的整体时间特征。
反应时数据使用 lmer 命令拟合,采用高斯链接函数,并纳入修剪后的正确反应(盲人阅读与言语分别为 1,854 与 1,928 个试次;非盲人阅读与言语分别为 1,782 与 1,774 个试次)。在 TMS 实验的准确率分析中,我们遵循 Jaeger 提出的指南,这些指南也在启发本实验的既往 TMS 研究中得到实施。 具体而言,鉴于反应的二分性质,准确率分析采用 LME4 R 软件包中的带二项链接函数的广义线性混合效应模型。反应时联合模型纳入 7,338 个正确试次。准确率联合模型纳入 7,796 个试次,其中包括正确(7,338)、错误(412)与缺失(46)反应,缺失反应被视为错误。对所有模型,为适应大量试次,模型拟合使用 "nAGQ = 0" 与 "control = glmerControl (optimizer = "nloptwrap")" 进行优化。所有模型还与一个零模型(仅随机截距)进行比较,并通过似然比检验进行偏差分析以确保拟合。**固定效应及其交互项的显著性通过 III 类方差分析进行检验,其中反应时模型使用 Satterthwaite 方法估计自由度,准确率模型使用 Wald 卡方检验。**所有事后两两比较均通过 emmeans R 软件包中的估计边际均值计算获得。
最后,由于估计边际均值属于基于模型的数值,可能较难解释(尤其对准确率而言),我们还提供观测值以便进行可视化检查与比较。"观测反应时"数据表示在每个实验条件下基于平均反应时计算得到的 TMS 效应。"观测准确率"图表示基于准确率计算得到的 TMS 效应,即相对于控制时间窗,在所有 TMS 时间窗内正确率(%)的下降幅度。
结果
行为结果
首先,我们考察了两组在词与伪词上的阅读速度。2(组别:盲人、非盲人)× 2(词汇性:词、伪词)的混合方差分析显示,组别主效应显著(F(1,38) = 128. 2,p < 0.**001),词汇性主效应显著(F(1,38) = 260.**4,p < 0.001),且组别 × 词汇性交互作用显著(F(1,38) = 39,p < 0.001)。经 Bonferroni 校正的事后检验如预期所示:在 1 min 内,两组朗读的词均多于伪词(配对 t 检验:盲人 T(19) = 9.1;pcorr < 0.001;非盲人 T(19) = 13.3;pcorr < 0.001);并且不论词汇性如何,非盲人的整体性视觉阅读均快于盲人的序列式盲文阅读(两独立样本 t 检验:伪词 T(28) = 7.9;pcorr < 0.001;词 T(37) = 13;pcorr < 0.001;图 4)。
接下来,fMRI 任务中的表现显示,尽管两组在语言条件下的表现相当,但盲人在退化语音控制条件的加工上优于非盲人,而在阅读控制条件的加工上则更差。我们分析了阅读与言语加工中所有条件(词、伪词、控制)的行为表现。我们在每个条件下计算 d′ 统计量,以校正被试的反应策略差异。以条件与通道为被试内因素、组别为被试间因素的混合方差分析显示,条件主效应显著(F(2,76) = 15. 7;p < 0.001),组别 × 通道交互作用显著(F(1,38) = 23.7;p < 0.001),通道 × 条件交互作用显著(F(2,76) = 3.8;p = 0.041),且组别 × 通道 × 条件交互作用显著(F(1,38) = 1.9;p < 0.001)。**简单主效应分析显示,组别(F(1,38) = 1.**1;p = 0.295)与通道(F(1,38) = 1.9;p = 0.171)均无效应。在每种通道内对条件与组别进行的计划比较显示:非盲人在言语控制条件下的表现差于词与伪词条件(两者均为 T(19) = 4.3;pcorr = 0.005),且其表现也差于盲人(T(24) = 3.3;pcorr = 0.019)。盲人在各通道内不同条件之间无差异(所有 pcorr > 0.444)。盲人在阅读控制条件(T(22) = 3;p = 0.006)与伪词条件(T(29) = 2.6;p = 0.016)下的表现差于非盲人,并且在言语伪词条件下的表现边缘性更差(T(19) = 1.8;p = 0.083;图 1B)。

图 4. 行为结果:伪词与词的阅读速度。 被试使用标准化阅读材料进行测试,并需在 1 min 内尽可能快速地朗读。***p < 0.001,Bonferroni 校正。
fMRI 结果
感觉剥夺不会使 V1 更偏好语言刺激
首先,为了刻画 EVC 对各类刺激的反应特征,我们使用经 Bonferroni 校正的单样本 t 检验,将不同组别与条件下的 BOLD(血氧水平依赖)信号水平与 0 进行比较(图 5,左)。 盲人被试的 EVC 在阅读过程中对所有类型的刺激均表现出显著反应(控制 T(20) = 3.9,pcorr = 0.032;伪词 T(20) = 5.3,pcorr = 0.001;词 T(20) = 4.1,pcorr = 0.019),在言语加工过程中同样对所有类型的刺激均表现出显著反应(控制 T(20) = 9.7,pcorr < 0.001;伪词 T(20) = 5.7,pcorr < 0.001;词 T(20) = 6.5,pcorr < 0.001)。另一方面,非盲人被试的 EVC 在阅读条件下对感觉控制刺激表现出显著反应(T(20) = 4.6,pcorr = 0.006),但对伪词(T(20) = 2.2,pcorr = 0.99)与词(T(20) = 2.4,pcorr = 0.801)均无显著反应。这一差异可能由控制条件下进行细致视觉搜索时视觉注意增强所驱动,而在其他条件中阅读更为自动化。**与使用声音的研究结果一致,我们在蒙眼的非盲人参与者的 EVC 中发现,在言语加工的所有条件下均出现负向 BOLD 反应(控制 T(20) = −4.**2,pcorr = 0.016;伪词 T(20) = −6.4,pcorr < 0.001;词 T(20) = −6,pcorr < 0.001)。
接下来,为检验反应的选择性,我们进行了混合方差分析,结果显示组别主效应显著(F(1,38) = 63. 4,p < 0.001),感觉通道主效应显著(F(1,38) = 9.4,p = 0.004),条件主效应显著(F(2,76) = 18.6,p < 0.001)。****关键的是,存在显著的组别--通道--条件三重交互作用,提示 EVC 在不同组别间呈现不同的神经反应模式(F(2,76) = 12.****9,p < 0.001;事后两两比较细节见表 2)。尽管上述分析显示盲人的 EVC 在阅读时对所有类型的触觉刺激均有反应,但这些反应缺乏选择性,因为感觉控制刺激、词与伪词之间差异不显著(图 5,上;表 2)。然而,在言语加工中,低水平的控制声音在 EVC 中诱发的反应强于词或伪词,这提示在听觉通道中可能更偏好低水平刺激,或该条件可能具有更高的注意需求(图 5,上;表 2)。在非盲人的视觉阅读中也观察到类似模式,即 V1 对低水平阅读控制刺激的反应强于对词或伪词的反应,且后两者之间无差异。此外,非盲人在言语加工中各条件之间未发现差异(图 5,上;表 2)。
**最后,尽管超出了本文的范围,我们也检验了该三重交互作用的其他层面:在每个条件内,对组别(盲人、非盲人)与感觉通道(阅读、言语)进行比较。简要而言,这些结果显示,盲人与非盲人在 V1 活动水平上的差异仅在言语加工(词、伪词与控制)期间显著,而在阅读期间不显著。**最后,先天性盲人被试在控制条件下对言语的 V1 激活强于对触觉阅读的激活,但在词与伪词加工中无差异。如预期,非盲人在所有条件下对(视觉)阅读的 V1 激活均强于对言语加工的激活。上述检验的细节见表 3。

图 5. 功能性 MRI 结果: 先天性盲人与有视者在阅读(触觉盲文或视觉)或言语加工过程中,对感觉控制刺激、伪词与词的反应,分别展示于早期视觉皮层(上图)与视觉词形区(VWFA,下图)。提取信号的兴趣区(ROI)以红色标示:V1 数据来自 visfatlas 中合并的初级视觉皮层掩膜;VWFA 数据来自放置在既定坐标处、半径 5 mm 的球形 ROI。柱状图上方的星号表示相对于 0 的单样本 t 检验显著性,柱状图之间的星号表示事后配对 t 检验显著性。所有 p 值均采用 Bonferroni 校正以控制多重比较。NS,不显著;*p < 0.05,**p < 0.01,***p < 0.001。

图 6. TMS 对反应时的影响: 按组别(左:先天性盲人;右:有视者)、感觉通道(上:阅读;下:言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示。图中 TMS 效应通过对比计算得到:将各实验时间窗(刺激呈现后 60/100、160/200 或 260/300 ms 施加 TMS)下的反应时估计边际均值,与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的估计边际均值进行对比。误差线表示对比估计值的标准误。原始观测到的平均 TMS 效应另见图 12。时间窗标签上方的符号表示其相对于控制时间窗的对比显著性。NS,不显著;*p < 0.05;**p < 0.01;***p < 0.001;t p = 0.1,Bonferroni 校正(细节见材料与方法)。
VWFA 偏好词汇材料,不受感觉剥夺与加工通道影响
先天性盲人被试的视觉词形区(VWFA)在阅读与言语加工过程中对伪词与词均表现出显著反应(阅读伪词 T(19) = 5.2,pcorr = 0.002;阅读词 T(19) = 5.6,pcorr < 0.001;言语伪词 T(19) = 7;pcorr < 0.001;言语词 T(19) = 6.7;pcorr < 0.001;图 5,下)。此外,盲人在控制条件下也出现显著反应,但仅出现在言语加工中(T(19) = 4. 3;pcorr = 0.022),而不出现在阅读中(T(19) = 1.3;pcorr = 0.999)。在非盲人中,伪词(T(19) = 6.1;pcorr < 0.001)与词(T(19) = 5.1;pcorr = 0.004)均诱发显著活动,但仅在视觉阅读期间出现。**我们在非盲人的言语加工中未观察到任何条件下的显著活动(所有 ps > 0.**517)。
接下来,我们使用混合方差分析检验反应的选择性,其结果与 EVC 类似,显示组别主效应显著(F(1,38) = 7. 9,p < 0.001)、感觉通道主效应显著(F(1,38) = 5.9,p = 0.019)以及条件主效应显著(F(2,76) = 37.5,p < 0.001)。然而,由于在两组的两种通道中,词与伪词相较于感觉控制条件均诱发更高的反应,因此不存在显著的组别--通道--条件三重交互作用,这提示 VWFA 在两组之间呈现相似的神经反应模式(F(2,76) = 0.7,p = 0.478;具体比较见表 2)。相反,我们观察到两个双因素交互作用:组别 × 通道(F(1,38) = 38.9;p < 0.001)与组别 × 条件(F(2,76) = 4.6;p = 0.013),其驱动因素为盲人组存在言语反应(图 5,下)。不同于在 V1 中观察到的结果,VWFA 的神经反应显示对词汇材料的偏好,这体现在先天性盲人与非盲人在阅读与言语中对词与伪词的激活强于对感觉控制条件的激活(图 5,下;表 2)。尽管更弱,这一模式在非盲人的言语加工中也可观察到。****为直接检验关于盲人与非盲人在不同 ROI、通道与条件之间活动差异的假设,我们在每个组内进行了额外的交互作用分析。****结果显示,ROI × 通道 × 条件的交互作用在盲人(F(2,38) = 10.6,p < 0.001)与非盲人(F(2,38) = 5.2,p = 0.01)中均存在。
此外,我们还比较了各条件下的活动水平在组别(盲人、非盲人)之间以及感觉通道(阅读与言语;在每个组内)之间的差异。****结果显示,阅读期间盲人与非盲人之间无差异;而在言语加工期间,盲人的 VWFA 在所有条件下的反应显著强于非盲人(表 3)。****最后,在每个组内对两种通道进行比较显示:盲人在触觉阅读与言语加工之间各条件均无差异;非盲人则在所有条件下均表现出对视觉阅读相较于言语的偏好(表 3)。

图 7. TMS 对准确率的影响: 按组别(先天性盲人、有视者)、感觉通道(阅读、言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示。图中 TMS 效应通过对比计算得到:将各时间窗下的准确率与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的准确率进行对比。所有效应以线性混合效应分析中使用的 logit 尺度呈现,对应于准确率约 5% 的上下波动。误差线表示对比估计值的标准误。以准确率变化(%)计算的原始观测 TMS 效应另见图 14。每个时间窗上方的数值表示其相对于控制时间窗的对比显著性。NS,不显著。

图 8. TMS 反应时:词汇性的主效应在不同组别与通道中的表现。 盲人组(左)与有视者组(右)在阅读(上)与言语加工(下)中,对伪词与词的反应时估计边际均值。每个子图内数据在 TMS 刺激部位(早期视觉皮层与视觉词形区)以及 TMS 时间窗(控制、早期、中期、晚期)上取平均(细节见材料与方法)。按上述实验条件拆分的数据见图 10(估计边际均值)与图 13(观测反应时)。***p < 0.001。
TMS 结果
盲人的 EVC 与 VWFA 在阅读的早期阶段提供支持,其方式与非盲人相似
首先,我们考察了先天性盲人组在阅读与言语加工中由 TMS 引起的反应时变慢在空间与时间上的模式。我们通过将包含所有固定效应(感觉通道、TMS 刺激部位、TMS 时间窗、词汇性)与随机效应(被试、刺激长度)的完整模型与零模型进行比较,确保纳入这些效应后整体模型拟合得到改善(即仅包含被试随机截距的模型;χ(232) = 3,989. 9,p < 0.001)。**关键的是,完整线性混合效应模型显示感觉通道、受刺激部位与时间窗之间存在显著三重交互作用,表明 TMS 在阅读与言语中对盲人 EVC 与视觉词形区的影响不同(F(3,3736) = 2.**84,p = 0.036)。我们还观察到感觉通道主效应(F(1,3736) = 6,619;p < 0.001)、部位主效应(F(1,3736) = 41.9;p < 0.001)、时间窗主效应(F(3,3736) = 9.3;p < 0.001)以及词汇性主效应(F(1,3736) = 262.4;p < 0.001)。总体而言,相较于言语,加工在阅读时更慢;相较于控制时间窗,所有实验时间窗均更慢;当 TMS 施加于视觉词形区时更慢;当被试加工伪词时更慢。

表 2. fMRI 任务中早期视觉皮层 BOLD 反应在组别与条件之间的事后两两比较
接下来,为了考察 EVC 与视觉词形区在不同通道下的特异性模式,我们基于通道特异模型的估计边际均值进行了两两比较。理论上,TMS 不应在控制时间窗(−40/0 ms)干扰刺激加工。因此,我们将刺激特异性定义为每个"实验"时间窗(即 60/100、160/200 与 260/300 ms)下的反应时与控制时间窗之间差异的显著性,从而可控制与刺激本身有关的所有混杂因素。当盲人被试以触觉盲文阅读时,施加于 EVC 的 TMS 在刺激呈现后的 60/100 ms(T(1824) = 3.27;pcorr = 0.026)、160/200 ms(T(1824) = 3.22;pcorr = 0.031)与 260/300 ms(T(1824) = 3.69;pcorr = 0.005)均引起反应时变慢(图 6,左上)。这一效应表明盲人的 EVC 从最早时刻起就参与触觉刺激加工,但该效应在时间上较为泛化,不具备时间特异性。相反,在盲人的视觉词形区中,阅读期间最早时间窗的 TMS 效应缺失(T(1824) = 0.72;pcorr = 0.999),但在后两个时间窗均显著,且变慢幅度随着时间推移逐步增加并在最晚时间窗达到更大值(160/200 ms:T(1824) = 3.88;pcorr = 0.003;260/300 ms:T(1824) = 5.27;pcorr < 0.001;图 6,左上)。该结果提示视觉词形区仅在对刺激完成初步感觉评估之后才参与触觉阅读。在盲人的言语加工中,TMS 未引起任何相对于控制基线时间窗的显著反应时差异(EVC 与视觉词形区的所有 pcorr > 0.99;图 6,左下)。

图 9. TMS 对反应时的影响在词汇性上的差异: 按词汇性(词、伪词)、组别(左:先天性盲人;右:有视者)、感觉通道(上:阅读;下:言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示。图中 TMS 效应通过对比计算得到:将各实验时间窗(刺激呈现后 60/100、160/200 或 260/300 ms 施加 TMS)下的反应时估计边际均值,与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的估计边际均值进行对比。实线表示词的 TMS 效应,虚线表示伪词的 TMS 效应。原始观测到的平均 TMS 效应另见图 13。误差线表示对比估计值的标准误。每个时间窗标签上方的星号表示该时间窗相对于控制时间窗在词或伪词条件下的对比显著性;同一时间窗内的星号表示词与伪词之间 TMS 效应幅度的差异。*p < 0.05;***p < 0.001;t pcorr = 0.117(puncorr = 0.004),Bonferroni 校正(细节见材料与方法)。
接下来,为进一步考察视觉皮层在阅读与言语加工中的时间性参与模式,我们比较了相邻实验时间窗之间 TMS 效应幅度的差异。 当 TMS 施加于盲人 EVC 时,无论是触觉阅读还是言语加工,60/100、160/200 与 260/300 ms 之间均无差异(所有 pcorr > 0.99)。然而,在视觉词形区中,我们发现后续时间窗相较于最早时间窗的差异具有触觉阅读特异性。**具体而言,与 60/100 ms 时间窗相比,当 TMS 在刺激呈现后 160/200 ms(T(1824) = 3.**17;pcorr = 0.036)与 260/300 ms(T(1824) = 5.04;pcorr < 0.001)施加时引起更大的变慢,而后两者之间无差异(T(1824) = 1.37;pcorr > 0.99;图 6,左上)。
我们在非盲人对照组中采用了相同的分析方法,纳入视觉阅读与言语加工数据。在非盲人中,我们同样观察到感觉通道主效应(F(1,3511) = 2,103.7;p < 0.001)、部位主效应(F(1,3511) = 24.9;p < 0.001)、时间窗主效应(F(3,3511) = 5.5;p < 0.001)以及词汇性主效应(F(1,3511) = 255.8;p < 0.001)。总体而言,阅读更慢;相较于控制时间窗,所有实验时间窗更慢;当 TMS 施加于视觉词形区时更慢;加工伪词时更慢。我们观察到感觉通道 × TMS 时间窗的双因素交互作用:相较于控制时间窗,所有实验时间窗的显著变慢仅出现在阅读中(ps < 0.028)。此外,我们还观察到感觉通道 × 受刺激部位的双因素交互作用:反应时在视觉词形区刺激时更慢,同样仅限于阅读(p < 0.001)。在非盲人中,感觉通道、受刺激部位与 TMS 时间窗的三重交互作用不显著(F(3,3511) = 0.61;p = 0.608)。

表 3. fMRI 定位任务中早期视觉皮层与视觉词形区 BOLD 反应在组别与条件之间的事后两两比较
尽管非盲人中的 TMS 时间模式较盲人更弱,但两组之间仍保持了显著相似性。首先,我们以控制时间窗为基线检验 TMS 的特异性。结果显示,当非盲人进行视觉阅读时,施加于其 EVC 的 TMS 在最早(60/100 ms:T(1753) = 3.24;pcorr = 0.029)与最晚时间窗(260/300 ms:T(1753) = 3.13;pcorr = 0.042)使反应时变慢(图 6,右上),支持非盲人 EVC 中前馈与反馈加工可能存在相互作用。尽管这些变慢幅度(约 40 ms)远小于盲人的变慢幅度(约 120 ms),但两组的差异均构成相对于基线(控制)反应时约 6--7% 的增加。我们未在中间时间窗(刺激呈现后 160/200 ms)发现显著 TMS 效应(T(1753) = 2. 7;pcorr = 0.168),这可能部分源于我们对多重校正所采取的保守策略(puncorr = 0.007)。同样类似于盲人,当 TMS 作用于非盲人的视觉词形区时,阅读反应时在中间(T(1753) = 4.03;pcorr = 0.001)与晚期(T(1753) = 4.58;pcorr < 0.001;图 6,右上)时间窗相对于控制基线均变慢,从而支持腹侧枕颞皮层中存在高阶加工这一观点。我们未观察到非盲人在言语感知中由 TMS 引起的任何显著反应时变化(所有 pscorr > 0. 99,所有 psuncorr > 0.155)。
接下来,与盲人相同,我们比较了相邻实验时间窗之间 TMS 效应幅度的差异。在非盲人中,我们未观察到 EVC 在阅读或言语中任何时间窗之间的显著差异(所有 pscorr > 0. 99)。在视觉词形区中,变慢幅度随时间逐步增大,并呈现一种阅读特异的趋势,但在多重比较校正后未达到统计学显著。尽管如此,与早期时间窗相比,中间时间窗(T(1753) = 2.33;puncorr = 0.019,pcorr = 0.466)与晚期时间窗(T(1753) = 2.86;puncorr = 0.004,pcorr = 0.010;图 6,右上)引起的反应时增加更大。因此,尽管非盲人在视觉阅读中由 TMS 引起的变慢幅度小于盲人在触觉阅读中的变慢幅度,但相对的时间模式在两组之间仍保持了显著相似性。
**为明确检验两组之间空间与时间性 TMS 模式的差异,我们使用一个联合的混合线性效应模型检验组别、TMS 刺激部位、感觉通道与时间的四重交互作用,并加入额外偏移以处理组别 × 通道的方差不等,从而校正两组在阅读(触觉盲文 vs 视觉字母表)中的反应时差异,而不影响言语加工。该交互作用不显著(χ(23) = 2.**67,p = 0.45)。
接下来,我们考察了词汇判断任务中由 TMS 引起的准确率效应。完整模型显示组别、感觉通道、TMS 刺激部位与时间窗之间的四重交互作用呈趋势(χ(23) = 7. 12,p = 0.068)。**然而,通过通道与组别特异模型进一步检验时间性 TMS 模式显示,均未发现显著的时间 × 部位交互作用(盲人阅读 χ(23) = 1.**57,p = 0.66;盲人言语 χ(23) = 4.75,p = 0.19;非盲人阅读 χ(23) = 4.58,p = 0.21;非盲人言语 χ(23) = 3.55,p = 0.31)。对跨组别、时间、部位与感觉通道的 TMS 效应进行探索性分析(即在每个实验条件中,相对于控制时间窗,TMS 刺激引起的准确率变化)同样未显示效应(图 7)。鉴于总体准确率达到 94%,当前任务很可能对被试而言过于简单,因而难以通过 TMS 诱发错误(任务难度效应的引用)。

图 10. TMS 准确率:词汇性的主效应在不同组别与通道中的表现。 盲人组(左)与有视者组(右)在阅读(上)与言语加工(下)中,对伪词与词的反应时估计边际均值。每个子图内数据在 TMS 刺激部位(早期视觉皮层与视觉词形区)以及 TMS 时间窗(控制、早期、中期、晚期)上取平均(细节见材料与方法)。按上述实验条件拆分的数据见图 14(估计边际均值)与图 13(观测错误率)。***p < 0.001。
词汇性随时间调节 TMS 效应,但仅出现在盲人组
EVC 与视觉词形区的时间层级是否会受到刺激词汇性的影响? 词与伪词具有相似的低水平属性,并且二者都遵循正字法规则,但在语义意义上存在差异,语义意义仅存在于真实词中。我们最初的 fMRI 结果提示,在 EVC 与视觉词形区中,这两类刺激的活动水平没有差异(图 5)。 尽管如此,我们利用被试在 TMS 研究中完成了词汇判断任务这一机会,通过将刺激划分为词与伪词,进一步检视词汇性是否会调节盲人与非盲人视觉皮层参与的程度。**需要注意的是,估计边际均值是基于仅 10 个试次的平均计算得到,因此更具探索性,尤其是在联合线性模型中并未发现组别 × TMS 刺激部位 × 时间窗 × 词汇性的四重交互作用(χ(23) = 0.**43,p = 0.94)。
由于伪词相较于词更难加工,我们如预期地发现词汇性主效应(伪词反应时慢于词)在盲人组的阅读与言语加工中均存在(阅读 F(1,1824) = 273. 4;p < 0.001;言语 F(1,1898) = 99.2;p < 0.001),在非盲人组的阅读与言语加工中同样存在(阅读 F(1,1753) = 173.7;p < 0.001;言语 F(1,1745) = 151.2;p < 0.001;图 8)。**此外,交互作用分析显示,盲人组存在显著的通道 × 词汇性交互作用(F(1,3736) = 81.**2,p < 0.0001)以及通道 × 时间 × 词汇性交互作用(F(3,3736) = 3,p = 0.029),表明刺激词汇性会以不同方式影响阅读与言语的时间反应特征。然而,这些模式在 EVC 与 VWFA 之间相似(将 TMS 刺激部位纳入后的四重交互作用 F(3,3736) = 0.04,p = 0.993)。在非盲人中,我们未发现显著的词汇性交互作用。
接下来,我们分别对词与伪词更细致地探索了 TMS 对反应时的时间过程。 在盲人组中,当对 EVC 施加 TMS 时,前两个时间窗中词与伪词的效应相当。然而,在最晚时间窗(相对于控制时间窗),诱发的变慢仅对词选择性增强(T(1824) = 3.51;pcorr = 0.022),而对伪词不显著(T(1824) = 1.71;pcorr = 0.999),提示刺激意义可能在盲人 EVC 的较晚阶段神经计算中发挥作用(图 9,左上)。相反,在盲人的视觉词形区刺激期间,词汇性并未以不同方式影响反应时:对词(T(1824) = 4.22;pcorr = 0.001)与伪词(T(1824) = 3.26;pcorr = 0.055,puncorr = 0.001)均观察到向最晚时间窗逐步增大的、相当的变慢幅度。为直接检验变慢幅度随时间窗的线性增加,我们在每个刺激部位的刺激条件下分别对词与伪词拟合了跨时间窗的线性对比。在 VWFA 中,我们对词(T ratio(1824) = 4.9,p < 0.0001)与伪词(T ratio(1824) = 3.6,p < 0.**001)均发现显著拟合;而在 EVC 中,仅对词发现线性拟合(T ratio(1824) = 3.**3,p = 0.004),对伪词则未发现(T ratio(1824) = 1.7,p = 0.378)。
**在非盲人组中,我们未观察到在 EVC 刺激下、阅读过程中任何显著的词汇性效应。然而,在视觉词形区刺激下,阅读词在后续时间窗中出现变慢(中间时间窗 T(1753) = 4.**24;pcorr = 0.001;晚期时间窗 T(1753) = 4.21;pcorr = 0.001),而对伪词的效应要弱得多(中间时间窗 T(1753) = 1.51;pcorr = 0.999,puncorr = 0.131;晚期时间窗 T(1753) = 2.29;pcorr = 0.999,puncorr = 0.022;图 9,右上)。
最后,在言语加工中,我们观察到词汇性效应较弱的迹象,且仅限于盲人组的早期时间窗,表现为对词选择性的变慢,且在 EVC(T(1898) = 2. 14;puncorr = 0.026)与视觉词形区(T(1898) = 3.02;puncorr = 0.003;pcorr = 0.062;图 9,下)中均可见。此外,我们通过检验边际效应来比较 TMS 效应幅度的差异。具体而言,我们比较了各时间窗相对于控制时间窗的反应时对比在词与伪词之间的差异(对比的对比)。结果显示,在盲人组中,TMS 在言语加工的早期时间窗中对词诱发的变慢大于对伪词,在 EVC 中表现为(对比估计 = 106.6;SE = 34.5,z = 3.09;pcorr = 0.048),在 VWFA 中表现为(对比估计 = 106.6;SE = 34.5,z = 3.09;puncorr = 0.005;pcorr = 0.11)。在非盲人组中,即便采用更宽松的显著性标准,也未观察到言语加工的效应。
与主要分析相同,TMS 未影响盲人被试的准确率,在阅读或言语加工中既无显著的词汇性主效应(所有 ps > 0.344;图 10),也无显著交互作用(所有 ps > 0.285)。在非盲人组中,我们在阅读中发现显著的词汇性主效应(χ(21) = 5,p = 0. 025),表现为伪词的准确率更低。非盲人组中无任何词汇性交互作用达到显著(图 11)。最后,我们检查了 TMS 对反应时的原始观测模式(图 12)、跨词汇性的反应时(图 13)、准确率(图 14)以及跨词汇性的准确率(图 15),其结果与用于统计分析的混合线性模型一致。
讨论
****我们结合 fMRI 与计时式 TMS,以刻画先天性盲人与非盲人在通过触觉(盲文)或视觉进行阅读以及加工言语时的大脑反应,并刻画 EVC 与 VWFA 之间的计算层级。****我们的结果支持这样一种观点:非盲人与先天性盲人的枕叶皮层在语言加工上的时空层级在很大程度上相似。

图 11. TMS 对准确率的影响在词汇性上的差异: 按词汇性(词、伪词)、组别(先天性盲人、有视者)、感觉通道(阅读、言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示。图中 TMS 效应通过对比计算得到:将各时间窗下的准确率与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的准确率进行对比。实线表示词的 TMS 效应,虚线表示伪词的 TMS 效应。所有效应以线性混合效应分析中使用的 logit 尺度呈现,对应于准确率约 5% 的上下波动。以准确率变化(%)计算的原始观测 TMS 效应另见图 15。误差线表示对比估计值的标准误。每个时间窗上方的数值表示其相对于控制时间窗的对比显著性。

图 12. 观测到的 TMS 反应时效应的对照可视化:跨组别、通道、刺激部位与时间的观测数据。 按组别(左:先天性盲人;右:有视者)、感觉通道(上:阅读;下:言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示。图中 TMS 效应通过对比计算得到:将各时间窗(刺激呈现后 60/100、160/200 或 260/300 ms 施加 TMS)下的平均反应时,与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的平均反应时进行对比。误差线表示对比估计值的标准误。

图 13. 观测反应时的对照可视化(词汇性效应)。 跨组别(左:先天性盲人;右:有视者)、感觉通道(上:阅读;下:言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示的反应时 TMS 效应。图中 TMS 效应通过对比计算得到:将各时间窗内观测反应时均值(刺激呈现后 60/100、160/200 或 260/300 ms 施加 TMS)与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的观测均值进行对比。实线表示词的 TMS 效应,虚线表示伪词的 TMS 效应。误差线表示对比估计值的标准误。

图 14. 观测到的 TMS 准确率效应的对照可视化:跨组别、通道、刺激部位与时间的观测数据。 图中展示以百分比错误率表示的 TMS 效应:将各时间窗下的准确率与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的准确率进行对比得到。误差线表示对比估计值的标准误。

图 15. 观测准确率的对照可视化(词汇性效应)。 按组别(左:先天性盲人;右:有视者)、感觉通道(上:阅读;下:言语)、TMS 刺激部位(早期视觉皮层、视觉词形区)与时间展示的准确率 TMS 效应。图中展示以百分比错误率计算的效应:将各时间窗(刺激呈现后 60/100、160/200 或 260/300 ms 施加 TMS)下的观测反应时均值与控制时间窗(相对于刺激呈现为 −40/0 ms 施加 TMS)下的观测均值进行对比得到。实线表示词的 TMS 效应,虚线表示伪词的 TMS 效应。误差线表示对比估计值的标准误。
使用 fMRI,我们观察到在盲人与非盲人中,EVC 在阅读时对所有条件(词、伪词与感觉控制)均有反应,而不受其语言属性影响,这提示 EVC 在两组中均支持低水平的感觉提取。 确实,盲人的 V1 会在诸如纹理探索、振动触觉刺激或声音等简单任务中被激活,而不需要任何语言情境。此外,盲人的 EVC 对所有声音均有反应。盲人的 V1 相较于非盲人对言语的反应此前已有报道。**在此,V1 在无意义控制条件下的活动显著高于词与伪词,与非盲人在视觉加工中的模式相似(图 5)。**这提示,激活盲人的 EVC 并不需要高阶语言操作,因为其可能保留其对声音与触觉的调谐。这些早期的跨模态信号来自何处?研究提示,它们可能来自皮层下区域的自下而上输入,代表刺激评估的感觉成分。尽管盲人的视辐射会发生退变,这些通路仍可能被其他感觉通道所利用,从而使其在一定程度上呈现出与非盲人 EVC 部分相似的作用。在这一观点下,低水平加工可能起源于外侧膝状体到 V1 第 4 层的输入,并伴随来自其他感觉区域的皮层-皮层输入。
有趣的是,EVC 中的阅读效应还延伸到了其他时间窗(160/200 与 260/300 ms)。这些计算的性质是什么?首先,在阅读情境下,它们可能与对已加工输入的序列式更新有关。尤其在盲文阅读中,这种延伸效应可能由从一个字母推进到下一个字母所驱动。值得注意的是,在非盲人中也观察到类似向较晚时间窗的延伸,而非盲人的视觉阅读更偏整体性。尽管这可能与一种简化的皮层层级观相悖,但在非盲人的 EVC 中也确实观察到早期加工之外的效应。具体而言,阅读时的皮层内记录显示,在初始活动增加之后,非盲人的 EVC 会在刺激呈现后约 500 ms 再次激活。这也与来自视觉掩蔽研究的混合结果一致,这些研究报告的关键时间窗范围从 −50 到 200 ms,提示施加于 V1 的 TMS 很可能反映了多种复归性的视觉过程。因此,由于广泛的皮层-皮层连接以及前馈与反馈信号的混合,非盲人中 V1 在更复杂加工中的作用可能被观察到。
**超越 EVC 之外,本研究结果显示,高阶的、对词选择性的视觉皮层(推定为 VWFA)保留了其对语言材料的偏好,这体现在两组中词与伪词相较于控制刺激诱发更高反应,并且这一点也进一步得到我们的 TMS 结果在因果层面的支持。与其他关于阅读的计时式 TMS 研究一致,我们的结果凸显 vOTC 仅在 100/150 ms 之后才参与阅读。**由于 VWFA 仅在较晚阶段至关重要,其作用可能与盲人中被保留的正字法分析有关,这支持视觉皮层组织得以保留的假设。尽管其他 fMRI 研究已显示盲人以及受训的非盲人在视觉阅读与触觉阅读之间存在相似性,我们的结果表明,盲人视觉皮层在低水平与高阶区域之间的动态关系可能同样被保留。此外,两组在阅读与言语中对词汇刺激的反应均强于对控制条件的反应,这凸显了 vOTC 中语言加工的多模态性质,即便在非盲人中亦然。然而,这些反应的确切性质仍存在争论。结合 TMS 效应,这些结果提示操作顺序可能以一种后部到前部的梯度,从 EVC 经过 vOTC 传播至语言网络,在非盲人与盲人中均如此。
****我们的 fMRI 数据显示,语言偏好仅出现在 vOTC 而非 EVC 中。此外,我们的 TMS 结果显示,在非盲人与盲人中,EVC 的计算可以以相似方式先于 vOTC 的计算,这提示基本的计算梯度可能在很大程度上不依赖于终身缺乏视觉经验。****进一步而言,尽管盲人 EVC 中存在高阶语言加工的证据此前已有报道,但在非盲人的 EVC 中也发现了非视觉加工的痕迹,包括场景表征、言语加工与物体表征。因此,EVC 可能参与多种由自下而上与自上而下信号驱动的过程,从而同时表现出低水平加工(前馈输入)与来自高阶视觉区的反馈信号所支持的更复杂任务。这些过程还可能受到注意需求的调节。在此,更高的注意需求可能部分调节 EVC 对控制条件的 BOLD 反应(控制条件包含针对不可言语化材料的 1-back 任务)。总体而言,我们的结果支持这样一种观点:V1 可能作为一种超越低水平表征的"认知地图"。
与阅读相比,除盲人组在最早时间窗中出现较弱的、对词选择性的变慢之外,我们在言语加工期间并未观察到显著的 TMS 效应。 考虑到上述关于视觉皮层参与言语加工的证据,这似乎令人困惑,但可能存在若干解释。第一,尽管我们力求采用一种在组别与条件之间使用相同 TMS 时间窗的平衡设计,但听觉、视觉与触觉加工在时间上本质不同。**因此,若使用为言语量身定制的 TMS 时序,可能会揭示不同的结果模式。**第二,尽管视觉皮层中的言语相关活动在盲人与非盲人中均有报道,但这些活动在一定程度上可能只是伴随现象,并未在因果上参与听觉加工,因为它们可能反映了早期感觉区域之间连接或自上而下信号的副产物,这与将 V1 视为一种"多模态认知黑板"的理论相一致。最后,由于在盲人中 TMS 效应选择性地出现在有意义词的加工上(图 9),盲人 EVC 对声音的反应可能受到语义意义的调节。因此,V1 在接收以前馈为主、但也包含反馈信号的情况下,可能更偏好对空间排列的盲文纹理进行低水平加工,同时也支持更复杂的、由反馈驱动的加工(例如语义)。在此,盲人 EVC 刺激期间在最晚时间窗中对词而非伪词观察到更强的变慢,可能部分支持这种机制(图 9),而这一效应在非盲人中不存在。这些结果提出一个耐人寻味的可能性:对于言语而言,EVC 会增强其对更高层级语义加工的调谐,这在非盲人中已可观察到,但仅在盲人中才会在因果上支持知觉/行为。盲人 EVC 的这种反应可能建立在非盲人中同样可观察到的既有连接之上,但由于跨模态可塑性,这些连接仍可能表现出功能性重组。然而,鉴于该分析具有探索性,这些结果应谨慎解释。
我们承认本研究存在局限性。若增加针对每种通道专门设定的 TMS 时间窗,将能够追踪阅读与言语中语言加工的更晚阶段,并对组别与通道之间进行更直接的比较。尽管我们的主要目标是通过计时式 TMS 追踪视觉皮层在语言加工中的因果参与,但如果采用一种更精细、类别界定更清晰的设计,将有助于通过多体素模式分析对精细调谐的表征作出推断。
****总之,我们的发现提示,盲人与非盲人在阅读层级的初始阶段相似,即在 vOTC 之前,V1 对盲文与视觉阅读均至关重要,从而支持 V1 原有功能的部分保留。****尽管在言语中未观察到这种层级,但盲人的 EVC 对有意义词的加工至关重要,这提示可能存在来自语言网络的反馈信号驱动更复杂的计算。因此,尽管失明可能扩展被剥夺皮层所执行的功能,但其计算层级可能并不依赖视觉经验。
参考文献
Matuszewski, J., Bola, Ł., Collignon, O., & Marchewka, A. (2025). Similar Computational Hierarchies for Reading and Speech in the Occipital Cortex of Sighed and Blind: Converging Evidence from fMRI and Chronometric TMS. The Journal of Neuroscience , 45 (20), e1153242024.