.

GeorgeGeorgiou人天然库和

氟虽可以使牙齿洁白但也应适量使用 http://www.bdfyy999.com/bdf/jiankangzatan/m/28722.html

体液免疫系统对抗原的有效识别取决于抗体库中大量的序列和构象多样性免疫细胞。在抗原激活后,原始B细胞(NBCs)受到刺激,使抗体基因发生体细胞超突变(SHM),启动B细胞受体(BCR)信号。表达高亲和力BCRs的B细胞能够更好地竞争抗原,在近一步的SHM中获得优先增殖和进一步抗体序列多样化的信号。在结构水平上,体细胞突变抗体相对于种系抗体,通常表现出构象灵活性降低,抗原解离率降低,结合选择性增加。

了解人抗体库的特征对于免疫学研究至关重要。同时还需要了解病原体历史和环境暴露,及如何调节初始抗体的序列和构象特性,从而产生成熟的抗体库,提供有效的保护。来自人类供体的重链可变(VH)基因库的高通量DNA测序,已经描述了由不同B细胞亚群编码的抗体之间的差异。据报道,抗原接触导致相对于纯天然谱系的重链第三互补决定区(CDR-H3)的长度和疏水性降低,并CDR-H3氨基酸含量发生改变。对同卵双胞胎中VH组成的分析,证明种系基因的使用是遗传预定的。其他研究表明,不同供体对特定B细胞亚群的VH基因使用,与体内不同的B细胞亚群相比,关系更为密切,但由于技术上的限制,研究仅限于分别分析重链和轻链库。早期使用有限稀释和单细胞克隆来确定少量B细胞中完整抗体基因序列(即小量B细胞中的VH和轻链变量(VL)或VH:VL)的研究为B细胞和抗体库的发展方面提供了宝贵的见解。但是,由于B细胞克隆的通量低,因此无法解决许多关键问题,而这些问题需要更全面地涵盖VH:VL。例如,重链和轻链是以组合方式配对还是某些种系重链基因在结构上倾向于与特定的轻链基因配对仍然存在争议。

尽管目前无法进行全库的晶体学研究,但计算机蛋白质建模的进展已使具有中等长度CDR环的抗体的结构得以准确预测。特别是,使用RosettaAntibody预测的X射线结构建立的计算模型在框架预测中RMSD为1–1.5?,在CDR-H3预测中为2?。但是,使用RosettaAntibody进行谱库分析首先需要为每种抗体提供高质量的配对VH和VL序列数据。其次,大量的计算资源可用于高效执行抗体库的大规模计算建模;最后,还有一套适合库级比较的信息工具和统计指标。这样可以实现在抗原接触位点的3D水平上研究对于疾病和自身免疫重要的抗体库的理化性质。

本研究中采用一项最新开发的技术,该技术旨在从单个B细胞中大规模鉴定天然配对的VH:VL谱图,并结合高通量计算模型对外周血中循环的人类天然库和免疫库序列和结构进行分析。本研究分别对来自三个人类供体的超过,个高质量抗体序列簇和超过2,个天然和免疫库的抗体模型进行详细分析,同时合理解释关于抗体库成熟和发展的其他几个长期问题。

1抗体序列和结构的测定

从三名健康人类的外周血单个核细胞(PBMC)中分离出来的CD3-CD19+CD20+CD27-NBC(图1A)。基于单细胞乳化的方法生成并测序编码VH和VL序列的IgM扩增子(图1B),即通过在乳剂液滴中进行单细胞分离,细胞裂解和mRNA捕获,重叠延伸RT-PCR连接重链和轻链以及IlluminaMiSeq的VH:VLcDNA测序,可实现重链和轻链配对测序。在过滤读取质量,功能基因片段鉴定和CDR-H3聚类后,我们从NBC获得了55,个抗体序列。与先前的报道相似,对原始组中的序列进行过滤,以使其在构架3区域(FR3)中具有98%的种系核苷酸同一性,以消除由FACS人工产物引起的抗体序列(通常1%的天然细胞)或通过位于分类门内的低频CD27–抗原特异性B细胞(AEBC)(图1C)。对于其中两个捐赠者,我们从同一次抽取的外周血中确定了CD3-CD19+CD20+CD27+AEBC的IgM/IgG/IgAVH:VL配对库。由此得到与免疫库的VH:VL对相对应的不同CDR-H3的轻链第三互补决定区(CDR-L3)簇。MiSeq2×技术允许每个样品读长bp-bp。NBC序列不需要基因组装,由于天然的BCR不显示SHM,因此可以假定对应于种系FR1-FR3VH和VL基因片段。

使用基于高性能计算集群实现的RosettaAntibody3.0抗体建模进行结构抗体库建模(图1D和E)。即结构是通过(i)移植同源模板框架和CDR环区域,以及(ii)CDR-H3从头建模,同时完善周围的环以及重链和轻链变量空间位置(VH和VL的相对方向),从数千个候选模型结构中选择得分最高的模型。从这两个供体中,生成了1,个天然库抗体模型和1,个免疫库抗体模型。抗体的互补位是直接识别并结合抗原的区域。本研究使用抗体-抗原晶体结构中观察到的接触残基区域估计了互补位。计算得出的接触区域对位(CR-对位)的净电荷,溶剂可及表面积(SASA)和疏水性溶剂可及表面积(hSASA),并分析了框架区(FR),以了解抗体库的一级的构象相似性和差异性(图1F)。

图1.用于抗体库测序、建模和分析的高通量分析流程。(A)通过流式细胞仪(FACS)将健康人类供体的外周血B细胞分为天然(CD3?CD19+CD20+CD27?)和免疫(CD3?CD19+CD20+CD27+)样本。(B)在乳剂液滴中分离出B细胞作为单细胞,进行单细胞mRNA捕获、重叠延伸连锁RT-PCR和高通量测序。(C)VH:VL序列进行质量过滤,96%的CDR-H3身份聚类,以去除序列错误。对IgM表达和SHM负载进行过滤,以提高数据纯度。(D)从read数最高的序列中选择抗体建模,筛选CDR-H3长度和PDB中高质量、高序列相似性结构模板(E)抗体库采用RosettaAntibody3.0建模。(F)从抗体模型中鉴定CR-paratopes,并分析电荷(上)、疏水性(中)和SASA(下)。

2在天然库和免疫库中的V基因及公共VH:VL差异性分析

本研究初步分析了在个体之间和B细胞亚群之间成对的重:轻链V基因的差异性(图2A)。VH:VL抗原库V基因使用Pearson分层聚类显示,来自不同个体的天然抗体库聚类在一起,而来自多个供体的抗体库与纯天然库分开聚类(图2B)。此外,通过对免疫库进行重链同种型亚分类显示,免疫库IgM库集聚为一组,而类别转换库(IgG,IgA)则分别集聚(图2B)。免疫库的类别转换的IgG和IgA亚组在同一个体内比在两个个体内更相似(由图2B)。

接下来,使用基于线性模型的t检验,并对多重比较进行调整进行统计分析,分析重:轻v基因在B细胞亚群中的使用频率,与NBC库相比,我们发现AEBCs中28对VH:VL基因富集/缺失(P0.05),占所有实验样本中个种系VH:VL基因组合的3.2%(图2C)。研究发现与某些轻链V基因(KV1-33,LV3-19,LV1-40和LV3-1)配对时,IGHV6-1在antigen-experienced亚组中显着减少。但是,IGHV6-1与其他轻链基因(例如KV4-1,LV2-11和LV1-44)配对时会富集。

图2.成对的V基因在B细胞库中使用分析。(A)来自自天然(CD3-CD19+CD20+CD27-IgM)成对的重,轻V基因成对分析(左)和免疫(CD3-CD19+CD20+CD27+IgG/IgA)分析。V基因按字母数字顺序绘制,高度表示VH:VL簇之间的百分比表示。((B)成对重:轻v基因在供体间的使用,皮尔逊层次聚类分析得出的聚类图;相对距离用连接不同组的线高表示。(左)供体和b细胞子集汇编的聚类。(右)重链同型汇编(naive和抗原经验IgM、IgA和IgG)的聚类。(C)在NBC和AEBC剧目中VH:VL基因使用差异的火山图表示。阳性的折叠变化值表示VH:VL基因对,在免疫库中更常见。调整后P值在0.05以下的基因对以红色显示,其他基因对显示黑色。

在给定所有抗体中以x分数表示的pVH基因,以及所有抗体中y分数表示的qVL基因,则可以针对每个ijVH在预期的xi×yj分数处形成p×q不同的IgVH:VL基因配对:库中的VL基因对(定义为VH:VL期望值)。相对于预期频率,特定VH:VL基因对的观察频率降低表明该VH:VL为阴性选择。VH:VL的负值可能源于VH和VL结构域的结构不相容性。本研究应用了几种统计技术,包括基于线性模型的t检验,DESeq和Studentt检验,以识别与xi×yj期望值相比无效的“空洞”和较高频率的“峰值”(无效假说可以在多个供体的每个B细胞亚群中多次观察到)。在分析的B细胞亚组时,在供体之间没有鉴定出统计学上显着的空洞或峰,这与先前的小数据集一致,并表明人类重链和轻链V基因的任何不成对配对在单个B细胞数据集中观察到的结果未在其他供体中复制。

通过克隆单克隆b细胞和高通量测序VHrepertoire亚群获得的小集()抗体序列分析表明,AEBCs的CDR-H3区域更短,pI更基础,且比NBCs更亲水。本研究表明,天然库和免疫库相比,CDR-H3长度的减少非常小,但分布之间的差异具有统计学意义(naiveCDR-H3:15.23±3.69氨基酸,antigen-experienced:15.08±3.64氨基酸,均值±SD,国际免疫遗传学信息系统(IMGT)CDR3长度定义,P10?14的Kolmogorov-Smirnov(K-S)检验比较分布的平等性)。已经观察到混杂的轻链序列(即与两个或多个VH序列配对的轻链),其原因是轻链Vκ,λ–Jκ,λ连接的多样性较低。本研究发现,在同一供体中的多个BCR中存在混杂的轻链连接的现象,即Vκ,λ–Jκ,λ连接。在NBC中,混杂的CDR-L3连接在核苷酸水平上占库的68.4±4.5%(基于蛋白质序列为78.5±4.0%)。在AEBC中,混杂Vκ,λ–Jκ,λ连接的比例降低(30.2±3.9%核苷酸单位,46.9±5.7%氨基酸单位)。混杂的Vκ,λ–Jκ,λ接头与多种重链基因配对,即λ重组事件。

公开的Vκ,λ–Jκ,λ核苷酸和氨基酸连接点(即在一个以上的个体中观察到的连接点)占NBCCDR-L3的很大一部分(核苷酸为64.6±6.1%,氨基酸为75.7±6.7%))和AEBCCDR-L3(核苷酸的16.6±0.3%,氨基酸的33.6±1.9%)。与公共Vκ,λ–Jκ,λ核苷酸序列的相比,本研究观察到个体间公共CDR-H3核苷酸序列极少(在天然库中为三个,在免疫库中为一个)。在氨基酸水平上,我们观察到了23个CDR-H3序列,这些序列是在两个供体之间共享的(0.%的频率;三个供体没有共享CDR-H3),两个供体在免疫序列库中共享38个CDR-H3氨基酸序列(0.%的频率)。总体上,公共CDR-H3的长度明显短于其他CDR-H3的长度,大概反映了较短CDR-H3固有的较低序列多样性。我们检测到了五个免疫库的公共CDR-H3氨基酸序列,它们与相同的CDR-L3氨基酸序列配对。所有五种公共CDR-H3:CDR-L3抗体均由不同的核苷酸序列编码,具有不同的N/P值,SHM,基因组成和使用模式,表明它们源自不同的V(D)J重组。

3天然库和免疫库的电荷,表面积和疏水性的差异分析

本研究首先分析了RosettaAntibody对天然抗体的预测准确性。据报道,RosettaAntibody模型相对于免疫库的抗体的X射线结构,其FR和标准结构准确度为0.45-至1.0-RMSD,在CDR-H3环中平均为2.1-RMSD。对于蛋白质数据库(PDB)中的七种人类种系抗体(与种系V基因片段具有%的序列同一性),RosettaAntibody模型在FR和标准CDR环中显示了0.8-1.4?RMSD,而相对于X射线结构,CDR-H3中的RMSD2.4。本研究根据同源性建模的要求,在PDB中查找了FR和标准CDR的序列高同一性模板。由于较长的CDR-H3环在计算结构预测中存在问题,因此根据Chothia定义,我们仅考虑CDR-H3长度小于16个氨基酸的抗体库子集(占总测序抗体的76%)。

通过计算建模分析全库的物理和化学性质,包括电荷,疏水性,SASA和hSASA。这些特性对耐受性和避免自反应性很重要。我们整体计算了每种抗体的所有六个区域中的物理化学指标,这些区域包括抗原结合接触点,即CR对位。发现天然和免疫库中的CR-对位电荷受V基因严重影响(图3A)。天然抗体的CR对位负电荷比免疫抗体更弱,分布平均电荷分别为-1.1和-0.68(中位电荷-1和0;电荷分布差异具有统计学意义S检验,P=2.8×10-3)。由于IGKV1-33种系中的-3电荷,基因片段IGKV1-33的抗体在CR互补位上表现出较强的负电荷。排除IGKV1-33抗体后,再分析CR-paratope的电荷分布数据,结果显示,汇编库之间的CR-paratope电荷分布差异不显著(K-S检验P=0.,天然库和免疫库分别为n=,n=)。IGKV1-33是一个常见的基因片段,在配对的VH:VL原始库模型中占v基因使用的15%,而在免疫库的模型中仅占3.1%(分别在供体序列中为8.9%和3.1%)。事实上,IGKV1-33也是四对VH:VLv基因的成员,这四对基因在免疫库中表达显著下降。

本研究比较了计算模型抗体CR-paratopes和CDR-H3:CDR-L3氨基酸序列的电荷分布。来自天然库和免疫库中的CDR-H3:CDR-L3序列均显示中性电荷分布,其中库中90%的CDR3环总电荷在+2至-2之间。与CR互补位电荷分析相一致,与纯天然序列相比,免疫库的CDR-H3:CDR-L3氨基酸序列显示出略微减少的负电荷(分别为-0.47和-0.的平均电荷)(图3B)。与纯天然库相比,免疫库的CDR-H3和CDR-L3库在统计学上显示出显著的净电荷分布增加(图3C和D)。同时在免疫库的CDR-H3和CDR-L3中观察到CDR3电荷增加,表明免疫驱动了向正电荷的转变是通过功能性BCR选择而不是通过改变基因用途来实现。本研究观察到κ-λ轻链中CDR-L3电荷的明显分布,其中κCDR-L3组成部分相比λCDR-L3组成部分带正电荷。重要的是,在轻链CR-互补位中也存在明显的Igκ与Igλ轻链电荷分布。KappaCR互补位的中位电荷为0,而LambdaCRs的中位电荷为-1。

具有正电荷极端值的BCR在免疫库中的分布更广。具有高度正电荷的CDR3的抗体更有可能具有自身反应性的,并且会在骨髓中不同的发育检查点被清除。尽管如此,本研究结果表明,仍发现了一小部分但非常重要的高度带正电荷的抗体。此外,通过接触抗原,此类抗体的频率显著增加。

图3.天然库和免疫库的电荷分布。(A)CR对位电荷。(B)CDR-H3和CDR-L3总电荷。(C)CDR-H3电荷。(D)幼稚和有抗原经历的BCR曲目的CDR-L3电荷。

通过计算疏水指数(H指数)来分析成对的CDR-H3和CDR-L3环的疏水性。尽管天然库和免疫库库之间的平均H指数分布没有显著差异,但kappa和lambda库之间的CDR-L3平均H指数存在主要差异。Lambda轻链CDR3的疏水性比kappaCDR3的疏水性强。KappaCDR-L3比Lambda轻链承受更强的H-index阳性选择压力(kappa轻链从天然库到免疫库经历的平均H-index增加了0.,而Lambda轻链则为0.)。

结构模型也能够通过抗体库CR互补位来表征SASA和hSASA(图4A)。SASA的中位数略有增加,从NBC的抗体中的2,?2增加到AEBC的抗体中的2,?2(分别为SASA2,vs.2,?2)(图4B)。研究发现,IGHV4-59和IGHV4-34对抗体SASA产生了强烈影响。例如,使用IGHV4-34的抗体小于平均水平的SASA(使用IGHV4-34的抗体为2,?2,而本研究中所有模型化抗体的平均值为2,?2)。此外,研究发现由CDR-H1产生SASA的中位数比天然抗体库的中位数(图4C)小。尽管分布方式仅略有不同,但NBC与AEBC组成部分CR对位SASA和CDR-H1SASA的总体概率分布显著不同,在免疫库中,抗体CR对位的SASA更高。

免疫库中抗体的hSASA分数(即hSASA/SASA比)从0.57增加到0.58(图4D)。使用IGHV4-59,IGHV1-18和IGHV3-33以及IGHV1-3,IGHV3-30和IGKV3-20的抗体,在免疫库的抗体CR互补位占1–3%。CDR-L3CR互补位的疏水性与基于序列的疏水性指标密切相关,λCR-互补位的hSASA分数比CDR-L3的kappaCR-互补位高10%。

图4.SASA在天然库和免疫库中的分布。(A)各自分布的中位数分别带有SASA或hSASA的天然抗体(左)和经历过抗原的抗体(右)的CR对位SASA(上)和hSASA(下)。(上部)VHCR对映体SASA显示为蓝色;VLCR-对位SASA以绿色显示。(下)CR互补位的hSASA呈现为每个残基根据Eisenberg疏水性等级着色,从最大疏水性(红色)到最小(白色)。(B–D)天然(蓝色)和免疫库的(红色)BCR组成部分的总CR互补位SASA(B),CDR-H1SASA(C)和hSASA(D)的分数。

抗体FRs指示CDRs的构象空间。FR位置上的保守VH:VL相互作用是可变区域稳定性的关键决定因素。为了探索FRs中V基因使用与抗体结构相似性之间的关系,我们计算了每个天然抗体或经过抗原计算的抗体模型库(VH)中FR1-3主链上抗体模型的均方根值。在重链V基因片段上计算成对抗体重链FRRMSD,并比较每个供体中的基因亚组(图5A和B)。我们发现,抗体的结构在VHFR区域上彼此非常相似,天然库的均方根(RMSD)为1.02–1.09?,免疫库的均方根(RMSD)为1.03–1.04(图5)。在天然库中,具有相同VH基因区段使用FR难以区分(供体1和供体2的均方根均值为0.13),而免疫库中的均方根值均较小(实际均方根值分别为0.41和0.48?)对于使用同一家族的VH基因片段(即IGHV1,IGHV2等)的抗体,观察到相似的趋势,其中天然库与免疫库抗体之间的结构相似性更高(天然库:两个供体中均为0.51?;免疫库:供体1和2中的均方根均方根分别为0.56和0.57?)。有趣的是,使用来自不同VH基因家族的VH基因片段对成对的RMSDs并未显着增加,两个供体的所有组成中的均方根RMSD为1.1?。

本研究将每个供体中抗原扩增预测模型的FR1-3RMSDs与PDB中个非冗余的人类抗体结构进行了比较,PDB晶体结构的整体RMSD为1.0±0.29A;使用不同v基因片段的抗体中RMSD值为1.1±0.22A。这与我们的RosettaAntibody预测非常吻合。值得注意的是,与此处建模的抗体相比,PDB中的抗体序列发生了更高的体细胞超突变,PDB中的抗体具有83%的平均种系序列同一性,而在我们有免疫库中则平均为88%。因此,我们得出结论,SHM似乎不会对FR结构多样性产生重大影响。

图5.VHFR1-3主链原子的平均均方根值。(A)两种具有相同IGHV基因区段(左)或相同IGHV基因家族(中)或来自两个不同IGHV基因家族(右)的天然抗体的叠加模型。用于计算成对均方根值的FR1-3残基以蓝色突出显示。(B)具有相同IGHV基因区段(左)或相同IGHV基因家族(中)或来自两个不同IGHV基因家族(右)的两种免疫抗体的叠加模型。用于计算成对均方根值的FR1-3残基以红色突出显示。(C和D)供体1(C)和供体2(D)的FR平均成对RMSD。使用相同的V基因片段,相同的V基因家族和两个不同的V基因家族绘制抗体的平均成对RMSD。天然库以蓝色显示,免疫库以红色显示;误差线表示SD。

本研究阐明了抗原对人抗体库的影响,为我们对B细胞免疫理解提供基础。通过对大量单个B细胞的重链和轻链可变区(分别为VH和VL)进行了测序,并结合抗体结构的模型预测,综合评估人抗体库的序列和结构特征。数据集的分析包括来自天然B细胞的55,个抗体簇,免疫库的的,个抗体簇,以及横跨三个健康人群的2,RosettaAntibody预测的结构模型供体,主要结果如下:(i)VH和VL基因序列以组合方式配对,在人群水平上没有可检测的配对限制;(ii)某些VH:VL基因对相对于纯天然库在免疫库中显著富集或降低;(iii)抗原选择增加了抗体对位的净电荷和溶剂可及的表面积。(iv)免疫库库中的CDR-H3显示出轻链聚类的遗传现象,包括共享CDR-L3氨基酸序列和Vκ,λ–Jκ,λ基因。本研究数据解决了有关抗体库选择和开发的几个长期问题,并为将来对疫苗和疾病的抗体反应库的规模分析提供了基础。DekoskyBJ,LunguOI,ParkD,etal.Large-scalesequenceandstructural


转载请注明:http://www.jdnnv.com/myqxhl/10359.html

  • 上一篇文章:
  • 下一篇文章: 没有了