本研究利用代谢组学和关联分析方法,更好地了解小麦代谢的遗传基础,为小麦育种提供科学依据。
编译:一个矫情的农民,编辑:Tracy、江舜尧。
原创微文,欢迎转发转载。
导读
小麦是世界上最重要的作物之一,它提供了人类消耗的20%的卡路里和25%的蛋白质。代谢组学方法已广泛应用于许多作物,但仍局限于小麦。植物代谢组通常被认为是基因组和表型之间的桥梁,因为在最广泛的意义上,代谢组定义了表型,其与定量遗传分析的结合极大地帮助研究人员推断植物代谢和表型变异之间的遗传联系。将代谢组学与基因组学和转录组学相结合已被证明在分析代谢多样性及其潜在的遗传变异,以及识别许多新基因和代谢途径方面具有强大的作用,因此,代谢物可以作为预测复杂农艺性状的重要生物标记物,从而允许快速加速育种过程,同时降低其成本。植物富含特定的代谢物,这些代谢物在植物生命周期中发挥重要作用,并在其生活的复杂环境中介导它们的相互作用,然而,小麦代谢组的遗传结构尚未得到很好的研究,因此,本研究利用高密度遗传图谱,通过广泛靶向的LC-MS/MS对小麦籽粒代谢进行了全面的代谢组研究,进一步结合农艺性状,剖析代谢物与农艺性状的遗传关系。该研究极大地提高了人们对小麦代谢组学及其与农艺性状关系的认识,为作物改良提供了有力的工具。
论文ID
原名: Metabolomics analysis and metabolite‐agronomic trait associations using kernels of wheat(Triticum aestivum) recombinant inbred lines 译名: 小麦重组自交系籽粒代谢组学分析及代谢物-农艺性状关联 期刊: The Plant Journal IF: 6.141 发表时间: 2020.07 通讯作者: 陈伟,崔法 通讯作者单位: 华中农业大学,鲁东大学
实验设计
实验结果
1. 代谢谱分析和广义遗传
以 Kenong 9204 (KN9204) 与 Jing411 (J411) 杂交的 145 个重组自交系为材料,我们采集了成熟籽粒。为了鉴定影响农艺性状的主要基因,亲本品系在籽粒性状和穗部性状上存在很大差异。我们利用高通量 LC-MS/ MS 方法(该方法具有广泛的靶向性),通过 3 个生物重复检测并定量了自交系成熟籽粒提取物的 1260 个不同的代谢产物特征,在这些代谢特征中,有 116 种是通过直接比较其色谱和碎片行为与真实标准的结构确定的,而 351 种是通过使用之前描述的策略推定注释的。大多数注释的化合物是类黄酮、酚胺、多酚、脂类、维生素、植物激素及其衍生物、氨基酸及其衍生物、核酸及其衍生物、有机酸和糖,实现了对多个重要代谢通路的覆盖( ( 图 1a )。
代谢物积累的水平在不同的品系之间差异很大,我们对它们的遗传结构可以进行有效的分析。在 RIL 群体中,这些代谢物的平均遗传变异系数 (CV) 为 47.4%( 图 1b) ,然而,酚胺和多酚类化合物之间的差异很大,最大平均 CV 为 59.8% ,它的范围从精胺的 CV 为 13.6% 到 N', N''- Di-p- 香豆素亚精胺的 CV 为 194.5% 。代谢性状的广义遗传力 (H2) 分布表明,超过 56% 的代谢物具有 0.6 以上的遗传力 ( 图 1b) 。总的来说,附注的代谢产物中,次生代谢产物的 H2 值 ( 平均为 0.63) 高于初级代谢产物 ( 平均为 0.58) ,其中黄酮类化合物的遗传力最高 (H2 > 0.70) 。这些数据表明,代谢产物多样性主要受遗传因素的影响。
代谢物分析可以阐明代谢途径之间的联系,因此,我们使用 Spearman 来分析这些代谢物的相关性,并对所有检测到的代谢物构建一个热图。图 1c 显示了更多的正相关 ( 红色 ) ,而不是负相关 ( 蓝色 ) ,以及一些紧密相关的代谢物簇,如左上角的彩色方框主要由氨基酸及其衍生物、核酸及其衍生物、酚胺等组成;底部的紫色和蓝色方框分别代表了脂质和植物激素及其衍生物之间的高度正相关 ( 图 1c) ,这些密切相关的代谢物很可能是同一类型的分子或属于同一生化途径的分子。大多数氨基酸和核酸存在于一个紧密的代谢物簇中,而类黄酮相对分散,虽然它们之间的关系比其他物质更密切。脂质、多酚和酚胺在几个大的集群中被发现,表明这些代谢物参与多种代谢途径,并可能发挥不同的生理作用。
图1 小麦RIL群体的代谢谱分析 (a)检测到的代谢物数量及其分类。(b) RIL群体代谢性状变异系数(CV)和广义遗传力( H2 )值的分布。 H2 采用单因素方差分析(one- one ANOVA)进行估计,考虑到三种生物重复之间的差异,作为环境因素衍生的表型方差。(c)在热图中显示成对的皮尔逊相关性,而代谢物则根据基于相关性的层次聚类分析进行排序。相关程度用红色(正相关)和蓝色(负相关)表示。
2. 小麦群体籽粒mQTL定位
基于 Affymetrix Wheat 660K 芯片,我们获得 SNP 与 746 个代谢物开展 mQTL 分析(根据样本重复性从 1260 个代谢物中挑选出 746 个物质),共计得到 1005 个 mQTL ,其中有 493 个 mQTL 分布在小麦 B 基因组上,与其他分类代谢产物相比,类黄酮相关 QTL(61) 数量最高,其次是氨基酸、核酸及其衍生物。
我们通过卡方检验( Chi-Squared Test )分析了 1005 个 mQTL 在整个基因组水平的分布情况,发现共计存在 68 个热点,主要分布在 1B 、 4B 和 7A 染色体上,但 1B 的热点尤其突出 ( 图 2a) ,我们推测这些热点区域可能存在主要调控基因,影响多个代谢物在群体的变异,其中,黄酮和酚胺相关的遗传热点定位在 1B 和 4B 染色体上 ( 图 2b) ,而 5 个脂质代谢相关 QTL 位于 7A : 240.0-240.8 cM( 图 2b) 。而我们在多条染色体 ( 如染色体 3A 和 4D) 上检测到的 mQTLs 数量明显低于预期 ( 图 2a) 。
每个代谢物的 mQTLs 数量从 1 个到 6 个不等, 201 个代谢物至少含有两个 mQTLs ;然而,一些代谢物受到单一主要 mQTLs 的影响,例如,我们在 2A 染色体上定位了一个 n16920 水平的 QTL( 一个多酚被推测注释为羟基肉桂酰甘油酸 ) ,定位在 75.0 ~ 735.1 Mb 之间 (LOD = 15.3) ,它解释了 33.4% 的表型变异; mr1093 的另一个 QTL 定位于 2B 染色体 665.2 ~ 666.4 Mb (LOD = 11.9) ,解释了 31.2% 的表型方差。这些结果表明,一个单一基因,而不是上位互作,直接参与代谢产物的合成。 每个 mQTL 解释了所观察到的表型变异的 0.8-53.1% ,平均值为 13.3% , 263 个位点与 15% 以上的表型变异相关,其中,次生代谢产物 QTLs 的表型变异解释 (PVE)( 平均 PVE 为 14.0%) 普遍大于初级代谢产物 QTL 的表型变异解释 ( 平均 PVE 为 11.9%) 。不同 PVEs 在一定程度上反映了初级代谢 ( 中枢代谢 ) 和次级代谢之间的遗传结构差异。
图2 mQTLs在小麦染色体的分布统计 (a) 1005个mQTL的分布情况和hotspots,水平虚线表示mQTL热点的阈值,由mQTLs的最大数量表示,该数量预计会偶然落入任何间隔,且全基因组P = 0.01。间隔大小为10厘米;(b) 467个已知代谢物的mQTLs分布。每一行表示单个代谢性状的QTL映射。不同化学基团的代谢物用不同的颜色来表示。x轴表示小麦基因组的遗传位置。x轴下面的热图说明了整个基因组的QTL密度。窗口尺寸为10厘米。
3. mQTLs 候选基因的鉴定
mQTLs 的高分辨率有助于代谢物候选基因的分配。我们通过整合化合物结构、已知的生物合成途径和小麦基因组注释筛选了一系列候选基因 ( 表 1) 。在邻近区域,编码氨基酸渗透酶家族蛋白的 TraesCS5D01G028100 被认为是候选基因,因为它与功能注释基因拟南芥和水稻基因 AtPUT2 和 OsPAR1 高度相似 ( 在氨基酸水平上分别为 70 和 87% ),此外,多个黄酮物质共定位到 1A 染色体上的同一 locus 上( 588.7-593.5Mb ), TraesCS1A01G442200 和 TraesCS1A01G442300 区间内的两个基因与水稻类黄酮 30 - 羟化酶编码基因 OsF3’H 具有较高的同源性 ( 在氨基酸水平上分别为 70 和 78%) 。我们从候选基因列表中进一步选择了两个候选基因,并通过体外表达分析进行验证,如下所示。 表1 候选基因列表 (mQTLs)
代谢物 mr1092(apigenin 7-O-rutinoside) 的 mQTL 定位在染色体 2B 的 5.6–7.2 Mb 位置(图 3a ),该基因区域注释有 1 个糖基转移酶基因 TraesCS2B01G012000 ,该基因编码的氨基酸序列与水稻同源基因 UGT706D1 的氨基酸序列一致性达到 49.1% ,在 35S 启动子的控制下,从中国春小麦中克隆了编码序列到 Strepll 标记的载体上,并在烟草中表达 ( 图 3c) 。芹菜素和麦黄酮与 UDP- 葡萄糖和纯化蛋白一起作为共底物进行测试,显示其接受芹菜素,但不接受麦黄酮(图 3d )。该蛋白被 UGT 委员会注册为 UGT88C13 。从两个亲本中克隆该目的基因时,我们发现从 J411 品种中扩增该目的基因比较困难,使用了多个引物对,只有 KN9204 和 CS 得到阳性结果,因此,在 J411 的进化或驯化过程中,很可能发生了相当大的序列变化或基因丢失。
KN9204 的翻译蛋白 ( 命名为 UGT88C14) 在烟草中表达、提取和纯化 ( 图 3c) ,显示出类似中国春小麦的编码序列和蛋白活性。这一结果证明了候选基因的糖基转移酶活性,从而解释了糖基化芹菜素在 RIL 群体中的不同积累。 同样,通过 mQTL mr075 定位另一个类黄酮相关基因,我们发现只有 3 个基因位于区间内,其中一个基因 TraesCS2B01G459900 注释为糖基转移酶,与水稻 UGT706C1 类似 ( 在氨基酸水平上鉴定为 52.1%) ,于是我们从 CS 中克隆了该基因。虽然检测到活性,但我们注意到两个亲本具有相同的编码序列。接下来,我们采用 qRT-PCR 来测定其相对表达量,结果表明,在灌浆第二周收获的组织中, J411 基因的相对表达量是 KN9204 基因的 10 倍,这与 J411 的糖基化产物积累量高于 KN9204 的事实相一致。
图3 候选基因TraesCS2B01G012000功能验证 (a) mr1092在2B染色体上积累的QTL定位的LOD曲线。(b) TraesCS2B01G012000基因模型。(c)候选基因编码的蛋白在拟南芥中瞬时表达,并经StrepII纯化。样品在不同的纯化阶段。箭头表示纯化后的蛋白质。CBB,考马斯亮蓝染色;WB,免疫印迹。(d)纯化蛋白的酶促反应。底物和产物的结构(左)以及标准品和生化反应的色谱图。
4. 农艺性状与代谢物的相关性
该 RIL 群体的 17 个农艺性状是在前期的 3 次独立收获中获得的。为了分析代谢产物的变化与植株形态的关系,我们首先测定了 17 个农艺性状的 CV ,变异系数为 3.8 ~ 15.7% ,平均 H2 值为 0.61 ,表明该品种具有显著的遗传贡献和有益农艺性状的人工选择潜力。随后我们构建了代谢 - 农艺性状关联网络,由 467 个注释代谢产物和 17 个农艺性状组成 ( 图 4a) 。检测到有 754 项显著相关,正相关和负相关的数量大致相同 ( 图 4a) , 264 个 (56.5%) 代谢物与至少一个农艺性状相关,例如, mr869 与 8 个农艺性状相关。黄酮类、氨基酸、核酸、脂类、酚胺、多酚类与 13 个农艺性状显著相关 ( 图 4a) ,说明代谢产物参与了农艺性状的形成,代谢与农艺性状之间的相关性不如代谢性状之间的相关性紧密。 农艺性状中,粒宽 (GW) 、收获指数 (HI) 和千粒重 (KGW) 主要与注释代谢产物呈正相关。旗叶相关性状 ( 旗叶长度, FLL ;旗叶宽度, FLW ;旗叶面积, FLA )和穗数相关性状 ( 单株穗数, NSPP ;穗粒数, NGPS ;每穗小穗数, NSPS) 与注释代谢物大多呈负相关 ( 图 4a) 。我们从相关数据中发现,叶片性状 (FLL , FLW , FLA) 和籽粒性状 (KGW ;籽粒宽度, GW ;籽粒长宽比, LWR )分别与 56 个和 141 个代谢物显著相关 ( 图 4a) ,表明籽粒性状的形成可能比叶片性状的形成更为复杂。此外,有 54 个代谢物与 3 个籽粒性状显著相关,表明调整这些代谢物的含量可以作为提高籽粒产量和品质的策略。
5. 代谢物QTL与农艺性状QTL的共定位
为了进一步解析农艺性状与代谢物的内在联系,我们利用农艺性状数据进行了 pQTL 分析。结果显示, 17 个农艺性状 QTL 分析共计得到 97 个 pQTL ,主要分布在小麦 2D 和 4B 染色体上, PVE 的范围在 1.9 到 37.6% 之间,平均为 8.3% ,显著低于 mQTLs 的平均 PVE(13.3%) 。 接下来,我们分析了 mQTL 和 pQTL 之间的关系,发现大约一半的 pQTL(48 个 ) 与 mQTL 重叠;总共有 369 个 mQTLs ,代表 252 个代谢特征 ( 包括 61 个注释代谢物 ) 与 pQTL 共定位。 pQTL 代谢物共位点最多的是 mr1548 和 mr2801 ,其次是 mr107 和 mr1203 ,共位点包含 5 个农艺性状的 6 个 pQTL 。我们在基因组中发现了几个影响上述 10 个代谢物的时间间隔,同时影响 2 个以上农艺性状;这些间隔主要在 1B 和 4B 染色体上,例如, LWR 和 NGPS 在第 4B 染色体 23.7-30.9 Mb 区间上的 pQTL 与 42 个 mQTLs 共定位。 同时与农艺性状共定位的代谢物与农艺性状显著相关,说明相关代谢物影响农艺性状,反之亦然,例如,代谢物 mr115 (阿魏酸)和 3 个黄酮( mr1114 , n03958 , mr1120 )的 QTL 与产量指数( harvest index , HI ) QTL 共定位在染色体 1B 位置上。而我们在 mr1222 与 PH 、 n04711( 吡喃糖衍生物 ) 上也观察到这样的结果,并且种子的长宽比也相同 ( 图 4a) 。有趣的是,参与生长素合成的两种代谢物 mr1346(tryptophan) 和 wm0034 ( 4-indolecarbaldehyde )与 NGPS (每穗粒数)显著性相关,且 mQTL 和 pQTL 共定位在染色体 4B 相近区段(图 4B 、 C )。根据常见的 PCR 标记和 SNP 标记,我们进一步分析发现基因 TraesCS4B01G155000 位于区域内,该基因功能注释编码生长素和休眠相关的蛋白,而 mr1346(tryptophan) 和 wm0034 ( 4-indolecarbaldehyde )位于生长素合成通路,以上结果证实了利用代谢物解析复杂农艺性状的研究可行性。
图4 代谢物与农艺性状相关性网络分析 (a) 467个注释代谢物与17个农艺性状的关联分析。共同检测的代谢物和农艺性状以节点表示,其相关系数值以边表示。Pearson相关系数绝对值高于阈值(P<0.01)所示。不同的颜色代表不同种类的代谢物。圆形和绿色六边形分别代表代谢物和农艺性状,其中形状的大小代表关联的数量。相关水平表示为红色(正相关)或蓝色(负相关)。颜色的强度表示相关性,颜色越深表示相关性越强。黄色圆圈表示与近农艺性状共定位显著相关的代谢物。PR,穗率;YPP,单株产量;NSPP,单株穗数;AB,地上部生物量;SDW,秸秆干重;LWR,种子长宽比;GW,籽粒宽度;NSPS,每穗小穗数;FLW,旗叶宽;FLA,旗叶面积;FLL,旗叶长度;KGW,千粒重;HI,收获指数;NGPS,每穗粒数;GWPS,每穗粒重;SL,穗长;PH,株高。(b)两种代谢物(wm0034,4-吲哚甲醛;mr1346,色氨酸)和NGPS。(c)染色体4B上穗粒数、wm0034( 4- 吲哚甲醛)和mr1346(色氨酸)水平的QTL定位的LOD曲线。绿色代表每穗粒数;蓝色代表4-吲哚甲醛;红色代表色氨酸。
6. 利用代谢数据进行农艺性状预测
我们基于 BLUP 和 LASSO 模型, 结合大规模代谢数据 (1260 个代谢物特征 ) 进行预测 17 个农艺性状。 17 个农艺性状 BLUP 模型的平均预测值为 0.26 , LASSO 模型平均预测值为 0.27 ,其中预测值最好的农艺性状是 PH (株高)和 NGPS (每穗粒数),两种模型的平均预测值分别为 0.51 和 0.49 (图 5 )。 LASSO 法检测出 82 和 98 种代谢物特征,包括植物激素衍生物、糖类和有机酸等,其中,有部分对 NGPS (每穗粒数)和 PH (株高)有显著影响。在这些代谢物中, mr169 ( 甜菜碱 ) 和 S19-0168 (unknown) 分别对 PH (株高)和 NGPS (每穗粒数)有最显著的正向影响,而 mr355(2’-deoxylnosine-5’-monophosphate) 对两个性状均有显著的预测效应值,因此,代谢组可以预测作物农艺性状并助于育种改良。
图 5 基于LASSO和BULP模型预测小麦株高(PH)和每穗粒数(NGPS) 用BLUP模型和LASSO模型分别预测株高和穗粒数。右:BULP预测结果。左:套索预测结果。x轴为农艺性状预测值,y轴为表型观察值。该图像是使用R (http://www.r-project.org/)制作的。
讨论
代谢组学和基因组学相结合的方法已被广泛应用于确定代谢多样性的遗传基础,然而,迄今为止大多数研究只关注拟南芥、番茄、水稻和玉米。本研究结合代谢组学和高分辨率基因分型分析了 RIL 群体的基因代谢物和代谢基因组学性状的相关性。
1.代谢组学和mQTLs
代谢物的检测是研究代谢物遗传变异的基础。本研究通过广泛靶向的 LC-MS/MS 获得了 1260 个代谢物,鉴定了 467 个代谢物的化学结构。与之前的小麦代谢组研究相比,本研究获得的结果在代谢产物的检测方面取得了相当大的进展,其中包括了重要的化合物类别,如多酚和类黄酮,它们在植物的生物 / 非生物胁迫中是必需的,对人类健康有多重影响。主要代谢产物通常表现出很强的相关性,如氨基酸、核酸、植物激素和脂类 ( 图 1c) ,这与之前对水稻、小麦和番茄的研究结果一致。同时我们发现了代谢物相关性,其中一些具有很强的相关性,如酚酰胺类和类黄酮类 ( 图 1c) 。代谢物之间的相关性分析不仅反映了已知分子之间的关系,也反映了未知分子与已知分子之间的关系,为今后鉴定未知代谢物和途径提供了重要的资源。 我们基于 Wheat660K 高密度遗传图谱连锁分析发现,有 1005 个 mQTLs 随机分布在小麦基因组中 ( 图 2) ,其中,许多高分辨率的 mQTLs 被报道。此外,我们观察到 mQTL 的出现影响了不同代谢物的水平,并从籽粒中鉴定出 68 个热点,其中大部分位于染色体 4B 和 1B 上 ( 图 2) ,这些热点在拟南芥、水稻、番茄和玉米的研究中也有发现表明这一现象普遍且重要。这些发现表明,许多代谢物可以受到操纵小基因组区域的影响,这表明通过育种操纵代谢是切实的。
2.候选基因和通路分析
与早期研究相比,本研究的一个重要优势是,可获得小麦六倍体基因组,可以直接从 QTL 作图中进行候选基因鉴定。本研究通过对模型植物中相应基因的注释和研究,分配了 24 个候选基因 ( 表 1) ,通过重组蛋白活性测定或 mRNA 表达分析验证了 mQTL 定位的两个候选基因 ( 图 3) 。对于第一个候选蛋白,该蛋白被证实是一个 UDP- 糖基转移酶 (UGT) ,它可以对类黄酮 A 和 B 环的不同氧原子位置进行糖基化。根据我们的酶学测试,该 UGT 接受芹菜素、木犀草素、山羊皮酚和槲皮素,但不接受 B 环甲基化的黄酮类化合物。当葡萄糖在 4’-OH 以上时,它更倾向于 7-OH 位置,这种多位置糖基化现象之前在水稻中已经观察到;然而,有研究证明了主要的位置特异性糖基化,其中,两种主要的黄酮 UGTs 负责大米黄酮的 7-OH 和 5-OH 基团的糖基化 ( 分别为 OsUGT706D1 和 OsUGT707A2) 。我们验证的 TaUGTs 和其他已知 UGTs 建立了系统发育树,结果显示 TaUGTs 被归为 UGT88C 子组,但未被很好地识别。根据结果,这一亚群可能主要在黄烷醇 7- o - 葡萄糖基转移酶中发挥作用,并没有同时排除糖基化的 5-OH 和 30-OH 基团,这取决于环的修饰。与第一个候选基因不同,第二个验证基因 TraesCS2B01G459900 编码 UGT706E7 (UGT 委员会鉴定 ) ,在籽粒灌浆过程中相应代谢物的表达水平变化中发挥了作用。纯化后的蛋白对底物 3',4',5'- 三甲氧基黄酮 ( 含糖基供体 UDP- 葡萄糖 ) 表现出活性,对底物金圣草黄素表现出较小的活性,表明该蛋白对所有 3',4',5' 位甲基化的黄酮类化合物都有较好的活性。 候选基因列表中的基因与多种代谢途径相关,包括类黄酮、酚酰胺和氨基酸 ( 表 1) ,黄酮类化合物在分类代谢产物中所占比例最大,例如,由 mr1120 和 mr1112( 表 S4) 映射的 TraesCS1D01G020700 具有相当大的 PVE ,距离置信区间大约 300 kb 。其在水稻中的同源基因 (LOC_Os02g28170) 编码 osmat2 ,通过重组蛋白分析验证为类黄酮丙二酰转移酶。其在玉米中的对应同源基因 (GRMZM2G387394) 编码 AAT1 ,是我们通过突变表型分析发现的首个单子叶植物花青素酰基转移酶。基于这些发现,我们对 TraesCS1D01G020700 基因进行了归属,这些指定基因在普通小麦中尚未见报道,但其功能有待进一步证实,候选列表中的其他基因也是如此。 本研究中 mQTLs 的大规模和高分辨率特性得益于所使用代谢组学方法的高覆盖率、敏感性和准确性以及高密度的 SNP 标记。在未来的研究中,本研究鉴定出的数百个基因座将被进一步验证和鉴定,这将有助于剖析普通小麦代谢变异的分子基础,并阐明新的功能蛋白和代谢途径。
3.代谢性状与农艺性状的关系
代谢物被认为是连接基因组和表型的桥梁,因此,研究表型和代谢相关特性,很大程度上体现了这一桥梁的价值。在马铃薯 QTL 分析中,研究发现代谢物与淀粉和冷甜味剂相关性状共定位;还有研究表明,葫芦巴碱通过延长 G2 期和整个细胞周期的持续时间对 GW 产生积极影响。进一步的研究表明,分析代谢产物 - 农艺性状的共定位有助于推断玉米和番茄的遗传联系。在本研究中, mQTL 分析显示 wm0034 和 mr1346 共定位点,均位于色氨酸途径中,参与生长素的生物合成。我们通过网络分析 ( 图 4a) , NGPS 与这两种代谢物显著相关,此外,我们在 pQTL 分析中发现 NGPS 对应的位点与上述的 mQTL 在 4B 染色体上共定位 ( 图 4c) 。我们在小麦基因组注释中发现了一个生长素抑制 / 休眠相关蛋白的编码序列 TraesCS4B01G155000, Chr4B: 27.6 Mb ,先前的研究表明,蛋白质具有抑制生长素积累的功能,例如,研究表明,生长素抑制基因 SAR5 的高转录丰度与草莓果实生长的停止有关,或超表达的 BrARP1( 编码生长素蛋白 1) 或 BrDRM1( 编码休眠相关蛋白 1) 会导致较小的植物和较短的长角果,因此,该候选者可能通过负向调节生长素水平和 NGPS 来干扰植物的产量。代谢物的变化是否是农艺性状变化的原因,还需要进一步的实验证据和分析。 上述策略已被用于阐明代谢组学与农艺性状的关系以及表型性状的形成机制,鉴于双亲本群体的局限性,高通量代谢组学分析可用于显示出丰富遗传变异的自然群体,用于全基因组关联研究 (GWAS) ,以加速功能基因组学。这种方法很可能在未来的小麦研究中被证明是非常有效的。
4.农艺性状预测
在分子育种中,基因组选择 (GS) 比传统的分子标记辅助选择 (MAS) 更有效。随着高通量测序技术、转录组和代谢组技术的发展,多组学数据被用于预测复杂农艺性状,在作物研究中取得了很大进展。在本研究中,我们使用 BLUP 和 LASSO 方法证明了产量相关性状 (PH 和 NGPS) 的可预测性分别达到 0.56 和 0.51( 图 5) 。这一结果与之前的研究具有可比性,有研究使用来自 210 个 RIL 的 1000 个代谢组学特征数据有效预测 KGW 和其他性状,使用 BLUP 和 LASSO ,平均可预测 KGW 为 0.55 。 LASSO 模型能够有效筛选一千多种代谢物,并筛选出有限数量的对表型预测有重要影响的代谢物,如本研究所示。为了比较使用代谢数据和基因型数据进行预测,我们使用基因型数据进行了相同的预测。与基因型数据的预测值 (0.47 和 0.44) 对比, LASSO 对 NGPS 和 PH 的预测值更高,分别为 0.51 和 0.46 (图 5) ,然而,在 BLUP 模型下,这些值是相反的,当代谢物的数量增加到成千上万,或者与其他组学数据如转录组和基因组数据相结合时,预测的能力应该得到提高。因此,我们推测这些高效的代谢物特征在生物标记辅助育种中很重要,并可能通过提供更早的世代选择来加速植物育种。
结论
植物产生大量对其发育和生长非常重要的代谢物,然而,小麦代谢组的遗传结构尚未得到很好的研究。本研究利用高密度遗传图谱,通过广泛靶向的LC-MS/MS对小麦籽粒代谢进行了全面的代谢组研究;进一步结合农艺性状,剖析代谢物与农艺性状的遗传关系,共检测到1260个代谢特征。通过连锁分析,我们共发现1005个代谢数量性状位点(mQTLs)分布不均匀,结果发现24个候选基因调控不同代谢产物的水平,其中2个经体外分析功能性注释参与黄酮类化合物的合成和修饰。通过对代谢物农艺性状的相关分析、甲基化数量性状位点和表型QTL的共定位,我们揭示了代谢物与农艺性状的遗传关系,例如,利用相关性和共定位分析确定了一个候选品种,该品种可能管理生长素的积累,从而影响每穗粒数(NGPS)。我们用代谢组学数据预测小麦农艺性状的表现,发现代谢产物对NGPS和株高具有较强的预测能力。本研究利用代谢组学和关联分析方法,更好地了解小麦代谢的遗传基础,为小麦育种提供科学依据。
原文链接: https://pubmed.ncbi.nlm.nih.gov/32073701
人点赞
人收藏
打赏
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!