棉花纤维品质发育的分子研究综述 下载本文

棉花纤维品质发育的分子研究综述

摘要:棉花纤维是世界上最重要的纺织原料之一,是第一大产天然纤维的作物,具有重要的经济价值。棉纺工业技术的发展,对棉纤维强度等品质性状提出了更高的要求。应用遗传学、功能基因组学、蛋白质组学、生物信息学等理论和方法,开展棉花纤维发育的生物学机制的研究,发掘棉花纤维品质相关功能基因,进一步揭示棉花纤维品质性状的遗传基础和纤维发育的分子机制,筛选和创制一批有利用价值的特异纤维材料,提出棉花品质性状分子改良的新理论和方法,为优质高产棉花新品种培育提供材料基础和科学依据。本文综述了棉花纤维发育过程中在分子水平上的一些研究进展。

关键词:棉花, 纤维发育, 分子机制

The Research Progress on Cotton Fiber Development at

Molecular Level

Abstract:Cotton fiber is one of the world's most important textile materials, is the first major production of natural fiber crops, and has significant economic value. With the development of cotton industry and technology, it’s necessary to improve the quality traits of cotton fiber. Application of the theory and methods of genetics, functional genomics, proteomics, bioinformatics to carried out the cotton fiber development of biological mechanisms research. Explore cotton fiber quality-related functional genes, further reveal the genetic basis and molecular mechanism of fiber development. Screening and created a number of value-specific fiber materials, raised new theories and methods of molecular mechanisms to improve the quality traits in cotton. Lay the Material foundation and scientific basis for Cultivating new varieties of High yield and quality.

Key words:Cotton , Fiber development , Molecular mechanism

棉花是世界上重要的天然纤维作物,纤维是棉花的主要经济产品(张建,2012),具有重要的经济价值。它不仅能为纺织业提供大量的优质天然纤维,也是重要的食用油和词料工业原料,而且涉及到我国棉农的经济收入和我国棉纺织工业的稳定发展,在农业经济发展乃至在整个国民经济体系中都占据着重要的地位。

纤维细胞是极度伸长的单细胞,一根棉纤维就代表一个细胞, 陆地棉纤维长径比达1000-3000(Ma et al., 2006)。一根棉纤维细胞从开花后第零天(day post anthesis , DPA) 到16 DPA 可由10~15μm 伸长到215~310 cm , 无细胞分裂且形成高纤维素含量, 因此棉纤维成为研究植物细胞发育的理想材料。从形态上看,棉花纤维的发育过程分为四个时期:纤维起始期、纤维伸长期、次生壁增厚期和脱水成熟期。其中主要是快速伸长期和次生壁增厚期影响纤维的产量和品质(Shi et al.,2006)。

长期以来,我国棉花育种的主要目标是提高产量,虽使我国棉花产量得到了提高,但由于对纤维品质重视不足,也导致品质性状较差,绒长单一,纤维强度偏低,纺高支纱的优质棉需大量进口。随着社会的发展和人们生活水平的提高,人们

对棉纤维品质也有了更高的要求。为了提高棉纤维的品质, 各国的科研人员利用不同的材料对棉纤维的发育机制从分子水平上进行了广泛的研究。迄今为止, 已有许多基因被鉴定出参与了棉纤维的生长发育, 一些相关的QTLs 被定位出,这对深入了解棉纤维发生发育机制奠定了理论基础。 一、 棉花纤维品质基因的精细定位

1、构建高密度的分子标记图谱,发掘与品质性状紧密连锁的分子标记和功能标记

简单重复序YU(simple sequences repeat,SSR)具有数量丰富、高度多态、共显性等优点,是一种极具实用价值的标记,目前已成为研究种质资源遗传多样性、基因组作图的首选标记。SSR多重PCR扩增法可同时完成多个标记检测,具有高效、经济、快捷的特点,并保持了单一SSR引物扩增的高度敏感性和准确性.Hinchliffe等(2011)利用Li2棉花的两个近等基因系(突变型和野生型)杂交构建F2群体,并以此做出了位于18号染色体上的Li2的连锁谱。在LI2基因周围标定了5个SSR标记,其中位于两侧的最近的两个标记遗传距离分别为0.87和0.52里摩。利用微阵列基因表达分析了Li2表型中活性氧调节、细胞分裂素调节的作用,基因表达数据显示EST-SSR标记(NAU3991)与Li2基因的连锁关系。在棉花的基因组学中,这是第一次成功的将基因标达的数据转换成为一个与纤维品质相关基因的SSR标记。

姚金波等(2013)以TM-1的染色体片段代换系CSB22sh和TM-1杂交,构建了包含104个家系的重组自交系(RILs)群体。利用74对具有多态性位点的引物进行检测,构建了包含61个多态性位点,长度为76.93 cM的遗传图谱,平均标记间距离1.26 cM。利用此遗传图谱结合重组自交系群体4个环境下的5个纤维品质性状进行QTL定位,共定位出12个QTLs,解释性状表型变异的2.45%~21.11%;在1,2,3,4个环境中同时检测到的QTLs分别有9,1,1,1个。而利用4个环境平均值进行联合分析定位出个4个QTLs,纤维长度和纤维整齐度的QTLs均为2个,解释性状表型变异的14.37%~19.97%,并且纤维长度和整齐度的QTL在相同的位置。

2、完善棉花纤维品质性状的QTL定位,实现QTL的精细定位到相应染色体片段上

近年来,数量遗传学和现代生物技术的发展为作物育种赋予了新的活力,借助DNA分子标记和QTL作图,复杂的数量性状可剖分为若干离散的孟德尔因子所决定的组分,进而确定其在染色体上的位置及其与其他基因的关系。Lacape等(2010)以陆地棉和海岛棉杂交建立的重组自交系为材料在11个不同的环境下进行独立实验分析纤维特征。在每个站点的基础上通过复合区间作图法进行QTL分析。进行纤维品质性状QTL定位的有强度、伸长、长度、平均长度,细度、成熟度和颜色。通过对重组自交系和3次回交群体整合后QTL数据的元分析,将颜色定位在C6,C8和C25染色体上,细度定位在C15染色体上以及纤维长度定位在C3染色体上。这些与纤维品质特性有关的保守染色体区域使我们进一步加深了对重要纤维特征遗传和基因因素以及分子标记的选择的认识。

任立华等(2002)利用 (TM1×Sub 16 )F2∶3 家系对位于第16染色体上的重要农艺性状进行遗传分析 ,发现第 16染色体上有铃重、衣分、衣指、纤维

长度、第一果枝节位的QTLs各 2个 ,纤维伸长率、开花天数的QTL各 1个 ,没有检测到子指、纤维强度、麦克隆值的QTL。在构建第 16染色体的RAPD、SSR分子标记连锁图基础上 ,利用分子标记对相应重要农艺性状进行区间作图 ,检测到铃重、开花天数、纤维长度、纤维伸长率的QTL各 1个 ,在F2∶3 株系群体中能解释的表型变异分别为 15 .2 %、12 .1%、19.7%和 11.7% ;检测到 2个衣指QTLs,在F2∶3 株系群体中能解释的表型变异分别为 11.6 %和 41.9% ;检测到 3个衣分QTLs,在F2∶3 株系群体中能解释的表型变异分别为 8.7%、9.6 %和 2 9.2 %。单标记检测到铃重、开花天数的QTL各 1个 ,在F2∶3 株系群体中能解释的表型变异分别为 1.6 0 %和 4.6 3%。证明了第 16染色体与铃重、衣分、衣指、纤维长度、纤维伸长、开花天数等性状的关系 3、研究棉花纤维品质遗传构成的多样性和等位基因效应

目前QTL作图的结果以及利用新的统计工具对已有实验数据的重新分析,都发现对许多数量性状来说,控制性状遗传的基因在效应大小上是有差异的。效应较大的基因可以表现出主基因的特性,遗传效应相对较小的基因表现为微基因,性状的遗传表现为主基因加多基因的混合遗传模式。盖钧镒、王建康及章元明等在前人研究的基础上,对一对纯系亲本间杂种分离世代检测QTL体系的遗传实验方法作了全面研究,将混合分布理论与数量遗传学有机结合起来,使用了整个群体的信息,提出了一套完整的分析主基因与多基因的存在与效应的方法。

袁有禄等(2002)利用主基因与多基因混合遗传模型联合分析方法 ,通过纤维强度不同的 5个亲本配制的 8个组合 ,研究了棉花主要纤维品质性状的遗传。联合分析发现 ,在不同性状不同组配方式的 14个组合中 ,有 12个存在主基因 ,表明了纤维性状主基因存在的普遍性 ,以F2∶3 家系的预测效果最好 ;双亲纤维品质性状均存在较大差异的组合—72 35×TM1F2 代强度主基因的遗传率为 0 .196 ,麦克隆值为 0 .32 0 ,长度为 0 .139,回交世代的主基因遗传率小。除纤维长度总的显性效应为较高的正值外 ,其余各纤维性状的主基因显性与多基因显性的总和为负值或接近 0 ,杂合状态下大多数纤维品质性状表型值会偏向中亲值或低亲值 ,单纯依靠表型选择效率低。

马雪霞等(2008)利用亚洲棉农家品种中长纤维、高强度的江陵中棉和短纤维、低强度的浙江萧山绿树构建的F2∶3家系,利用主基因与多基因混合遗传模型分析方法,对主要纤维品质和产量性状进行4世代联合分析,得到有关纤维品质和产量性状的最适遗传模型。除伸长率之外,长度、马克隆值、比强度、整齐度、短纤维指数均没有检测到主基因;产量性状中铃重和单株铃数最适遗传模型为两对加性-显性-上位性主基因+加性-显性多基因混合遗传模型(E-1),衣分的最适遗传模型为两对主基因的加性模型(B-3),子指的最适遗传模型为无主基因的加性-显性-上位性多基因模型(C),单株皮棉产量的最适遗传模型为两对加性-显性-上位性主基因+加性-显性-上位性多基因混合遗传模型(E)。利用主基因与多基因混合遗传模型分析方法对亚洲棉纤维品质和产量性状进行遗传分析,有助于阐明棉花品质和产量性状的遗传规律。

二、利用转录组学研究棉纤维品质形成的基因表达分子机制

1、利用已建成棉花转录组的微阵列芯片,获得在棉纤维分化和突起、伸长、加厚等过程中特异性表达的棉花因子,揭示其可能调控或参与的代谢途径,阐明胚

珠表皮纤维突起及伸长的决定因素。

Gilbert MK等(2013)对Li1突变体纤维进行了生理和形态测量,包括在此过程中纤维素含量的测量。用基因芯片来分析在生长发育关键时期3DPA、12DOA、16DPA的档案记录。结果表明Li1基因严重干扰了与纤维发育相关的重要激素其它代谢途径,特别在从伸长到次生细胞壁的合成的过渡阶段。GO分析表明在过度时期一些重要的代谢途径被改变了。涉及乙烯生物合成和初生细胞壁的重排的基因受到影响,与初生细胞壁相关的纤维素合酶的转录受到抑制。用包含2,553个个体的F2群体做出连锁图谱并对在22号染色体上的Li1基因位点进行SSR标记定位。本文的结果将为纤维伸长的遗传和分子机制的进一步研究奠定了基础。

2、 分离鉴定植物激素信号途径对棉纤维发育起重要调控作用的基因,通过时空表达特性,推测这些基因在棉纤维发育过程中的作用。

Padmalatha KV等(2012)通过对陆地棉野生型和它的近等基因系突变型在起始期 (0 DPA)、伸长期 (5, 10和15 DPA)、以次生壁形成期 (20DPA) 的转录组分析表明在纤维细胞启动和分化中调控机制需要协调表达。扫描电子显微镜研究发现在突变体中纤维细胞发育起始延迟。转录组分析表明,在纤维起始和伸长初期(5 DPA)阶段,钙和植物激素介导的信号转导途径,生长素和乙烯和胁迫应答转录因子(TF)的生物合成都是下调节。在纤维伸长期(5-15DPA)碳水化合物和脂质代谢、线粒体电子传递系统(mETS)和细胞壁松弛、伸长也都表现下调节。另外发现,在纤维发育初始阶段中野生型变现为一些与植物激素信号传导和胁迫应答因子的转录均为上调节,而在突变型上表现为上调节且在更晚的阶段(15DPA)。

Naoumkina M等(2013)通过对从Li2突变型和野生型在纤维伸长阶段中分离的代谢物的主成份分析表明Li2的突变改变了纤维的代谢。这些改变有检测到游离糖,糖醇,糖酸,磷酸糖类水平的显著下降,碳水化合物合成、细胞壁松弛、细胞骨架建成生物过程也表现为下调节。与许多生物信号的因素有关的γ-氨基丁酸水平显著升高,2 - 酮戊二酸,琥珀酸盐,苹果酸盐积累量增加,说明在突变体中硝酸盐同化过程加快。氮化合物代谢相关基因的转录激活以及转移氨基酸含量水平的变化表明重定向碳进入到氮代谢中。许多与细胞伸长相关的因素在这项研究被发现,这将有助于进一步了解棉花纤维伸长的代谢过程。

3、分离和鉴定棉花纤维素合成相关基因,探索纤维素合成的网络调控关系,阐明棉纤维数量和长度的调控机制。

棉纤维发育突变体是克隆棉纤维发育关键基因和阐明其发育分子机理的优异资源。陆地棉李氏超短纤维突变体(Li1li1)是显性单基因突变体,表现为显性纯合体(Li1Li1)致死,显性杂合时(Li1li1)表型为茎秆扭曲、叶片卷曲和纤维短至6mm,而隐性纯合体(li1li1)则表现为株型和纤维发育都正常。

王磊等(2010)对开花后10d的李氏纤维发育正常材料(li1li1)和超短纤维突变体(Li1li1)胚珠纤维混合体进行mRNA差异显示反转录PCR(DDRT-PCR)分析,获得2条在李氏纤维发育正常材料中上调表达的差异片段。测序及DNA序列的生物信息学分析表明该差异片段分别与编码谷氨酸脱羧酶和质子焦磷酸酶的基因有较高同源性。通过电子拼接,5′RACE和全长cDNA序列验证,克隆了棉花的谷氨酸脱羧酶(GhGAD)和质子焦磷酸酶(GhVP1)基因全长cDNA,进一步对其功能和染色体

定位进行了初步分析。转录水平分析表明,这两个基因在棉花根、茎、叶和纤维中组成性表达,在棉纤维中优势表达。利用本实验室陆地棉遗传标准系TM-1和海岛棉海7124培育的含140个单株的BC1作图群体,将GhGAD和GhVP1分别定位在第12条染色体和第8条染色体

(4)棉花纤维发育早期RNA-Seq转录组分析

miRNA(microRNA)是一类21~24个核酸长度的非编码小分子RNA(sRNA),它主要通过抑制或降解靶基因来调控植物生长发育等过程。RNA-seq即转录组测序技术 就是把mRNA,smallRNA,and NONcoding RNA等或者其中一些用高通量测序技术把它们的序列测出来,反映出它们的表达水平。

为了揭示棉花纤维发育早期基因表达变化情况, 李锡花等(2013)以纤维长度存在显著差异的两个陆海回交近交系NMGA-062(32.58 mm)和NMGA-105(27.06 mm)为材料,利用Illumina HiSeqTM 2000对0、3 DPA的胚珠及10 DPA的纤维进行RNA-Seq测序。六个文库进行拼接,共得到长度大于200 bp的Unigene 98464个,总长度约为88.2 Mb。对10 DPA的纤维转录组数据进行差异表达分析,共筛选到1931个差异表达基因,1536个Unigene上调,395个Unigene下调。GO功能显著性富集和Pathway显著性富集分析发现,差异表达基因富集在脂质转移活性(Lipid transport activity)分子功能组和脂质代谢通路,由此推测脂类相关基因可能在纤维伸长发育过程中起重要作用。通过对棉纤维发育10 DPA基因转录水平差异比较分析,为深入开展纤维伸长相关功能基因的克隆和功能验证提供了丰富的资源,并为揭示棉花纤维伸长的机制打下了坚实的基础。

Kwak等(2009)以野生型和突变性的棉花胚珠细胞构建了两个小RNA文库,并分别对它们进行了测序和检验。结果发现了至少22个保守的miRNA家族,包含111个miRNAs。其中七个miRNA家族组成了在棉花胚珠中大量表达的miRNAs。由最保守的miRNAs总共推测出120个特异的目标基因。在棉花的胚珠中还发现了两个新的特异型细胞的miRNA。这项研究表明了在野生型和突变型中miRNASs表达丰度的重大不同,说明这些miRNA表达转录调控的不同与棉花的纤维发育密切相关。

南文智等(2013)试验利用在纤维长度上有显著差异的2个回交自交系BILs的0 DPA、3 DPA的胚珠和10 DPA的纤维构建6个sRNA文库并进行Solexa测序。共发现561个miRNAs,其中包括254个已知的miRNAs(属于40个miRNA家族),75个候选的miRNAs和232个新的miRNAs,研究结果极大地丰富了棉属miRNAs。通过miRNA靶基因预测分析发现多数miRNAs负调控其对应的靶基因,少数正调控。 三、棉纤维发育重要功能蛋白质的鉴定以及这些蛋白质在棉纤维发育过程中的相互作用和分子功能

棉花分子生物学、功能基因组学的发展已大大促进了棉花纤维发育过程中基因的表达谱及其调控机制的研究。但是,在蛋白质翻译、蛋白质分解、运输和翻译后修饰(如磷酸化、糖基化、酰基化)等水平上的棉花蛋白质组学研究较少。其中棉花纤维初始发育时期的磷酸蛋白质组学研究尤为重要,一方面是因为棉花原始纤维细胞的分化决定着种皮细胞是否能发育成为纤维;另一方面是因为可逆的磷酸化修饰是细胞信号转导的重要途径,在生物发育过程中起着关键的调节作用。因此,开展棉花纤维初始发育时期的磷酸蛋白质组学研究对于深入探究棉花