banner
Nachrichtenzentrum
Umfangreiche Erfahrung im Vertrieb und Marketing.

Genom

Feb 13, 2024

Wissenschaftliche Berichte Band 12, Artikelnummer: 10165 (2022) Diesen Artikel zitieren

1123 Zugriffe

4 Zitate

Details zu den Metriken

Die Genfamilie des C2H2-Zinkfingerproteins (C2H2-ZFP) spielt eine wichtige Rolle bei der Reaktion auf Umweltstress und verschiedene andere biologische Prozesse in Pflanzen. Ginseng ist ein wertvolles Heilkraut, das in Asien und Nordamerika angebaut wird. Über die C2H2-ZFP-Genfamilie und ihre Funktionen im Ginseng ist jedoch wenig bekannt. Hier haben wir 115 C2H2-ZFP-Gene aus Ginseng identifiziert, die als PgZFP-Genfamilie definiert sind. Es wurde in fünf Gruppen eingeteilt und mit acht konservierten Motiven ausgestattet, wobei jedes Gen ein bis sechs davon enthielt. Die Familiengene werden in 17 Unterkategorien der Genontologie eingeteilt und verfügen über zahlreiche regulatorische Elemente, die auf eine Vielzahl biologischer Prozesse reagieren, was auf ihre funktionelle Differenzierung schließen lässt. Die 115 PgZFP-Gene wurden in der Samenbildungsphase in 228 Transkripte gespleißt und variierten dramatisch in der Expression über Gewebe, Entwicklungsstadien und Genotypen hinweg, aber sie bilden ein Koexpressionsnetzwerk, was auf ihre funktionelle Korrelation schließen lässt. Darüber hinaus wurden vier Gene, PgZFP31, PgZFP78-01, PgZFP38 und PgZFP39-01, aus der Genfamilie identifiziert, die aktiv an der Reaktion der Pflanzen auf Salzstress beteiligt sind. Diese Ergebnisse liefern neue Erkenntnisse über Ursprung, Differenzierung, Evolution und Funktion der PgZFP-Genfamilie sowie neue Genressourcen für die C2H2-ZFP-Genforschung und -anwendung bei Ginseng und anderen Pflanzenarten.

Ginseng wird als wertvolles Heilkraut häufig für die menschliche Ernährung, Medizin und Kosmetika verwendet. Seine wichtigsten bioaktiven Inhaltsstoffe, Ginsenoside, können nachweislich verschiedene Krebsarten verhindern, hemmen und behandeln1,2,3. Daher wurde die Ginseng-Genomforschung in den letzten Jahren intensiv betrieben. Xu et al.4 berichteten über den ersten Entwurf des Ginseng-Genoms. Kim et al.5 veröffentlichten den Entwurf des Ginseng-Genoms für einen anderen Genotyp, aus dem 59.352 Gene identifiziert wurden. Kürzlich berichteten Wang et al.6 über einen chromosomengroßen Aufbau des Ginseng-Genoms für den dritten Genotyp, aus dem 65.913 Gene identifiziert wurden. Wang et al.7 sequenzierten das Transkriptom einer 4 Jahre alten Ginsengpflanze, die in 14 Geweben exprimiert wurde, stellten 248.992 Transkript-Unigene zusammen, die aus 130.557 Genmodellen gespleißt wurden, und quantifizierten ihre Expression in den 14 Geweben. Diese genomischen und transkriptomischen Ressourcen haben nützliche Werkzeuge für die genomweite Identifizierung und Charakterisierung von Genen bereitgestellt, die für die Ginseng-Forschung und -Züchtung wichtig sind.

Es wurde gezeigt, dass die Genfamilie des C2H2-Zinkfingerproteins (ZFP) eine wichtige Rolle bei der Reaktion von Pflanzen auf abiotischen und biotischen Stress, beim Pflanzenwachstum und bei der Pflanzenentwicklung sowie bei der Hormonsignaltransduktion spielt. Beispielsweise verbesserte die Überexpression eines C2H2-ZFP-Gens von Arabidopsis, ZAT18, die Dürretoleranz8. Das Reis-bsr-d1-Gen, das einen C2H2-Transkriptionsfaktor kodiert, erhöhte die Krankheitsresistenz und Immunität gegen Reisbrand9. Das Tomaten-SlZFP2-Gen war an der Regulierung der ABA-Biosynthese während der Fruchtentwicklung beteiligt und hemmte dadurch die Fruchtentwicklung durch die Transkriptionshemmung des Blühregulators10. Es wurde berichtet, dass die C2H2-ZFP-Genfamilie aktiv an der Reaktion der Pflanzen auf Salzstress beteiligt ist, was für die Pflanzenproduktion von Bedeutung ist11. Die Expression eines Tomaten-C2H2-ZFP-Gens, SlZF3, erhöhte die Pflanzensalztoleranz12. Die Expression von Zoysia japonica ZjZFN1 in Arabidopsis verbesserte die Samenkeimung, die Anpassungsfähigkeit der Pflanze an Salzstress und den Prozentsatz grüner Keimblätter unter Salzstressbedingungen13. Die AZFs- und STZ-Gene in Arabidopsis hatten transkriptionelle Repressionsaktivitäten und reagierten somit auf Salzstress14. Es wurde gezeigt, dass das OsZFP213-Gen in Reis mit OsMAPK3 interagiert und so die Salztoleranz erhöht15. Bei Sojabohnen und Arabidopsis spielte GmZAT4 eine wichtige Rolle bei der PEG- und NaCl-Stresstoleranz und der ABA-Reaktion16.

Daher wurden die Gene der C2H2-ZFP-Genfamilie genomweit in mehreren Pflanzenarten identifiziert und charakterisiert, darunter Arabidopsis, das 176 C2H2-ZFP-Gene enthält17, Reis (189)18, Pappel (109)19, Medicago truncatula (218). )20, Mais (211)21 und Sojabohne (321)22. Die C2H2-ZFP-Genfamilie wird normalerweise als X2CX2–4CX12HX2–8H ausgedrückt, wobei X für eine beliebige Aminosäure steht und die Zahl die Anzahl aller Aminosäuren angibt23. Es zeichnet sich durch sein C2H2-Zinkfingerprotein aus, das Koordinationsbindungen mit zwei Paaren von Cystein- und Histidinresten bildet und darüber hinaus durch β-Haarnadeln und α-Helices eine kompakte fingerartige tetraedrische Struktur bildet24. Darüber hinaus enthält die Genfamilie einige konservierte Domänen, darunter die DNA-Bindungsdomäne, die Transkriptionsregulationsdomäne und die Proteininteraktionsdomäne23. Die DNA-Bindungsdomäne ist durch ein hochkonserviertes QALGGH-Motiv gekennzeichnet, in dem jede Aminosäure für ihre DNA-Bindungsaktivität wichtig ist. Das Fehlen des QALGGH-Motivs in einem C2H2-ZFP-Gen kann die ABA-Empfindlichkeit und damit die Stomatengröße25 verringern und die Blütenstandsentwicklung beeinflussen26. Ein weiteres einzigartiges Merkmal der Genfamilie ist die Längenvariation des Abstandshalters zwischen zwei benachbarten Zinkfingern des C2H2-Zinkfingerproteins, die möglicherweise auch die DNA-Bindung beeinflusst23. Darüber hinaus enthalten einige C2H2-ZFPs eine hochkonservierte Aminosäuresequenz (L/FDLNL/FxP), das sogenannte EAR-Motiv, in der carboxyterminalen Region27. Das EAR-Motiv ist die kleinste bekannte Transkriptionsrepressionsdomäne. Wenn sich ein einzelner Rest im EAR-Motiv änderte, wurde die Fähigkeit zur Transkriptionsrepression stark reduziert oder verschwand28. Die drei DLN-Aminosäuren des Hexapeptidmotivs sind für die Transkriptionshemmung unverzichtbar und das Vorhandensein von mindestens zwei DLN-Resten führte zu einer maximalen Transkriptionshemmung29.

Dennoch wurde die C2H2-ZFP-Genfamilie in Ginseng nicht beschrieben. In der vorliegenden Studie identifizierten wir 228 C2H2-ZFP-Gentranskripte, die aus 115 C2H2-ZFP-Genen aus Jilin-Ginseng gespleißt wurden, definierten PgZFP-Gene und charakterisierten sie hinsichtlich genetischer Diversität, Evolution, Expression, funktioneller Differenzierung und Gen × Gen-Interaktion. Darüber hinaus identifizierten wir vier PgZFP-Gene, die an der Reaktion von Ginseng auf Salzstress beteiligt sind, und bestätigten so die Rolle der Familie bei der Reaktion von Pflanzen auf Salzstress. Daher bieten die Ergebnisse dieser Studie einen umfassenden Einblick in die PgZFP-Genfamilie im Ginseng, das Wissen und die Genressourcen, die für die fortgeschrittene Forschung und Züchtung im Ginseng und verwandten Arten erforderlich sind.

Für diese Studie wurden drei Sätze Jilin-Ginseng-Pflanzenmaterialien verwendet (ergänzende Abbildung S1A). Diese Pflanzenmaterialien umfassten 14 Gewebe eines 4 Jahre alten Lebenslaufs. Damaya-Pflanze, Wurzeln von 5, 12, 18, 25 Jahre alten Lebensläufen. Damaya-Pflanzen und 4 Jahre alte Pflanzenwurzeln von 42 Sorten (im Folgenden als Genotypen bezeichnet), kodiert von S1 bis S42 (Ergänzungstabelle S1). Die Samen dieser Pflanzenmaterialien stammten alle aus unserem Labor und sind auf Anfrage erhältlich. Die 14 Gewebe des 4-jährigen Lebenslaufs. Zur Damaya-Pflanze gehörten Faserwurzel, Beinwurzel, Hauptwurzelepiderm, Hauptwurzelrinde, Armwurzel, Rhizom, Stängel, Blattstiel, Blättchenstiel, Blattspreite, Fruchtstiel, Fruchtstiel, Frucht und Samen7. Die Wurzeln von 5, 12, 18 und 25 Jahre alten Pflanzen wurden alle von der Sorte Damaya gesammelt. Die 42 Genotypen wurden im Ursprungs- und Diversitätszentrum des Ginsengs in der Provinz Jilin in China gesammelt, wo über 65 % des weltweiten Ginsengs produziert wurden. Diese Genotypen waren Vertreter der genetischen Vielfalt des Jilin-Ginsengs.

Um die Forschung zur funktionellen Genomik von Ginseng zu erleichtern, haben wir zuvor mehrere Datenbanken mit funktionellen Genen für Jilin-Ginseng entwickelt. Diese Datenbanken umfassten die Gensequenz- und Expressionsdatenbank in den oben genannten 14 Geweben der 4 Jahre alten Pflanze (Datenbank A)7, die Gensequenz- und Expressionsdatenbank der vier verschiedenen einjährigen Pflanzenwurzeln (Datenbank B)7 und die Gensequenz- und Expressionsdatenbank der 4 Jahre alten Pflanzenwurzeln von 42 Genotypen (Datenbank C)30. Diese Datenbanken wurden für diese Studie verwendet. Datenbank A besteht aus 248.992 einzigartigen Transkripten mit 59.092–113.456 einzigartigen Transkripten pro Gewebe. Datenbank B enthält 54.444–65.412 einzigartige Transkripte pro einjähriger Pflanzenwurzel. Datenbank C besteht aus 48.211–79.134 einzigartigen Transkripten pro Genotyp. Darüber hinaus wurden für diese Studie auch drei Ginseng-Genomassemblierungen aus drei Genotypen4,5,6 verwendet.

Datenbank A wurde verwendet, um die C2H2-ZFP-Gene in Ginseng zu identifizieren. Zuerst haben wir das C2H2-ZFP Hidden Markov Model (HMM) (Proteinfamilie: PF00096) aus der Pfam-Datenbank (Pfam 33.1; https://pfam.xfam.org/)31 abgerufen, das als Abfragen für die Suche in der Ginseng-Datenbank A verwendet wurde C2H2-ZFP-Gene und identifizierte die mutmaßlichen C2H2-ZFP-Gene in Ginseng. Anschließend wurden die identifizierten mutmaßlichen Ginseng-C2H2-ZFP-Gene in iTAK (http://bioinfo.bti.cornell.edu/tool/itak) importiert, um die mutmaßlichen C2H2-ZFP-Gene durch konservative C2H2-ZFP-Domänensuche weiter zu bestätigen. Die mutmaßlichen C2H2-ZFP-Gene, von denen bestätigt wurde, dass sie über die C2H2-ZFP-Domänen verfügen, wurden als Ginseng-C2H2-ZFP-kodierende Gene betrachtet und als PgZFP-Gene definiert (Ergänzungstabelle S2). Schließlich wurde der ORF-Finder (https://www.ncbi.nlm.nih.gov/orffinder/) verwendet, um die ORFs der PgZFP-Gene zu identifizieren. Die relevanten physiologischen und biochemischen Indikatoren ihrer mutmaßlichen Proteinsequenzen wurden mithilfe von Protparam (https://web.expasy) vorhergesagt, einschließlich isoelektrischer Punkt (PI), Molekulargewicht (Da), großer Durchschnitt der Hydropathie, Instabilitätsindex und aliphatischer Index. org/protparam/).

Wir haben die oben identifizierten PgZFP-Gene mit Blastn auf drei Ginseng-Genom-Assemblys abgeglichen4,5,6, um ihre Verteilung im Ginseng-Genom6 und die Variation der Größe der PgZFP-Genfamilie zwischen den Genotypen zu bestimmen. Für das Alignment wurden die Kriterien Identität ≥ 99 %, Coverlänge ≥ 200 bp und E-Wert ≤ 1,0E−100 verwendet. Die PgZFP-Gene wurden mit den Kriterien Identität ≥ 75 %, Deckungslänge ≥ 80 bp und E-Wert ≤ 1,0E-10 auf das Arabidopsis-Genom abgeglichen, da Ginseng entfernt mit Arabidopsis verwandt ist (ergänzende Abbildung S1B)33. Die Verteilung der Genfamilie im Ginseng-Genom und ihre Syntenie mit dem Arabidopsis-Genom wurden mithilfe des R-Pakets Circlize34 konstruiert. Die auf jede Genomanordnung abgestimmten Gene wurden verglichen, um die Pan- und Core-Transkriptome der Genfamilie unter den drei Ginseng-Genotypen zu identifizieren.

Um den Ursprung, die Entwicklung und die Phylogenie der PgZFP-Genfamilie zu bestimmen, haben wir mit dem NCBI ORF-Finder (https://www.ncbi.nlm.nih.gov/orffinder/) nach den ORFs der Transkripte aller 115 PgZFP-Gene gescreent. ), berechnete das Ka/Ks-Verhältnis der kürzlich duplizierten PgZFP-Gene, konstruierte ihren phylogenetischen Baum und sagte ihre konservierten Domänen voraus. Die Transkripte mit vollständigem CDS wurden für die Ka/Ks-Berechnung mit dem KaKs_Calculator35 verwendet. Der Zeitpunkt der Genduplikation und -divergenz wurde durch T = Ks/2λ × 10−6 geschätzt, wobei Ks die synonyme Nukleotidsubstitutionsrate und λ die Anzahl der Substitutionen pro synonymer Stelle pro Generation ist, für die λ = 6,5 × 10−9 wurde verwendet36,37,38.

Das Transkript mit der längsten Aminosäuresequenz für ein PgZFP-Gen wurde zur Konstruktion des phylogenetischen Baums der Genfamilie verwendet. Der phylogenetische Baum wurde unter Verwendung der Maximum-Likelihood-Methode (ML) von MEGA X39 mit 1000 Bootstrap-Replikationen erstellt. 45 C2H2-ZFPs von Arabidopsis wurden aus der Plant Transcription Factor Database (http://plntfdb.bio.uni-potsdam.de/v3.0/) heruntergeladen und als Fremdgruppe und evolutionäre Referenz verwendet.

MEME40 wurde verwendet, um die konservierten Domänen in den PgZFP-Gentranskripten vorherzusagen. Die mutmaßlichen Proteinsequenzen der 26 PgZFP-Gene, die über die vollständigen konservativen Domänen verfügen, wurden als Repräsentanten für die Vorhersage der konservierten Domänen der Gene verwendet. Die Motivlänge wurde auf 10–50 Aminosäuren und die maximale Anzahl der Motive auf 6, 8 bzw. 10 festgelegt, während andere Parameter als Standard festgelegt wurden.

Studien haben dokumentiert, dass die Arten von Gen-cis-regulatorischen Elementen, wie z. B. Promotoren, mit der biologischen Funktionalität der Gene, wie z. B. Pflanzenreaktionen auf Hormone, abiotischen und biotischen Stress sowie Pflanzenwachstum und -entwicklung, zusammenhängen. Wir haben die funktionelle Differenzierung und Divergenz der Gene in der PgZFP-Genfamilie durch Kategorisierung der Genontologie (GO) und Sequenzanalyse der cis-regulatorischen Elemente geschätzt. Die PgZFP-Gentranskripte wurden mit Blast2GO V5.041 GO kategorisiert. Die Anreicherung der Anzahl der in jede Unterkategorie kategorisierten PgZFP-Gentranskripte wurde mit einem Chi-Quadrat-Test getestet, wobei die Kategorisierung der Transkripte verwendet wurde, die in der 4 Jahre alten Ginsengpflanze als Kontrolle exprimiert wurden7. Die 1500-bp-Upstream-Sequenzen der PgZFP-Gene wurden analysiert, die cis-regulatorischen Elemente der Gene wurden identifiziert und die Typen der cis-regulatorischen Elemente wurden mithilfe der PlantCARE-Datenbank klassifiziert42.

Wir haben die PgZFP-Genfamilie durch Analyse der Expressionen, Heatmaps und Koexpressionsnetzwerke ihrer Gentranskripte in 14 Geweben einer 4 Jahre alten Pflanze, in 5, 12, 18 und 25 Jahren, charakterisiert. alte Pflanzenwurzeln und in den 4 Jahre alten Pflanzenwurzeln 42 Genotypen. Die Ausdrücke der PgZFP-Gentranskripte wurden aus den Datenbanken A, B bzw. C extrahiert. Die Expressions-Heatmaps der Gene wurden unter Verwendung eines R-Sprachpakets zur Heatmap-Erstellung und -Visualisierung erstellt. Die Koexpressionsnetzwerke der Gene wurden mit der Software BioLayout Express3D Version 3.243 konstruiert. Darüber hinaus haben wir die Tendenz, dass die PgZFP-Gentranskripte ein Koexpressionsnetzwerk bildeten, mithilfe des Student-t-Tests getestet, indem wir 176 zufällig aus den 228 in dieser Studie identifizierten PgZFP-Gentranskripten ausgewählte Transkripte mit der gleichen Anzahl zufällig aus Datenbank A ausgewählter Transkripte verwendet haben Kontrolle. Der Test wurde bei einer Reihe von Cutoff-Werten von P ≤ 5,0E−02 bis 1,0E−08 mit 20 Wiederholungen pro Cutoff-Wert durchgeführt. Darüber hinaus haben wir die Hub-Gene des PgZFP-Genfamiliennetzwerks anhand der folgenden Kriterien identifiziert: Netzwerk-Cutoff-P-Wert ≤ 0,001, Konnektivität ≥ 30 und der Prozentsatz der Hub-Gene an der Gesamtzahl der Gene im Netzwerk ≤ 5 %. Die Konnektivität eines Gens in einem Netzwerk gibt nicht nur den Grad seiner Koexpressionskorrelation mit anderen Genen an, sondern auch die Anzahl der Gene, mit denen es im Netzwerk interagiert.

Um die mögliche Funktion der PgZFP-Genfamilie als Reaktion auf Salzstress zu untersuchen, haben wir Ginseng mit dem NaCl-Salz gestresst und dabei seine Adventivwurzeln als Versuchsmaterialien verwendet. Die 1 cm großen Adventivwurzeln wurden auf dem B5-Medium, das 0 mM, 20 mM, 40 mM und 80 mM NaCl enthielt, 30 Tage lang bei 25 °C kultiviert und belastet. Die Länge der Wurzeln wurde gemessen, schnell in flüssigem Stickstoff eingefroren und zur Genexpressionsanalyse bei -80 °C gelagert.

Wir haben zunächst die PgZFP-Gene analysiert, indem wir sie mit den in A. thaliana, STZ und AZF identifizierten salzresponsiven Genen abgeglichen haben. Die PgZFP-Gene, die am besten mit den STZ- und AZF-Genen übereinstimmen, wurden dann ausgewählt und einer vergleichenden Expressionsanalyse unter Verwendung der mit und ohne Salz gestressten Ginseng-Adventivwurzeln durch quantitative Echtzeit-PCR (qPCR) unterzogen, um zu testen, ob die Gene des PgZFP-Gens vorhanden sind Familie reagiert auf Salzstress. Die qPCR-Primer der ausgewählten PgZFP-Gene wurden basierend auf ihren Sequenzen entworfen (Ergänzungstabelle S3). Gesamt-RNA wurde aus den Adventivwurzeln isoliert, die mit den oben genannten unterschiedlichen NaCl-Konzentrationen unter Verwendung der Trizol-Methode gestresst wurden. mRNA wurde aus der Gesamt-RNA gereinigt und Erststrang-cDNA wurde synthetisiert und als qPCR-Matrizen verwendet. Als Referenzgen wurde das CYP-Gen verwendet44. qPCR wurde mit dem Applied Biosystems 7500 Real-Time System (ABI, USA) und dem Ultra SYBR Mixture Kit (Low ROX) (ComWin, Peking, China) durchgeführt. Die 2−ΔΔCT-Methode wurde verwendet, um die relativen Expressionen der PgZFP-Gene zu bestimmen.

Die Autoren bestätigen, dass alle Methoden in Übereinstimmung mit den relevanten Richtlinien und Vorschriften durchgeführt wurden. Alle in dieser Studie verwendeten Pflanzenmaterialien stammten aus dem Labor der Autoren.

Insgesamt wurden 228 PgZFP-Gentranskripte mit einer Sequenzlänge von 202 bis 5327 bp und einer durchschnittlichen Länge von 1419 bp identifiziert (Ergänzungstabelle S2). Diese Transkripte wurden aus 115 PgZFP-Genen gespleißt, mit 1 bis 20 Transkripten pro Gen und durchschnittlich 2 Transkripten pro Gen. Die Molekulargewichte der mutmaßlichen Proteine ​​der PgZFP-Gentranskripte variierten zwischen 3808 und 177.151 Dalton (Da), ihr isoelektrischer Punkt (PIs) lag zwischen 4,55 und 12,13, der maximale Gesamtdurchschnitt ihrer Hydropathien lag bei 1,253 und der minimale Gesamtdurchschnitt bei ihre Hydropathizität betrug − 1,512. Da nur 16 der PgZFP-Gentranskripte einen positiven Gesamtdurchschnitt der Hydropathie aufwiesen, spekulierten wir, dass die meisten Gene der PgZFP-Genfamilie hydrophile Proteine ​​kodieren. Die Instabilitätsindizes der mutmaßlichen PgZFP-Proteine ​​lagen zwischen 18,90 und 88,75, wobei die meisten von ihnen über 40,00 lagen, was darauf hindeutet, dass die meisten PgZFP-Gene in der Genfamilie instabile Proteine ​​kodieren (Ergänzungstabelle S4).

73 der 115 in dieser Studie identifizierten PgZFP-Gene wurden auf alle 24 Chromosomen des chinesischen Ginsengs6 abgebildet, wobei jedes Chromosom 1–6 PgZFP-Gene aufwies. Es wurde gezeigt, dass 17 von 73 PgZFP-Genen, die im Genom des chinesischen Ginsengs kartiert wurden, syntenisch zu 11 Arabidopsis-Orthologen in vier der fünf Arabidopsis-Chromosomen, den Chromosomen 1, 3, 4 und 5, sind, wobei jedes Chromosom 2–4 Arabidopsis-Orthologe aufweist (Abb. 1A). Von den 115 in dieser Studie identifizierten PgZFP-Genen wurden 74 und 74 mit den Genomen des chinesischen Ginsengs IR826 (Ref.4) bzw. des koreanischen Ginsengs ChP5 abgeglichen. Eine vergleichende Analyse zeigte, dass das Pan-Transkriptom der Genfamilie aus 149 PgZFP-Genen bestand und das Kerntranskriptom der Genfamilie nur 12 PgZFP-Gene enthielt, was auf eine große Variation der Genfamiliengröße zwischen den Genotypen innerhalb von P. ginseng hindeutet.

Die Verteilung der PgZFP-Genfamilie im Ginseng-Genom und ihre Familiengrößenvariation zwischen den Ginseng-Genotypen. (A) Die Positionen der PgZFP-Genfamilie im chinesischen Ginseng-Genom6 und ihre Syntenie mit dem Arabidopsis-Genom. Die PgZFP-Gene wurden auf alle 24 Ginseng-Chromosomen abgebildet, die durch hellblaue Balken angezeigt werden, und ihre Arabidopsis-Orthologe wurden auf vier der fünf Arabidopsis-Chromosomen abgebildet, die durch gelbe Balken angezeigt werden. (B) Venn-Diagramm, das die Pan- und Core-Transkriptome der PgZFP-Genfamilie zeigt. Die Zahlen im Venn-Diagramm geben die Anzahl der PgZFP-Gene in der Familie an, die genotypspezifisch sind, zwischen den Genotypen gemeinsam sind und allen drei Genotypen gemeinsam sind. Der Prozentsatz der Gene wurde berechnet, indem die Anzahl der Gene durch die Gesamtzahl der PgZFP-Gene (221), die an das Genom jedes Genotyps angepasst waren, mal 100 dividiert wurde.

Wir haben zunächst den Duplikations- und Selektionsmodus der PgZFP-Gene in der Genfamilie geschätzt. Die Analyse von 20 Paaren der PgZFP-Gene, die über vollständige ORFs verfügen und zuletzt dupliziert wurden, ergab, dass diese Gene vor 18,0–40,7 Millionen Jahren (MYA) dupliziert und divergiert wurden. Ungefähr 55 % von ihnen wurden einer reinigenden Selektion (Ka/Ks < 1,0 ± 0,1), 40 % einer neutralen Selektion (Ka/Ks = 1,0 ± 0,1) und 5 % einer positiven Selektion (Ka/Ks > 1,0 ± 0,1) unterzogen ) (Ergänzungstabelle S5).

Um den Ursprung und die Phylogenie der PgZFP-Genfamilie in Jilin-Ginseng zu bestimmen (Ergänzungstabelle S1A), wurden die mutmaßlichen Proteine ​​der längsten Transkripte aller 115 PgZFP-Gene für das Experiment verwendet (Ergänzungstabelle S4). 45 repräsentative C2H2-ZFP-Gene von A. thaliana (At), ausgewählt aus ihrem phylogenetischen Baum (Ergänzungstabelle S6), wurden als Außengruppe verwendet (Ergänzungsabbildung S1B)33. Die PgZFP-Gene wurden zusammen mit den AtC2H2-ZFP-Genen in fünf Cluster eingeteilt, die von I bis V definiert sind (Abb. 2). Cluster I umfasste 26 PgZFP-Gene, gruppiert mit den Mitgliedern aus den Clustern C1-2i, C1-3i, C1-4i und C1-5i der AtC2H2-ZFP-Gene. Cluster II bestand aus 25 PgZFP-Genen, gruppiert mit Mitgliedern aus den Unterfamilien C2, C3, A3 und A4 der AtC2H2-ZFP-Gene. Cluster III bestand aus 46 PgZFP-Genen, gruppiert mit den Mitgliedern der C1-1i-, C1-2i-, A1-a-, A1-b- und A1-c-Cluster der AtC2H2-ZFP-Gene. Cluster IV enthielt 11 PgZFP-Gene, gruppiert mit Mitgliedern aus der AtC2H2-ZFP-A2-Unterfamilie und der B-Familie. Cluster V bestand aus 7 PgZFP-Genen, gruppiert mit dem einzigen Mitglied aus der AtC2H2-ZFP-C2-Unterfamilie17. Diese Ergebnisse legen den antiken Ursprung und die Vielfalt der PgZFP-Genfamilie nahe.

Phylogenie der PgZFP-Genfamilie. Der phylogenetische Baum der PgZFP-Genfamilie wurde unter Verwendung aller 115 PgZFP-Gene und der C2H2-ZFP-Gene von Arabidopsis thaliana (At) als Außengruppe erstellt. Die Unterfamilien der PgZFP-Genfamilie werden durch I, II, III, IV und V angezeigt. Der phylogenetische Baum wurde unter Verwendung der Maximum-Likelihood-Methode (ML) mit 1.000 Bootstrap-Replikationen erstellt. Die Zahl neben jedem Cluster gibt die Bootstrap-Konfidenz des Clusters in Prozent (%) an.

Darüber hinaus analysierten wir die konservierten Motive der PgZFP-Genfamilie unter Verwendung der mutmaßlichen Proteine ​​von 26 repräsentativen PgZFP-Genen, die vollständig konservierte Domänen innerhalb von ORFs mit Motivlängen von 10–50 Aminosäuren und einer maximalen Motivanzahl von 6, 8 oder mehr aufweisen 10. Bei einer maximalen Motivanzahl von 6 wurden sechs konservative Motive identifiziert. Bei einer maximalen Motivanzahl von 8 wurden acht konservative Motive identifiziert. Bei einer maximalen Motivanzahl von 10 wurden zehn konservative Motive identifiziert. Dennoch stimmten die sechs oder acht Motive der PgZFP-Gene, die mit einer maximalen Motivanzahl von 6 oder 8 identifiziert wurden, vollständig mit den ersten sechs oder acht der 10 Motive der Gene überein, die mit einer maximalen Motivanzahl von 10 identifiziert wurden. Abbildung 3A zeigt das Acht konservierte Motive der PgZFP-Gene, die mit der maximalen Motivanzahl von 8 identifiziert wurden, definierten Motiv 1 bis Motiv 8. Motiv 1 wurde in 88,5 % der 26 untersuchten PgZFP-Gene identifiziert (Abb. 3B), was auf die evolutionäre Konservierung des PgZFP-Gens hinweist Familie. Das QALGGH der Motive 1 und 2 spielt eine wichtige Rolle bei der DNA-Bindung8. Die EXEXXAXCLXXL (L-Box) von Motiv 4 ist eine leucinreiche Region, die vermutlich eine wichtige Rolle bei Protein-Protein-Wechselwirkungen spielt23. Motiv 5 umfasst als EAR-Domäne die DLNL-Kernsequenz und spielt nachweislich eine wichtige Rolle bei der Transkriptionshemmung und der Reaktion auf abiotischen Stress29,45.

Die konservierten Motive und ihre Verteilung in den PgZFP-Genen. (A) Konservierte Motive von PgZFP-Proteinen. (B) Konservierte Motivverteilung in den PgZFP-Proteinen. Der phylogenetische Baum der PgZFP-Proteine ​​wurde mit der Maximum-Likelihood-Methode (ML) erstellt.

Zunächst haben wir die PgZFP-Gentranskripte mit der Genontologie (GO) kategorisiert. Die 228 PgZFP-Gentranskripte wurden in alle drei primären Funktionskategorien MF (molekulare Funktion), BP (biologischer Prozess) und CC (zelluläre Komponente) eingeteilt (Abb. 4A). Die MF-Kategorie umfasste 88 Transkripte, von denen 27 MF-spezifisch waren, 17 sowohl in die MF- als auch in die CC-Kategorie kategorisiert wurden, 13 sowohl in die MF- als auch in die BP-Kategorie kategorisiert wurden und 31 in alle drei Hauptkategorien kategorisiert wurden. Die BP-Kategorie umfasste 49 Transkripte, von denen 3 BP-spezifisch waren, 2 sowohl in die BP- als auch in die CC-Kategorie kategorisiert wurden und die übrigen Transkripte wie oben mit MF sowie mit MF und CC kategorisiert wurden. Die CC-Kategorie umfasste 56 Transkripte, von denen 6 CC-spezifisch waren und die übrigen Transkripte wie oben mit MF, mit BP und mit MF und BP kategorisiert wurden. Die BP-Kategorie wurde auf Ebene 2 weiter in acht Unterkategorien kategorisiert, von denen drei in der Anzahl der PgZFP-Gene herabgesetzt waren (P ≤ 0,05 oder 0,01) (Abb. 4B). Die MF-Kategorie wurde in drei Unterkategorien eingeteilt: katalytische Aktivität, Bindung und Transkriptionsregulatoraktivität, von denen die an der katalytischen Aktivität beteiligten PgZFP-Gene herabgesetzt (P ≤ 0,01) und diejenigen, die an der Bindungs- oder Transkriptionsregulatoraktivität beteiligt sind, herauf angereichert wurden (P ≤ 0,01). Die CC-Kategorie wurde in sechs Unterkategorien eingeteilt, von denen zwei eine verringerte und zwei eine erhöhte Anzahl der PgZFP-Gene aufwiesen (P ≤ 0,05 oder 0,01). Diese Ergebnisse legen die funktionelle Differenzierung, Divergenz und Spezialität der PgZFP-Gene nahe.

(A) GO-Kategorisierung der PgZFP-Gentranskripte. (B) Anreicherung der PgZFP-Gentranskripte. BP, biologischer Prozess; MF, Molekulare Funktion; CC, Zellularkomponente.

Darüber hinaus untersuchten wir, ob die GO-Kategorisierung der PgZFP-Genfamilie über Gewebe, Entwicklungsstadien und Genotypen hinweg konsistent war. Die Ergebnisse zeigten, dass die PgZFP-Genfamilie auf Ebene 2 über Gewebe, Entwicklungsstadien und Genotypen hinweg konsistent in dieselben 17 Unterkategorien wie oben eingeteilt wurde (ergänzende Abbildung S2). Dennoch variierte die Anzahl der PgZFP-Gentranskripte, die in jede der 17 Unterkategorien kategorisiert wurden, je nach Gewebe, Entwicklungsstadium und Genotyp erheblich.

Als nächstes analysierten wir die cis-regulatorischen Elemente der PgZFP-Gene, wie z. B. Promotorelemente, aufgrund ihrer Beziehung zu Genexpressionsaktivitäten und potenziellen biologischen Funktionen. Da 73 der 115 PgZFP-Gene auf das chinesische Ginseng-Genom ausgerichtet waren6, wurden die 1500 bp großen Upstream-Sequenzen der 73 PgZFP-Gene nach cis-regulatorischen Elementen durchsucht. Für die 73 PgZFP-Gene wurden insgesamt 3709 cis-regulatorische Elemente identifiziert und diese Elemente in 53 Typen eingeteilt, wie z. B. TATA-Box, CAAT-Box, SARE, ARE, AuxRE und MBS. Diese Elemente reagieren auf Hormone, Umweltstress und Pflanzenwachstum (ergänzende Abbildung S3A). Von den 3709 cis-regulatorischen Elementen der 73 PgZFP-Gene reagierten 276 auf Hormone, darunter Auxin, Gibberellin, Salicylsäure, Abscisinsäure und MeJA (ergänzende Abbildung S3B); 149 auf Umweltbelastungen, einschließlich Verteidigung, Licht, niedrige Temperaturen und Dürre (Ergänzende Abbildung S3C); und 82 zum Pflanzenwachstum, wie Samen-, Meristemexpression und Endospermexpression (ergänzende Abb. S3D).

Wir haben die Expression der PgZFP-Genfamilie räumlich, gemäßigt und über Genotypen hinweg, die im Ursprungs- und Diversitätszentrum von Jilin-Ginseng gesammelt wurden, in verschiedenen Aspekten charakterisiert. Die Analyse einer zufälligen Auswahl von Transkripten aus der PgZFP-Genfamilie zeigte, dass die Expression verschiedener Gentranskripte in einem Gewebe, in einem Entwicklungsstadium oder in einem Genotyp dramatisch variierte. Dennoch war die Expression eines Gentranskripts über Gewebe, Entwicklungsstadien und Genotypen hinweg relativ konsistent, obwohl seine Expression auch über Gewebe, Entwicklungsstadien und Genotypen hinweg variierte (ergänzende Abbildung S4). Von den 228 Transkripten der PgZFP-Genfamilie, die in dieser Studie identifiziert wurden, exprimierten nur 54,4–71,9 % in einem einzelnen Gewebe (ergänzende Abbildung S5A) und 27,6–33,8 % in einem einzelnen Entwicklungsstadium der Wurzel (ergänzende Abbildung S5B). Sechsundvierzig von ihnen wurden in allen vier Entwicklungsstadien der Wurzeln exprimiert und 13, 5, 4 und 14 wurden speziell bei 5, 12, 18 und 25 Jahre alten Wurzeln exprimiert (ergänzende Abbildung S5C). . Unter den untersuchten Genotypen wurden 49,1–64,5 % der PgZFP-Gentranskripte in der 4 Jahre alten Pflanzenwurzel eines Genotyps exprimiert (ergänzende Abbildung S5D). Die Heatmap-Analyse der Transkriptexpression zeigte, dass die Expression einer großen Mehrheit der Transkripte in der PgZFP-Genfamilie unabhängig voneinander über Gewebe, Entwicklungsstadien und Genotypen hinweg reguliert wurde (Abb. 5). Es wurde festgestellt, dass nur PgZFP94 und PgZFP80-05 in den analysierten Geweben koreguliert sind (Abb. 5A); Keines der analysierten Gene wurde über die Entwicklungsstadien der Wurzeln hinweg koreguliert (Abb. 5B); und PgZFP36-02 und PgZFP36-03 wurden über alle Genotypen hinweg co-reguliert (Abb. 5C).

Expressions-Heatmaps der PgZFP-Gentranskripte in 14 Geweben (A), vier unterschiedlich alten Wurzeln (B) und den 4 Jahre alten Wurzeln von 42 Genotypen (C).

Die obige phylogenetische Analyse, GO-Kategorisierung und cis-regulatorische Elementuntersuchung der PgZFP-Genfamilie zeigten, dass sich die Genfamilie in Sequenz und Funktionalität erheblich differenziert hat. Die Frage ist, ob zwischen den Genen der PgZFP-Genfamilie weiterhin eine Beziehung besteht. Daher führten wir eine Koexpressionsnetzwerkanalyse mit PgZFP-Gentranskripten durch. Die Ergebnisse zeigten, dass alle 228 Transkripte der PgZFP-Genfamilie ein einziges starkes Koexpressionsnetzwerk bildeten (Abb. 6A). Das Netzwerk bestand aus 228 Knoten und 4745 Kanten, die in acht Clustern zusammengefasst waren (Abb. 6B). Im Vergleich dazu war das Netzwerk der PgZFP-Genfamilie viel robuster als das zufällig ausgewählter unbekannter Ginseng-Transkripte (Abb. 6C, D). Statistiken zeigten, dass die PgZFP-Gentranskripte mit größerer Wahrscheinlichkeit ein Koexpressionsnetzwerk bilden als die zufällig ausgewählten unbekannten Ginseng-Transkripte (Abb. 6E, F). Diese Ergebnisse legen nahe, dass sich die Genfamilie zwar in Sequenz und Funktionalität erheblich differenziert hat, die Expressionsaktivitäten ihrer Gene jedoch weiterhin korrelieren, was auf ihre funktionelle Korrelation hinweist. Weitere Analysen ergaben, dass acht der 115 PgZFP-Gene, PgZFP79, PgZFP82, PgZFP114, PgZFP87, PgZFP01-02, PgZFP48, PgZFP63-04 und PgZFP30, wahrscheinlich eine zentrale Rolle im Netzwerk spielten, wenn P ≤ 0,001 angewendet wurde; Daher handelt es sich bei diesen Genen wahrscheinlich um Hub-Gene, wobei jedes Gen eine Konnektivität von 30–43 aufweist (ergänzende Abbildung S6). Darüber hinaus haben wir versucht, diese acht PgZFP-Gene mit dem Arabidopsis-Genom abzugleichen, aber nur PgZFP79 und sein paraloges Gen, PgZFP79P, wurden mit At3G48430 (REF6) im Arabidopsis-Genom abgeglichen (siehe Abb. 1). Es wurde festgestellt, dass dieses Gen ein positiver Regulator der Blüte in einem FLC-abhängigen Signalweg in Arabidopsis ist46.

Das Koexpressionsnetzwerk der PgZFP-Gentranskripte, exprimiert in den 4-jährigen Wurzeln von 42 Genotypen. (A) Das Koexpressionsnetzwerk der 228 PgZFP-Gentranskripte, konstruiert bei P ≤ 5,0E−02. Es enthält 228 Gentranskriptknoten und 4745 Interaktionskanten. (B) Die 12 Cluster des Netzwerks. (C, D) Tendenz der Netzwerkbildung bei verschiedenen P-Werten: Variation in der Anzahl der Knoten (C) und Kanten (D). (E,F) Statistik der Netzwerkbildungstendenz in Anzahl der Kanten (E) und Knoten (F), mit 20 Replikationen. „**“ gibt an, dass der Unterschied bei P ≤ 0,01 signifikant ist; und „NS“ gibt an, dass der Unterschied bei P ≤ 0,05 nicht signifikant ist. Die zufällig ausgewählten unbekannten Ginseng-Gentranskripte wurden aus Datenbank A als Kontrollen ausgewählt.

Da die obige cis-regulatorische Elementanalyse der PgZFP-Genfamilie zeigte, dass die Gene der Familie wahrscheinlich auf Umweltstress reagieren, haben wir die Reaktion der Genfamilie auf Umweltstress, insbesondere auf Salzstress, weiter untersucht. Die Sequenzausrichtungsanalyse identifizierte vier PgZFP-Gene, die am besten mit den auf Salz reagierenden STZ- und AZF-Genen von Arabidopsis übereinstimmen, darunter PgZFP31, PgZFP78-01, PgZFP38 und PgZFP39-01. Von den vier Genen wurde PgZFP31 mit dem Genom des chinesischen Ginsengs abgeglichen6 und einer cis-regulatorischen Elementanalyse unterzogen, die seine potenzielle Reaktionsfähigkeit auf Hormone, Umweltstress und Wachstum zeigte. Diese vier PgZFP-Gene stammten alle aus Cluster III des Stammbaums. Für das Experiment wurden Ginseng-Adventivwurzeln verwendet. Abbildung 7A,B zeigt, dass die Ginseng-Adventivwurzeln empfindlich auf Salzstress (NaCl) reagierten. Als die Salzkonzentration auf 40 mM anstieg, wurde das Wachstum der Ginsengwurzeln deutlich gehemmt (Abb. 7A), was durch kürzere Wurzeln (P ≤ 0,05) angezeigt wird (Abb. 7B). Die relativen Expressionsniveaus aller vier Gene wurden durch Salz hochreguliert (Abb. 7C). Als sich die Salzkonzentration 20 mM NaCl näherte, begannen die relativen Expressionen von zwei der vier Gene deutlich anzusteigen. Wenn die Konzentration des Salzes 40 mM NaCl oder höher erreichte, stieg die relative Expression aller vier Gene signifikant (P ≤ 0,05) oder extrem signifikant (P ≤ 0,01), was darauf hindeutet, dass mindestens vier Gene in der PgZFP-Genfamilie daran beteiligt sind Pflanzenreaktion auf Salzstress.

Die Reaktionen der PgZFP-Genfamilie auf Salzstress. (A) Ginseng-Adventivwurzeln, die 30 Tage lang mit unterschiedlichen NaCl-Konzentrationen auf dem B5-Medium gestresst wurden. (B) Variation der seitlichen Wurzellänge der salzbeanspruchten Wurzeln. (C) Die relativen Ausdrücke der aus der Genfamilie ausgewählten PgZFP-Gene in den salzbeanspruchten Wurzeln. Die Expression der Gene in den mit Salz gestressten Wurzeln wurde als Expressionsniveau im Verhältnis zu denen der Gene in den Wurzeln ohne Salzstress (0 mM NaCl) dargestellt, die als „1“ betrachtet wurden. Der t-Test wurde verwendet, um den mittleren Unterschied der Genexpressionen zwischen Kontroll- und salzgestressten Wurzeln zu testen. „*“, signifikant bei P ≤ 0,05; „**“, signifikant bei P ≤ 0,01.

Es wurde gezeigt, dass die C2H2-ZFP-Genfamilie bei mehreren Arten, darunter Arabidopsis, Reis, Tomate und Sojabohne, wichtige Funktionen bei Pflanzenreaktionen auf abiotischen und biotischen Stress, Pflanzenwachstum und -entwicklung sowie Hormonsignaltransduktion spielt8,9,10, 11,13,14,15,16. Die Genfamilie von Ginseng ist jedoch noch unbekannt. Diese Studie hat zum ersten Mal die Genfamilie im Ginseng genomweit identifiziert und charakterisiert. Insgesamt 228 C2H2-ZFP-Gentranskripte, alternativ gespleißt aus 115 C2H2-ZFP-Genen, werden als PgZFP-Gene identifiziert und definiert. Daher besteht die PgZFP-Genfamilie aus mindestens 115 Genmitgliedern. Diese Größe der Genfamilie in Ginseng ist vergleichbar mit derjenigen der Genfamilie in Pappel (109)19 und Tomate (99)47, sie ist jedoch kleiner als die der Genfamilie in Arabidopsis (176)17, Reis (189). 18, Medicago truncatula (218)20, Mais (211)21 und Sojabohne (321)22. Dieses Ergebnis zeigt, dass die PgZFP-Genfamilie eine moderate Genfamilie ist. Dennoch wurde diese Anzahl der PgZFP-Gene im chinesischen Ginseng-Lebenslauf identifiziert. Damaya. Die Pan-Transkriptom-Analyse zeigt, dass die Anzahl der Gene in der Familie zwischen den Genotypen von P. ginseng erheblich variiert, wobei das Pan-Transkriptom aus 149 PgZFP-Genen und ein Kern-Transkriptom aus nur 12 Genen besteht, was darauf hindeutet, dass Ginseng über ein entbehrliches Transkriptom verfügt, das um mindestens 5 % variiert 137 PgZFP-Gene.

Die PgZFP-Genfamilie ist in allen 24 Chromosomen des chinesischen Ginseng-Genoms verteilt, aber nur 17 (23 %) der 73 kartierten PgZFP-Gene sind syntenisch zu 11 der C2H2-ZFP-Gene von Arabidopsis. Die Analyse von 46 der 115 PgZFP-Gene mit vollständigem CDS zeigt, dass 40 (87 %) von ihnen im Zeitraum von 18–41 MYA dupliziert wurden, was darauf hindeutet, dass die Genduplikation eine wichtige Rolle bei der Erweiterung der Genfamilie spielt. Die Analyse des Ka/Ks-Verhältnisses zeigt, dass reinigende und neutrale Selektionen die Familienentwicklung vorantreiben. Die vorliegende PgZFP-Genfamilie wird zusammen mit den C2H2-ZFP-Genen von Arabidopsis in fünf Cluster eingeteilt, was darauf hindeutet, dass es sich bei der Genfamilie um eine alte Genfamilie handelt, die vor der Spaltung zwischen Ginseng und Arabidopsis entstand. Jeder Cluster der PgZFP-Genfamilie weist spezifische konservierte Motive auf, die sich von anderen Clustern unterscheiden. Dennoch enthalten die meisten Gene der Genfamilie das hochkonservierte QALGGH-Motiv oder seine Variante, wie z. B. R/KALGGH. Eine frühere Studie zeigte, dass die Veränderung einer beliebigen Aminosäure in QALGGH seine DNA-Bindungsfähigkeit beeinträchtigen kann und die Mutation der Q-Aminosäure seine DNA-Bindungsfähigkeit stark reduziert48. Die C2H2-ZFP-Gene, die sowohl QALGGH- als auch I/D/FLN-Motive enthalten, spielten eine wichtige Rolle bei der Reaktion von Pflanzen auf biotischen und abiotischen Stress23.

Die PgZFP-Genfamilie wurde auf Ebene 2 in 17 Unterkategorien eingeteilt und es stellte sich heraus, dass sie über 53 Arten von cis-regulatorischen Elementen verfügt, die auf mehrere biologische Prozesse reagieren, was darauf hindeutet, dass während des Evolutionsprozesses erhebliche Veränderungen in der Struktur und den stromaufwärts gelegenen Regionen der PgZFP-Gene und -Gene aufgetreten sind Diese Veränderungen haben sich auf ihre Funktionsvielfalt ausgewirkt36,37,38. Die funktionelle Vielfalt der Genfamilie ist größer als die der Genfamilien PgbHLH49, PgNAC50 und PgGRAS51 in Ginseng, die in 11, 8 bzw. 15 Unterkategorien eingeteilt wurden. Von den 228 PgZFP-Gentranskripten haben 134 (59 %) Bindungsfunktionen. Im Vergleich dazu verfügt Pappel auch über die meisten (106) C2H2-ZFP-Gene, die an der Bindung beteiligt sind19, und Tomaten verfügen über alle annotierten C2H2-ZFP-Gene, die an der Bindung beteiligt sind, einschließlich der Kernsäurebindung, der Bindung organischer zyklischer Verbindungen und der Bindung heterozyklischer Verbindungen47. Dies legt nahe, dass die PgZFP-Gene eine Rolle bei der Transkriptionsregulation spielen, indem sie an nachgeschaltete Zielgene binden28,29,52.

Die Expressionsanalysen der PgZFP-Genfamilie haben zu mehreren interessanten Erkenntnissen geführt. Erstens werden die meisten Gene der PgZFP-Genfamilie in relativ geringem Maße in einem Gewebe, in einem Entwicklungsstadium und in der Wurzel eines Genotyps exprimiert. Die PgZFP-Gene, die in einem Gewebe, in einem Entwicklungsstadium und in der Wurzel eines Genotyps aktiv exprimiert wurden, neigten dazu, auch in anderen Geweben, in anderen Entwicklungsstadien und in den Wurzeln anderer Genotypen aktiv zu exprimieren. Zweitens ist es offensichtlich, dass die Expressionsbeziehungen der Gene in der Familie nicht mit ihren phylogenetischen Beziehungen übereinstimmen, die durch die Ähnlichkeit der Aminosäuresequenzen bestimmt werden, was darauf hindeutet, dass die Gene mit ähnlichen Sequenzen möglicherweise keine ähnlichen Expressionsmuster aufweisen. Drittens kann die Expression der aus demselben Gen gespleißten Transkripte in einem Gewebe, in einem Entwicklungsstadium und in der Wurzel eines Genotyps erheblich unterschiedlich sein. Schließlich werden von den 115 Genen in der PgZFP-Genfamilie nur die Expressionen einiger weniger koreguliert, während die Expressionen der überwiegenden Mehrheit unabhängig reguliert werden. Dennoch ist es wahrscheinlicher, dass die Gene der PgZFP-Genfamilie ein Koexpressions-Interaktionsnetzwerk bilden, von dem einige eine zentrale Rolle im Netzwerk spielen, was darauf hindeutet, dass die Genmitglieder der Genfamilie funktionell korreliert bleiben49.

Frühere Studien haben gezeigt, dass die C2H2-ZFP-Genfamilie eine wichtige Rolle bei Wachstum und Entwicklung sowie bei der Reaktion von Pflanzen auf Hormone sowie biotischen und abiotischen Stress spielt23. Die cis-regulatorische Elementanalyse der PgZFP-Gene in der vorliegenden Studie liefert einen weiteren Beweis für diese Rolle der Gene in Ginseng. Darüber hinaus wurden vier Gene der PgZFP-Genfamilie, PgZFP31, PgZFP78-01, PgZFP38 und PgZFP39-01, identifiziert, die an der Reaktion auf Salzstress beteiligt waren, was darauf hindeutet, dass die PgZFP-Genfamilie tatsächlich eine Rolle bei Pflanzenreaktionen auf abiotischen Stress spielt , insbesondere gegen Salzstress bei Ginseng. Interessanterweise stammen die vier PgZFP-Gene alle aus Cluster III des Genstammbaums. Von den vier untersuchten PgZFP-Genen, die auf Salzstress reagieren, weisen PgZFP31 und PgZFP78-01 ähnliche Zinkfingerstrukturen auf wie STZ, das an der Pflanzenreaktion auf Salzstress in Arabidopsis14 beteiligt ist. Sowohl PgZFP31 als auch PgZFP78-01 gehören zu den Zinkfingerproteinen vom Typ C1-2i, weisen eine hohe Ähnlichkeit im DLN-Motiv auf und enthalten das FDLNI/L-Motiv. Ein ähnliches Ergebnis wurde für PgZFP38 und PgZFP39-01 im Vergleich zu AZF1 erzielt, das auch an der Pflanzenreaktion auf Salzstress bei Arabidopsis beteiligt ist14,53. Diese vier PgZFP-Gene stellen daher Genressourcen für die Salztoleranzforschung und die genetische Verbesserung von Ginseng bereit.

Die PgZFP-Genfamilie ist eine alte Genfamilie, die aus etwa 115 PgZFP-Genen besteht, die auf alle 24 Chromosomen des Ginseng-Genoms verteilt sind. Es entstand vor der Abspaltung von Ginseng aus Arabidopsis und seine Gene unterschieden sich erheblich in den Aminosäuresequenzen und der Funktionalität, da sie 18–41 MYA duplizierten. Dennoch gibt es unter den mutmaßlichen Proteinen der Gene in der Familie konservierte Motive. Verschiedene Genmitglieder in der Genfamilie exprimieren in einem Gewebe, in einem Entwicklungsstadium und in einem Genotyp unterschiedlich, und die Expression desselben Gens variiert je nach Gewebe, Entwicklungsstadium und Genotyp, was weiter auf eine Differenzierung ihrer Funktionalität hinweist. Dennoch tendieren die Gene in der Familie dazu, korrelativ zu exprimieren und ein Koexpressionsnetzwerk zu bilden, was auf ihre funktionelle Korrelation schließen lässt. Biologisch gesehen spielt die PgZFP-Genfamilie eine wichtige Rolle bei der pflanzlichen Reaktion auf Salzstress im Ginseng, wobei vier PgZFP-Gene identifiziert wurden, die an der Reaktion auf Salzstress im Ginseng beteiligt sind.

Die für diese Studie verwendeten Daten wurden im Sequence Read Archive (SRA) des National Center for Biotechnology Information (NCBI), BioProject PRJNA302556, hinterlegt; und bei Gene Expression Omnibus (GEO) von NCBI, SRP066368 und SRR13131364-SRR13131405. Das Pflanzenmaterial ist auf Anfrage bei den entsprechenden Autoren erhältlich.

Choi, JS, Chun, KS, Kundu, J. & Kundu, JK Biochemische Grundlagen der Krebs-Chemoprävention und/oder Chemotherapie mit Ginsenosiden. Int. J. Mol. Med. 32, 1227–1238 (2013).

Artikel CAS PubMed Google Scholar

Xu, FY et al. Die Antitumoraktivitätsstudie von Ginsenosiden und Metaboliten in Lungenkrebszellen. Bin. J. Übers. Res. 8, 1708–1718 (2016).

CAS PubMed PubMed Central Google Scholar

Zheng, Y. et al. Antiproliferative Wirkung von Protopanaxadiol-Ginsenosiden auf menschliche Darmkrebszellen. Biomed. Rep. 1, 555–558 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Xu, J. et al. Untersuchung des Panax-Ginseng-Genoms zur Ginsenosid-Biosynthese. Gigaence 6, 1–15 (2017).

Google Scholar

Kim, NH et al. Genom und Evolution des schattenbedürftigen Heilkrauts Panax Ginseng. Pflanzenbiotechnologie. J. 16, 1904–1917 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, Z.-H. et al. Neuordnung der Chromatintopologie und epigenetischen Modifikation des angestammten Kern-Eudikotylen-Genoms in Panax. Nat. Komm. 13, 1902 (2022).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wang, K. et al. Die räumlichen und zeitlichen transkriptomischen Landschaften von Ginseng, Panax Ginseng CA Meyer. Wissenschaft. Rep. 5, 18283 (2015).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Yin, M. et al. Der Arabidopsis Cys2/His2-Zinkfinger-Transkriptionsfaktor ZAT18 ist ein positiver Regulator der Pflanzentoleranz gegenüber Trockenstress. J. Exp. Bot. 68, 2991–3005 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Li, W. et al. Ein natürliches Allel eines Transkriptionsfaktors in Reis verleiht eine Breitband-Blastenresistenz. Zelle 170, 114–126 (2017).

Artikel CAS PubMed Google Scholar

Lin, W. et al. Der Zinkfinger-Transkriptionsfaktor SlZFP2 reguliert die Abscisinsäure-Biosynthese und die Fruchtreife in Tomaten negativ. Pflanzenphysiologie. 167, 931–949 (2015).

Artikel CAS Google Scholar

Zhu, JK Abiotische Stresssignale und Reaktionen in Pflanzen. Zelle 167, 313–324 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Li, Y. et al. Das C2H2-Zinkfingerprotein SlZF3 reguliert die AsA-Synthese und Salztoleranz durch Interaktion mit CSN5B. Pflanzenbiotechnologie. J. 16, 1201–1213 (2018).

Artikel CAS PubMed Google Scholar

Teng, K. et al. Die heterologe Expression eines neuartigen C2H2-Zinkfinger-Gens von Zoysia japonica, ZjZFN1, verbesserte die Salztoleranz bei Arabidopsis. Vorderseite. Pflanzenwissenschaft. 9, 1159 (2018).

Artikel PubMed PubMed Central Google Scholar

Sakamoto, H. et al. Arabidopsis-Zinkfingerproteine ​​vom Cys2/His2-Typ fungieren als Transkriptionsrepressoren unter Dürre-, Kälte- und Stressbedingungen mit hohem Salzgehalt. Pflanzenphysiologie. 136, 2734–2746 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, Z. et al. Ein C2H2-Zinkfingerprotein OsZFP213 interagiert mit OsMAPK3, um die Salztoleranz in Reis zu verbessern. J. Pflanzenphysiologie. 229, 100–110 (2018).

Artikel ADS CAS PubMed Google Scholar

Sun, Z. et al. Die ektopische Expression von GmZAT4, einem mutmaßlichen Zinkfingerprotein vom C2H2-Typ, erhöht die PEG- und NaCl-Stresstoleranz bei Arabidopsis thaliana. 3 Biotechnologie. 9, 1–10 (2019).

Google Scholar

Englbrecht, CC, Schoof, H. & Böhm, S. Konservierung, Diversifizierung und Expansion von C2H2-Zinkfingerproteinen im Genom von Arabidopsis thaliana. BMC Genomics 5, 39 (2004).

Artikel PubMed PubMed Central CAS Google Scholar

Agarwal, P. et al. Genomweite Identifizierung der C2H2-Zinkfinger-Genfamilie in Reis und deren Phylogenie- und Expressionsanalyse. Pflanzenmol. Biol. 65, 467–485 (2007).

Artikel CAS PubMed Google Scholar

Liu, Q., Wang, Z., Xu, PLoS ONE 10, e0134753 (2015).

Artikel PubMed PubMed Central CAS Google Scholar

Jiao, Z. et al. Genomweite Studie der C2H2-Zinkfinger-Genfamilie in Medicago truncatula. BMC Plant Biol. 20, 401 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Wei, K., Pan, S. & Li, Y. Funktionelle Charakterisierung der C2H2-Zinkfinger-Genfamilie von Mais. Pflanzenmol. Biol. Rep. 34, 761–776 (2016).

Artikel CAS Google Scholar

Yuan, S. et al. Genomweite Identifizierung und Klassifizierung von C2H2-Zinkfingerproteinen aus Sojabohnen und Analyse ihrer Expression in der Hülsenfrucht-Rhizobium-Symbiose. Vorderseite. Mikrobiol. 9, 126 (2018).

Artikel PubMed PubMed Central Google Scholar

Agnieszka, KM Beteiligung pflanzlicher Zinkfinger-Transkriptionsfaktoren vom C2H2-Typ an Stressreaktionen. Pflanzenwissenschaft. 185, 78–85 (2012).

Google Scholar

Pabo, CO, Peisach, E. & Grant, RA Design und Auswahl neuartiger Cys2His2-Zinkfingerproteine. Annu. Rev. Biochem. 70, 313–340 (2001).

Artikel CAS PubMed Google Scholar

Luo, X. et al. Eine Überexpression von GsZFP1, einem ABA-responsiven Zinkfingerprotein vom C2H2-Typ, dem ein QALGGH-Motiv fehlt, verringert die ABA-Empfindlichkeit und verringert die Stomatagröße. J. Pflanzenphysiologie. 169, 1192–1202 (2012).

Artikel CAS PubMed Google Scholar

Bao, Z., Zhang, N. & Hua, J. Endopolyploidisierung und Blütezeit werden durch die Checkpoint-Komponente MAD1 und den Immunmodulator MOS1 antagonistisch reguliert. Nat. Komm. 5, 5628 (2014).

Artikel ADS CAS PubMed Google Scholar

Ohta, M., Matsui, K., Hiratsu, K., Shinshi, H. & Ohme-Takagi, M. Repressionsdomänen von ERF-Transkriptionsrepressoren der Klasse II teilen ein wesentliches Motiv für die aktive Repression. Pflanzenzelle 13, 1959–1968 (2001).

Artikel CAS PubMed PubMed Central Google Scholar

Hiratsu, K., Ohta, M., Matsui, K. & Ohme-Takagi, M. Das SUPERMAN-Protein ist ein aktiver Repressor, dessen carboxyterminale Repressionsdomäne für die Entwicklung normaler Blüten erforderlich ist. FEBS Lett. 514, 351–354 (2002).

Artikel CAS PubMed Google Scholar

Singh, P., Mathew, IE, Verma, A., Tyagi, AK & Agarwal, P. Analyse von Reisproteinen mit DLN-Repressor Motif/S. Int. J. Mol. Wissenschaft. 20, 1600 (2019).

Artikel CAS PubMed Central Google Scholar

Li, H. et al. Gene des Basic-Leucin-Zipper-Transkriptionsfaktors (bZIP) und ihre Reaktionen auf Trockenstress bei Ginseng, Panax Ginseng CA Meyer. BMC Genomics 22, 316 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

El-Gebali, S. et al. Die Datenbank der Pfam-Proteinfamilien im Jahr 2019. Nucleic Acids Res. 47, D427–D432 (2019).

Artikel CAS PubMed Google Scholar

Zheng, Y. et al. iTAK: Ein Programm zur genomweiten Vorhersage und Klassifizierung pflanzlicher Transkriptionsfaktoren, Transkriptionsregulatoren und Proteinkinasen. Mol. Werk 9, 1667–1670 (2016).

Artikel CAS PubMed Google Scholar

Lin, Y. et al. Evolution, funktionelle Differenzierung und Co-Expression der RLK-Genfamilie wurden in Jilin-Ginseng, Panax-Ginseng CA Meyer entdeckt. Mol. Genet. Genomics 293, 845 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Brors, B., Gu, L., Schlesner, M., Eils, R. & Gu, Z. Circlize implementiert und verbessert die zirkuläre Visualisierung in R. Bioinformatics 30, 2811–2812 (2014).

Artikel PubMed CAS Google Scholar

Zhang, Z. et al. KaKs_Calculator: Berechnung von Ka und Ks durch Modellauswahl und Modellmittelung. Genom. Proteom. Bioinform. 4, 259–263 (2006).

Artikel CAS Google Scholar

Faraji, S. et al. Untersuchung und Computeranalyse der Sulfotransferase (SOT)-Genfamilie in Kartoffeln (Solanum tuberosum): Einblicke in die Schwefelanpassung für eine ordnungsgemäße Entwicklung und Reizreaktionen. Pflanzen 10, 2597 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Abdullah et al. Die GASA-Genfamilie in Kakao (Theobroma cacao, Malvaceae): Genomweite Identifizierung und Expressionsanalyse. Agronomie 11, 1425 (2021).

Artikel CAS Google Scholar

Heidari, P., Faraji, S., Ahmadizadeh, M., Ahmar, S. & Mora-Polete, F. Neue Einblicke in Struktur und Funktion von TIFY-Genen in Zea mays und Solanum lycopersicum: Eine genomweite umfassende Analyse. Vorderseite. Genet. 12, 657970 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Kumar, S., Stecher, G., Li, M., Knyaz, C. & Tamura, K. MEGA X: Molekulare evolutionäre Genetikanalyse auf verschiedenen Computerplattformen. Mol. Biol. Entwicklung 35, 1547–1549 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Bailey, TL et al. MEME SUITE: Tools zur Motivfindung und -suche. Nukleinsäuren Res. 37, W202–W208 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Conesa, A. & Götz, S. Blast2GO: Eine umfassende Suite für die Funktionsanalyse in der Pflanzengenomik. Int. J. Plant Genomics 2008, 619832 (2008).

Artikel PubMed CAS Google Scholar

Lescot, M. et al. PlantCARE, eine Datenbank pflanzlicher cis-wirkender regulatorischer Elemente und ein Portal zu Tools für die In-silico-Analyse von Promotorsequenzen. Nukleinsäuren Res. 30, 325–327 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

Theocharidis, A., van Dongen, S., Enright, AJ & Freeman, TC Netzwerkvisualisierung und Analyse von Genexpressionsdaten mit BioLayout Express3D. Nat. Protokoll. 4, 1535–1550 (2009).

Artikel CAS PubMed Google Scholar

Li, L. et al. Auswahl und Validierung von Referenzgenen, die für die Genexpressionsanalyse mittels qRT-PCR in MeJA-behandelten Ginseng-Haarwurzeln wünschenswert sind. PLoS ONE 14, e0226168 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Huang, J. et al. Ein neuartiges Zinkfingerprotein vom Reis-C2H2-Typ ohne DLN-Box/EAR-Motiv spielt eine Rolle bei der Salztoleranz. Biochim. Biophys. Acta. 1769, 220–227 (2007).

Artikel CAS PubMed Google Scholar

Noh, B. et al. Unterschiedliche Rollen eines Paares homologer Transkriptionsfaktorproteine ​​der Jumonji-/Zinkfinger-Klasse bei der Regulierung der Blütezeit von Arabidopsis. Pflanzenzelle 16, 2601–2613 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Zhao, T. et al. Genomweite Analysen des genetischen Screenings von Zinkfinger-Transkriptionsfaktoren vom C2H2-Typ und abiotischen und biotischen Stressreaktionen in Tomaten (Solanum lycopersicum) basierend auf RNA-seq-Daten. Vorderseite. Genet. 11, 540 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Kubo, K. et al. Cys2/His2-Zinkfinger-Proteinfamilie der Petunie: Evolution und allgemeiner Mechanismus der Zielsequenzerkennung. Nukleinsäuren Res. 26, 608–615 (1998).

Artikel CAS PubMed PubMed Central Google Scholar

Zhu, L. et al. Die bHLH-Genfamilie und ihre Reaktion auf Salzstress in Jilin-Ginseng, Panax-Ginseng CA Meyer. Mol. Genet. Genomics 295, 877–890 (2020).

Artikel CAS PubMed Google Scholar

Liu, Q. et al. Identifizierung, Charakterisierung und funktionelle Differenzierung der NAC-Genfamilie und ihrer Rolle als Reaktion auf Kältestress bei Ginseng, Panax Ginseng CA Meyer. PLoS ONE 15, e0234423 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, N. et al. Transkriptomweite Identifizierung, Evolutionsanalyse und GA-Stressreaktion der GRAS-Genfamilie in Panax Ginseng CA Meyer. Pflanzen 9, 190 (2020).

Artikel CAS PubMed Central Google Scholar

Ciftci-Yilmaz, S. et al. Das EAR-Motiv des Zinkfingerproteins Zat7 vom Cys2/His2-Typ spielt eine Schlüsselrolle bei der Abwehrreaktion von Arabidopsis auf Salzstress. J. Biol. Chem. 282, 9260–9268 (2007).

Artikel CAS PubMed Google Scholar

Han, G. et al. C2H2-Zinkfingerproteine: Hauptregulatoren abiotischer Stressreaktionen in Pflanzen. Vorderseite. Pflanzenwissenschaft. 11, 115 (2020).

Artikel PubMed PubMed Central Google Scholar

Referenzen herunterladen

Diese Arbeit wurde vom Ministerium für Wissenschaft und Technologie der Provinz Jilin (20210402043GH, 20200801063GH, 20190201264JC, 20190103104JH, 20180414077GH und 20180101027JC) und der Entwicklungs- und Reformkommission der Provinz Jilin (2016C064) unterstützt und 2018C047-3).

Diese Autoren haben gleichermaßen beigetragen: Yue Jiang und Lingyu Liu.

Hochschule für Biowissenschaften, Jilin Agricultural University, Changchun, 130118, Jilin, China

Yue Jiang, Lingyu Liu, Zhaoxi Pan, Mingzhu Zhao, Lei Zhu, Yilai Han, Li Li, Kangyu Wang, Sizhang Liu, Yi Wang und Meiping Zhang

Jilin Engineering Research Center for Ginseng Genetic Resources Development and Utilization, Jilin Agricultural University, Changchun, 130118, Jilin, China

Mingzhu Zhao, Yanfang Wang, Kangyu Wang, Yi Wang und Meiping Zhang

College of Chinese Medicinal Materials, Jilin Agricultural University, Changchun, 130118, Jilin, China

Yanfang Wang

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MPZ und YW konzipierten und gestalteten die Studie, und MPZ überarbeitete das Manuskript. YJ, LYL, YH, YFW und KW führten eine Datenanalyse durch und LYL und MZ verfassten das Manuskript. ZP kultivierte die Ginseng-Adventivwurzeln. LYL, LZ, LL und SL führten Salzstress und eine qRT-PCR durch. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Yi Wang oder Meiping Zhang.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Jiang, Y., Liu, L., Pan, Z. et al. Genomweite Analyse der C2H2-Zinkfingerprotein-Genfamilie und ihrer Reaktion auf Salzstress in Ginseng, Panax Ginseng Meyer. Sci Rep 12, 10165 (2022). https://doi.org/10.1038/s41598-022-14357-w

Zitat herunterladen

Eingegangen: 06. April 2022

Angenommen: 06. Juni 2022

Veröffentlicht: 17. Juni 2022

DOI: https://doi.org/10.1038/s41598-022-14357-w

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Wissenschaftliche Berichte (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.