Un atlas moléculaire révèle le tri

Nouvelles

MaisonMaison / Nouvelles / Un atlas moléculaire révèle le tri

Apr 22, 2023

Un atlas moléculaire révèle le tri

Volume Communication Nature

Nature Communications volume 14, Numéro d'article : 837 (2023) Citer cet article

3962 accès

253 Altmétrique

Détails des métriques

Le processus de production de soie naturelle dans la glande ampullée majeure (Ma) de l'araignée confère à la soie dragline des propriétés mécaniques extraordinaires et le potentiel d'applications biomimétiques. Cependant, les rôles génétiques précis de la glande Ma au cours de ce processus restent inconnus. Ici, nous avons réalisé un atlas moléculaire systématique de la production de soie dragline grâce à un assemblage de génome de haute qualité pour l'araignée orb-tissage Trichonephila clavata et une approche multiomique pour définir l'architecture tri-sectionnelle de la glande Ma : queue, sac et conduit. Nous avons découvert une biosynthèse hiérarchique des spidroines, des acides organiques, des lipides et de la chitine dans la glande Ma sectionnée dédiée à la constitution de la soie fine. La sécrétion ordonnée des spidroïnes a été obtenue par la régulation synergique des signatures épigénétiques et cARN pour les gènes de spidroïnes distribués par groupe génomique. Le profilage d'ARN unicellulaire et spatial a identifié dix types de cellules avec une division fonctionnelle partitionnée déterminant l'organisation en trois sections de la glande Ma. L'analyse de convergence et la manipulation génétique ont en outre confirmé que cette architecture tri-sectionnelle de la glande à soie était analogue chez les arthropodes et inextricablement liée à la formation de la soie. Collectivement, notre étude fournit des données multidimensionnelles qui élargissent considérablement les connaissances sur la génération de soie de dragline d'araignée et profitent finalement à l'innovation dans les fibres inspirées de l'araignée.

Les araignées (ordre Araneae) sont d'abondants prédateurs d'arthropodes généralistes, comprenant plus de cinquante mille espèces existantes1,2. Toutes les araignées produisent des soies, qui sont des fibres protéiques naturelles à haute performance qui sont cruciales pour la survie et la reproduction des araignées3,4. La production de soie est un trait fascinant d'intérêt économique particulier, principalement en raison des propriétés exceptionnelles de ces fibres, notamment une résistance et une ténacité élevées, une faible densité, un actionnement rotatif auto-alimenté et une biocompatibilité5,6,7. De nombreux chercheurs ont tenté d'imiter les processus de production et de filage de la spidroïne naturelle (les principales protéines de la soie d'araignée) pour la génération biomimétique de matériaux artificiels aux propriétés semblables à celles de la soie d'araignée8,9,10,11 ; cependant, une grande partie de notre compréhension actuelle de la formation de la soie d'araignée est basée sur des études physiques et matérielles qui n'ont fourni qu'une image partielle de sa nature12,13. Ainsi, l'élucidation des mécanismes de biologie moléculaire impliqués dans le système de production de soie naturelle sera précieuse pour acquérir une compréhension approfondie de la soie d'araignée14,15,16,17.

Bien que les araignées orb-web aient plusieurs glandes productrices de soie, la glande ampullée majeure (Ma) est souvent utilisée comme système modèle dans la recherche sur la production de soie en raison de sa taille relativement grande et, surtout, des propriétés impressionnantes de son produit, la soie dragline18. En conséquence, la plupart des tentatives d'innovation de fibres inspirées de la soie dragline ont généralement impliqué les protéines de soie et le microenvironnement produits par la glande Ma11,12,19. La glande Ma peut être divisée en trois segments macroscopiques, la queue, le sac et le conduit, qui sont caractérisés par des gradients de valeurs de pH, de concentrations d'ions et de forces de cisaillement20,21,22. La protéine de soie liquide est synthétisée et stockée à une concentration très élevée dans la queue et le sac et transformée en fibre insoluble via le Duct23,24.

Dans ce contexte, des spidroines ampullates majeures recombinantes (MaSps) ont été construites pour obtenir des propriétés physiques spécifiques de la soie, notamment la résistance, l'extensibilité et l'adhésivité25,26,27. Les éléments constitutifs de la soie d'araignée (SpiCE), qui sont des protéines non spidroïnes, ont été utilisés pour augmenter la résistance à la traction dans le cas des films de soie composites28,29. De plus, un dispositif microfluidique conçu pour simuler étroitement les conditions ioniques et de pH naturelles a permis aux fibres d'être directement tirées de la sortie, puis enroulées dans l'air, comme dans le filage naturel30,31,32. Il devient évident que les mécanismes détaillés sous-jacents à la production de soie de dragline, y compris l'architecture cellulaire et la fonction moléculaire de la glande Ma ainsi que la biocomposition et la formation de la soie de dragline, sont fondamentaux pour l'innovation avancée des fibres11,33.

Pour faire la lumière sur ces mécanismes, nous présentons ici un génome de référence à l'échelle chromosomique de haute qualité pour l'araignée orb-web Trichonephila clavata, qui présente un corps coloré et construit une grande et impressionnante toile orb (Fig. 1a). Par analyse multiomique de la glande Ma et de la soie de dragline, nous avons retracé les origines des composants de la soie de dragline à partir des segments de la glande Ma (queue, sac et conduit), élucidé les caractéristiques de régulation épigénétiques et post-transcriptomiques des gènes de spidroïne et construit un seul -architecture spatiale cellulaire de la glande tri-sectionnelle Ma, qui fournit les premières définitions cytologiques détaillées de la glande araignée Ma basées exclusivement sur la classification de l'expression génique spécifique au segment, au type de cellule, à l'espace et à la soie dragline. Ces résultats nous ont permis de générer un atlas moléculaire complet de la production de soie naturelle dans la glande tri-sectionnelle Ma, élucidant ainsi le mécanisme de génération de la soie dragline. Les données ont été étendues pour révéler l'évolution convergente de la production de soie chez le ver à soie Bombyx mori, une espèce modèle d'un autre groupe d'arthropodes, et ont montré les caractéristiques moléculaires communes des glandes à soie de l'araignée et du ver à soie. Nos ensembles de données multiomiques sont accessibles dans SpiderDB (https://spider.bioinfotoolkits.net) et seront précieux pour les futures explorations des origines évolutives des stratégies de production de soie et la création de soies d'araignées biomimétiques.

a Photographie de T. clavata montrant une femelle adulte et un mâle adulte sur l'orb-web doré (ci-dessus) et les caryotypes femelle et mâle (ci-dessous). SCS, système des chromosomes sexuels. b Diagramme circulaire illustrant le paysage génomique des 13 pseudochromosomes (Chr1–13 sur une échelle Mb). c Vingt-huit gènes de spidroïne de T. clavata ancrés sur des chromosomes. d Groupes de gènes Spidroin d'une autre araignée orb-web, T. antipodiana. Les données génomiques publiées de T. antipodiana35 ont été analysées pour identifier les informations de localisation des gènes de spidroïne. e Catalogue de gènes Spidroin de six espèces d'araignées orb-web. f Regroupement d'expression des glandes à soie (ampulées majeures et mineures (Ma et Mi), flagelliformes- (Fl), tubuliformes- (Tu), agrégées- (Ag) et aciniformes et pyriformes (Ac et Py) glandes) et des glandes à venin. La ligne rose montre la relation la plus étroite entre les glandes Ma et Mi. g Morphologie des glandes à soie de T. clavata. Des résultats similaires ont été obtenus dans trois expériences indépendantes et résumés dans Source data. h Modèles d'expression de 28 gènes de spidroïne dans différents types de glandes à soie. Les données source sont fournies sous la forme d'un fichier de données source.

Pour explorer la production de soie dragline chez T. clavata, nous avons cherché à assembler un génome de haute qualité de cette espèce. Ainsi, nous avons d'abord effectué une analyse cytogénétique de T. clavata capturé dans la nature dans la ville de Dali, province du Yunnan, Chine, et avons trouvé un complément chromosomique de 2n = 26 chez les femelles et 2n = 24 chez les mâles, comprenant onze paires d'éléments autosomiques et chromosomes sexuels non appariés (X1X1X2X2 chez les femelles et X1X2 chez les mâles) (Fig. 1a). Ensuite, l'ADN de T. clavata adulte a été utilisé pour générer des données à lecture longue (Oxford Nanopore Technologies (ONT)), à lecture courte (Illumina) et Hi-C (Données supplémentaires 1). Un total de 349,95 Go de lectures Nanopore, 199,55 Go de lectures Illumina et environ 438,41 Go de données brutes Hi-C ont été générés. Notre approche d'assemblage séquentiel (Fig. 1c supplémentaire) a abouti à un génome de 2, 63 Gb avec un échafaudage N50 de 202, 09 Mb et un score d'exhaustivité du génome Benchmarking Universal Single-Copy Ortholog (BUSCO) de 93, 70% (Tableau 1; Données supplémentaires 3). Enfin, le génome a été assemblé en 13 pseudochromosomes. L'analyse Pool-Seq spécifique au sexe des araignées a indiqué que Chr12 et Chr13 étaient des chromosomes sexuels (Fig. 1b; Fig. 2 supplémentaire). Sur la base du pipeline MAKER234 (Fig. 1e supplémentaire), nous avons annoté 37 607 modèles de gènes codant pour des protéines et prédit des éléments répétitifs d'une longueur collective de 1,42 Gb, représentant 53,94 % du génome.

Pour identifier les gènes de spidroïne de T. clavata, nous avons recherché dans les modèles de gènes annotés des séquences similaires à 443 spidroïnes publiées (données supplémentaires 6) et effectué une analyse phylogénétique des séquences de spidroïne putatives à des fins de classification (Fig. 12a supplémentaire). Sur la base de la connaissance qu'un gène de spidroïne typique consiste en un long domaine de répétition pris en sandwich entre les domaines N/C-terminaux non répétitifs16, 128 hits non répétitifs ont été principalement identifiés. Ces candidats ont ensuite été validés et reconstruits à l'aide de données de séquençage d'isoformes de transcription complètes (Iso-seq) et de séquençage de transcriptome (RNA-seq). Nous avons ainsi identifié 28 gènes de spidroïnes, parmi lesquels 26 étaient de pleine longueur (Fig. 11a supplémentaire), dont 9 MaSps, 5 spidroïnes ampullées mineures (MiSps), 2 spidroïnes flagelliformes (FlSps), 1 spidroïne tubuliforme (TuSp), 2 spidroïnes agrégées (AgSp), 1 spidroïne aciniforme (AcSp), 1 spidroïne pyriforme (PySp) et 5 autres spidroïnes. Cet ensemble complet de gènes de spidroïne était localisé sur neuf des 13 chromosomes de T. clavata. Fait intéressant, nous avons constaté que les gènes MaSp1a – c et MaSp2e, MaSp2a – d et MiSp-a – e étaient répartis en trois groupes indépendants sur les chromosomes 4, 7 et 6, respectivement (Fig. 1c). Notamment, en utilisant les données génomiques d'une autre espèce d'araignée à tissage d'orbes, Trichonephila antipodiana35, nous avons identifié des distributions de groupes homologues de gènes de spidroïne sur les chromosomes de T. antipodiana (Fig. 1d), ce qui indique la fiabilité des résultats de regroupement de notre étude. Lorsque nous avons comparé le catalogue de gènes de spidroïne de T. clavata et ceux de cinq autres espèces d'araignées orb-web avec des données génomiques28,29,36,37, nous avons constaté que T. clavata et Trichonephila clavipes possédaient le plus grand nombre de gènes de spidroïne (28 gènes chez les deux espèces ; Fig. 1e).

Pour explorer plus avant l'expression des gènes de la spidroïne dans différentes glandes, toutes les glandes morphologiquement distinctes (ampulées majeures et mineures - (Ma et Mi), flagelliformes - (Fl), tubuliformes - (Tu) et agrégées (Ag) glandes) ont été proprement et séparément des araignées femelles adultes T. clavata, à l'exception des glandes aciniformes et piriformes, qui n'ont pas pu être séparées proprement en raison de leurs emplacements anatomiques proximaux et ont donc été traitées comme un échantillon combiné (glandes aciniformes et piriformes (Ac et Py)). Après le séquençage de l'ARN de ces glandes à soie, nous avons effectué une analyse de regroupement d'expression des données transcriptomiques et avons constaté que les glandes Ma et Mi présentaient la relation la plus étroite en termes de structure morphologique (Fig. 1g) et d'expression génique (Fig. 1f, h). Nous avons noté que les profils d'expression des gènes de spidroïne étaient largement compatibles avec leurs rôles putatifs dans les glandes à soie morphologiquement distinctes correspondantes ; par exemple, l'expression de MaSp a été trouvée dans la glande Ma (Fig. 1h). Cependant, certains transcrits de spidroïne, tels que MiSps et TuSp, étaient exprimés dans plusieurs glandes à soie (Fig. 1h). Les gènes de spidroïne non classés, tels que les gènes riches en Sp-GP, ne semblaient pas montrer d'expression spécifique à la glande (Fig. 1h).

En résumé, le génome à l'échelle chromosomique de T. clavata nous a permis d'obtenir des informations détaillées sur la structure et la localisation de tous les gènes de spidroïne de cette espèce. Nous avons également trouvé un ensemble relativement diversifié de gènes de spidroïne et une distribution groupée de MaSps et MiSps chez T. clavata.

Pour évaluer plus en détail les caractéristiques moléculaires détaillées de la sécrétion médiée par la glande Ma de la soie de dragline, nous avons effectué des analyses intégrées des transcriptomes des trois segments de glande T. clavata Ma et du protéome et du métabolome de la soie de dragline de T. clavata (Fig. 2a) . L'analyse par électrophorèse sur gel de dodécylsulfate de sodium – polyacrylamide (SDS – PAGE) de la soie de dragline a principalement montré une bande épaisse au-dessus de 240 kDa, suggérant une variété relativement petite de protéines totales (Fig. 2b). Une analyse ultérieure par chromatographie liquide et spectrométrie de masse (LC-MS) a identifié 28 protéines, dont dix spidroïnes (neuf MaSp et une MiSp) et 18 protéines non spidroïnes (une glucose déshydrogénase (GDH), une mucine-19, une protéine de venin et 15 SpiCE. de soie dragline (SpiCE-DS)) (Fig. 2b; Données supplémentaires 10). Parmi ces protéines, nous avons constaté que les composants protéiques de base de la soie dragline par ordre de pourcentage de quantification absolue basée sur l'intensité (iBAQ) étaient MaSp1c (37,7%), MaSp1b (12,2%), SpiCE-DS1 (11,9%, également appelé SpiCE-NMa1 dans une étude précédente28), MaSp1a (10,4 %) et MaSp-like (7,2 %), représentant environ 80 % de l'abondance totale de protéines dans la soie dragline (Fig. 2b). Ces résultats ont révélé des composants protéiques potentiels qui pourraient être fortement corrélés avec l'excellente résistance et la ténacité de la soie dragline.

a Illustration schématique de la segmentation de la glande Ma. b Électrophorèse sur gel de dodécylsulfate de sodium – polyacrylamide (SDS – PAGE) (à gauche) et analyses LC – MS (à droite) de la protéine de soie dragline. iBAQ, quantification absolue basée sur l'intensité. Des résultats similaires ont été obtenus dans trois expériences indépendantes et résumés dans Source data. c Classification des métabolites identifiés dans la soie dragline. d Analyses LC-MS des métabolites. e Analyses LC-MS de l'extrait d'or de la soie de dragline de T. clavata. Le pigment doré a été extrait avec du méthanol à 80 %. Les chromatogrammes d'ions extraits (EIC) ont montré un pic à m/z 206 [M + H]+ pour l'acide xanthurénique. f Corrélation de Pearson de différents segments de glande Ma (queue, sac et conduit). g Regroupement d'expressions de la queue, du sac et du conduit. Les données transcriptomiques ont été regroupées selon la méthode de classification hiérarchique (HC). h Analyse combinatoire du transcriptome et du protéome montrant le profil d'expression des gènes de la soie dragline dans la queue, le sac et le conduit. i Voie biosynthétique concise de l'acide xanthurénique (métabolisme du tryptophane) dans la glande Ma de T. clavata. Les niveaux d'expression génique cartographiés sur le métabolisme du tryptophane sont présentés dans trois segments de la glande Ma. Les enzymes impliquées dans la voie sont indiquées en rouge et les gènes codant pour les enzymes sont affichés à côté d'eux. j Analyse d'enrichissement par l'ontologie génique (GO) des gènes spécifiques au segment de la glande Ma indiquant les fonctions biologiques de la queue, du sac et du conduit. Les 12 principaux termes GO significativement enrichis sont présentés pour chaque segment de la glande Ma. Une valeur P <0,05 a été définie comme critère de sélection des termes GO significativement enrichis. Les données source sont fournies sous la forme d'un fichier de données source.

Pour évaluer la composition de la soie de dragline de T. clavata, nous avons ensuite évalué sa composition en métabolites et identifié un total de 180 composants (Données supplémentaires 12). Parmi les métabolites, 109 ont été classés en dix catégories : 34 acides organiques, 22 composés organohétérocycliques, 16 lipides, 13 benzénoïdes, 5 azotes organiques, 8 oxygènes organiques, 5 nucléosides, 3 organooxygènes, 2 phénylpropanoïdes et polycétides et 1 alcaloïde (Fig. 2c ; données supplémentaires 13). Nous avons noté que l'acide xanthurénique (XA, un pigment jaune38) était le pigment le plus abondant (Fig. 2d), tandis que d'autres pigments jaunes (tels que les caroténoïdes et les flavonoïdes39,40) n'ont pas été détectés dans notre analyse, ce qui implique que XA est le pigment majeur. donnant à la soie de dragline de T. clavata sa coloration dorée. La présence de XA a été confirmée par une analyse LC-MS (Fig. 2e), conformément à un rapport récent41.

Pour explorer l'origine des composants de soie dragline de la glande tri-sectionnelle Ma, nous nous sommes concentrés sur les caractéristiques transcriptomiques de la queue, du sac et du conduit. Nous avons déterminé que les profils d'expression génique de la queue et du sac étaient plus fortement corrélés entre eux qu'avec celui du conduit (Fig. 2f, g; Fig. 13c supplémentaire), ce qui implique que la queue et le sac ont des fonctions moléculaires similaires. De plus, des analyses transcriptomiques et protéomiques combinées ont révélé les modèles d'expression des 28 transcrits de protéines de soie dragline dans la queue, le sac et le conduit (Fig. 2h; Données supplémentaires 10). Notamment, MaSp1a–c et MaSp2e (MaSp-Group1) étaient fortement coexprimés dans la queue et le sac, et MaSp2a–d (MaSp-Group2) étaient fortement coexprimés uniquement dans le sac, alors qu'aucun de ces groupes de protéines n'était fortement coexprimé dans le conduit, indiquant que la queue et le sac sont les principaux segments sécrétant de la soie.

Nous avons ensuite utilisé les ensembles de données tri-sectionnels de la glande Ma pour retracer la source du métabolite XA. Nous avons constaté que les gènes codant pour les enzymes clés impliquées dans la voie de biosynthèse du XA (métabolisme du tryptophane) étaient activés dans les trois segments de la glande Ma (Fig. 2i); en particulier, un gène de la kynurénine aminotransférase (KAT, Tc09G169510) codant pour les enzymes primaires catalysant la transamination de la 3-hydroxy-L-kynurénine (3-HK) en XA a montré ce schéma. Ces résultats suggèrent que XA est sécrété par la queue, le sac et le conduit.

Pour caractériser les fonctions biologiques spécifiques de la queue, du sac et du conduit liées à la production de soie dragline, nous avons ensuite attribué des termes d'ontologie génétique (GO) pour classer les fonctions des gènes spécifiques au segment de la glande Ma (données supplémentaires 14). Nous avons constaté que les termes GO significativement enrichis dans la Tail (par rapport au Duct et au Sac) étaient principalement liés à la synthèse des acides organiques (le groupe le plus important dans le métabolome de la soie), ceux du Sac (par rapport au Duct et au Sac). Tail) étaient principalement liés à la synthèse des lipides (le troisième plus grand groupe du métabolome de la soie), et ceux du conduit (par rapport au sac et à la queue) étaient liés à l'échange d'ions (Ca2+ et H+) et à la synthèse de chitine (Fig. .2j). Ainsi, une division segmentaire des fonctions biologiques a été révélée.

Pris ensemble, nos résultats démontrent un processus de génération tri-sectionnel de soie dragline dans la glande Ma. Ainsi, nous avons établi une relation génétique entre les composants de la soie dragline et les glandes Tail, Sac et Duct.

Sur la base des données d'ARN-seq de la glande Ma, nous avons constaté que le nombre total de fragments par kilobase de transcrit par million de lectures cartographiées (FPKM) des gènes de soie dragline représentait respectivement 47,49 % et 34,33 % des valeurs FPKM de la queue et du sac. ; cependant, dans le conduit, ces gènes ne représentaient que 0, 76% des valeurs FPKM (données supplémentaires 11), ce qui indique que la transcription des gènes de la soie dragline était incroyablement efficace dans les deux premiers segments. En particulier, les MaSp au sein des deux groupes étaient fortement coexprimés dans les segments spécifiques de la glande Ma (Fig. 2h). Ces résultats ont révélé un modèle d'expression spécifique au segment des gènes de la soie dragline.

Pour mieux comprendre le mode de régulation transcriptionnelle de ces gènes, nous avons d'abord étudié l'accessibilité de la chromatine (CA) à l'échelle du génome dans la queue, le sac et le conduit en utilisant le test de chromatine accessible à la transposase avec séquençage (ATAC-seq). Un total de 702 037 (Tail), 767 517 (Sac) et 653 361 (Duct) pics ATAC significatifs (RPKM > 2) ont été identifiés dans les régions de 2 kb en amont et en aval des gènes, et 10 501 151 (Tail), 11 356,55 (Sac ) et 9 778 368 pics ATAC significatifs (Duct) (RPKM > 2) ont été identifiés au niveau du génome entier. Les tracés Tail (moyenne RPKM : 1,78) et Sac (moyenne RPKM : 2,04) montraient des gènes avec une chromatine plus accessible que les tracés Duct (moyenne RPKM : 1,59) (Fig. 3a). Nous avons ensuite analysé le niveau de méthylation de l'ADN à l'échelle du génome dans la queue, le sac et le conduit. Nous avons trouvé les niveaux les plus élevés de méthylation de l'ADN dans le contexte CG (valeur bêta : 0,12 dans Tail, 0,13 dans Sac et 0,10 dans Duct) et seulement une petite quantité dans le CHH (valeur bêta : 0,04 dans Tail, 0,05 dans Sac et 0,03 dans Duct) et CHG (valeur bêta : 0,04 dans Tail, 0,05 dans Sac et 0,04 dans Duct) (Fig. 3b). Dans l'ensemble, il n'y avait pas de différence significative dans les niveaux de méthylation entre la queue, le sac et le conduit. Pris ensemble, nos résultats suggèrent un rôle régulateur potentiel de CA plutôt que la méthylation de l'ADN dans la transcription des gènes de la soie dragline.

un tracé métagène des signaux ATAC-seq et une carte thermique des densités de lecture ATAC-seq dans la queue, le sac et le conduit. L'accessibilité de la chromatine était indiquée par la valeur RPKM moyenne (en haut) et la région bleue (en bas). b Diagramme métagène des niveaux de méthylation de l'ADN dans les contextes CG/CHG/CHH dans la queue, le sac et le conduit. (c, d) Captures d'écran des pistes de méthylation et ATAC-seq des gènes MaSp1b (c) et MaSp2b (d) dans la queue, le sac et le conduit. Les motifs TF potentiels (valeur E <1e-10) dans l'ensemble de pics indiqué (2 kb en amont du TSS) sont répertoriés à droite et triés par position. Les astérisques représentent le motif TF partagé au sein du groupe MaSp correspondant. e réseau Venn de motifs TF entre MaSp-Group1 et MaSp-Group2. f Niveaux d'expression des miARN et des lncARN dans la queue, le sac et le conduit. Les dates sont présentées sous forme de moyenne ± SD (n = 3 pour chaque segment Ma). Les diagrammes en boîte montrent le minimum au maximum (moustaches), 25 à 75 % (boîte), la médiane (bande à l'intérieur) avec tous les points de données. g réseau de ceRNA des gènes de la soie dragline.

Ensuite, la visualisation des ensembles de données ATAC-seq et de méthylation des deux groupes MaSp dans un navigateur génomique a révélé une tendance inverse des signaux de pointe (Fig. 3c, d; Fig. 16 supplémentaire). Nous avons analysé les motifs TF potentiels parmi les ensembles de pics ATAC-seq dans les régions de 2 kb en amont des sites de démarrage de la transcription (TSS). Nous avons identifié neuf motifs TF spécifiques à Tail et Sac pour MaSp1b (dans MaSp-Groupe 1) et 13 motifs TF spécifiques à Sac pour MaSp2b (dans MaSp-Groupe 2) (Données supplémentaires 15; Fig. 17a, b supplémentaires). Fait intéressant, nous avons noté que les motifs TF les plus proches des TSS, tels que les motifs MYB et homeobox pour MaSp-Group 1 et deux motifs C2H2 pour MaSp-Group 2, étaient partagés au sein de chaque groupe MaSp (Fig. 3c, d). Cependant, le réseau Venn de motifs TF entre MaSp-Group1 et MaSp-Group2 a montré peu de points communs entre Tail, Sac et Duct (Fig. 3e). Par conséquent, nous avons conclu qu'il existait un schéma de régulation commun au sein de chaque groupe MaSp, mais un schéma de régulation différencié entre les deux groupes MaSp.

Pour étudier l'impact des ARN endogènes concurrents (ceRNAs : un système de régulation post-transcriptionnel mis en œuvre par les miARN et les lncARN42) correspondant à la régulation des gènes de la soie dragline, nous avons effectué une analyse transcriptomique complète de la glande Ma tri-sectionnelle et identifié un total de 527 miARN (179 dans la queue, 167 dans le sac, 181 dans le conduit) et 10 110 lncARN (240 dans la queue, 982 dans le sac et 4808 dans le conduit) (Fig. 3f). À partir de ces données, nous avons construit des paires d'interactions potentielles lncRNA-miRNA-ARNm en utilisant les algorithmes miRanda43 et RNAhybrid44 pour identifier le site de liaison potentiel entre miARN et lncRNA/ARNm, puis visualisé les réseaux d'interaction à l'aide du logiciel Cytoscape45. Comme le montre la figure 3g, le réseau d'ARNc de gènes de soie dragline se composait de 28 ARNlnc, 21 miARN et 13 ARNm. Remarquablement, nous avons noté que les réseaux d'ARNc de MaSp1a–c et MaSp2e (MaSp-Groupe 1) étaient étroitement regroupés, tout comme ceux de MaSp2a–d (MaSp-Groupe 2) ; trois lncARN (LXLOC_047988, LXLOC_047990 et LXLOC_051464) du réseau MaSp-Groupe 1 étaient fortement exprimés dans la glande Ma (Fig. 18 supplémentaire); un lncARN (LXLOC_070389) et quatre miARN (novel_mir42, novel_mir46, novel_mir166 et miR-285_3) du réseau MaSp-Group 2 étaient fortement exprimés dans la glande Ma (Fig. 18 supplémentaire) ; de plus, les réseaux d'ARNce des deux groupes MaSp étaient indépendants l'un de l'autre (Fig. 3g; Fig. Supplémentaire 18). Ces résultats ont en outre révélé des réseaux post-transcriptionnels potentiels et le schéma de corégulation différencié des gènes dans les deux groupes MaSp de la glande Ma.

En résumé, nous avons observé une abondance de signatures épigénétiques et d'ARNc associées à la transcription efficace et spécifique au segment des gènes de la soie dragline. Nos données suggèrent l'existence de stratégies de régulation différentielles dans les trois segments de la glande Ma dédiés à la réalisation de l'expression hiérarchique des gènes des MaSps.

Pour explorer davantage la base cytologique liée à l'organisation hiérarchique de la glande Ma, nous avons généré des modèles unicellulaires et spatiaux d'expression génique dans la glande Ma entière de T. clavata. Un total de 9 349 cellules individuelles (SC) de haute qualité ont été obtenues après contrôle de la qualité, puis divisées en dix groupes par approximation et projection uniformes (UMAP) (Fig. 4a). Sur la base de l'analyse GO des gènes marqueurs spécifiques au cluster combinés aux profils d'expression des gènes spécifiques au segment dans chaque cluster (Fig. 21 supplémentaire et note complémentaire "Annotation du type de cellule"), nous avons effectué les annotations fines de dix clusters SC , à savoir, groupe 1 : cellule d'origine de la glande Ma (MaGO), groupe 2 : cellule de synthèse du groupe MaSp (MG1S), groupe 3 : cellule de synthèse de la chitine (CS), groupe 4 : cellule inconnue, groupe 5 : cellule squelettique de la lumière ampulsée ( ALS), groupe 6 : Cellule de transport d'ions (IT), groupe 7 : Cellule de synthèse des lipides (LS), groupe 8 : Cellule d'ajustement du pH (PA), groupe 9 : Cellule I de synthèse de MaSp-Groupe 2 (MG2S I) et groupe 10 : Cellule II de synthèse MaSp-Groupe 2 (MG2S II) et délimité leurs sources à partir de la queue (grappes 1 et 2), du sac (grappes 1, 2, 5, 7, 9, 10) et du conduit (grappes 1, 3, 4, 6, 8) (Fig. 4a).

une analyse d'approximation et de projection uniformes (UMAP) des types de cellules dans la glande Ma et de leur regroupement en dix groupes de cellules. Les chiffres dans les cercles remplis de blanc indiquent les amas de cellules. Les clusters omniprésents sont représentés dans la série jaune, les clusters Sac dans la série verte et les clusters Duct dans la série bleue. b Trajectoire pseudo-temporelle de toutes les cellules glandulaires 9349 Ma. Chaque point indique une seule cellule, codée par couleur par le cluster comme dans (a). Les chiffres dans les cercles remplis de noir indiquent les sites des succursales. Les flèches noires indiquent le début de la trajectoire. c Coloration à l'hématoxyline et à l'éosine des sections de la glande Ma et regroupement non biaisé des taches transcriptomiques spatiales (ST). Les lignes pointillées représentent le contour de la glande Ma. Des résultats similaires ont été obtenus dans trois expériences indépendantes et résumés dans Source data. d UMAP et ST présentent des tracés de l'expression des gènes dans le groupe MaSp. e Carte thermique montrant l'expression des gènes spécifiques au segment de la glande Ma dans chaque type de cellule et chaque groupe ST ainsi que les termes GO correspondants. Les données source sont fournies sous la forme d'un fichier de données source.

Pour discerner comment la queue, le sac et le conduit se développent dans la glande Ma, nous avons ordonné toutes les cellules individuelles en fonction du pseudo-temps et construit une trajectoire de développement. Cela a abouti à un continuum de cellules avec trois points de ramification distincts. Nous avons constaté qu'un ensemble de cellules du cluster 1 (cluster SC omniprésent) s'est assemblé au début de la période pseudo-temporelle et s'est progressivement bifurqué en quatre points terminaux représentant deux segments (le sac et le conduit) de la glande Ma, avec les clusters disposés à différents sites de ramification (Fig. 4b). Nous avons étudié plus en détail les trajectoires de développement de la queue, du sac et du conduit séparément. Comme prévu, la plupart des cellules du groupe 1 ont été assemblées au début de la période pseudo-temporelle, tandis que les cellules Sac (groupes 2, 5, 7, 9 et 10) et les cellules Duct (groupes 3, 4, 6, 8) ont été regroupées en différentes branches (Fig. 4b ; Fig. Supplémentaire 23). Ces résultats ont identifié le groupe SC 1 comme la cellule d'origine de la glande Ma et ont fourni des informations sur les trajectoires de différenciation des cellules de la glande Ma pendant les transitions d'état cellulaire.

Nous avons ensuite évalué l'organisation spatiale des populations de cellules dans les sections de la glande Ma. Cet ensemble de données contenait des informations sur l'expression génique à partir d'une ressource générée sur 579 spots transcriptomiques spatiaux (ST) dans les sections de la glande Ma (Fig. 4c). Après avoir analysé les signatures transcriptionnelles des taches ST, nous avons identifié sept grappes de taches (une dans la queue, quatre dans le sac et deux dans le conduit). Comme première démonstration des modèles d'expression génique unicellulaires et spatiaux dans la glande Ma, nous avons visualisé l'expression des gènes MaSp-Group1 et MaSp-Group2 dans les parcelles de caractéristiques UMAP et ST pour mieux localiser les cellules de sécrétion de protéines de soie dans nos captures. populations cellulaires. Fait intéressant, nous avons constaté que les gènes MaSp-Group1 étaient largement exprimés dans les clusters Tail et Sac (clusters SC 1, 2, 5, 7, 9 et 10 et clusters ST "a-f"), tandis que les gènes MaSp-Group2 étaient principalement exprimés dans les clusters Sac (clusters SC 9–10 et cluster ST "d") (Fig. 4d; Fig. Supplémentaire 22a). Ainsi, les gènes présentaient des modèles cellulaires et spatiaux spécifiques aux clusters selon les résultats de scRNA-seq et ST qui étaient cohérents avec les résultats des analyses d'expression et de régulation (Figs. 2h, 3c, d, g).

Pour caractériser les clusters SC et ST identifiés liés à la fonction moléculaire de la glande Ma, nous avons sélectionné 35 des gènes spécifiques au segment identifiés dans les transcriptomes de segment pour effectuer des analyses d'expression basées sur les ensembles de données scRNA-seq et ST. Nous avons constaté que le groupe SC 2 et le groupe ST "a" étaient des ensembles majeurs avec les fonctions du processus métabolique des acides organiques et de l'activité de l'oxydoréductase ; Le groupe SC 7 et le groupe ST "e" étaient des ensembles majeurs avec les fonctions du processus métabolique lipidique et de l'activité transférase ; Le groupe SC 6 et le groupe ST "f" étaient des ensembles majeurs avec la fonction de liaison aux ions calcium; Le cluster SC 3/8 et le cluster ST "c/g" étaient des ensembles majeurs avec la fonction du complexe ATPase de type V transportant les protons ; et le groupe SC 3 et le groupe ST "f" étaient des ensembles majeurs avec la fonction de liaison à la chitine (Fig. 4e; Figs. Supplémentaires 25, 26).

En résumé, la description anatomique et moléculaire détaillée de la glande Ma a révélé un seul type de cellule dans la queue et plusieurs types de cellules dans le sac et le conduit, mettant en évidence la différenciation développementale et fonctionnelle de la glande Ma dans la tri-section.

Pour étendre notre enquête à un organisme modèle établi qui a également développé des glandes spécialisées pour filer la soie, nous avons choisi le ver à soie, Bombyx mori, qui a une position phylogénétique distincte des araignées dans le phylum Arthropoda46. Grâce à des observations anatomiques, nous avons noté une convergence morphologique de la glande à filature de soie entre la glande T. clavata Ma (queue, sac et conduit) et la glande à soie B. mori (glande à soie postérieure (PSG), glande à soie moyenne (MSG ) et glande à soie antérieure (ASG)), indiquant une correspondance biunivoque de l'architecture en trois sections (Fig. 5a, b). Nous avons également trouvé un nombre similaire de types de cellules de glandes à soie entre T. clavata et B. mori47, mais des annotations différenciées à l'exception du processus lié à la chitine dans le conduit / ASG (Fig. 5b; Fig. Supplémentaire 29). Nos études précédentes ont révélé des défauts de filature de la soie par les vers à soie causés par une déficience structurelle de la PSG et de l'ASG48,49. Cependant, le système de manipulation génétique des araignées n'a pas encore été établi. Pour examiner si le segment restant de la glande à soie du ver à soie est nécessaire à une production de soie appropriée, nous avons utilisé la surexpression transgénique (OE) induite par le promoteur ser1 d'une cytotoxine de papillon (pierisin-1A, P1A50) pour générer un ver à soie déficient en MSG (P1A- OE) (Fig. 5c). Nous avons constaté que le MSG de la souche P1A-OE avait été tronqué avec succès et que ces vers à soie n'avaient pas réussi à filer un cocon (Fig. 5c), ce qui correspond aux phénotypes des vers à soie déficients en PSG et ASG48,49. Nos résultats ont en outre démontré que l'architecture en trois sections de la glande à soie est essentielle pour la filature de la soie.

a Morphologie de la glande Ma de T. clavata, de la soie de dragline, de la glande de soie de B. mori et de la soie de cocon. Les médaillons montrent des coupes transversales de fils de soie. Des résultats similaires ont été obtenus dans trois expériences indépendantes et résumés dans Source data. b Illustration schématique montrant la convergence morphologique de la glande Ma de T. clavata, avec la queue, le sac et le conduit indiqués (ci-dessus), et la glande de soie de B. mori, avec le PSG, le MSG et l'ASG indiqués (ci-dessous). c Construction du vecteur transgénique piggyBac (ci-dessus) et des phénotypes de glande à soie des souches P1A-OE et de type sauvage (WT) chez le ver à soie (ci-dessous). Ser1-P, promoteur Ser1. 3 × P3-P, 3 × promoteur P3. SV40-T, terminateur SV40. L5D7 représente le 7e jour du cinquième stade. Les flèches indiquent le processus de production de la soie et une croix rouge indique que le processus a été bloqué. d Alignement de séquences des protéines Hsp20 orthologues (Tc04G175120 et BMSK0007630) chez l'araignée et le ver à soie. La ligne rouge indique la région d'édition. La flèche montre la distribution des allèles identifiés autour du site de clivage du sgRNA. Les 16 premières séquences avec un pourcentage élevé ont été exposées. e Poids du cocon, poids de la pupe et performance du taux de couche de cocon de la souche de vers à soie knock-out Hsp20 basée sur CRISPR/Cas9. Les données ont été présentées sous forme de moyenne ± ET (n = 3). Les comparaisons statistiques ont été faites à l'aide du test t de Student bilatéral. ns indique non significatif. **Valeur P <0,01. La flèche indique le processus de production de la soie. La ligne rouge se terminant par une barre transversale indique que le processus a été supprimé. f Convergence fonctionnelle moléculaire de la glande Ma de T. clavata et de la glande à soie de B. mori selon l'analyse des termes GO. Une valeur P < 0,05 a été définie comme critère de sélection des termes GO significativement enrichis. g Convergence de l'expression génique orthologue entre la glande T. clavata Ma et la glande à soie B. mori. h, i Convergence des composants de la protéine (h) et du métabolite (i) entre les soies produites par T. clavata et B. mori. Les métabolites avec un pourcentage d'intensité totale supérieur à 90 % ont été analysés. Les principaux métabolites de la soie de dragline de T. clavata et de la soie de cocon de B. mori sont indiqués en rouge. Les données source sont fournies sous la forme d'un fichier de données source.

Pour étudier plus avant la convergence entre ces deux espèces, nous avons effectué un alignement blastp du génome entier et nous avons identifié 9593 et ​​7355 gènes orthologues chez T. clavata et B. mori, respectivement. Parmi ces paires d'orthologues de gènes attribuées, nous avons sélectionné la paire Hsp20 (Tc04G175120 et BMSK0007630) en raison de l'identité de séquence élevée de 87, 1% entre T. clavata et B. mori (Fig. 5d); de plus, Hsp20 était exprimée dans les glandes à soie de T. clavata et de B. mori et servait simultanément de gène marqueur du cluster SC 5 de la glande Ma de T. clavata (Données supplémentaires 17), qui code pour une petite protéine de choc thermique qui agit comme une protéine chaperon pour protéger les autres protéines contre le mauvais repliement et l'agrégation51. Nous avons ensuite effectué l'inactivation (KO) basée sur CRISPR / Cas9 de Hsp20 dans le ver à soie et identifié avec succès des indels (96, 46%) sur le site cible du sgRNA Hsp20 (Fig. 5d). Fait intéressant, nous avons constaté que la production de soie (poids du cocon et taux de couche de cocon) de la souche Hsp20-KO était significativement inférieure à celle du type sauvage (Fig. 5e). À partir de ces résultats, nous avons conclu que la Hsp20 orthologue jouait un rôle positif dans la production de soie à la fois chez l'araignée étudiée et chez le ver à soie.

Pour étudier plus avant les signatures moléculaires de la filature de la soie afin de prouver l'évolution convergente de l'araignée et du ver à soie, nous avons ensuite effectué des analyses comparatives transcriptomiques, protéomiques et métabolomiques des glandes à soie tri-sectionnelles et des soies de T. clavata et B. mori. Des termes GO partagés ont été identifiés entre chaque région de glande à soie correspondante de T. clavata et B. mori. Nous avons constaté que trois termes GO (liaison aux ions calcium, liaison à la chitine et transduction du signal) étaient couramment enrichis dans le conduit et l'ASG et qu'un terme GO (processus métabolique des acides gras) était couramment enrichi dans le sac et le MSG (Fig. 5f) . Ces termes GO partagés étaient spécifiques à la glande à soie et non identifiés dans d'autres types de tissus (hémocytes et ovaires) (Fig. 30 supplémentaire). Ensuite, nous avons effectué un dépistage génétique unique pour chaque segment de glande à soie à l'aide d'un pipeline personnalisé (Fig. 28a supplémentaire). Nous avons constaté que 42, 6 et 2 paires de gènes orthologues étaient coexprimées dans le Duct et l'ASG, le Sac et le MSG, et la Queue et le PSG, respectivement (Fig. 5g; Données supplémentaires 20). Fait intéressant, nous avons constaté que sept paires de gènes orthologues impliquées dans la famille des ATPases de type V, codant pour des facteurs clés impliqués dans la régulation de la fibrillogenèse de la soie52, étaient significativement régulées à la fois dans le conduit et l'ASG (Fig. 5g). Nos résultats ont indiqué une cohérence plus élevée entre le conduit et l'ASG dans les fonctions moléculaires qu'entre le sac et le MSG ou la queue et le PSG.

Nous avons ensuite exploré si les composants des soies d'araignées et de vers à soie montraient une convergence en effectuant des analyses de Venn des protéomes et des métabolomes de soie des deux espèces (Fig. 28b supplémentaire). Nous avons découvert que la mucine-19 et la GDH étaient les deux seules protéines présentes à la fois dans la soie de dragline de T. clavata et dans la soie de cocon de B. mori, et plus intéressant encore, ces protéines étaient principalement synthétisées et sécrétées par Tail/PSG et Sac/MSG (Fig. 5h). Nous avons également identifié six métabolites communs dans ces deux soies : la choline, l'acide N-méthyl-α-aminoisobutyrique, l'acide DL-malique, le D(-)-thréose, la 4-oxoproline et l'acide L-thréonique (Fig. 5i). Parmi ces métabolites, il convient de noter que la choline, un composant des phospholipides des membranes cellulaires53, et l'acide DL-malique, qui agit comme un conservateur ou un ajusteur de pH54, étaient tous deux des métabolites majeurs de la soie dragline et de la soie cocon (Fig. 5i) . Nous avons donc émis l'hypothèse que la sécrétion de soie des cellules glandulaires vers la lumière s'accompagne d'une libération de choline par la membrane cellulaire et que, dans la soie naturelle, les caractéristiques anti-pourriture et antibactériennes sont conférées par l'acide DL-malique.

En résumé, les caractéristiques moléculaires partagées des glandes à soie tri-sectionnelles d'une araignée et d'un ver à soie ont indiqué une évolution convergente dans des cas similaires liés à la filature de la soie et ont fourni de riches informations sur la fonction des glandes à soie et la biosynthèse de la soie.

Nous rapportons ici le premier assemblage du génome de référence à l'échelle chromosomique de T. clavata. Ce génome de haute qualité combiné à des analyses multiomiques a permis d'élucider les processus de biosynthèse de la soie dans la glande tri-sectionnelle Ma. Nos découvertes nous ont amenés à émettre l'hypothèse que la queue remplit la fonction principale dans la sécrétion de MaSps, tandis que le sac, agissant comme un site de stockage, sécrète une large gamme de protéines (MaSps et protéines non spidroïnes), et le conduit joue un rôle limité dans la sécrétion de protéines. mais un rôle crucial dans la transition structurelle des protéines20,21,24.

Nous proposons un modèle moléculaire décrivant de manière exhaustive le mécanisme sous-jacent à la biosynthèse de la soie dragline dans la glande T. clavata Ma (Fig. 6) : (i) La queue, composée de deux types de cellules omniprésentes, est le site majeur de la sécrétion d'acides organiques et 13 protéines de soie dragline constituant la couche interne de la soie dragline. La présence d'acides organiques peut affecter la solubilité des protéines dans l'eau en modifiant les états conformationnels55. Dans la queue, ces 13 gènes de la soie dragline sont hautement activés, parmi lesquels les transcrits codant pour les protéines MaSp-groupe 1 sont les composants dominants. Une CA relativement élevée dans ce segment, ainsi que la méthylation de mCG, pourraient contribuer à cette expression génique abondante. (ii) Le sac, composé de deux types de cellules ubiquitaires et de quatre types de cellules uniques, est le principal site de sécrétion de lipides et de 28 protéines de soie dragline constituant la couche intermédiaire de la soie dragline. Les lipides agissent comme un manteau qui s'enroule autour de la soie dragline pour réguler sa teneur en eau55. Ces 28 gènes de soie dragline sont également hautement activés dans le Sac, parmi lesquels MaSp-Group1, MaSp-Group2, MaSp-like, SpiCE-DS1, SpiCE-DS2, SpiCE-DS4 et SpiCE-DS13 sont les composants dominants. Une méthylation relativement élevée de CA et de mCG pourrait également contribuer à l'expression génique élevée observée dans ce segment. (iii) Le conduit, constitué d'un type cellulaire omniprésent et de quatre types cellulaires uniques, est le principal site de sécrétion de chitine, de protéines cuticulaires, d'ions (Ca2+ et H+) et de 13 protéines de soie dragline. La chitine et les protéines cuticulaires forment l'intima cuticulaire, où les forces de cisaillement sont générées21,56. Les ions sont responsables d'un état de flux multidimensionnel, y compris l'échange d'ions, la formation d'un gradient de pH et la déshydratation11,20, et les 13 protéines de soie de dragline constituent la couche externe de la soie de dragline. La transcription des gènes de la soie dragline est moins active dans le Duct que dans le Tail et le Sac, et seulement 0,76% des transcrits proviennent de ces gènes. Une CA relativement faible dans ce segment, ainsi que la méthylation de mCG, pourraient contribuer à cette diminution de l'expression. Dans l'ensemble, nos résultats définissent non seulement les composants protéomiques et métaboliques de la soie dragline, mais retracent également leurs origines à partir de la glande tri-sectionnelle Ma. Le nombre de types de cellules dans la queue, le sac et le conduit est positivement corrélé à la diversité de leurs fonctions.

Les cercles pleins orange représentent les gènes avec un FPKM> 10 000 et les cercles creux orange représentent les gènes avec un FPKM <10 000, accessibilité à la chromatine CA, méthylation Me. Adobe Illustrator 2020 a été utilisé pour créer l'image.

Nos résultats fournissent des indices génomiques pour la biosynthèse hiérarchiquement ordonnée des spidroines. Nous avons documenté que les gènes MaSp1a–c & MaSp2e, MaSp2a–d et MiSp-a–e sont répartis en trois groupes distincts. De plus, nous avons démontré que les MaSp au sein de chacun de ces groupes présentaient des profils d'expression SC et ST concertés dans la glande tri-sectionnelle Ma. Nous avons également identifié les motifs TF communs spécifiques au groupe au niveau épigénétique et construit des réseaux lncRNA-miRNA-mRNA spécifiques au groupe au niveau de l'ARNe. Ces résultats ont révélé de nouvelles caractéristiques structurelles, expressionnelles et régulatrices des gènes de la spidroïne qui n'ont pas été signalées dans d'autres génomes d'araignées. On pense que les spidroins exercent une influence importante sur les propriétés mécaniques de la soie de dragline16,57,58. Comme les distributions de groupe des gènes de spidroïne ont déjà été identifiées dans les génomes d'araignées de haute qualité de T. antipodiana35 et Latrodectus elegans59 avec des protéines de spidroïne cataloguées, nos données comblent une importante lacune d'information concernant l'arrangement des gènes de spidroïne sur des chromosomes entiers et fournissent un aperçu général. point d'entrée pour la différenciation mécanique de la soie et l'étude plus approfondie de l'évolution du génome de l'araignée.

En plus des découvertes génomiques ci-dessus, nos résultats fournissent des indices cellulaires pour l'organisation en trois sections et la division fonctionnelle de la glande Ma. Alors que des études antérieures ont montré qu'il existe deux ou trois types de cellules qui sécrètent des spidroines dans la glande Ma des araignées orb-web21,60, le nombre de types de cellules dans la glande Ma a fait l'objet de débats. Les résultats divergents concernant ces types de cellules ont suggéré qu'ils peuvent varier d'une espèce à l'autre, mais reflètent probablement aussi des difficultés technologiques dans la capture de cellules intactes après la préparation d'échantillons pour des études cellulaires et morphologiques20,21,61. Notre étude fournit des données scRNA-seq et ST bien vérifiées indiquant l'existence de dix types de cellules dans l'ensemble de la glande Ma, contribuant ainsi à répondre à cette question controversée. L'architecture spatiale unicellulaire fascinante de la glande indique en outre la trajectoire de différenciation des cellules de la glande Ma pendant les transitions d'état cellulaire, suggérant que le sac et le conduit sont dérivés du type de cellule précoce présent dans la queue via la différenciation cellulaire.

Nos analyses génomiques, protéomiques et métabolomiques révèlent davantage de détails sur la génération de soie dans les glandes productrices de soie. Des études physiques et matérielles ont montré que la dope de soie liquide est transformée en fibre insoluble par les effets combinés des gradients de pH et d'ions ainsi que des forces d'extension et de cisaillement lors de sa migration à travers la glande à soie3,62. Notre travail fournit des preuves biologiques de ce rôle de la glande à soie et démontre en outre une convergence élevée de plusieurs fonctions moléculaires dans le conduit de la glande Ma de l'araignée et l'ASG du ver à soie, y compris la liaison des ions calcium, la liaison de la chitine, la transduction du signal et le transport H+ de type V. Expression de l'ATPase. Ces chevauchements étaient spécifiques à la glande à soie et non identifiés dans d'autres types de tissus (hémocytes et ovaires) (Fig. 30 supplémentaire). De plus, nous avons identifié des composants de soie convergents dans les soies d'araignées et de vers à soie, dont deux protéines (mucine-19 et GDH) et deux métabolites majeurs (choline et acide DL-malique). Ces aspects analogues ont indiqué des processus critiques et des composants essentiels à la formation de la soie, qui contribuent à comprendre l'évolution de la filature de la soie et peuvent être utilisés comme références pour l'optimisation des dispositifs de filature artificielle à base de conduits et la conception de solutions de protéines de soie dans la filature artificielle.

En conclusion, nos travaux actuels illustrent de manière exhaustive la base biologique de la formation de soie dragline chez une araignée à tissage orbe. À notre connaissance, cette étude est la première à révéler avec autant de détails le mécanisme biologique de la filature de la soie chez les araignées. Nous pensons que le génome de référence à l'échelle chromosomique de l'araignée orb-web et l'atlas moléculaire de la glande Ma tri-sectionnelle présenté ici faciliteront la compréhension du processus de filature de la soie de l'araignée chez les araignées et serviront en outre de plate-forme puissante pour études évolutives des organismes fileurs de soie. Plus important encore, les caractéristiques moléculaires significatives révélées par nos résultats et les ensembles de données générés devraient à terme ouvrir la voie à la production de soies synthétiques optimisées grâce à des manipulations génétiques et biomimétiques.

Des araignées T. clavata ont été capturées dans la nature dans la ville de Dali, province du Yunnan, en Chine. Les araignées T. clavata femelles adultes capturées ont été cultivées à l'intérieur à 25 ° C et leurs œufs ont été échantillonnés le troisième jour après le frai pour le caryotypage de l'ADN. Environ 20 œufs ont été écrasés avec des pincettes, mélangés avec 1,5 mL de colchicine à 0,05 % pendant trois heures, immobilisés avec une solution de KCl à 0,075 mol/L (20 min) et fixés dans une solution de méthanol/acide acétique (3:1) (30 min) . La suspension cellulaire a été déposée sur des lames de verre prérefroidies, séchées à la flamme, colorées avec une solution de Giemsa à 5 % (50 min), rincées à l'eau courante et séchées à l'air. Les caryotypes chromosomiques ont été observés à l'aide d'un microscope Olympus avec un grossissement de 40×.

Pour capturer de manière plus complète l'ensemble de gènes de T. clavata, les 18 tissus frais suivants (Données supplémentaires 1) ont été disséqués dans une solution PBS : corps de la femme (TcF), corps de l'homme (TcM), hémolymphe (Hem), pédipalpes (Ped), jambes (Leg), épiderme (Epi), corps gras (Fat), ovaire (Ova), glande à venin (Ven), glande ampullée majeure entière (Ma), queue de la glande Ma (Tail), sac de la glande Ma ( Sac), conduit de la glande Ma (Duct), glande ampullée mineure (Mi), glande tubuliforme (Tu), glande flagelliforme (Fl), glande agrégée (Ag) et glandes aciniformes et piriformes (Ac & Py); et trois répétitions biologiques indépendantes ont été réalisées pour chaque échantillon. Ensuite, l'ARN total a été extrait à l'aide du réactif TRIzol et séquencé sur la plateforme DNBSEQ.

Pour améliorer la qualité de l'annotation du gène de la spidroïne, nous avons également effectué un séquençage complet du transcriptome. Sept tissus de glandes à soie (glandes Ma, Mi, Tu, Fl, Ag, Ac et Py) ont été mélangés pour construire des bibliothèques pour le séquençage Isoform (Iso-seq) sur la plateforme PacBio. Pour réduire le biais de fragment, nous avons construit deux bibliothèques : l'une allant de 0 à 10 kb et l'autre de 5 à 10 kb.

Pour l'assemblage de novo du génome de T. clavata (Fig. 1c supplémentaire), les lectures longues de Nanopore ont été initialement corrigées à l'aide de Canu v2.263 avec les paramètres par défaut, et SMARTdenovo (https://github.com/ruanjue/smartdenovo) a été ensuite employé pour produire les contigs primaires. Ensuite, trois cycles de correction de contig ont été effectués à l'aide de Racon v1.5.064. Pour améliorer la précision de l'assemblage, Pilon v1.2465 a été utilisé pour le polissage contig basé sur les lectures courtes Illumina. Les lectures courtes Hi-C appariées ont été principalement coupées à l'aide de Hic-pro v2.1066, et les lectures optimisées ont été mappées sur le projet de contig avec Juicer v1.6.267 en utilisant 3D-DNA v18041968 pour la construction de pseudochromosomes et l'outil Juicebox v1.967 pour corrections manuelles.

Une base de données de répétition personnalisée de T. clavata a été identifiée de novo en utilisant RepeatModeler v269 et LTR_FINDER v1.0670. Ensuite, les séquences répétées obtenues ont été importées dans RepeatMasker v4.0571 pour rechercher des éléments transposables (ET) dans le génome. Tandem Repeats Finder v4.0972 a été utilisé pour trouver des répétitions en tandem.

La prédiction de la structure des gènes était basée sur les données d'homologie et la prédiction de novo. Les fichiers de données comprenaient des données ARN-seq (ARN-seq de 17 tissus), des données Iso-seq et des séquences protéiques d'espèces étroitement apparentées (quatre espèces : A. ventricosus, A. bruennichi, T. antipodiana et T. clavipes) . Le logiciel AUGUSTUS v3.2.373 (http://bioinf.uni-greifswald.de/) a été utilisé pour la prédiction génique de novo. Des annotations de gènes basées sur des preuves ont été produites dans le pipeline MAKER234 avec les paramètres par défaut. Ensuite, nous avons intégré les résultats MAKER et de novo sur la base des critères de dépistage suivants : la proportion de séquences répétées était inférieure à 50 %, la longueur de la séquence protéique était supérieure à 50 aa, la valeur FPKM était supérieure à 0,1 dans au moins dix échantillons. , et la séquence était étayée par des preuves Iso-seq (identité> 95%) ou une séquence correspondante d'au moins une espèce étroitement apparentée (valeur E> 1e-5, identité> 50%).

Un total de 443 séquences de spidroïne redondantes (données supplémentaires 6) ont été téléchargées à partir de la base de données de protéines NCBI (https://www.ncbi.nlm.nih.gov/protein). Toutes les séquences protéiques de T. clavata ont été utilisées pour aligner ces spidroines par blastp (valeur E < 1e−10), et 128 hits non répétitifs ont été principalement identifiés. Pour identifier de manière plus fiable les spidroines, nous avons revérifié que chaque séquence comprenait des répétitions typiques et des extrémités N ou C-terminales, et les 28 spidroines putatives finales ont finalement été identifiées.

En bref, (1) 79 séquences complètes de spidroïne, 48 séquences N-terminales et 22 séquences C-terminales (Données supplémentaires 7) ont été cartographiées sur le génome de T. clavata pour générer les fichiers de suivi GFF à l'aide de l'outil genBlast v13874 ; (2) les fichiers BAM des données Iso-seq de la glande de soie et des données d'ARN-seq de la glande de soie ont été extraits en tant que pistes de données d'expression ; (3) les fichiers GFF3 des 28 spidroins ont été extraits en une seule piste ; (4) les fichiers de suivi des trois étapes précédentes ont été importés dans IGV v2.9.475, et l'intégrité de chaque spidroin a été vérifiée manuellement ; et (5) la séquence d'ADN de la spidroïne incomplète sur les régions correspondantes du génome a été tronquée, puis réparée sur la base de la traduction et de la prédiction par décalage de cadre à l'aide de l'outil en ligne AUGUSTUS v3.2.373 (http://Augustus.gobics.de/).

La teneur en acides aminés et les motifs ont été quantifiés à l'aide d'un script Perl. Les motifs comprenaient (GA)n, (A)n, GGX, XQQ et GPGXX. La O-glycosylation a été prédite avec l'outil NetOGlyc v4.076.

La soie de dragline de l'araignée T. clavata et la soie de cocon du ver à soie B. mori ont été coupées avec des ciseaux (Données supplémentaires 1). Tout d'abord, des échantillons de soie (n = 3, 20 mg de chaque échantillon) ont été dissous dans 500 μL de LiSCN 9 M, et le surnageant a été collecté après centrifugation (10 000 × g, 10 min). Les concentrations de protéines ont été mesurées via le test de protéines de Bradford (Beyotime, Chine). Ensuite, les échantillons ont été dilués 10 fois dans une solution d'urée 8 M, mélangés avec un tampon SDS – PAGE 5 × et séparés à l'aide d'un gel de protéines NuPAGE 4–12% Bis-Tris (Thermo Fisher Scientific, États-Unis). Les échantillons ont ensuite été digérés avec de la trypsine (1/50 μg de protéine) pendant 20 h à 37 °C. Les échantillons digérés ont été lyophilisés et remis en suspension dans de l'acide formique (FA) à 0, 1%, puis mesurés par LC-MS / MS sur une colonne Q Exactive HF-X (Thermo Fisher Scientific, USA). Le gradient a été défini comme 5 à 95 % d'acétonitrile dans 0,1 % d'acide formique. Le débit et le temps d'analyse étaient respectivement de 600 nL/min et 70 min. Les paramètres de l'instrument étaient les suivants : le balayage MS complet variait de m/z 350 à 1 500 avec une résolution de 60 000 (à m/z 200) ; la valeur cible de la commande automatique de gain (AGC) était de 3 × 106 et la durée maximale d'injection d'ions était de 20 ms ; les 40 premiers précurseurs de la plus grande abondance dans le balayage complet ont été sélectionnés et fragmentés par dissociation collisionnelle à plus haute énergie (HCD) et analysés en MS/MS, où la résolution était de 15 000 (à m/z 200), la valeur cible AGC était de 1 × 105, le temps maximal d'injection d'ions était de 45 ms, une énergie de collision normalisée était fixée à 27 %, un seuil d'intensité était de 2,2 × 104 et le paramètre d'exclusion dynamique était de 20 s. Les données MS brutes résultantes ont été analysées avec MaxQuant v1.3.0.577. Les recherches MaxQuant ont été effectuées sur la base de données SpiderDB (https://spider.bioinfotoolkits.net) contenant 37 607 séquences de protéines. Les paramètres de recherche étaient les suivants : l'oxydation de la méthionine et l'acétylation N-terminale ont été définies comme modifications variables, et la carbamidométhyl cystéine a été définie comme modification fixe ; la longueur minimale du peptide a été fixée à sept acides aminés et un maximum de deux clivages erronés a été autorisé ; les identifications de peptides et de protéines ont été filtrées à un taux de fausse découverte de 1 % ; la protéine identifiée nécessitait au moins un peptide unique et tous les impacts inverses et contaminants courants ont été supprimés. Sur la base de la somme des intensités maximales, l'algorithme de quantification absolue basée sur l'intensité (iBAQ) de MaxQuant a été utilisé pour calculer les abondances de protéines.

Des échantillons de soie dragline déchiquetée et de soie de cocon (n = 6, 20 mg de chaque échantillon) ont été utilisés pour l'extraction des métabolites (données supplémentaires 1). Chaque échantillon de soie a été placé dans un tube, homogénéisé dans 500 μL de méthanol à 80 %, conservé sur de la glace pendant 10 min et centrifugé à 15 000 × g pendant 20 min à 4 °C. Le surnageant (250 µL par échantillon) a été collecté pour les expériences LC-MS/MS et injecté sur une colonne Hypesil Gold (C18, 100 × 2,1 mm, 1,9 μm) en utilisant un gradient linéaire de 17 min à un débit de 0,2 mL/min. Les éluants pour le mode de polarité positive étaient l'éluant A (0,1 % FA dans l'eau) et l'éluant B (méthanol). Les éluants pour le mode de polarité négative étaient l'éluant A (acétate d'ammonium 5 mM, pH 9,0) et l'éluant B (méthanol). Le gradient de solvant a été fixé comme suit : 2 % B, 1,5 min ; 2–100 % B, 3 minutes ; 100 % B, 10 minutes ; 100–2 % B, 10,1 minutes ; 2 % B, 12 min. Le spectromètre de masse Q Exactive HF (Thermo Fisher Scientific, États-Unis) fonctionnait en mode de polarité positive/négative avec une tension de pulvérisation de 3,5 kV, une température capillaire de 320 °C, un débit de gaz gaine de 35 psi et un débit de gaz auxiliaire de 10 L/min, niveau RF de la lentille S de 60, température du réchauffeur de gaz auxiliaire de 350 °C. Le balayage complet allait de m/z 350 à 1500 avec une résolution de 60 000 (à m/z 200). La valeur cible de l'AGC était de 3 × 106 et le temps d'injection d'ions maximum était de 20 ms. Les 40 premiers précurseurs les plus abondants dans l'analyse complète ont été sélectionnés et fragmentés par HCD et analysés en MS/MS, où la résolution était de 45 000 (à m/z 200) pour 10 plex, la valeur cible AGC était de 5 × 104, le temps maximal d'injection d'ions était de 86 ms, une énergie de collision normalisée était fixée à 32 %, un seuil d'intensité était de 1,2 × 105 et le paramètre d'exclusion dynamique était de 20 s. Les identités et les quantités de métabolites ont été confirmées par l'analyse du logiciel Compound Discoverer 3.1 (CD 3.1), y compris l'alignement sur mzCloud (https://www.mzcloud.org/), mzVault (mzCloud Offline pour mzVault 2.3_2020A.db) et Mass List (Endogenous Metabolite-Animal-POS/NEG-20191029) bases de données (date de récupération : 15/06/2020). De plus, les bases de données KEGG78 (https://www.kegg.jp/), HMDB79 (https://hmdb.ca/metabolites) et LIPIDMaps80 (http://www.lipidmaps.org/) (date de récupération : 7 /17/2020) ont été utilisés pour l'annotation des métabolites.

La queue, le sac et le conduit séparés de la glande Ma ont été soumis à WGBS. Tout d'abord, l'ADN génomique a été extrait et fragmenté à une taille moyenne de 250 pb par sonication à l'aide d'un Bioruptor (Diagenode, Belgique), suivi de l'ajout d'une base "A" aux extrémités 3' terminales des fragments d'ADN et de la ligature de adaptateurs méthylés aux deux extrémités des fragments d'ADN. Le kit EZ DNA Methylation-Gold (ZYMO) a été utilisé pour la conversion au bisulfite de l'ADN ligaturé. Les produits ont été purifiés à l'aide d'un kit d'extraction de gel QIAquick (Qiagen, USA) et amplifiés par PCR. Enfin, les librairies ont été séquencées sur la plateforme Illumina HiSeq 2500.

Les lectures propres ont été mappées sur le génome de référence à l'aide du logiciel BSMAP 2.90 (https://code.google.com/archive/p/bsmap/) avec les paramètres (-v 8 -z 33 -p 4 -n 0 -w 20 -s 16 -f 10 -L 100) après retrait des adaptateurs et lectures de mauvaise qualité (N > 10 % et Q < 20). Les niveaux de méthylation ont été estimés en déterminant les valeurs bêta correspondantes : bêta = M/(M + U), où M et U représentent respectivement les valeurs de signal méthylées et non méthylées. Le fichier BED des données de méthylation a été converti au format BigWig en utilisant la ligne de commande "bedGraphToBigWig" et visualisé dans IGV75.

La queue, le sac et le conduit séparés de la glande Ma ont été soumis à un séquençage ATAC. Les échantillons ont été broyés individuellement dans de l'azote liquide et transférés dans une solution de lysat cellulaire prérefroidie à 4 ° C pendant 10 min. Après centrifugation (500 × g, 4 ° C et 10 min), le surnageant a été éliminé et les culots cellulaires ont été conservés. Les culots ont été lavés avec une solution tampon prérefroidie et centrifugés (500 × g, 4 ° C et 10 min) pour collecter les noyaux cellulaires. La solution de noyau cellulaire a été mélangée avec de la Tn5-transposase et incubée pendant 30 min à 37 ° C, suivie d'une collecte de fragments d'ADN, d'une amplification par PCR et d'un séquençage sur la plate-forme Illumina PE150.

Les lectures propres ont été cartographiées sur le génome à l'aide du logiciel Bowtie281, les données ont été converties du format.sam au format.bam et les lectures ont été filtrées à l'aide de SAMtools v0.1.1982 avec les paramètres (vue -b -f 2 -q 30). Les pics des régions accessibles à la chromatine ont été identifiés séparément dans chaque échantillon à l'aide de MACS283 (–shift −100–extsize 200–nomodel -B -q 0,05). La commande "intersection" de BEDTools v2.26.084 a été utilisée pour identifier les pics partagés entre les échantillons répétés. Les cartes thermiques ont été générées à l'aide de la fonction "plotHeatmap" de deepTools v3.5.185. Des motifs significativement enrichis ont été identifiés par l'outil HOMER86.

L'ARN total a été extrait de la queue, du sac et du conduit de la glande Ma avec le réactif TRIzol, suivi de la construction d'une bibliothèque d'ARNlnc et de miARN, comme décrit ci-dessous.

Les échantillons d'ARN total ont été incubés avec la DNase I pour digérer les fragments d'ADN et avec la RNase H pour éliminer l'ARNr. Après purification de l'ARN, l'ADNc a été synthétisé avec une base "A" ajoutée à l'extrémité 3', et la ligature de l'adaptateur a été réalisée, suivie d'une digestion UDG du second brin et d'une amplification par PCR. La banque construite a été séquencée sur la plateforme DNBSEQ. Les lectures propres ont été cartographiées sur le génome de référence à l'aide de HISAT287 (–phred64–sensible–no-discordant–no-mixed -I 1 -X 1000), et les transcriptions ont été assemblées à l'aide de StringTie88 (-f 0,3 -j 3 -c 5 - g 100 -s 10000 -p 8) et comparé avec des ARNm connus en utilisant le programme CuffCompare (-p 12) de Cufflinks89. Ensuite, les méthodes de classification coopérative des données (CPC), txCdsPredict et coding noncoding index (CNCI) ont été utilisées pour distinguer les ARNm et les lncRNA. Des méthodes cis et trans ont été utilisées pour évaluer les ARNm cibles des ARNlnc. Les cis-lncRNA ont été définis comme les lncRNA situés à 10 kb en amont ou à 20 kb en aval de l'ARNm cible. L'énergie de liaison (BE) des lncARN et des ARNm a été analysée par RNAplex90, et si la BE était < -30, l'lncRNA était considéré comme un trans-lncRNA.

L'ARN total a été purifié et isolé par électrophorèse PAGE et a ensuite été excisé du gel pour obtenir des fragments d'ARN de 18 à 30 nt. L'extrémité 3' de chaque petit fragment d'ARN a été ligaturée à un adaptateur 5-adénylé et 3-bloqué, et une amorce marquée par des identificateurs moléculaires uniques (UMI) a été ajoutée pour l'hybridation avec l'adaptateur 3'. Ensuite, l'adaptateur 5' a été hybridé avec l'extrémité 5' du marqueur UMI. Le brin d'ADNc a été synthétisé avec des amorces marquées UMI et une polymérase hautement sensible a été utilisée pour amplifier le produit. Nous avons utilisé Bowtie281 (-q -L 16–phred64 -p 6) pour aligner les lectures propres sur le génome de référence et la base de données de petits ARN Rfam91 (en utilisant cmsearch avec les paramètres–cpu 6–noali). Pour identifier les miARN, qui ont été annotés et prédits avec la base de données miRBase92 (https://www.mirbase.org/) et l'outil miRDeep293, des cibles ont été prédites entre les miARN et les lncARN/ARNm en utilisant miRanda43 (-en −20 -strict) et RNAhybrid44 (-b 100 -c -f 2,8 -m 100000 -v 3 -u 3 -e -20 -p 1).

Les glandes Ma fraîchement disséquées de trois araignées indépendantes ont été lavées à l'aide d'un milieu de culture et coupées en petits morceaux, et des morceaux de tissu ont été digérés dans un incubateur à température constante pendant 45 min. Après digestion, le milieu a été filtré sur un tamis cellulaire de 40 μm et lavé au moins trois fois par centrifugation pendant 5 min à 300 × g et 4 °C. Enfin, les suspensions cellulaires avec une activité supérieure à 85 % et des taux d'agglomération inférieurs à 5 % ont été utilisées pour la construction de la bibliothèque et le séquençage. La bibliothèque a été construite selon les instructions du fabricant (10 × Genomics) sur la plate-forme 10 × Chromium Single Cell 3'.

Les données brutes ont été importées dans le pipeline cellranger v4.0.0 pour obtenir les matrices d'expression de chaque cellule et de chaque gène. Pour éliminer les cellules de mauvaise qualité, les nombres de cellules et les nombres d'UMI de gènes dans la plage de la médiane ± 2 fois l'écart absolu médian (MAD) ont été conservés pour une analyse plus approfondie. De plus, les doublets (≥ 2 cellules dans une goutte d'huile) ont été supprimés à l'aide de DoubletFinder v2.0.394. Un total de 9349 cellules de haute qualité ont été utilisées pour analyser le regroupement et l'expression sur la base du package Seurat v4.0.695. Les trajectoires de développement de tous les amas de cellules ont été prédites avec le package Monocle v2.22.096.

Les glandes Ma fraîches ont été congelées avec de l'isopentane dans de l'azote liquide, incorporées avec de l'OCT et stockées dans un récipient hermétique à -80 ° C. Le tissu congelé intégré a été sectionné et des sections avec une qualité d'ARN acceptable (RIN> 7,0) ont été utilisées pour d'autres expériences. Ensuite, les coupes ont été placées sur des lames Visium Spatial, fixées au méthanol, colorées à l'hématoxyline et à l'éosine, et observées au microscope BX53 (Olympus, Japon). L'ARNm polyadénylé a été capturé avec les amorces utilisées pour les taches. Le réactif de transcription inverse RT Master Mix a ensuite été ajouté aux sections de tissu de perméat, et la synthèse d'ADNc du second brin a été effectuée sur la lame en ajoutant le Second Strand Mix. L'ADNc obtenu a été dénaturé de chaque zone de capture et transféré dans le tube correspondant pour amplification, construction de bibliothèque et séquençage sur la plateforme Illumina NovaSeq600.

Après avoir retiré les adaptateurs et les lectures de faible qualité (N > 3, Q < 5 et rapport de base ≥ 20 %), les programmes spaceranger v1.3.1 mkref et count ont été utilisés pour le prétraitement des données. Ensuite, le regroupement ponctuel a été analysé à l'aide du package Seurat v4.0.695.

Pour évaluer l'occurrence d'une évolution convergente entre la glande à soie du ver à soie et la glande de l'araignée Ma, nous avons comparé cinq aspects (voir la note complémentaire pour plus de détails) : (1) la structure morphologique des glandes à soie ; (2) les microstructures de la soie de dragline et de la soie de cocon observées au microscope électronique à balayage SU3500 (SEM) (Hitachi, Japon) avec une tension d'accélération de 5 kV ; (3) la convergence d'expression des gènes de la glande à soie, (4) les composants protéiques homologues de la soie dragline et de la soie cocon ; et (5) les composants métabolites de la soie dragline et de la soie cocon. Les gènes orthologues partagés par le ver à soie et l'araignée ont été identifiés à l'aide du programme blastp97 (E-value < 1e−5).

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Toutes les données brutes de séquençage à haut débit de ce projet ont été déposées dans le Genome Sequence Archive (GSA) du National Genomics Data Center (NGDC, https://ngdc.cncb.ac.cn/) et sont disponibles via BioProject ID PRJCA014503. Les données de protéomique de spectrométrie de masse ont été déposées auprès du Consortium ProteomeXchange (http://proteomecentral.proteomexchange.org/cgi/GetDataset) via le référentiel partenaire iProX98 avec l'identifiant d'ensemble de données PXD038734. Les données métabolomiques ont été déposées au NGDC (https://ngdc.cncb.ac.cn/omix/release/OMIX002862, https://ngdc.cncb.ac.cn/omix/release/OMIX002863). Les métriques unicellulaires et spatiales ont été déposées dans FigShare (https://figshare.com/articles/dataset/Single_cell_matrices_zip/20399475, https://figshare.com/articles/datasset/Spatial_Transcriptomics_zip/20399580). L'assemblage du génome, l'annotation des gènes et les résultats de l'analyse multiomique de Trichonephila clavata sont également disponibles sur SpiderDB (https://spider.bioinfotoolkits.net). Les données sources sont fournies pour les Fig. 1, 2, 4, 5. Les données sources sont fournies avec cet article.

Des scripts et des flux de travail personnalisés pour l'analyse des données sont disponibles sur FigShare (https://figshare.com/articles/dataset/SpiderGenomeAnanlysis_code_zip/20399652, https://figshare.com/articles/dataset/SpiderGenomeAnanlysis_code1_zip/20399706).

Musée d'histoire naturelle de Berne. Catalogue mondial des araignées. Version 23.5. http://wsc.nmbe.ch (consulté le 17 juillet 2022).

Pennisi, E. Démêler la biologie des araignées. Sciences 358, 288-291 (2017).

Article ADS CAS PubMed Google Scholar

Vollrath, F. & Knight, DP Filage cristallin liquide de la soie d'araignée. Nature 410, 541–548 (2001).

Article ADS CAS PubMed Google Scholar

Garrison, T.-N.-L. et al. Phylogénomique des araignées : démêler l'arbre-araignée de la vie. Peer J 4, e1719 (2016).

Article PubMed PubMed Central Google Scholar

Roberts, AD et al. Biologie synthétique pour fibres, adhésifs et matériaux de camouflage actifs en protection et aéronautique. MME Commun. 9, 486–504 (2019).

Article CAS PubMed PubMed Central Google Scholar

Whittall, DR, Baker, KV, Breitling, R. & Takano, E. Systèmes hôtes pour la production de soie d'araignée recombinante. Tendances Biotechnol. 39, 560-573 (2021).

Article CAS PubMed Google Scholar

Liu, D. et al. Spider dragline soie comme actionneur de torsion entraîné par l'humidité. Sci. Adv. 5, eaau9183 (2019).

Article ADS CAS PubMed PubMed Central Google Scholar

Rising, A. & Johansson, J. Vers la filature de soie d'araignée artificielle. Nat. Chim. Biol. 11, 309–315 (2015).

Article CAS PubMed Google Scholar

Vollrath, F. & Porter, D. Silks comme modèles anciens pour les polymères modernes. Polymère 50, 5623–5632 (2009).

Article CAS Google Scholar

Vollrath, F., Porter, D. & Holland, C. Il y a encore beaucoup d'autres leçons à tirer des soies d'araignée. Matière molle 7, 9595–9600 (2011).

Article ADS CAS Google Scholar

Malay , AD , Craig , HC , Chen , J. , Octaviani , NA & Numata , K. Complexity of spider dragline silk . Biomacromolécules 23, 1827–1840 (2022).

Article CAS PubMed PubMed Central Google Scholar

Li, J. et al. Fibres artificielles inspirées de la soie d'araignée. Adv. Sci. 9, e2103965 (2022).

Article MathSciNetGoogle Scholar

Blamires, SJ, Blackledge, TA & Tso, IM Variation des propriétés physicochimiques de la soie d'araignée : écologie, évolution et production synthétique. Annu. Rév. Entomol. 62, 443–460 (2017).

Article CAS PubMed Google Scholar

Lewis, soie d'araignée RV : idées anciennes pour de nouveaux biomatériaux. Chim. Rév. 106, 3762–3774 (2006).

Article CAS PubMed Google Scholar

Garb, JE, Sharma, PP & Ayoub, NA Progrès récents et perspectives pour faire progresser la génomique des arachnides. Courant. Avis. Insect Sci. 25, 51-57 (2018).

Article PubMed Google Scholar

Gatesy, J., Hayashi, C., Motriuk, D., Woods, J. et Lewis, R. Extrême diversité, conservation et convergence des séquences de fibroïne de soie d'araignée. Sciences 291, 2603-2605 (2001).

Article ADS CAS PubMed Google Scholar

Chaw, RC, Correa-Garhwal, SM, Clarke, TH, Ayoub, NA & Hayashi, CY Preuve protéomique des composants de la synthèse de la soie d'araignée à partir des glandes et des fibres de soie de la veuve noire. J. Proteome Res. 14, 4223–4231 (2015).

Article CAS PubMed PubMed Central Google Scholar

Vollrath, F. & Selden, P. Le rôle du comportement dans l'évolution des araignées, des soies et des toiles. Annu. Rév. Ecol. Évol. S. 38, 819–846 (2007).

Article Google Scholar

Ramezaniaghdam, M., Nahdi, ND & Reski, R. Soie d'araignée recombinante : promesses et goulots d'étranglement. Devant. Bioeng. Biotechnol. 10, 835637 (2022).

Article PubMed PubMed Central Google Scholar

Andersson, M. et al. L'anhydrase carbonique génère du CO2 et du H+ qui entraînent la formation de soie d'araignée via des effets opposés sur les domaines terminaux. PLoS Biol. 12, e1001921 (2014).

Article PubMed PubMed Central Google Scholar

Andersson, M., Holm, L., Ridderstrale, Y., Johansson, J. & Rising, A. Morphologie et composition de la glande ampullée majeure de l'araignée et de la soie dragline. Biomacromolécules 14, 2945–2952 (2013).

Article CAS PubMed Google Scholar

Knight, DP & Vollrath, F. Changements dans la composition des éléments le long du conduit en rotation chez une araignée Nephila. Naturwissenschaften 88, 179-182 (2001).

Article ADS CAS PubMed Google Scholar

Andersson, M., Johansson, J. & Rising, A. Filature de soie chez les vers à soie et les araignées. Int. J. Mol. Sci. 17, 1290 (2016).

Article PubMed PubMed Central Google Scholar

Foo, CWP et al. Rôle du pH et de la charge sur l'assemblage des protéines de soie chez les insectes et les araignées. Appl. Phys. A-Mater. 82, 223-233 (2006).

Article ADS CAS Google Scholar

Teule, F. et al. Les vers à soie transformés avec des gènes chimériques de vers à soie/soie d'araignée filent des fibres de soie composites avec des propriétés mécaniques améliorées. Proc. Natl Acad. Sci. ETATS-UNIS. 109, 923–928 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Xu, J. et al. Production massive de soie d'araignée par remplacement ciblé de gènes chez Bombyx mori. Proc. Natl Acad. Sci. ETATS-UNIS. 115, 8757–8762 (2018).

Article ADS CAS PubMed PubMed Central Google Scholar

Zhang, XL et al. CRISPR/Cas9 a initié des vers à soie transgéniques en tant que fileuses naturelles de soie d'araignée. Biomacromolécules 20, 2252–2264 (2019).

Article CAS PubMed Google Scholar

Kono, N. et al. La nature multicomposant sous-tend les propriétés mécaniques extraordinaires de la soie de dragline d'araignée. Proc. Natl Acad. Sci. États-Unis 118, e2107065118 (2021).

Article CAS PubMed PubMed Central Google Scholar

Kono, N. et al. Le génome de l'araignée à tissage d'orbe Araneus ventricosus élucide le catalogue des gènes de la spidroïne. Sci. Rep. 9, 8380 (2019).

Article ADS PubMed PubMed Central Google Scholar

Luo, J. et al. Fibres de soie résistantes préparées dans l'air à l'aide d'une puce microfluidique biomimétique. Int. J. Biol. Macromol. 66, 319–324 (2014).

Article CAS PubMed Google Scholar

Luken, A. et al. Fibres de soie biocompatibles à l'échelle du micron fabriquées par filage humide microfluidique. Adv. Santéc. Mater. 10, e2100898 (2021).

Article PubMed Google Scholar

Kinahan, ME et al. Soie accordable : utilisation de la microfluidique pour fabriquer des fibres de soie aux propriétés contrôlables. Biomacromolécules 12, 1504–1511 (2011).

Article CAS PubMed PubMed Central Google Scholar

Ramezaniaghdam, M., Nahdi, ND & Reski, R. Soie d'araignée recombinante : promesses et goulots d'étranglement. Devant. Bioeng. Biotechnol. 10, 835637 (2022).

Article PubMed PubMed Central Google Scholar

Holt, C. & Yandell, M. MAKER2 : un pipeline d'annotations et un outil de gestion de bases de données génomiques pour les projets de génome de deuxième génération. BMC Bioinforma. 12, 491 (2011).

Article Google Scholar

Fan, Z. et al. Un génome au niveau chromosomique de l'araignée Trichonephila antipodiana révèle la base génétique de sa polyphagie et la preuve d'un ancien événement de duplication du génome entier. Gigascience 10, giab016 (2021).

Article PubMed PubMed Central Google Scholar

Babb, PL et al. Le génome de Nephila clavipes met en évidence la diversité des gènes de la soie d'araignée et leur expression complexe. Nat. Genet. 49, 895–903 (2017).

Article CAS PubMed Google Scholar

Kono, N. et al. L'araignée à écorce de Darwin partage un répertoire de spidroïne avec Caerostris extrusa mais atteint une ténacité de soie extraordinaire grâce à l'expression génétique. Ouvrez Biol. 11, 210242 (2021).

Article CAS PubMed PubMed Central Google Scholar

Li, J., Beerntsen, BT & James, AA Oxydation de la 3-hydroxykynurénine pour produire de la xanthommatine pour la pigmentation des yeux : une voie principale du catabolisme du tryptophane au cours du développement pupal chez le moustique de la fièvre jaune, Aedes aegypti. Biochimie des insectes. Molec 29, 329-338 (1999).

Article CAS Google Scholar

Sakudoh, T. et al. La coloration de la soie caroténoïde est contrôlée par une protéine de liaison aux caroténoïdes, un produit du gène du sang jaune. Proc. Natl Acad. Sci. ETATS-UNIS. 104, 8941–8946 (2007).

Article ADS CAS PubMed PubMed Central Google Scholar

Daimon, T. et al. Le locus Green b du ver à soie code pour une quercétine 5-O-glucosyltransférase qui produit des cocons verts aux propriétés de protection contre les UV. Proc. Natl Acad. Sci. ETATS-UNIS. 107, 11471–11476 (2010).

Article ADS CAS PubMed PubMed Central Google Scholar

Fujiwara, M. et al. L'acide xanthurénique est le principal pigment de la soie de dragline dorée de Trichonephila clavata. Biomolécules 11, 563 (2021).

Article CAS PubMed PubMed Central Google Scholar

Salmena, L., Poliseno, L., Tay, Y., Kats, L. & Pandolfi, PP L'hypothèse ceRNA : la pierre de rosette d'un langage ARN caché ? Cellule 146, 353–358.

Article CAS PubMed PubMed Central Google Scholar

Kuhn, DE et al. Validation expérimentale des cibles miARN. Méthodes 44, 47–54 (2008).

Article CAS PubMed PubMed Central Google Scholar

Kruger, J. & Rehmsmeier, M. RNAhybrid : prédiction de cible de microARN simple, rapide et flexible. Nucleic Acids Res. 34, W451–W454 (2006).

Article PubMed PubMed Central Google Scholar

Shannon, P. et al. Cytoscape : un environnement logiciel pour des modèles intégrés de réseaux d'interactions biomoléculaires. Génome Res. 13, 2498-2504 (2003).

Article CAS PubMed PubMed Central Google Scholar

Xia, QY, Li, S. & Feng, QL Progrès dans les études sur les vers à soie accélérés par le séquençage du génome de Bombyx mori. Annu. Rév. Entomol. 59, 513-536 (2014).

Article CAS PubMed Google Scholar

Ma, Y. et al. Un atlas transcriptomique unicellulaire caractérise l'organe séricigène du ver à soie. Nat. Commun. 13, 3316 (2022).

Article ADS PubMed PubMed Central Google Scholar

Hu, W., Chen, Y., Lin, Y. et Xia, Q. Les caractéristiques développementales et transcriptomiques caractérisent les défauts de croissance des glandes à soie et de production de soie chez le mutant de pupe nue du ver à soie. Biochimie des insectes. Moléc. 111, 103175 (2019).

Article CAS Google Scholar

Ma, SY et al. Activation ciblée de BmCyclinE dans Bombyx mori à l'aide d'effecteurs TAL de concepteur. Insect Sci. 26, 1055-1058 (2019).

Article PubMed Google Scholar

Otsuki, R. et al. Les vers à soie issus de la bio-ingénierie avec des glandes à soie modifiées par la cytotoxine papillon produisent des cocons de séricine avec une utilité pour un nouveau biomatériau. Proc. Natl Acad. Sci. ETATS-UNIS. 114, 6740–6745 (2017).

Article ADS CAS PubMed PubMed Central Google Scholar

Buchberger, A., Bukau, B. & Sommer, T. Contrôle de la qualité des protéines dans le cytosol et le réticulum endoplasmique : frères d'armes. Mol. Cellule 40, 238-252 (2010).

Article CAS PubMed Google Scholar

Wang, X. et al. La formation des fibres et les propriétés mécaniques de la soie de Bombyx mori sont régulées par l'ATPase de type vacuolaire. ACS Biomater. Sci. Ing. 7, 5532–5540 (2021).

Article CAS PubMed Google Scholar

Tayebati, SK, Marucci, G., Santinelli, C., Buccioni, M. & Amenta, F. Phospholipides contenant de la choline : relations structure-activité versus applications thérapeutiques. Courant. Méd. Chim. 22, 4328–4340 (2015).

Article CAS PubMed Google Scholar

Lee, B. et al. Acide dl-malique en tant que composant des acides alpha-hydroxy : effet sur l'inflammation induite par le 2,4-dinitrochlorobenzène dans les lésions cutanées de type dermatite atopique in vitro et in vivo. Immunopharm. Immuno. 41, 614–621 (2019).

Article Google Scholar

Hardy, JG, Romer, LM & Scheibel, TR Matériaux polymères à base de protéines de soie. Polymère 49, 4309–4327 (2008).

Article CAS Google Scholar

Wang, X. et al. La chitine et les protéines de la cuticule forment la couche cuticulaire dans le canal de filature du ver à soie. Acta Biomater. 145, 260-271 (2022).

Article CAS PubMed Google Scholar

Vollrath, F. Biologie de la soie d'araignée. Int. J. Biol. Macromol. 24, 81–88 (1999).

Article CAS PubMed Google Scholar

Hayashi, CY & Lewis, RV Architecture moléculaire et évolution d'un gène de protéine de soie d'araignée modulaire. Sciences 287, 1477-1479 (2000).

Article ADS CAS PubMed Google Scholar

Wang, Z. et al. L'assemblage du génome au niveau des chromosomes de l'araignée veuve noire Latrodectus elegans éclaire la composition et l'évolution du venin et des protéines de soie. Gigascience 11, giac049 (2022).

Article PubMed PubMed Central Google Scholar

Dicko, C., Vollrath, F. & Kenney, JM Le repliement de la protéine de soie d'araignée est contrôlé en modifiant le pH. Biomacromolécules 5, 704–710 (2004).

Article CAS PubMed Google Scholar

Bell, AL & Peakall, DB Modifications de la structure fine lors de la production de protéines de soie dans la glande ampullée de l'araignée Araneus sericatus. J. Cell Biol. 42, 284-295 (1969).

Article CAS PubMed PubMed Central Google Scholar

Jin, HJ & Kaplan, DL Mécanisme de traitement de la soie chez les insectes et les araignées. Nature 424, 1057-1061 (2003).

Article ADS CAS PubMed Google Scholar

Koren, S. et al. Canu : assemblage à lecture longue évolutif et précis via une pondération k-mer adaptative et une séparation répétée. Génome Res. 27, 722–736 (2017).

Article CAS PubMed PubMed Central Google Scholar

Vaser, R., Sovic, I., Nagarajan, N. & Sikic, M. Assemblage rapide et précis du génome de novo à partir de longues lectures non corrigées. Génome Res. 27, 737–746 (2017).

Article CAS PubMed PubMed Central Google Scholar

Walker, BJ et al. Pilon : un outil intégré pour la détection complète des variants microbiens et l'amélioration de l'assemblage du génome. PLoS One 9, e112963 (2014).

Article ADS PubMed PubMed Central Google Scholar

Serviteur, N. et al. HiC-Pro : un pipeline optimisé et flexible pour le traitement des données Hi-C. Génome Biol. 16, 259 (2015).

Article PubMed PubMed Central Google Scholar

Durand, NC et al. Juicebox fournit un système de visualisation des cartes de contact Hi-C avec un zoom illimité. Cellule Syst. 3, 99-101 (2016).

Article CAS PubMed PubMed Central Google Scholar

Dudchenko, O. et al. L'assemblage de novo du génome d'Aedes aegypti à l'aide de Hi-C donne des échafaudages de longueur chromosomique. Sciences 356, 92–95 (2017).

Article ADS CAS PubMed PubMed Central Google Scholar

Flynn, JM et al. RepeatModeler2 pour la découverte génomique automatisée de familles d'éléments transposables. Proc. Natl Acad. Sci. ETATS-UNIS. 117, 9451–9457 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Xu, Z. & Wang, H. LTR_FINDER : un outil efficace pour la prédiction des rétrotransposons LTR pleine longueur. Nucleic Acids Res. 35, W265–W268 (2007).

Article PubMed PubMed Central Google Scholar

Chen, N. dans Utilisation de RepeatMasker pour identifier les éléments répétitifs dans les séquences génomiques. Unité 4 10 Ch. 4, (Curr. Protocole. Bioinformatique, 2004).

Benson, G. Tandem répète finder : un programme pour analyser les séquences d'ADN. Nucleic Acids Res. 27, 573–580 (1999).

Article CAS PubMed PubMed Central Google Scholar

Stanke, M. et al. AUGUSTUS : prédiction ab initio de transcrits alternatifs. Nucleic Acids Res. 34, W435–W439 (2006).

Article CAS PubMed PubMed Central Google Scholar

Elle, R. et al. genBlastG : utilisation des recherches BLAST pour créer des modèles de gènes homologues. Bioinformatique 27, 2141-2143 (2011).

Article CAS PubMed Google Scholar

Thorvaldsdottir, H., Robinson, JT & Mesirov, JP Integrative Genomics Viewer (IGV) : visualisation et exploration de données génomiques hautes performances. Bref. Bioinformer. 14, 178-192 (2013).

Article CAS PubMed Google Scholar

Steentoft, C. et al. Cartographie de précision du glycoprotéome O-GalNAc humain grâce à la technologie SimpleCell. EMBO J. 32, 1478-1488 (2013).

Article CAS PubMed PubMed Central Google Scholar

Cox, J. & Mann, M. MaxQuant permet des taux d'identification de peptides élevés, des précisions de masse individualisées en ppb et une quantification des protéines à l'échelle du protéome. Nat. Biotechnol. 26, 1367-1372 (2008).

Article CAS PubMed Google Scholar

Kanehisa, M., Furumichi, M., Tanabe, M., Sato, Y. & Morishima, K. KEGG : nouvelles perspectives sur les génomes, les voies, les maladies et les médicaments. Nucleic Acids Res. 45, D353–D361 (2017).

Article CAS PubMed Google Scholar

Wishart, DS et al. HMDB 4.0 : la base de données du métabolome humain pour 2018. Nucleic Acids Res. 46, D608–D617 (2018).

Article CAS PubMed Google Scholar

Fahy, E., Sud, M., Cotter, D. & Subramaniam, S. Outils en ligne LIPID MAPS pour la recherche sur les lipides. Nucleic Acids Res. 35, W606–W612 (2007).

Article PubMed PubMed Central Google Scholar

Langmead, B. & Salzberg, SL Alignement rapide en lecture lacunaire avec Bowtie 2. Nat. Méthodes 9, 357–359 (2012).

Article CAS PubMed PubMed Central Google Scholar

Li, H. et al. Le format Sequence Alignment/Map et SAMtools. Bioinformatique 25, 2078-2079 (2009).

Article PubMed PubMed Central Google Scholar

Zhang, Y. et al. Analyse basée sur un modèle de ChIP-Seq (MACS). Génome Biol. 9, R137 (2008).

Article PubMed PubMed Central Google Scholar

Quinlan, AR & Hall, IM BEDTools : une suite flexible d'utilitaires pour comparer les caractéristiques génomiques. Bioinformatique 26, 841–842 (2010).

Article CAS PubMed PubMed Central Google Scholar

Ramirez, F., Dundar, F., Diehl, S., Gruning, BA & Manke, T. deepTools : une plate-forme flexible pour explorer les données de séquençage en profondeur. Nucleic Acids Res. 42, W187–W191 (2014).

Article CAS PubMed PubMed Central Google Scholar

Tu, JC et al. Homer lie un nouveau motif riche en proline et relie les récepteurs métabotropiques du glutamate du groupe 1 aux récepteurs IP3. Neurone 21, 717-726 (1998).

Article CAS PubMed Google Scholar

Kim, D., Paggi, JM, Park, C., Bennett, C. & Salzberg, SL Alignement du génome basé sur un graphique et génotypage avec HISAT2 et HISAT-genotype. Nat. Biotechnol. 37, 907–915 (2019).

Article CAS PubMed PubMed Central Google Scholar

Pertea, M. et al. StringTie permet une reconstruction améliorée d'un transcriptome à partir de lectures d'ARN-seq. Nat. Biotechnol. 33, 290-295 (2015).

Article CAS PubMed PubMed Central Google Scholar

Trapnell, C. et al. Analyse différentielle de l'expression des gènes et des transcrits d'expériences d'ARN-seq avec TopHat et Cufflinks. Nat. Protocole 7, 562–578 (2012).

Article CAS PubMed PubMed Central Google Scholar

Tafer, H. & Hofacker, IL RNAplex : un outil rapide pour la recherche d'interaction ARN-ARN. Bioinformatique 24, 2657–2663 (2008).

Article CAS PubMed Google Scholar

Kalvari, I. et al. Rfam 14 : couverture élargie des familles métagénomiques, virales et microARN. Nucleic Acids Res. 49, D192–D200 (2021).

Article CAS PubMed Google Scholar

Kozomara, A., Birgaoanu, M. & Griffiths-Jones, S. miRBase : des séquences de microARN à la fonction. Nucleic Acids Res. 47, D155–D162 (2019).

Article CAS PubMed Google Scholar

Friedlander, MR, Mackowiak, SD, Li, N., Chen, W. et Rajewsky, N. miRDeep2 identifie avec précision des gènes connus et des centaines de nouveaux gènes de microARN dans sept clades d'animaux. Nucleic Acids Res. 40, 37–52 (2012).

Article PubMed Google Scholar

McGinnis, CS, Murrow, LM & Gartner, ZJ DoubletFinder : détection de doublets dans les données de séquençage d'ARN unicellulaire à l'aide de voisins artificiels les plus proches. Cellule Syst. 8, 329–337.e4 (2019).

Article CAS PubMed PubMed Central Google Scholar

Satija, R., Farrell, JA, Gennert, D., Schier, AF & Regev, A. Reconstruction spatiale des données d'expression génique unicellulaire. Nat. Biotechnol. 33, 495–502 (2015).

Article CAS PubMed PubMed Central Google Scholar

Qiu, X. et al. L'incorporation de graphe inversé résout les trajectoires complexes à cellule unique. Nat. Méthodes 14, 979–982 (2017).

Article CAS PubMed PubMed Central Google Scholar

Mount, DW Utilisation de l'outil de recherche d'alignement local de base (BLAST). CSH Protocole. 2007, pdb top17 (2007).

Google Scholar PubMed

Chen, T. et al. iProX en 2021 : connecter le partage de données protéomiques avec le big data. Nucleic Acids Res. 50, D1522–D1527 (2022).

Article CAS PubMed Google Scholar

Télécharger les références

Nous remercions Daojun Cheng de l'Université du Sud-Ouest et Yi Zou de l'Université du Sud-Ouest pour la lecture critique du manuscrit. Nous remercions Yazhou Li de l'Université agricole du Sichuan pour son aide dans le caryotypage. Nous remercions également les sociétés BGI, Novogene, Frasergen, OE Biotech et Berry Genomics pour avoir fourni le séquençage multiomique. Ce travail a été soutenu par la Fondation nationale des sciences naturelles de Chine [U21A20248], la Fondation nationale des sciences naturelles de Chine [32000340] et les Fonds de recherche fondamentale pour les universités centrales [XDJK2019TJ003].

Ces auteurs ont contribué à parts égales : Wenbo Hu, Anqiang Jia.

State Key Laboratory of Silkworm Genome Biology, Biological Science Research Center, Southwest University, Chongqing, 400715, Chine

Wenbo Hu, Anqiang Jia, Sanyuan Ma, Guoqing Zhang, Zhaoyuan Wei, Fang Lu, Yongjiang Luo, Jiahe Sun, Tianfang Yang, TingTing Xia, Qinhui Li, Ting Yao, Jiangyu Zheng, Zijie Jiang, Zehui Xu, Qingyou Xia et Yi Wang

École des sciences de la vie, Université du Sud-Ouest, Chongqing, 400715, Chine

Zhisheng Zhang

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

WH, AJ, QX et YW ont conceptualisé le projet. YW a supervisé le projet. WH, AJ, ZZ, JS, TY, TX, QL, TY, JZ et YW ont collecté des échantillons pour le séquençage multiomique. AJ a conçu et mis en œuvre le pipeline d'assemblage du génome et effectué l'analyse des données. WH et AJ ont rédigé le manuscrit. FL, YL, ZJ et ZX ont généré les données et créé la base de données. WH et SM ont mené les expériences. YW a finalisé le manuscrit avec la contribution de tous les auteurs. Tous les auteurs ont lu et approuvé le manuscrit final.

Correspondance avec Qingyou Xia ou Yi Wang.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Nadia Ayoub, Shuqiang Li et les autres évaluateurs anonymes pour leur contribution à l'évaluation par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Hu, W., Jia, A., Ma, S. et al. Un atlas moléculaire révèle le mécanisme de rotation en trois sections de la soie de dragline d'araignée. Nat Commun 14, 837 (2023). https://doi.org/10.1038/s41467-023-36545-6

Télécharger la citation

Reçu : 19 juillet 2022

Accepté : 07 février 2023

Publié: 15 février 2023

DOI : https://doi.org/10.1038/s41467-023-36545-6

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.