Chapitre I : Structure fine de la chromatine et régulation de l’expression génique. I.
Généralités
Dans le noyau, le DNA n’est jamais nu, mais toujours associé à des protéines et même à des ARN. L’ensemble constituant ce que l’on appelle la chromatine. Le diamètre du noyau ne dépassant pas quelques microns, un énorme taux de compaction est nécessaire pour que la molécule de DNA puisse y tenir. Mais cette compaction ne se fait pas au hasard, puisque le DNA doit rester accessible aux protéines qui régulent son expression et sa duplication. Quand un noyau est mis en solution de faible force ionique, il libère de la chromatine sous une forme d’une une fibre de 100 nm de diamètre. Dans d’autres conditions expérimentales cette fibre possède un diamètre de 30nm ou même de 10nm. Ces valeurs sont très supérieures au diamètre de la double hélice de DNA qui est de 20A°. Le DNA dans la chromatine n’est donc pas libre mais intégré dans une structure.
Fibre chromatinienne de 100 nm
30nm
10nm
4
II. Structure de base de la fibre chromatinienne. La chromatine est constituée essentiellement de l'ADN du génome complexé avec de petites protéines basiques (= chargées positivement), les histones, dans un rapport 1:1 en masse. C'est l'interaction du génome avec les histones qui permet de le condenser de façon à la fois extrême, ordonnée et souple, dans le noyau. La chromatine présente un aspect fibrillaire dense, avec des zones du noyau où elle est encore plus dense.
Quand la chromatine est digérée par la nucléase de microcoque , L’ADN est coupé en des fragments dont la taille est un multiple d’une unité de longueur, aprés fractionnement par électrophorèse sur gel d’agarose, on obtient une échelle s’étendant sur une dizaine de bandes successives est de l’ordre de 200 pb.
Si en digère du l’ADN du foie de rat par la nuclèase de microcoque en 30s de digestion en obtient des fragments de 200 pb. Une digestion plus prolongée aboutie à une bande de 146 pb. Conclusion : L’ADN du nucléosome = ADN coeur fixe de 146pb
Les nucléosomes La brique de base de la chromatine, l'unité structurale responsable de sa condensation, c'est le nucléosome. La quasi-totalité du génome est constituée en nucléosomes. Quatre espèces d'histones - H3, H4, H2A, H2B - forment ensemble un complexe octamérique, en forme de cylindre aplati; cet octamère comporte un cœur tétramérique fait de deux molécules d'histone H3 et deux molécules d'H4 et, de part et d'autre de ce tétramère central, deux hétérodimères [H2AH2B].
5
portrait schématique d un nucléosome (a), (b), et (c) : Structure simplifiée du nucléosome, d'après les données cristallographiques. Ces données ne renseignent pas sur la position des domaines N-terminaux flexibles des histones, c'est pourquoi e\.Jls leurs domaines globulaires centraux sont représentés. (a) : L'octamère d'histones se présente comme un cylindre de 70 A de diamètre et de 55 A de haut, avec un axe de symétrie passant au centre des deux moléc!Jles d'histone H3, perpendiculairement au plan du dessin. (b) : Le nucléosome, vu sous le même angle qu'en (a), l'ADN faisant 1.8 tour autour de l'octamère, en une superhélice gauche dont le pas est de 28 A. (c) : Le même qu'en (b), tourné de 90° autour de l'axe vertical. (d) et (e) : Spéculations sur la position des domaines N-terminaux des histones dans le nucléosome, d'après les données récentes de pontage chimique à l'ADN. Les vues sont les mêmes qu'en (b) et (c), respectivement, sauf que l'ADN est prolongé pour faire deux tours complets autour du nucléosome. Les domaines N-terminaux des histones sont représentés par des "vermicelles" figurant leur flexibilité.
le nucléosome résulte de l'enroulement de la double hélice d'ADN autour de l'octamère d'histones. L'ADN fait presque deux tours autour de cette structure, à raison de 80 pb par tour, en contactant les histones principalement par le petit sillon. Le sens d'entoulement est à l'inverse de celui de la double hélice elle-même - règle générale dans ce genre de complexe (cf. p. 82). Deux nucléosomes consécutifs sont séparés par une région d'ADN dite linker, dont la longueur moyenne, de 0 à 80 pb, paraît caractéristique de chaque type cellulaire (figure )
6
Enchaînement des nucléosomes en 'collier de perles' ln vitro, les nucléosomes ne se présentent ainsi qu'à basse force ionique, soit 'en collier de perles' comme ici, soit 'en zigzag' comme dans les figures 42a et 44b. Sinon, et de même in vivo, ils sont plutôt en contact étroit les uns avec les autres; ce qui ne change pas la périodicité de l'enchaînement nucléosomal, qui est en moyenne de 200 pb : 2 tours complets autour de chaque octamère = 166 pb, plus 0 à 80 pb d'ADN linker (la valeur moyenne est fonction du type cellulaire). Ici, pour la clarté du dessin, un seul tour a été représenté par octamère.
Domaines fonctionnels des histones Le degré de conservation des différentes histones au cours de l'évolution reflète la structure même de la chromatine. Les histones de l'octamère sont très conservées parmi tous les eucaryotes, spécialement les deux histones du cœur de l'octamère, H3 et H4 : l'histone H4 du pois et celle de la vache ne diffèrent qu'en deux aminoacides. Les histones H2A et H2B sont un peu plus variables, et enfin l'histone Hl l'est beaucoup plus (elle n'existe pas chez un eucaryote unicellulaire comme la levure). Les histones présentent toutes un domaine globulaire central hydrophobe et un domaine N-terminal chargé positivement, hydrophile et peu structuré, flexible. L’histone Hl comporte en plus un domaine C-terminal également hydrophile et flexible.
C'est l'assemblage des domaines globulaires hydrophobes des quatre petites histones qui constitue le corps de l'octamère, autour duquel l'ADN s'enroule. Quant à l'histone Hl, son domaine globulaire central hydrophobe interagit avec ceux des quatre autres histones, scellant ainsi le nucléosome, et son domaine C-terminal, par lequel il relie les nucléosomes entre eux, est le déterminant majeur de la condensation des nucléosomes en fibres d'ordre supérieur.
7
Chaque histone peut subir toute une série de modifications post-traductionnelles: méthylation, ADP- ribosylation, acétylation, phosphorylation, ubiquitination. Toutes ces modifications concernent les domaines flexibles N – et C-terminaux (figure45). Elles doivent donc influencer fortement les propriétés dynamiques des nucléosomes, et leurs modes d'empilement, mais on ne sait pas uès [ et encore bien dans quel sens. On commence seulement à le cerner dans le cas de l'acétylation de H3 et H4 (p. 119), associée à la transcription, et de la phosphorylation de H3 et de HI, associée à la condensation des chromosomes à la mitose (p. 438).
Au-delà du nucléosome : l'histone Hl et les fibres chromatiniennes Une cinquième histone, l'histone Hl, vient sceller et relier les nucléosomes. Elle est deux fois plus grande que les autres histones (24 kD au lieu de 10-12), surtout du fait d'un bras Cterminal nettement plus long (figure ). Hl interagit avec 10 pb à l'entrée et à la sortie du nucléosome, de sorte que l'ADN fait désormais deux tours complets autour de l'octamère, scellés à leur base par Hl. Ensuite, les molécules d'H 1 associées à chaque nucléosome peuvent interagir entre elles, sans doute par leur bras C-terminal flexible, reliant ainsi les nucléosomes. Du fait de ces interactions Hl-Hl, la fixation de Hl à l'ADN est fortement coopérative.
Interaction de l'histone H1 avec les nucléosomes Les domaines flexibles N- et C-terminaux de H1 sont ici resp. à gauche et à droite de son domaine globulaire central. H1 scelle deux tours complets d'ADN autour de l'octamère d'histones, et relie les nucléosomes entre eux, par une interaction H1-H1, qui met en jeu surtout son domaine flexible C-terminal. La condensation des nucléosomes qui en résulte semble bien changer le positionnement de H1 sur l'ADN.
8
Organisation des nucléosomes sur la fibre chromatinienne. Une séquence particulière d’ADN est-elle toujours proche d’une certaine position par rapport à la topographie du nucléosome? Ou bien les nucléosomes sont-ils disposés au hasard sur l’ADN, si bien qu’une séquence particulière puisse apparaître localisée, par exemple, dans la région coeur d’une copie du génome et dans la région de liaison sur une autre copie du génome. Supposant que la séquence d’ADN soit organisée dans les nucléosomes selon une seule configuration particulière de telle sorte que chaque site sur l’ADN soit toujours localisé sur une position déterminée du nucléosome. Ce type d’organisation est appelé nucléosome en phase. Si les nucléosomes sont organisés au hasard, leur positions changera d’un ADN à un autre
Les produits d’une double digestion par la nucléase et par l’enzyme de restriction sont séparés par électrophorèse sur gel. Une sonde qui représente la séquence immédiatement adjacente au site de restriction est utilisée pour identifier le fragment correspondant dans la double digestion. L’identification d’une seule bande étroite démontre que la position du site de restriction est précisément déterminée par rapport à l’extrémité de l’ADN nucléosomal. Donc le nucléosome possède bien une séquence particulière d’ADN. Dans le cas ou le nucléosome n’est pas localisé en une position unique, les fragments de
liaison sont maintenant constitués de différentes séquences d’ADN dans chaque copie du génome. Ainsi, à chaque fois la position du site de restriction est différente; en fait, toutes les localisations sont possibles par rapport aux extrémités de l’ADN nucléosomal monomérique. La double digestion engendrera donc une large traînée allant des plus petits fragments détectables (20 bases) jusqu’à la longueur du monomère d’ADN.
9
Facteur de compaction du génome et niveaux de condensation Au-delà du nucléosome, les niveaux supérieurs de condensation de la chromatine résultent de la proportion des nucléosomes à s'empiler régulièrement les uns sur les autres, dans plusieurs directions, et au rôle structurant, reliant, de l'histone Hl dans ces empilements. Le premier niveau d'empilement, en colonne, conduit à ce qu'on appelle la fibre de 11 nm de diamètre (largeur d'un nucléosome). La microscopie électronique révèle des structures fibreuses, dont la fibre de 30 nm, fibre torsadée large de six nucléosomes, observée répétitivement par microscopie électronique et étudiée in vitro après extraction de la chromatine, qui constituerait le premier niveau de condensation au-delà de l'empilement simple. Dans la fibre de 30 nm, le facteur de compaction de l'ADN est de 40 fois. Cela signifie que la distance physique entre deux points de la molécule séparés par au moins un tour de fibre, soit 1200 pb (= 6 nucléosomes de 200 pb), est en moyenne 40 fois plus petite que la longueur d'ADN qui les sépare. On estime que le facteur de compaction global de la chromatine dans le noyau est de l'ordre de mille fois et qu'il s'accroît encore de dix fois lorsque s'individualisent les chromosomes à la mitose. Au-delà des nucléosomes, l'organisation compacte de la chromatine doit provenir pour une bonne part de son interaction intime avec le réseau de protéines non histones qui constitue ce qu'on appelle la matrice nucléaire.
Deux modèles pour la structure de la fibre de 30 nm (a) Le solénoïde: c'est le plus connu; de bas en haut, le dessin montre comment se constitue la structure solénoïdale in vitro, à mesure qu'on augmente la force ionique, jusqu'à comporter 6 nucléosomes le tour . (b) Le ruban hélicoïdal: les nucléosomes forment un collier de perles 'en zigzag' qui, lorsqu'on augmente la force ionique, s'enroule en une hélice double
Le squelette chromosomal Au début de la mitose, l'enveloppe nucléaire disparaît ; l'espace nucléaire est aboli ; la chromatine se condense progressivement en chromosome et cesse d’être transcrite. Si on isole un chromosome mitotique et qu'on en retire les histones et d'autres protéines à haute force ionique, on se retrouve avec un squelette chromosomal qui forme l'axe au chromosome, et de longues boucles d'ADN qui en partent radicalement tout à fait analogues aux boucles qu on voyait dans le noyau inter-phasique. Mais la composition biochimique du squelette chromosome
10
est beaucoup plus simple que celle de la matrice nucléaire; nombre de protéines de la matrice ont dû être dispersées dans le cytoplasme.
III. Nature de la chromatine active On ne peut pas voir au microscope la transcription des gènes in situ, dans le noyau, et suivre les changements de structure de la chromatine qui y seraient associés. La chromatine est trop dense. Sauf dans des situations exceptionnelles, qui ont permis une première approche de la question, dans les années 50. Dans la diversité des organismes étudiés, les biologistes ont trouvé deux situations spéciales, où il était possible de visualiser l'activité transcriptionnelle de la chromatine, deux situations où les chromosomes se présentaient sous une forme à la fois individualisée, bien visible, et peu condensée; hors mitose, donc transcriptionnellement actifs. Il s'agit des chromosomes en écouvillon, étudiés surtout chez les amphibiens, et des chromosomes polytènes des insectes. Ces deux systèmes sont à l'origine de la conception actuellement prédominante que la transcription des gènes implique la décondensation de la chromatine. Les chromosomes en écouvillon. Ces chromosomes apparaissent au stade diplotène de la méiose dans les ovocytes de presque tous les animaux (chez certaines espèces, comme les amphibiens, ce stade peut durer plusieurs mois). Ils se présentent sous une forme beaucoup plus étendue que les chromosomes mitotiques (10 à 100 fois), comme des chapelets de paquets de chromatine, appelés chromomères. Dès 1892, Rückert décrit qu'il s'agissait bien de chromosomes, présentant sur toute leur longueur de grandes boucles sortant radialement du chromosome entre deux chromomères adjacents. C'est lui qui compara leur aspect à celui d'un écouvillon (lampbrush). Aujourd'hui encore, les chromosomes en écouvillon demeurent la preuve la plus convaincante que le génome est organisé en boucles dans le noyau, car c'est la seule situation ou les boucles sont visualisables individuellement in vivo (figure). Les boucles visibles représentent des régions où la chromatine est beaucoup moins condensée que dans les chromo mères adjacents. Elles font de 3 à 300 kilobases et on en compte environ dix mille chez un amphibien. On a montré dès 1950 que ces boucles décondensées correspondaient aux régions transcrites des chromosomes.
11
Chromosome en écouvillon d'ovocyte de triton Vue au microscope optique, en contraste de phase. Au stade diplotène de la méiose, chaque chromosome est un bivalent, fait de deux chromatides-sœurs ; les deux lignes noires qui s'entrecroisent, dessinant les axes des deux chromatides, sont constituées par les chromomères, paquets de chromatine condensée; entre eux, se déploient des centaines de boucles (la barre = 10 flm).
Le nombre, la taille et la position des boucles évoluent au cours de la maturation de l'ovocyte comme son activité transcriptionnelle. Chaque boucle apparaît comme une unité fixe, ouverte et transcrite - décondensée - ou fermée et silencieuse (sous forme de chromomère), qui peut contenir un ou plusieurs gènes, de polarités identiques ou opposées. On peut voir tout autour de la boucle des complexes de transcription, avec l'ARN polymérase et l'ARN naissant qui lui est attaché (voir figure). Celui-ci apparaît comme un collier de perles; ces perles qui condensent l'ARN naissant sont les particules ribonucléoprotéiques (RNP) qui vont prendre en charge l'ARN jusqu'à la fin de sa maturation. Les chromosomes polytènes de la Drosophile. On trouve ces chromosomes dans les cellules géantes de certains tissus des larves d'insectes, en interphase. Il s'agit de chromosomes géants, issus de réplications successives où les chromatides-filles ne se séparent pas, et cela répétitivement, de sorte que le noyau peut contenir jusqu'à 500 fois le contenu d'ADN normal. Chaque chromosome polytène est donc fait de la juxtaposition longitudinale des chromatides non détachées. L'intérêt pour l'observation est là encore la faible condensation de ce matériel, ainsi que son amplification. Chaque chromosome se présente comme une succession de chromomères, alternés avec des zones plus claires, qu'on appelle bandes. Chacune des 5 000 bandes du génome contient un ou plusieurs gènes. À certains endroits des chromosomes, particulièrement dans les glandes salivaires où ils sont bien visibles, se voyaient des sortes de larges expansions locales diffuses baptisées puffs.
12
Chaque puff représente l'extrusion radiale, la décondensation d'une boucle d'ADN, comme dans les chromosomes en écouvillon, sauf qu'il s'agit d’un paquet de centaines d'exemplaires de la même boucle. L'idée que les puffs représentent les gènes actifs est due au faite que beaucoup de puffs étaient tissu-spécifiques, et que leur distribution changeait au cours du développement. De ces deux systèmes expérimentaux provient initialement l'idée que pour être transcrit, le matériel génétique doit être spécifiquement décondensé de son état ordinairement empaqueté très serré. Domaine de sensibilité accrue à la DNase 1. L'ARN polymérase de la bactérie E. Coli, mise en présence de chromatine, était capable de transcrire les gènes de globines, mais seulement s'il s'agissait de chromatine extraite d'érythrocytes, et pas d'un autre tissu n'exprimant pas les gènes de globines. Il semblait peu probable que l'enzyme bactérienne puisse reconnaître dans la chromatine de l'érythrocyte les signaux spécifiques déterminant l'expression des globines dans ce type cellulaire. La transcription tissu-spécifique obtenue avec l'enzyme bactérienne devait plutôt refléter une accessibilité particulière des gènes actifs dans la chromatine. L’activité génique semble être associée à la décondensation de la chromatine. Cette accessibilité accrue ne reflétait pas l'absence d'histones : grâce à une nucléase qui coupe préférentiellement entre les nucléosomes, dans l'ADN linker (la nucléase de Microcoque), on montrait que les gènes actifs conservent une structure nucléosomale. C'est l'usage d'une autre nucléase, la DNase 1, qui allait permettre de distinguer la chromatine active. En lysant doucement les cellules, on peut isoler leurs noyaux intacts, avec parfois un peu de cytoplasme autour. On peut alors incuber ces noyaux en présence de DNase1 qui, entrant dans les noyaux, va progressivement hydrolyser le génome. On compare alors les vitesses auxquelles différentes régions du génome sont digérées en particulier selon qu'elles sont ou non transcriptionnellement actives. Cette sensibilité est prise comme mesure de l'accessibilité de l'ADN à l'enzyme in situ, dans le noyau.
13
Une règle s’est rapidement dégagée : les gènes exprimés dans un tissu donné sont plus sensibles à l'action de la DNasel (de 2 à 10 fois, selon le protocole utilisé) que les gènes inactifs dans ce même tissu, ou encore que les mêmes gènes dans un autre tissu où ils ne sont pas exprimés. La région d'ADN concernée par cette sensibilité accrue ne se réduit pas au gène luimême mais déborde souvent largement de part et d'autre, définissant ainsi un domaine DNase1 qui inclut le gène. De plus, lorsque plusieurs gènes apparentés sont organisés en groupe (comme les gènes de globine, ou le couple albumine l’α-fœtoprotéine ou le domaine du gène de l'ovalbumine chez la poule, qui s'étend sur 100 kb et contient trois gènes), l'ensemble du groupe est contenu dans un seul domaine de sensibilité. Dès qu'un des gènes du groupe est exprimé, l'ensemble du domaine est globalement sensible à la DNaseI.
Domaines de sensibilité accrue à la DNase1, autour de trois gènes exprimés dans l'oviducte de poule. Chaque domaine génique est représenté en abscisse, les gènes sont figurés par des boîtes noires (sans distinguer exons et introns) et leur sens par une flèche. Au voisinage du gène de l’ovalbumine (OV) se trouvent deux autres gènes X et Y, aussi exprimés seulement dans l'oviducte. De part et d'autre du gène du lysozyme est indiquée la position des deux seules régions d'attachement à la matrice nucléaire (SAR) trouvées sur 60 kb autour du gène. Ce locus et celui du gène de la GAPDH sont ici représentés à la même échelle. Alors que le lysozyme et l'ovabumine sont d'expression hautement tissu spécifique, la GAPDH (glycéraldéhyde 3 phosphate déshydrogénase) est exprimée dans toutes les cellules. En ordonnée est indiquée la sensibilité à la DNase1 au long de chaque locus dans les noyaux d'oviducte.
14
Les sites hypersensibles. Les gènes activement transcrits présentent, en plus de leurs sensibilité aux nucléases, des sites hypersensibles dans et autour de leur unité de transcription. Une telle hypersensibilité n’apparaît pas dans l’ADN nu correspondant. Généralement, les sites d’hypersensibilité sont immédiatement en amont du site d’initiation de transcription, mais aussi localisés dans ou à l’extrémité 3’ de l’unité de transcription ; il faut rappeler que sites peuvent contenir des séquences d’amplification ou de terminaison. De plus, certains gènes possèdent des sites d’hypersensibilité à l’ADNase I à des grandes distances en amont du site de coiffage (plusieurs kpb en amont du gène de la β-globine humaine). Dans la plupart des cas, cette hypersensibilité est restreinte aux tissus ou cellules dans lesquels les gènes sont exprimés ou programmés pour l’être. Le site d’hypersensibilité en 5’ du gène de la préproinsuline, par exemple, est présent dans les îlots β des cellules pancréatiques mais non dans les cellules hépatiques. Signification de la sensibilité générale à la DNaseI des gènes exprimés L’interprétation dominante de ce phénomène est celle dont a vu les prémices avec les chromosomes polytènes ou en écouvillon: l'accessibilité accrue à la DNasel mesurerait la décondensation partielle d'une boucle de chromatine, plus précisément la suppression partielle des niveaux de condensation HI-dépendants, au-delà du nucléosome, comme la fibre de 30 nm. Avec l'idée que l'accessibilité accrue de l'ADN facilite son interaction avec l'ARN polymérase ou avec les protéines susceptible d'activer sa transcription. Réciproquement, on imagine que la traversée des nucléosomes par le complexe de transcription, accompagné du déroulement nécessaire de la double hélice, doit désorganiser leurs empilements. Ce n'est sans doute pas si simple car la sensibilité accrue à la DNasel des gènes exprimés demeure dans les chromosomes mitotiques, très condensés et ranscriptionnellement inertes. Cela peut signifier que cette accessibilité accrue signale aussi un changement de composition biochimique de la chromatine qui perdure dans les chromosomes mitotiques. On a proposé qu'il s'agisse de la présence des protéines HMG 14 et 17. En outre et puisque la DNasel est issue de l'extérieur du noyau, la sensibilité accrue des gènes exprimés pourrait fort bien signaler leur communication préférentielle avec le cytoplasme, donc avec les pores nucléaires, seules voies de passage des macromolécules entre cytoplasme et noyau (ce qui sous-entend que l'architecture du génome dans le noyau n'est pas aléatoire). Ces trois types de suggestions sont sans doute justes: la sensibilité à la DNase 1 signale sans doute un remaniement global de la chromatine qui inclut une différenciation biochimique de la chromatine, sa décondensation partielle, et l'établissement d'une communication préférentielle (donc d'une voie de convoi des transcrits) avec l'extérieur du noyau. Domaines DNase1-sensibles et sites d'attachement du génome à la matrice nucléaire L’interprétation des domaines de sensibilité accrue à la DNase 1 comme unités de décondensation autonomes amène aussitôt à les rapprocher de ces unités topologiques autonomes de taille analogue que sont les boucles chromosomiques visualisées par microscopie. La sensibilité accrue liée à l'activité génique serait due à la décondensation partielle de la boucle ( par exemple la désorganisation de la fibre de 30 nm, HI-dépendante, se propageant jusqu'aux extrémités de la boucle). Si les domaines DNasel-sensibles et les boucles sont une seule et même
15
entité, les extrémités des domaines DNase I-sensibles devraient coïncider avec les points d'attachement des boucles à la matrice nucléaire en interphase, donc avec des SAR. Les domaines DNase1-sensibles sont-ils bordés par des SAR ? C’est du moins le cas du gène du lysozyme, et celui de l'apolipoprotéine B. Les deux seules SAR trouvées dans un voisinage de 60 kb correspondent aux bornes du domaine de sensibilité accrue (22 kb pour le lysozyme, 48 kb pour le gène Apo-B) qui se révèle autour du gène lorsque celui-ci est exprimé. Ailleurs, on peut noter que chez la Drosophile, où le plus grand nombre de SAR a été caractérisé, celles-ci sont rarement trouvées dans les gènes, mais bien de part et d'autre des gènes ou groupes de gènes, distribution donc compatible avec l'idée qu'elles puissent signaler les bornes des domaines de décondensation de ces différents gènes. Néanmoins, chez les mammifères, toutes les SAR ne représentent pas des limites de domaines DNasel-sensibles, car on en a trouvé plusieurs à l'intérieur de gènes ou groupes de gènes: dans l'intron juste en amont des régions constantes des gènes d'immunoglobulines, ainsi que dans tout le domaine β-globine humain. Les SAR (scaffold attachement regions) On sait depuis peu que l'ancrage des boucles chromosomiques, aussi bien à la matrice nucléaire qu'au squelette des chromosomes mitotiques, est le fait de régions spécifiques du génome, baptisées SAR (scaffold attachment regions) ou MAR (matrix attachment regions). L'emplacement des SAR a été cartographié au voisinage d'une vingtaine de gènes eucaryotes. Il s'agit de régions de 500 à 2 000 pb, très riches en A:T (70 %). Parmi les loci étudiés jusqu'ici, la distance entre deux SAR successives varie entre 4 et plus de 140 kb. Chez la Drosophile, elles sont presque toujours trouvées entre les gènes ; chez les mammifères, on les trouve parfois dans les gènes (dans des introns). Leur ancrage à la matrice paraît surtout déterminé par les séquences Tn. Des homopolymères synthétiques poly(dT) se fixent très bien à la matrice in vitro. Dans les SAR naturelles, il s'agit toujours de plusieurs séries de T assez courtes, séparées par d'autres nucléotides.
Gènes et régions d'attachement potentiel à la matrice nucléaire dans un segment de 320 kb du génome de la Drosophile Les divers loci identifiés par la génétique sont indiqués par des traits et les régions d'attachement à la matrice nucléaire (SAR) par des barres noires pourvues d'un crochet. Est aussi indiquée la taille des boucles potentielles que définissent ces points d'ancrage successifs à la matrice.
16
Le réseau matriciel Quelles protéines la matrice interagit avec les SAR ? La composition de la matrice nucléaire est complexe. Dans le squelette chromosomal, plus simple, on trouve deux protéines majeures : SC1 ( 170 kD) à raison de trois molécules par boucle en moyenne et SC2 (I35 kD). Or SC1 n'est autre que la topoisomérase II. Enzyme qui démêle l'ADN, particulièrement les chromatides sœurs de la réplication. Par immunofluorescence elle apparaît bien à la base des boucles dans le squelette chromosomal. Une autre propriété encore plus intéressante commune au moins à la topo II, RAP1 et ARBP, est leur capacité in vitro de se fixer coopérativement à deux SAR séparées par plusieurs milliers de paires de bases, donc en formant de grandes boucles d'ADN. Ces diverses protéines pourraient ainsi à des degrés divers former un réseau, qui à la fois définit et scelle les boucles, et les réunit les unes aux autres, participant ainsi à la condensation ordonnée du génome. Remaniements de la chromatine associés au processus de transcrpition Un certain nombre de traits variables de la chromatine ont été plus ou moins clairement attribués, de façon globale, à la chromatine active. Les plus convaincants sont la tétracétylation des histones du cœur de l'octamère [H3-H4], la mobilité des histones H2A et H2B , la teneur accrue en protéines HMG 14 et 17 ainsi qu'en topoisomérase l . D’autres procédures de fractionnement de la chromatine (par exemple selon sa sensibilité différentielle à la nucléase de Microcoque) montrent que la chromatine effectivement transcrite comporte des perturbations qui la distinguent des zones voisines, DNasel-sensibles mais non transcrites. Perturbations très probablement liées aux passages répétés des complexes de transcription Association des protéines HMG 14 et 17 aux régions transcrites Les petites protéines de la famille HMG sont des protéines abondantes du noyau (106 molécules de chacune par noyau, soit le dixième de l'histone H 1), de tailles analogues aux histones: HMG 1 et 2 (25kD), HMG 14 et 17 (10 kD). Ces protéines ont une structure bipartite caractéristique: une moitié N-terminale basique et une moitié C-terminale très acide (41 résidus acides consécutifs chez HMG 1). Par leur domaine basique, elles interagissent avec le petit sillon de l'ADN, sans spécificité de séquence, avec une préférence toutefois pour les régions riches en A/T, et pour l'ADN simple brin. Quant au domaine acide, dans le cas des HMG 14 et 17 on a montré son interaction avec les histones, ce qui n'est guère surprenant vu leur caractère basique. On trouve une structure bipartite analogue chez les protéines chaperons qui médiatisent l'assemblage correct des histones et de l'ADN en nucléosomes (ainsi que leur désassemblage), au détriment d'interactions ioniques non spécifiques entre ADN et histones. HMG 14 et 17 sont trouvées préférentiellement associées à la chromatine active. On peu même leur attribué la responsabilité de la sensibilité accrue à la DNasel, car si après avoir isolé les noyaux, on les expose à une force ionique qui décroche les HMG 14/17 de la chromatine mais pas les histones, on supprime du même coup la sensibilité accrue des gènes actifs. L'immunofractionnement d'oligonucléosomes , a permis de situer les zones riches en HMG14 et 17 pour un gène donné ; il est ainsi apparu que ces protéines sont concentrées non pas tout au long du domaine DNasel-sensible, mais seulement dans la portion effectivement transcrite, suggérant que leur présence pourrait être une conséquence, une trace de la transcription.
17
Acétylation des histones I’acétylation des résidus lysine, particulièrement la tétracétylation du domaine aminoterminal des histones du cœur H3 et H4 a été répétitivement corrélée avec la chromatine active. I’acétylation des histones présente un turo-over rapide (un acétyl dure environ 10 mn), permettant d'envisager qu'elle puisse suivre étroitement les changements d'activité transcriptionnelle des gènes. Récemment, c'est ce qui a été effectivement observé pour des gènes spécifiques rapidement induits pour un court laps de temps en réponse aux facteurs de croissance: les gènes c-fos et c-myc. L’acétylation, qui neutralise les charges positives des résidus lysine, relâche probablement les contraintes appliquées par les domaines N-terminaux de H3 et H4 sur l'ADN nucléosomal. Elle réduit la variation du nombre d'enlacements associée à l'enroulement nucléosomal, qui passe de 1 à 0.8 par nucléosome. Elle semble aussi réduire la capacité de l'histone Hl à provoquer la condensation des nucléosomes. Une fois la transcription amorcée, l'acétylation pourrait faciliter le déplacement transitoire des nucléosomes au passage de la polymérase. Méthylation de l’ADN, modification épigénétique. C’est la seule modification enzymatique stable de l'ADN que l'on connaisse chez les vertébrés. Elle a pratiquement toujours lieu au sein du dinucléotide CG, noté CpG (où p souligne le squelette phosphate/pentose qui relie les bases, permet d'éviter la confusion avec les appariements CG). Près de 70 % des CpG du génome sont méthylés. Corrélation : expression des gènes et degré de méthylation En comparant le profil de méthylation des gènes selon leur état d'activité, il est vite apparu qu'en gros : • les gènes actifs étaient nettement moins méthylés que les gènes inactifs - en particulier en comparant l'état de méthylation d'un gène TS dans le tissu expresseur et dans les autres. • la région promotrice et son voisinage étaient toujours non méthylés dans les tissus où le gène était actif ; quant au reste du gène, l'activité transcriptionnelle allait souvent de pair avec une sous-méthylation, mais pas toujours. La déméthylation du promoteur était-elle nécessaire à l'activation tissu-spécifique des gènes? Dans les rares cas où on a pu suivre la cinétique d'activation, apparemment non La déméthylation du promoteur n’est pas nécessaire à l'activation génique : l'activation précédait la déméthylation. Réciproquement, dans les quelques cas où l'on pouvait suivre la répression d'un gène αfoetoprotéine après la naissance, rétrovirus intégrés dans l'embryon avant implantation ou dans des cellules de carcinome embryonnaire, gènes du chromosome X inactivé , extinction des gènes TS dans les hybrides somatiques - il y avait bien méthylation de novo mais elle survenait clairement après la mise au silence du gène, progressivement et sur plusieurs générations cellulaires. la méthylation, est partie prenante non pas des événements d'activation/extinction de gènes, mais du maintien de ces décisions, de leur perpétuation dans la descendance
18
L'inactivation du chromosome X chez les mammifères L'inactivation du chromosome X survient chez tous les mammifères et entraîne l'inactivation sélective des allèles portés par l'un des deux chromosomes X chez les femelles. Elle permet une compensation de dosage. Ce mécanisme compense en effet les différences, selon le sexe, du dosage des gènes autosomiques et des gènes liés au chromosome X (deux pour un chez les mâles: un pour un chez les femelles) : les mâles, n'ayant qu'un chromosome X, sont constitutionnellement hémizygotes pour les gènes du chromosome X, mais les femelles deviennent fonctionnellement hémizygotes par inactivation des allèles d'un chromosome X parental. L'inactivation du chromosome X se produit, chez les femelles mammifères, à un stade précoce du développement, elle est initiée au stade tardif de blastula. L'un des deux chromosomes X parentaux est inactivé au hasard dans chaque cellule qui donnera naissance à un fœtus féminin. Plus tard, le chromosome inactif le demeure habituellement dans toutes les cellules qui en dérivent, le profil d'inactivation du chromosome X étant hérité de façon clonale. Les femelles des mammifères sont donc des mosaïques, constituées d'un mélange de lignées cellulaires dans lesquelles le X paternel est inactivé et de lignées dans lesquelles le X maternel est inactivé. Chaque cellule femelle contient deux chromosomes X, l’un d’origine paternelle (Xp) et l’autre d’origine maternelle (Xm). L’inactivation a lieu en trois étapes : Au début de l’embryogenèse, l’un des deux chromosomes X est initialement choisi au hasard pour l’inactivation. C’est le gène XIST est exclusivement exprimé à partir du chromosome X inactivé - c'est le seul cas où l'allèle porté par le chromosome X inactif est celui exprimé dans les cellules femelles. le gène XIST code un ARN fonctionnel. On pense qu'il serait nécessaire à l'initiation de l'inactivation de l'X mais pas à son maintien. Ensuite, l’inactivation progresse tout le long du chromosome. Finalement, l’état modifié est stabilisé de façon à ce que le chromosome sélectionné reste inactif au cours des générations cellulaire ultérieures. corrélations entre la méthylation et l’inactivation du chromosome X De frappantes corrélations lient la méthylation au processus de l’inactivation du chromosome X chez les femelles des mammifères. le chromosome X inactif est largement hyperméthylé par rapport au chromosome X actif, d’ou l’idée qu’un degré élevé de méthylation est l’une des modifications de l’ADN qui peuvent entraîner cette inactivation.
Cependant il a été montré qu’on peut réactiver les gènes d’un chromosome X inactif en empêchant la méthylation de l’ADN.
La méthylation ne devrai donc pas jouer aucun rôle dans le choix du chromosome pour l’inactivation ou dans la propagation de l’inactivation. Elle serait donc plutôt un mécanisme secondaire permettant le maintien de l’état inactif.
19