Características generales
La Tabla 1 compara la características de Oltmannsiellopsis cpDNA con las de los cuatro cpDNAs de clorofita completamente secuenciados hasta ahora, p.ej. los genomas de Nephroselmis, Chlorella, Pseudendoclonium y Chlamydomonas . Con un 59,5%, el contenido total de A+T del ADNc de Oltmannsiellopsis es similar al del ADNc de Nephroselmis, pero es significativamente menor que el de los tres genomas UTC secuenciados previamente. El genoma de Oltmannsiellopsis se mapea como una molécula circular de 151.933 bp (Figura 1) y contiene 105 genes. Dos copias de una secuencia IR de 18.510 pb, cada una codificando diez genes, están separadas entre sí por regiones de copia única desiguales, designadas SC1 y SC2. Al igual que otros cpDNAs UTC, el genoma de Oltmannsiellopsis está menos densamente repleto de secuencias codificantes que los cpDNAs de Mesostigma y Nephroselmis; con un 59,2%, su densidad de secuencias codificantes es similar a la de los cpDNAs de Clorella y Pseudendoclonio. Los espaciadores intergénicos en el ADNcp de Oltmannsiellopsis presentan SDRs y tienen un tamaño promedio de 512 pb, un valor comparable al observado para el ADNcp de Pseudendoclonio (600 pb). Un total de cinco intrones, todos los cuales pertenecen a la familia del grupo I, fueron identificados en Oltmannsiellopsis cpDNA.
Contenido de genes e intrones
El contenido de genes de Oltmannsiellopsis cpDNA es intermedio entre los de Chlorella y Chlamydomonas cpDNAs (Tabla 1). Aunque Oltmannsiellopsis y Pseudendoclonium cpDNAs codifican el mismo número de genes, estos genomas difieren ligeramente en su repertorio genético (Tabla 2). El ADNcp de Oltmannsiellopsis ha conservado los tres genes chl que faltan en el ADNcp de Pseudendoclonio, pero ha perdido ycf62, trnL(caa) y trnR (ccg). En relación con Chlorella cpDNA, a los genomas de Oltmannsiellopsis, Pseudendoclonium y Chlamydomonas les falta un conjunto de cinco genes, es decir, cisA, quiste y tres genes de ARNt (trnL(gag), trnS(gga) y trnT(ggu)) (Tabla 2). La ausencia de tres genes (ycf62, trnL(caa) y trnR(ccg)) es compartida únicamente por Oltmannsiellopsis y Chlamydomonas cpDNAs, mientras que ninguna pérdida específica de genes es compartida por Pseudendoclonio y Chlamydomonas cpDNAs. Tanto Oltmannsiellopsis como Pseudendoclonium cpDNAs han retenido el gen trnR(ucc), que está ausente de todos los demás cpDNAs clorofíticos completamente secuenciados.
Al igual que en los genomas de cloroplastos UTC investigados anteriormente, las regiones codificantes de varios genes en el ADNCPC de Oltmannsiellopsis se expanden en relación con sus contrapartes de Mesostigma (Tabla 3). Sin embargo, la mayoría de las expansiones génicas en Oltmannsiellopsis son menos extensas que las del Pseudendoclonio; solo el cemA muestra una secuencia de codificación más larga que su homólogo de Pseudendoclonio.
Nuestro hallazgo de cinco intrones del grupo I en el ADNcp de Oltmannsiellopsis contrasta marcadamente con los 27 intrones del grupo I encontrados en el ADNcp de Pseudendoclonio (Tabla 1). La menor abundancia de intrones en el ADNcp de Oltmannsiellopsis explica principalmente el tamaño más pequeño de este genoma en relación con el ADNcp de Pseudendoclonio. Los intrones Oltmannsiellopsis interrumpen tres genes (petB, psbA y rrl) que se encuentran en la IR (Tabla 4). Los genes petB y psbA contienen cada uno un intrón, mientras que tres intrones están presentes en el rrl. Los cinco intrones, con la excepción del intrón petB, son homólogos posicional y estructuralmente a los intrones notificados previamente en ADNcp de plantas verdes (Tabla 5). Mientras que los homólogos del intrón psbA de Oltmannsiellopsis están presentes en Pseudendoclonium y Chlamydomonas, los homólogos de los tres intrones rrl se encuentran en una mayor diversidad de plantas verdes. Teniendo en cuenta que estos intrones homólogos se han identificado en linajes UTC, podrían haber sido heredados por herencia vertical del último ancestro común de las algas UTC; sin embargo, el hallazgo de que potencialmente codifican para endonucleasas homing de las familias LAGLIDADG o GIY-YIG (Tabla 4) no nos permite excluir la posibilidad de que se adquirieran por transferencia horizontal. Aunque la mayoría de los 16 intrones del grupo I en el ADNcp de Pseudendoclonio no tienen homólogos en sitios afines idénticos en otros genomas de cloroplastos, sus similitudes estructurales y de secuencia cercanas, junto con su ausencia del ADNcp de Oltmannsiellopsis, sugieren que surgieron de la proliferación intragenómica en el linaje que conduce al Pseudendoclonio . Tenga en cuenta que las búsquedas de explosiones de la secuencia de intrones PETB de Oltmannsiellopsis contra la base de datos GenBank no detectaron ningún intrón homólogo en otros organismos.
Estructura del genoma y partición génica
El patrón de partición génica dentro de las regiones de copia única del ADNcp de Oltmannsiellopsis difiere sustancialmente del patrón de partición ancestral observado para los ADNcp de Mesostigma, Nefroselmis y estreptofitos (Figura 1). La gran mayoría de los 30 genes que se encuentran en la región SC1 de Oltmannsiellopsis se encuentran típicamente en la región ancestral LSC, mientras que la región SC2 contiene 52 genes característicos de la región ancestral LSC, además de diez genes característicos de la región ancestral SSC. Curiosamente, el SC2 incluye 12 de los 14 genes LSC que se han transferido a la región SSC en el ADNcp de Pseudendoclonio. Los dos genes excepcionales de pseudendoclonio que no tienen homólogos en Oltmannsiellopsis SC2 son trnH (gug) y trnL (caa); el gen trnH(gug) reside en la región SC1 de Oltmannsiellopsis, mientras que el trnL(caa) se ha perdido del ADNcp de Oltmannsiellopsis. Teniendo en cuenta el contenido genético de las regiones de copia única de Oltmannsiellopsis, parece inapropiado etiquetar estas regiones de acuerdo con sus tamaños. Aunque SC1 es más pequeño que SC2, es probable que corresponda a la región ancestral LSC, y SC2 se deriva aparentemente de la región ancestral SSC.
La secuencia IR en el ADNcp de Oltmannsiellopsis es aproximadamente 12 kb mayor que la del ADNcp de Pseudendoclonio y contiene cinco genes además de los encontrados en el operón del ARNr (Figura 1). A los 18.510 a. p., la secuencia IR de Oltmannsiellopsis es similar en tamaño a la de Chlamydomonas (Tabla 1). Ambas uniones IR en Oltmannsiellopsis cpDNA abarcan genes (cemA y ftsH) de los cuales las secuencias codificantes se expanden en las regiones de copia única. Al igual que en el Pseudendoclonio IR, los genes del ARNr Oltmannsiellopsis se transcriben hacia la región de copia única que lleva los genes que se asignan al LSC en los ADNC prasinófitos y estreptófitos. En contraste, el operón del ARNr se transcribe hacia la región SSC en Nefroselmis y cpDNAs estreptofíticos. La orientación del operón del ARNr no se puede establecer en Chlamydomonas cpDNA debido a las regiones de copia única ampliamente codificadas, y esta orientación sigue siendo desconocida en Chlorella cpDNA debido a la pérdida de IR.
Considerando que Oltmannsiellopsis y Pseudendoclonium representan linajes divergentes tempranos de las Ulvophyceae, las sorprendentes similitudes entre las arquitecturas cuatripartitas de Oltmannsiellopsis y Pseudendoclonium cpDNAs sugieren que tanto el patrón de partición génica atípico como la orientación inusual del IR fueron característicos del genoma de cloroplastos de las ulvofitas divergentes más tempranas. Nuestros datos predicen que la región SSC del último ancestro común de los ADNC de Oltmannsiellopsis y Pseudendoclonio presentaba 12 de los genes que generalmente se encuentran en la región LSC en los ADNC de Nefroselmos y estreptofitos, mientras que la región LSC contenía exclusivamente genes característicos de la región LSC ancestral. En consecuencia, en el linaje que conduce al Pseudendoclonio, dos genes adicionales se transfirieron a la región SSC, mientras que 40 genes adicionales migraron a esta región en el linaje Oltmannsiellopsis. Aunque los mecanismos subyacentes a estas migraciones génicas entre regiones de copia única siguen siendo desconocidos, probablemente involucraron eventos de recombinación intramolecular o intermolecular. El análisis de los grupos de genes conservados que se indican a continuación indica claramente que varios genes se transfirieron juntos en el curso de estas migraciones.
Los genes se han barajado más ampliamente entre las dos regiones de copia única en Chlamydomonas cpDNA (Figura 1). Se puede imaginar que durante la evolución de las ulvofitas y las algas verdes clorofíceas, el patrón ancestral de partición de genes se interrumpió en pasos sucesivos, con una organización similar al Pseudendoclonio que evolucionó en una organización similar al Oltmannsiellopsis, lo que finalmente llevó a la extensa mezcla de genes observada en las Clamidomonas. Dada la ausencia de IR en el genoma de la Clorella, es muy difícil determinar si la dirección de transcripción del operón del ARNr cambió y si los genes se reubicaron de una región genómica a otra durante la evolución de los trebouxiofitos. La pérdida de la IR se asocia generalmente con muchos reordenamientos de genes ; en el caso de Chlorella cpDNA, sin embargo, todos los genes que se encuentran generalmente en la región ancestral SSC se han mantenido agrupados, con la excepción de tres genes (psaC, ycf20 y trnL(uag)) (Figura 1). Se requerirán investigaciones de genomas de cloroplastos que contienen IR de distintos linajes de trebouxiofitos para probar si algunas de las reubicaciones de genes identificadas aquí en los ADNC de Oltmannsiellopsis y Pseudendoclonio se originaron del ancestro común de las algas UTC.
Agrupamiento de genes
La organización general de genes del ADNc de Oltmannsiellopsis difiere ampliamente de la de su homólogo de Pseudendoclonio y, sorprendentemente, se asemeja más a la del ADNc de Clorella (Figura 2). Oltmannsiellopsis y Chlorella cpDNAs comparten 21 bloques de secuencias colineales que contienen un total de 65 genes, mientras que Oltmannsiellopsis y Pseudendoclonium cpDNAs tienen en común 18 bloques que contienen 55 genes. Solo ocho bloques que contienen 19 genes se conservan en los genomas de Oltmannsiellopsis y Chlamydomonas.
Muchos de los 24 grupos de genes ancestrales compartidos por Mesostigma y Nephroselmis cpDNAs se han interrumpido durante la evolución de las algas verdes UTC. En este estudio, hemos analizado 19 clusters ancestrales; los cinco restantes no pudieron investigarse porque los genes que contienen se han perdido de cpDNAs UTC (Figura 3). Los 19 racimos se han roto al menos en una ocasión durante la evolución de las algas UTC. Con solo 12 puntos de interrupción, Chlorella cpDNA muestra la conservación más fuerte de los racimos ancestrales. Con 20 puntos de corte, el ADNcp de Oltmannsiellopsis ocupa una posición mediana entre Clorella y Pseudendoclonio (24 puntos de corte) ADNcp, mientras que el ADNcp de Chlamydomonas revela el doble de puntos de corte (42 puntos de corte). Los genomas de Chlamydomonas, Oltmannsiellopsis y Pseudendoclonium comparten cinco puntos de corte que faltan en Chlorella cpDNA. Aparte de estos puntos de corte, Pseudendoclonium y Chlamydomonas cpDNAs comparten seis puntos de corte que están ausentes de Oltmannsiellopsis y Chlorella cpDNAs. No hay un punto de interrupción exclusivo de los genomas Oltmannsiellopsis y Chlamydomonas.
Dos clústeres ancestrales muestran puntos de corte que son exclusivos de las Ulvophyceae. El cúmulo de psbB-psbT-psbN-psbH, conservado casi universalmente, se fragmentó en el extremo 5′ de psbN, creando dos piezas separadas, cada una codificando un par de genes, en Oltmannsiellopsis cpDNA. En el linaje de Pseudendoclonio, la introducción de un punto de ruptura adicional en el lado opuesto del psbN llevó a la reubicación de este gen en la cadena de ADN que codifica psbB, psbT y psbH, sin ningún cambio en el orden de los genes. En el linaje Oltmannsiellopsis, se produjeron tres puntos de corte en el operón ancestral del ARNr para generar una nueva unidad de transcripción en la que se ha invertido el orden de los genes ARNt(ugc) y trnI(gau). Se han reportado operones de ARNr reordenados para los ARNR CPD del trebouxiofito Chlorella ellipsoidea y el Codium fragile ulvofito ; sin embargo, en estos casos, el operón ancestral de ARNr se dividió en fragmentos separados que se transcriben de diferentes promotores.
En términos de grupos de genes derivados, el ADNc de Oltmannsiellopsis es más similar al ADNc de Clorella (Figura 4). Un grupo derivado se define aquí como un grupo de genes con las mismas polaridades relativas en dos o más genomas UTC, pero ausentes del Mesostigma y del Nephroselmis cpDNAs. El ADNc de Oltmannsiellopsis comparte cinco grupos derivados con su homólogo de Clorella, mientras que el ADNc de Pseudendoclonio comparte tres grupos, uno de los cuales falta en Oltmannsiellopsis. De los cuatro grupos derivados comunes a Oltmannsiellopsis y Pseudendoclonium cpDNAs, ninguno se encuentra en Chlamydomonas cpDNA.
Se estimó que se requerirían un mínimo de 50 inversiones para transformar la organización génica del ADNcp de Oltmannsiellopsis en la de cualquier otro genoma de clorofita (Tabla 6). Los análisis comparativos de ADNcp de plantas terrestres y de clamidomonadas estrechamente relacionadas sugieren que las inversiones representan el mecanismo predominante de los reordenamientos del genoma de cloroplastos en plantas verdes. Sin embargo, las inversiones podrían no ser los únicos eventos mutacionales que causan cambios en el orden de los genes de los clorofitos cpDNAs, ya que se han propuesto transposiciones para explicar algunos de los reordenamientos observados en Campanulaceae y en subclaves cpDNAs.
Elementos repetidos
En Oltmannsiellopsis cpDNA se encuentra un gran número de elementos de DEG (Figura 5). Aunque estos elementos residen predominantemente dentro de espaciadores intergénicos e intrones, unas pocas copias pueblan las regiones codificantes de cemA, chlB, chlL, chlN, ftsH, rpoB, rpoC1 y rpoC2. Los elementos más abundantes se pueden clasificar en cinco grupos de unidades repetitivas no superpuestas (de A a E) sobre la base de sus secuencias primarias (Tabla 7). Sus tamaños varían de 7 a 21 pb y sus números de copia varían de 17 a más de 250. La secuencia de la unidad repetida A o B está más a menudo vinculada al complemento inverso de la misma secuencia, formando así palíndromos perfectos o estructuras de bucle de tallo putativo con un bucle de dos A o dos T (Figura 6). En algunos casos, los palíndromos o porciones de tallo de las estructuras de bucle de tallo se extienden mediante la adición de repeticiones menos frecuentes. Además, algunas copias de las unidades repetidas A y B se producen como secuencias solitarias, representando versiones probablemente degeneradas de los arreglos más comunes con palíndromos o estructuras de bucle de tallo. La unidad de repetición C puede formar estructuras de bucle de tallo, con un bucle de tamaño variable. Aunque las unidades repetidas D y E no están asociadas con estructuras de bucle de tallo, residen en la vecindad de otros elementos repetidos.
Los DEG en Oltmannsiellopsis cpDNA no se parecen mucho a los presentes en otros cpDNAs UTC. Las repeticiones de Oltmannsiellopsis están sesgadas en G + C, mientras que las repeticiones de Clorella muestran un sesgo en A + T. Los SDRs Pseudendoclonium y Chlamydomonas también son ricos en G + C, pero sus secuencias no comparten similitudes obvias con las repeticiones de Oltmannsiellopsis. Esta falta de similitudes de secuencia entre los DEG derivados de distintos genomas UTC sugiere que los DEG se han adquirido de forma independiente en los linajes UTC. Sin embargo, la hipótesis alternativa de que los DEG se transmitieran verticalmente no puede excluirse si suponemos que estos elementos evolucionan a un ritmo muy rápido. Se requerirán estudios de ADNcp de taxones UTC estrechamente relacionados para distinguir entre estas dos hipótesis.
Es muy probable que los DEG hayan desempeñado un papel importante en la remodelación del genoma de los cloroplastos en los linajes UTC. Se ha observado previamente una correlación entre la abundancia de SDRs y el alcance de los reordenamientos genéticos en los genomas de algas UTC . Esta correlación todavía se mantiene con la adición de la secuencia genómica de cloroplastos de Oltmannsiellopsis. La abundancia de elementos SDR en el ADNcp de Oltmannsiellopsis es comparable a la observada en el ADNcp de Pseudendoclonio (Figura 7) y los genes se han reorganizado de manera similar en ambos genomas (Tabla 6). Los DEG en los ADNC de plantas verdes podrían servir como puntos calientes para eventos recombinacionales no homólogos y conducir a inversiones y transposiciones .