Información

Conservadurismo evolutivo

Conservadurismo evolutivo


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Enumere las siguientes proteínas en orden decreciente de conservadurismo evolutivo de su estructura primaria:

  1. Somatotropina.
  2. Subunidad catalítica de una ADN - polimerasa.
  3. Histona H1.
  4. Prolaminas (proteínas de almacenamiento de cereales).

Lo que pienso: estoy seguro de que el cuarto debería ser el último. Creo que la secuencia H1 no es tan importante, ya que leí en alguna parte que una célula puede sobrevivir incluso sin la histona H1. También creo que la subunidad catalítica es la más importante. Entonces, según yo, el orden debería ser: 2,1,3,4.

Estoy en lo cierto?


Incluso cuando puede vivir sin la histona H1, es una proteína ampliamente distribuida que se encuentra básicamente en todas las células vivas (excepto en algunas levaduras, si mal no recuerdo). Esto apunta al hecho de que debe estar disponible durante bastante tiempo. Lo mismo ocurre con la subunidad catalítica de la ADN polimerasa. La somatropina sigue siendo bastante importante (y se puede encontrar en muchos organismos), las prolaminas son bastante específicas de ciertos cereales. Lo agruparía 2-3-1-4.


Dawkins contra Gould

Dawkins contra Gould: la supervivencia del más apto es un libro sobre las diferentes opiniones de los biólogos Richard Dawkins y Stephen Jay Gould del filósofo de la biología Kim Sterelny. Cuando se publicó por primera vez en 2001, se convirtió en un éxito de ventas internacional. En 2007 se publicó una nueva edición para incluir el libro de Gould. La estructura de la teoría evolutiva terminado poco antes de su muerte en 2002, y obras más recientes de Dawkins. La siguiente sinopsis es de la publicación de 2007. [1]


Evolución congelada. O no es así, señor Darwin. Adiós al gen egoísta.

El hecho de que el código genético sea capaz de al menos un grado de evolución limitado se refleja en la existencia de códigos genéticos modificados, que se encuentran en los núcleos de algunos grupos de protozoos y también con bastante frecuencia en orgánulos de origen simbiótico, en las mitocondrias ( Fig. X.8) Simultáneamente, las posiciones de los grupos individuales de organismos con código genético modificado dentro del árbol fitogenético indican que sus predecesores tenían un código genético universal clásico (Cedergren & amp Miramontes 1996) .Los mismos cambios ocurrieron repetidamente, en ambos especies relacionadas y no relacionadas (Fig. X.9). La desviación más común radica en la asignación de algunos aminoácidos a uno de los codones terminales. Los condones UAA y UAG comenzaron a codificar glutamina en algunos ciliados, Acetabularia algas unicelulares y Hexamita flagellatae, el codón UGG comenzó a codificar triptófano en muchos ciliados, en micoplasmas y, por ejemplo, también en las mitocondrias de los vertebrados. genoma (su función continúa siendo soportada por los otros tripletes sinónimos), desaparición del tRNA original, reaparición de los tripletes dados en diferentes lugares del ADN y la selección conectada a favor de la formación de tRNA que es capaz de leer el codón dado Este mecanismo es aparentemente posible principalmente en el ADN mitocondrial y quizás en el micoplasma, es decir, en sistemas donde el genoma es relativamente pequeño y donde la primera etapa del proceso de 4 etapas descrito anteriormente puede ocurrir con relativa facilidad ( Jukes 1981 Jukes & amp Osawa 1993) Por otro lado, en los ciliados se tiende a asumir un mecanismo diferente, en principio basado en la existencia ce de micronúcleos y macronúcleos en su célula y la existencia de "herencia macronuclear" (Cohen & amp Adoutte 1995).

Figura X.8. Códigos genéticos modificados. En la tabla del código genético universal, el color gris denota posiciones que, en los códigos genéticos de los orgánulos o también en los núcleos de algunos taxones, difieren más frecuentemente en su significado del código genético universal. Según Knight et al. (1999).

Figura X.9. Cambios en el código genético mitocondrial durante la filogénesis de eucariotas. Respetando el principio de máxima parsimonia, los cambios individuales en el código genético mitocondrial se localizaron en el árbol filogenético del eucariota formado a partir de la secuencia de genes para el ARNr. Es evidente a partir de la ubicación de los eventos evolutivos individuales que algunos cambios deben haber ocurrido repetidamente. Significado de los eventos evolutivos individuales: 1 –UGA stop → Trp, 2 - AUA Ile → Met, 3 - AGA, AGG Arg → Ser, 4 - AUA Met → Ile, 5 - AAA Lys → Asn, 6 - AGA, AGG Ser → Gly, 7 - parada UAA → Tyr, 8 - CUN (kde N = U, C, A, G) Leu → Thr, 9 - CGN Arg →?, 10 - AGA, AGG? → detener, 11 - AGA? → Gly, 12 - AGA, AGG Ser →?, 13 - AGA? → Ser, 14 - Parada UAG → Leu, 15 - Parada UAG → Ala, 16 - UCA Ser → Parada. El enraizamiento del árbol filogenético debe verse como solo provisional según algunos autores, la raíz del árbol filogenético de los eucariotas se encuentra en un lugar diferente y la topología general aún puede sufrir cambios sustanciales. Modificado según Knight et al. (2001).

Es interesante que el desarrollo de códigos genéticos no estándar va acompañado de un cierto grado de optimización del código genético universal original. Para el código genético universal, el 3% de las transiciones en la tercera posición del triplete conducen a mutaciones de sustitución, mientras que, para El código genético mitocondrial de los vertebrados, ninguna transición en la tercera posición del triplete conduce a una mutación de sustitución (Wakeley 1996). Según diferentes criterios (minimización del impacto de los errores que ocurren durante la traducción), sin embargo, el código mitocondrial parece ser subóptimo en comparación con el código universal (Knight, Freeland y Landweber 2001).

Es posible que el código genético original evolucionara sobre la base de interacciones estereoquímicas directas entre los nucleótidos y los aminoácidos y luego se volviera más complicado como consecuencia de las modificaciones bioquímicas de los aminoácidos individuales y la asignación de los nuevos aminoácidos así formados a los codones originalmente sinónimos. y finalmente (o en paralelo) esto se optimizó desde el punto de vista de la preferencia por el conservadurismo de la mutación y los errores de traducción mediante mecanismos similares a los que eran válidos durante la formación de códigos genéticos modificados (Knight, Freeland y Landweber 1999).


Hacia la comprensión de las limitaciones evolutivas: enfoques experimentales y teóricos

Aunque los organismos se han diversificado notablemente a través de la evolución, no exhiben una variabilidad ilimitada. Durante la evolución, los cambios fenotípicos no ocurren al azar, sino que son direccionales y están restringidos por las restricciones que se les imponen. A pesar de la importancia percibida de caracterizar la desigualdad de estos cambios, los estudios sobre las limitaciones evolutivas han sido principalmente de naturaleza cualitativa. En esta revisión, nos centramos en los estudios recientes de limitaciones evolutivas, que se basan en la cuantificación de datos fenotípicos y genotípicos de alta dimensión. Además, presentamos un análisis teórico que nos permite predecir las limitaciones evolutivas sobre la base de la fluctuación fenotípica, modelada en la relación fluctuación-respuesta en la física estadística. La revisión hace hincapié en las estrechas interacciones entre los análisis experimentales y teóricos en biología evolutiva que contribuirán a una mejor comprensión de las limitaciones evolutivas.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución.


Evaluación de las presiones evolutivas y la señal filogenética en las lombrices de tierra: un estudio de caso: el número de laminillas de tiflosola en Hormogastridae (Annelida, Oligochaeta)

Rara vez se han utilizado métodos comparativos filogenéticos para estudiar la correlación entre rasgos fenotípicos y variables ambientales en invertebrados. Con la convergencia generalizada y el carácter conservador de los caracteres morfológicos utilizados en las lombrices de tierra, estos métodos comparativos podrían ser útiles para mejorar nuestra comprensión de su evolución y sistemática. Uno de los caracteres morfológicos más destacados de la familia Hormogastridae, endémica de las zonas mediterráneas, es su tiflosola multilaminar, tradicionalmente pensada como una adaptación a suelos pobres en nutrientes. Probamos la correlación del tamaño corporal y las características del suelo con el número de laminillas de tiflosola mediante un análisis filogenético de mínimos cuadrados generalizados (PGLS). Se construyó una hipótesis filogenética ultramétrica con una secuencia de ADN de 2580 pb de 90 poblaciones, utilizada en combinación con tres variables morfológicas y 11 del suelo. El modelo mejor soportado, basado en el criterio de información de Akaike, se obtuvo optimizando los parámetros lambda (λ), kappa (κ) y delta (δ). La señal filogenética fue fuerte para el número de laminillas de tiflosol y el peso corporal promedio, y fue menor para las variables del suelo. El aumento del peso corporal pareció ser la principal presión evolutiva detrás del aumento en el número de laminillas de tiflosol, teniendo la textura y la riqueza del suelo un efecto más débil pero significativo. La información sobre la tasa evolutiva del número de laminillas de tiflosola sugirió que la evolución temprana de este carácter podría haber moldeado fuertemente su variabilidad, como se encuentra en una radiación adaptativa. Este trabajo destaca la importancia de implementar el método comparativo filogenético para probar hipótesis evolutivas en taxones de invertebrados.

Apéndice S1. Localidad, coordenadas y números de acceso al GenBank para las especies estudiadas.

Apéndice S2. Estudio de correlación entre superficie de tiflosol y número de laminillas.

Apéndice S3. Definición de los factores de PCA y diagnóstico del modelo para el análisis PGLS.

Apéndice S4. Caracteres morfológicos y variables edáficas para las distintas poblaciones y localidades.

Apéndice S5. Inferencia bayesiana y de máxima verosimilitud del árbol filogenético a partir de la secuencia concatenada.

Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea contenido faltante) debe dirigirse al autor correspondiente del artículo.


Resultado

Genes con repeticiones de aminoácidos homopoliméricos

Primero obtuvimos secuencias de nucleótidos de 861 repeticiones de aminoácidos homopoliméricos de los 658 genes informados por Faux et al. (2005) de GenBank. Comprobamos su autenticidad y excluimos las repeticiones ambiguas del análisis posterior. Se excluyeron las repeticiones de Lys (K) si las colas poli (A) del ARNm se consideraban repeticiones de Lys debido a un error de anotación (19 repeticiones). Luego, utilizando las secuencias de aminoácidos deducidas de las 842 repeticiones restantes de 639 genes humanos como consultas para una búsqueda Blast contra la base de datos nr de NCBI, recolectamos sus genes ortólogos en mamíferos. Como era de esperar, la mayoría de los genes obtenidos procedían del chimpancé, el macaco rhesus, el ratón y la rata porque se han realizado proyectos de secuenciación del genoma completo para estas especies. Después de la verificación mediante una búsqueda Blast recíproca, alineamos las secuencias de aminoácidos para cada gen, centrándonos en las repeticiones de aminoácidos homopoliméricos. Encontramos 28 repeticiones en 23 genes para mostrar diferencias de longitud entre primates. Para dilucidar aún más el grado de cambio, intentamos determinar de nuevo las secuencias de nucleótidos de genes que contienen estas repeticiones para 6 especies de primates pertenecientes a 5 géneros de 5 familias de 3 infraórdenes de orangutanes de 2 semiordernos (P. pygmaeus) pertenecientes a grandes simios, lar y ágiles gibones (H. lar y H. agilis) pertenecientes a simios menores, macacos japoneses (M. fuscata) pertenecientes a monos del Viejo Mundo, monos búho (A. trivirgatus) pertenecientes a los monos del Nuevo Mundo y a los grandes galgos (O. crassicaudatus) pertenecientes a prosimios. La clasificación de primates se basó en Goodman et al. (1998). Recientemente identificamos secuencias de nucleótidos de 27 repeticiones en 22 genes.

Basándonos en el conservadurismo evolutivo, clasificamos las 805 repeticiones de 615 genes de la siguiente manera:

Categoría CM: Repeticiones de aminoácidos homopoliméricos cuyas longitudes se conservan entre los mamíferos.

Categoría CP: Repeticiones de aminoácidos homopoliméricos cuyas longitudes son diferentes entre mamíferos no primates pero conservadas entre especies de primates.

Categoría VP: repeticiones de aminoácidos homopoliméricos cuyas longitudes difieren entre primates.

En total, 686, 91 y 28 repeticiones se clasificaron en las categorías CM, CP y VP, respectivamente. La figura 1 ilustra el procedimiento descrito anteriormente. Los genes con las repeticiones clasificadas en cada categoría se enumeran en las tablas complementarias S2 - Datos complementarios, Material complementario en línea.

La clasificación de los aminoácidos homopoliméricos se repite en tres categorías, CM, CP y VP (consulte el texto para obtener más detalles).

La clasificación de los aminoácidos homopoliméricos se repite en tres categorías, CM, CP y VP (consulte el texto para obtener más detalles).

Aminoácidos que constituyen repeticiones homopoliméricas

La distribución de los tipos de aminoácidos en las repeticiones de aminoácidos homopoliméricos se muestra en la figura 2. No se encontraron repeticiones de cisteína (Cys, C), isoleucina (Ile, I), valina (Val, V), triptófano (Trp, W), o tirosina (Tyr, Y). Las repeticiones de ácido aspártico (Asp, D) se distribuyeron a bajas frecuencias en cualquiera de las tres categorías. Las repeticiones de fenilalanina (Phe, F), metionina (Met, M) y asparagina (Asn, N) fueron extremadamente raras, mientras que las repeticiones de ácido glutámico (Glu, E), glicina (Gly, G) y serina (Ser, S) se observaron en las tres categorías. Las repeticiones de glutamina (Gln, Q) fueron las más abundantes en la categoría VP. Fueron codificados principalmente por codones CAG, que están bien estudiados (Orr et al. 1993 Orr y Zoghbi 2007). Las repeticiones de Glu fueron el segundo aminoácido más abundante en la categoría VP y fueron codificadas principalmente por codones GAG. Las repeticiones de alanina (Ala, A) y prolina (Pro, P) tuvieron mayor proporción en la categoría CP. Sin embargo, las repeticiones de Ala fueron menos frecuentes en la categoría VP, y no se encontraron repeticiones de Pro ni de histidina (His, H) en la categoría VP. Una fuerte restricción funcional parece haber estado operando en longitudes de repeticiones homopoliméricas Ala, His y Pro durante la evolución de los primates. Al igual que las repeticiones Ala, las repeticiones de leucina (Leu, L) fueron relativamente frecuentes en la categoría CM pero raras en las categorías CP y VP. Esto sugiere que la longitud de las repeticiones de Leu ha tenido menos posibilidades de cambiar durante la evolución de los mamíferos. Se observaron repeticiones de lisina (Lys, K), arginina (Arg, R) y treonina (Thr, T) solo en la categoría CM, aunque fueron menos frecuentes.

Distribuciones de frecuencia de repeticiones de aminoácidos homopoliméricos para las categorías CM, CP y VP. Tenga en cuenta que no se observaron repeticiones para Cys (C), Ile (I), Val (V), Trp (W) o Tyr (Y).

Distribuciones de frecuencia de repeticiones de aminoácidos homopoliméricos para las categorías CM, CP y VP. Tenga en cuenta que no se observaron repeticiones para Cys (C), Ile (I), Val (V), Trp (W) o Tyr (Y).

Homogeneidad de codones y longitudes de repetición

Estudios previos mostraron una correlación entre la homogeneidad de codones y la longitud de las repeticiones de aminoácidos homopoliméricos, con repeticiones con mayor homogeneidad de codones más propensas a tener deslizamiento y alargarse (Albà et al. 1999 Albà y Guigó 2004 Mularoni et al. 2006). Como se muestra en la figura 3, no encontramos correlación entre la longitud de la repetición y la homogeneidad del codón (r = 0.06, PAG = 0,08), aunque las repeticiones con menos homogeneidad de codones tendían a ser más cortas mientras que las repeticiones con mayor homogeneidad tenían longitudes de repetición más largas. La homogeneidad del codón parece estar correlacionada con la variabilidad de la longitud cuanto mayor es la homogeneidad del codón, más variable es la longitud. Tal tendencia se encontró para las tres categorías, CM, CP y VP. La probabilidad de deslizamiento de la cadena de ADN durante la replicación es probablemente mayor para repeticiones con mayor homogeneidad de codones.

Gráfico de dispersión de la longitud de las repeticiones de aminoácidos homopoliméricos frente a la homogeneidad del codón de la secuencia de nucleótidos. La homogeneidad se definió como la relación entre el número de codones que aparecen con mayor frecuencia en la región de repetición y el número total de codones en la repetición.

Gráfico de dispersión de la longitud de las repeticiones de aminoácidos homopoliméricos frente a la homogeneidad del codón de la secuencia de nucleótidos. La homogeneidad se definió como la relación entre el número de codones que aparecen con mayor frecuencia en la región de repetición y el número total de codones en la repetición.

Estructura intrínsecamente desordenada de las repeticiones de aminoácidos homopoliméricos

Las regiones intrínsecamente desordenadas se predijeron utilizando el software Spritz (Vullo et al. 2006) para 805 repeticiones de aminoácidos homopoliméricos en 615 genes humanos. La probabilidad de una región intrínsecamente desordenada (índice de desorden) se evaluó contando los residuos que se predice que están desordenados en relación con la longitud total de la repetición. El resultado fue esencialmente el mismo que el obtenido con otro paquete de software Poodle (Shimizu et al. 2007). Como se esperaba de estudios anteriores (Huntley y Golding 2002 Simon y Hancock 2009), la mayoría de las repeticiones se predijeron como una estructura desordenada: el índice de trastorno fue 1 para casi la mitad de las repeticiones (tabla 1 y figura complementaria S1, material complementario en línea). Sin embargo, sorprendentemente, varias de las repeticiones tenían un índice de trastorno de 0. Para la categoría CM, un poco más del 10% de las repeticiones tenían un índice de trastorno de ≤0,1, mientras que más del 50% tenía un índice de trastorno de & gt0,9. . Para la categoría CP, más del 60% de las repeticiones de aminoácidos tenían un índice de trastorno de & gt0,9 y menos del 4% tenía un índice de trastorno de ≤0,1. Curiosamente, alrededor del 35% de las repeticiones tenían un índice de trastorno de & gt0,9, mientras que más del 25% tenía un índice de trastorno de ≤0,1 para la categoría VP. La proporción de repeticiones de aminoácidos que no se predijo como desordenada fue mayor en la categoría VP que en la categoría CM. Evaluamos la significancia estadística de estas tendencias mediante la prueba de permutación. La categoría VP tuvo una proporción menor de repeticiones con un índice de trastorno de & gt0.9 que el esperado aleatoriamente (PAG & lt 0,05). Por otro lado, las categorías CM y CP no mostraron la desviación de la esperada aleatoriamente para las repeticiones con un índice de trastorno de & gt0,9. Las categorías VP y CM tenían una proporción significativamente mayor de repeticiones con un índice de trastorno de ≤0,1, mientras que la categoría CP tenía una proporción significativamente menor de repeticiones que la esperada aleatoriamente (PAG & lt 0.05 para cada comparación). En la tabla 1, no tomamos en cuenta las repeticiones con índice de trastorno & gt0.1 o ≤0.9. Esto se debe a que para este tipo de repeticiones, el límite desordenado / no desordenado se predijo en medio de las repeticiones de aminoácidos homopoliméricos. Predecir el límite exacto entre regiones desordenadas y no desordenadas es difícil y podría ser inexacto. La Figura 4 muestra el índice de trastorno promedio para cada residuo de aminoácido de las repeticiones de aminoácidos homopoliméricos. Las pruebas ANOVA mostraron que el índice de trastorno promedio era diferente entre los aminoácidos (PAG & lt 0,001). Cuando eliminamos Phe, Leu, Thr, Met, Ala, Glu y Gln (los siete aminoácidos más bajos para el índice de trastorno), el ANOVA no mostró ningún significado. Esto indica que un grupo de aminoácidos (Phe, Leu, Thr, Met, Ala, Glu y Gln) tiene un índice de trastorno más bajo y otro grupo (Asp, Ser, Lys, Arg, Gly, His, Pro y Asn) tener un índice de trastorno más alto. En particular, las repeticiones de Phe y Leu tenían un índice de trastorno extraordinariamente bajo.

Distribución de los valores del índice de trastorno para todas las repeticiones y para cada categoría.

Distribución de los valores del índice de trastorno para todas las repeticiones y para cada categoría.

Índice de trastorno promedio de repeticiones de aminoácidos homopoliméricos para cada residuo. Phe (F), Leu (L), Thr (T), Met (M), Ala (A), Glu (E) y Gln (Q) se agrupan en el grupo de índice de trastorno inferior y Asp (D), Ser (S), Lys (K), Arg (R), Gly (G), His (H), Pro (P) y Asn (N) se agrupan en el grupo de índice de trastorno más alto. Tenga en cuenta que Met y Asn se observaron solo una vez y Phe solo dos veces en el genoma humano, por lo que podrían ser excepciones.

Índice de trastorno promedio de repeticiones de aminoácidos homopoliméricos para cada residuo. Phe (F), Leu (L), Thr (T), Met (M), Ala (A), Glu (E) y Gln (Q) se agrupan en el grupo de índice de trastorno inferior y Asp (D), Ser (S), Lys (K), Arg (R), Gly (G), His (H), Pro (P) y Asn (N) se agrupan en el grupo de índice de trastorno más alto. Tenga en cuenta que Met y Asn se observaron solo una vez y Phe solo dos veces en el genoma humano, por lo que podrían ser excepciones.

Tasas de sustitución de los genes con repeticiones de aminoácidos homopoliméricos

Para abordar la naturaleza evolutivamente permisiva de las proteínas con repeticiones de aminoácidos homopoliméricos cuyo índice de trastorno era 0, estimamos el sinónimo (Ks) y no sinónimos (Ka) tasas de sustitución y su ratio (Ka/Ks) para los genes con repeticiones cuyo índice de trastorno era 0 y 1. Estas tasas de sustitución se evaluaron a partir de toda la región codificante del gen utilizando el método de Li (1993). Cuando un gen tenía al menos una repetición con un índice de trastorno de 0, se clasificaba como "Índice de trastorno = 0", y cuando el gen tenía al menos una repetición con un índice de trastorno de 1, se clasificaba como "Índice de trastorno = 1. " Los genes con ambos tipos de repeticiones se excluyeron del cálculo. los Ka y Ks valores y el Ka/KLa relación entre humanos y ratones fue significativamente mayor para los genes con repetición del índice de trastorno = 0 que para los genes con repetición del índice de trastorno = 1 (PAG & lt 0,001, consulte la tabla 2). También obtuvimos promedio Ka/Ks ratios para cada una de las tres categorías, CM, CP y VP. Se observaron diferencias estadísticamente significativas entre los genes con repetición del índice de trastorno = 0 y 1 en las categorías CM y VP (PAG & lt 0,001).

Tasas de sustitución promedio en humanos y ratones de los genes con repeticiones cuyo índice de trastorno fue 0 y 1.

Índice de trastorno = 0 Índice de trastorno = 1
Ka/Ks 0.207 0.111 *
Ks 0.530 0.426 *
Ka 0.121 0.052 *
Ka/Ks (CM) 0.205 0.112 *
Ka/Ks (CP) 0.089 0.113
Ka/Ks (vicepresidente) 0.333 0.073 *
Índice de trastorno = 0 Índice de trastorno = 1
Ka/Ks 0.207 0.111 *
Ks 0.530 0.426 *
Ka 0.121 0.052 *
Ka/Ks (CM) 0.205 0.112 *
Ka/Ks (CP) 0.089 0.113
Ka/Ks (vicepresidente) 0.333 0.073 *

Los asteriscos indican que la diferencia entre el índice de trastorno = 0 y el índice de trastorno = 1 es significativa. (*PAG & lt 0,001).

Tasas de sustitución promedio en humanos y ratones de los genes con repeticiones cuyo índice de trastorno fue 0 y 1.

Índice de trastorno = 0 Índice de trastorno = 1
Ka/Ks 0.207 0.111 *
Ks 0.530 0.426 *
Ka 0.121 0.052 *
Ka/Ks (CM) 0.205 0.112 *
Ka/Ks (CP) 0.089 0.113
Ka/Ks (vicepresidente) 0.333 0.073 *
Índice de trastorno = 0 Índice de trastorno = 1
Ka/Ks 0.207 0.111 *
Ks 0.530 0.426 *
Ka 0.121 0.052 *
Ka/Ks (CM) 0.205 0.112 *
Ka/Ks (CP) 0.089 0.113
Ka/Ks (vicepresidente) 0.333 0.073 *

Los asteriscos indican que la diferencia entre el índice de trastorno = 0 y el índice de trastorno = 1 es significativa. (*PAG & lt 0,001).


La personalidad predice preferencias políticas

Existe una fuerte relación entre la política de un votante y su personalidad, según una nueva investigación de la Universidad de Toronto.

Los investigadores de la UofT han demostrado que la preocupación psicológica por la compasión y la igualdad está asociada con una mentalidad liberal, mientras que la preocupación por el orden y el respeto de las normas sociales está asociada con una mentalidad conservadora.

"Los conservadores tienden a ser más altos en un rasgo de personalidad llamado orden y más bajos en apertura. Esto significa que están más preocupados por un sentido de orden y tradición, expresando un motivo psicológico profundo para preservar la estructura social actual", dice Jacob Hirsh. estudiante de posdoctorado en psicología en la UofT y autor principal del estudio.

El estudio, que aparece en la publicación de este mes Boletín de personalidad y psicología social, incluso puede otorgar cierta legitimidad al término "liberal de corazón sangrante".

"Nuestros datos muestran que el liberalismo se asocia más a menudo con los motivos subyacentes de la compasión, la empatía y la igualdad", dice Hirsh.

Los investigadores pidieron a más de 600 participantes de Canadá y Estados Unidos que clasificaran su política como liberal pequeña L o conservadora pequeña C en lugar de identificarse con un partido político en particular. Luego administraron una prueba de personalidad para determinar los rasgos de personalidad de los participantes y su relación con las preferencias políticas.

El trabajo de Hirsh contribuye a acumular evidencia que sugiere que el comportamiento político está motivado por necesidades psicológicas subyacentes. "Estamos empezando a comprender las motivaciones más profundas que intervienen en la determinación de las inclinaciones políticas de un individuo", dice Hirsh. "Si bien todo el mundo tiene la misma arquitectura motivacional básica, la fuerza relativa de los sistemas subyacentes varía de una persona a otra. Si las preocupaciones por el orden y la igualdad están relativamente equilibradas, es probable que el individuo sea políticamente moderado, ya que cualquiera de los motivos se vuelve más fuerte que el otras, las preferencias políticas se mueven más hacia uno u otro extremo del espectro ".

"Los valores de las personas están profundamente arraigados en su biología y herencia genética", dice el profesor y coautor de la UofT, Jordan Peterson. "Esto significa que hay que tener una visión más profunda de los valores políticos y la moralidad en términos de dónde provienen estos motivos de las preferencias políticas que no surgen de una simple consideración racional de los temas".

Peterson sostiene que para mantener una sociedad en funcionamiento, se requieren ambos tipos de motivación política.

"El hecho de que aún exista variabilidad en estos sistemas motivacionales, desde una perspectiva evolutiva, significa que ninguno es suficiente por sí solo. Hay costos y beneficios para cada perfil político y ambos parecen críticos para mantener un equilibrio efectivo en la sociedad".

Fuente de la historia:

Materiales proporcionados por Universidad de Toronto. Nota: El contenido puede editarse por estilo y longitud.


Evolución congelada. O no es así, señor Darwin. Adiós al gen egoísta.

Si mutaciones puntuales ocurren en la sección de codificación de proteínas de ADN, es posible y con frecuencia útil clasificar las mutaciones de acuerdo con su efecto sobre la estructura de esa proteína. degeneración del código genético, es decir, en relación con el hecho de que un único aminoácido está codificado por varios codones, es decir. tripletes de nucleótidos, reemplazo de un nucleótido en el codón no es necesario que se manifieste en la estructura de la proteína. sinónimo (mismo sentido) mutaciones.Mutaciones de este tipo, similares a la mayoría de las mutaciones en el área de intrones o pseudogenes, es decir, en genes que han perdido su funcionalidad y no se reescriben en la célula y se traducen en proteínas, son importantes porque son invisibles, neutral, desde el punto de vista de la selección natural; sin embargo, de hecho se encontró que las mutaciones sinónimos no son neutrales en el verdadero sentido de la palabra. Puede ser importante para el organismo si un determinado aminoácido codificado por triplete se traduce por raro o común. Además, las mutaciones sinónimos también afectan la regulación de la transcripción del gen dado, la estructura secundaria del ARN sintetizado, su estabilidad y la intensidad de la traducción. En drosophila, el coeficiente de selección promedio que actúa contra la mutación en el sitio sinónimo ha ha sido estimado en s= 2,3/nortemi, dónde nortemi es el tamaño efectivo de la población (Akashi 1995). En los seres humanos, se ha estimado que aproximadamente el 3% de las mutaciones sinónimos, el 12% de las mutaciones no sinónimas y el 100% de las mutaciones sin sentido (ver más abajo) son perjudiciales <12299>.

Sin sentido (no sinónimo) mutaciones son mutaciones a través de las cuales un aminoácido es reemplazado por otro diferente Si el aminoácido es reemplazado por un aminoácido con propiedades físico-químicas similares, entonces esto se denomina un sustitución conservadora.A sustitución conservadora No es necesario cambiar sustancialmente la estructura terciaria y la función biológica de la proteína. El código genético está organizado de manera que la mayoría de las sustituciones de aminoácidos que pueden ocurrir a través de la mutación de un solo nucleótido en el trillizo están conservador.Por ejemplo, el 97% de las transiciones en la tercera posición del codón son sinónimos y el 3% restante conduce a sustituciones conservadoras. De las transversiones menos comunes, el 59% de las de la tercera posición son sinónimos (Wakeley 1996). Actualmente es evidente si esta disposición del código genético es una adaptación útil de los organismos que previenen cambios drásticos en la estructura de la proteína como consecuencia de mutaciones de sustitución o si esto es sólo una indicación de la forma en que el evolución del código genético Los aminoácidos individuales difieren sustancialmente en su grado de conservadurismo. Por ejemplo, durante la evolución de las proteínas, el aminoácido glicina es sustituido por otro aminoácido sólo muy raramente, mientras que, por el contrario, la asparagina se reemplaza mucho más. Las diferencias en las tasas de evolución de las proteínas individuales pueden explicarse en un grado considerable por diversos contenidos de aminoácidos conservadores y no conservadores. Por ejemplo, las diferencias en el contenido de glicina por sí sola pueden explicar el 39% de la variabilidad total en la tasa del desarrollo de 27 proteínas de mamíferos estudiadas si tenemos en cuenta el contenido de 5 aminoácidos con mayor efecto en la tasa de evolución, entonces se puede explicar el 73% de la variabilidad (Graur 1985).

Otro tipo de mutación de sustitución consiste en disparates mutaciones En estas mutaciones, una de las tres codones de terminación se forma a partir del codón del aminoácido, por lo que la traducción en este sitio conduce a la terminación prematura de la síntesis de la cadena de la proteína. Esto es, por supuesto, un cambio drástico en la estructura de la proteína, que conduce principalmente a la formación de una proteína no funcional. .

Los cambios drásticos también ocurren a través del efecto de inserción osupresión de un nucleótido Estos cambios, mutaciones de cambio de marco, conducir a un desplazamiento (interrupción) del marco de lectura de modo que una secuencia de nucleótidos básicamente inalterada se traduce en el ribosoma como una secuencia de trillizos a una secuencia de aminoácidos completamente diferente (Fig. III.1). Además, el cambio en el marco de lectura significa que, tarde o temprano, un codón de terminación aparece en la secuencia de nuevos codones, de modo que la síntesis de proteínas termina prematuramente en el sitio dado.

Figura III.1. El origen de las mutaciones de cambio de marco y sus consecuencias. Si se inserta un nucleótido en la cadena de ADN que codifica la cadena de la proteína (o, por otro lado, si se elimina), se produce un cambio en el marco de lectura y los aminoácidos incorrectos se incluirán en la cadena de la proteína a partir de este sitio. Además, tarde o temprano, uno de los tripletes de codones de terminación se formará aquí y la síntesis de la proteína particular terminará prematuramente en este sitio.


Abstracto

Si bien muchas características morfológicas, fisiológicas y ecológicas de los organismos escalan con el tamaño del cuerpo, algunas no cambian con la transformación del tamaño. Se llaman invariantes. Un estudio reciente recomendó cinco criterios para identificar rasgos invariantes. Estos se basan en que un rasgo muestra una tendencia central unimodal y varía en un rango limitado con la masa corporal (tipo I), o que no varía sistemáticamente con la masa corporal (tipo II). Mejoramos metodológicamente estos criterios y luego los aplicamos a los rasgos del ciclo de vida de los anfibios, Anura, Caudata (once rasgos) y reptiles (ocho rasgos). El número de rasgos invariantes identificados por criterios difirió entre órdenes de anfibios y entre anfibios y reptiles. La producción reproductiva (número máximo de eventos reproductivos por año), el tiempo de incubación, la duración del período larvario y el tamaño de la metamorfosis fueron invariantes de tipo I y II entre los anfibios. En ambos órdenes de anfibios, la producción reproductiva y el tamaño de la metamorfosis fueron invariantes de tipo I y II. En Anura, el tiempo de incubación y la duración del período larvario y en Caudata, el tiempo de incubación fueron invariantes del tipo II. En los reptiles, sin embargo, solo el número de nidadas por año fue invariante (tipo II). Todas estas diferencias podrían reflejar que en el tamaño corporal de los reptiles y en los anfibios, la metamorfosis de Anura y Caudata (las especies neoténicas no la atraviesan) y la tendencia hacia la independencia del desarrollo de huevos y larvas del agua restringieron adicionalmente la evolución de la historia de vida. Además, demostramos que todos los criterios de invariancia funcionaron para los rasgos del ciclo de vida de los anfibios y reptiles, aunque corroboramos algunas limitaciones conocidas e identificadas para su aplicación.


Aspectos evolutivos y moleculares de la proteína de la capa del virus del rizado de la hoja del tomate indio

Tomato leaf curl disease (ToLCD) is manifested by yellowing of leaf lamina with upward leaf curl, leaf distortion, shrinking of the leaf surface, and stunted plant growth caused by tomato leaf curl virus (ToLCV). In the present study, using computational methods we explored the evolutionary and molecular prospects of viral coat protein derived from an isolate of Vadodara district, Gujarat (ToLCGV-[Vad]), India. We found that the amino acids in coat protein required for systemic infection, viral particle formation, and insect transmission to host cells were conserved amongst Indian strains. Phylogenetic studies on Indian ToLCV coat proteins showed evolutionary compatibility with other viral taxa. Modeling of coat protein revealed a topology similar to characteristic Geminate viral particle consisting of antiparallel β-barrel motif with N-terminus α-helix. The molecular interaction of coat protein with the viral DNA required for encapsidation and nuclear shuttling was investigated through sequence- and structure-based approaches. We further emphasized the role of loops in coat protein structure as molecular recognition interface.

1. Introducción

Tomato leaf curl virus (ToLCV) is one of the most devastating causal agents of tomato (Solanum lycopersicum) crop which had emerged causing damage and encroaching new areas in tropical and subtropical continents every year. Plant-infecting geminiviruses belong to the family Geminiviridae in which Begomovirus is one among the genera possessing both mono- and bipartite genomes that infect especially dicotyledonous plant species [1]. The disease is marked by symptoms such as yellowing of leaf lamina with upward leaf curl as well as distortion, reduction in internodes, new leaves size reduction, wrinkle facade, stunted growth, and dissemination of flower from plant before onset of fruiting. ToLCV is primarily transmitted by sweet potato whitefly (Bemisia tabaci) and silver leaf whitefly (also called Biotype B Bemisia argentifolii). Whiteflies harboring virus can nonspecifically infect a wide spectrum of plant crops and weeds including eggplant, potato, tobacco, pepper, and common bean. Infected plants seem healthy but develop symptoms leading to enormous economic loss [2].

In Indian subcontinent, ToLCV is a major problem for tomato-growing regions as several reports on new strains have been documented including New Delhi, Lucknow, Bangalore, Varanasi, Mirzapur, Vadodara, and so forth and posed a threat to crop productivity [6]. Indian ToLCV isolates are mostly monopartite (DNA-A) in nature with few isolates possessing bipartite (DNA-A and DNA-B) genome organization such as tomato leaf curl New Delhi virus (ToLCNDV) and tomato leaf curl Palampur virus (ToLCPalV) [7]. Both DNA-A and DNA-B are single-stranded (ss) DNA genomes of approximately 2.7 kb size and encode viral factors essential for viral replication, encapsidation, transmission, and systemic spread [8]. Jyothsna et al. 2012 reported tomato leaf curl Gujarat virus (ToLCGV) possesses monopartite genome and is infectious expressing systemic symptoms in Nicotiana benthamiana and tomato [9]. An increased symptom severity and shortened incubation period required for symptom expression was noticed when ToLCGV was coinoculated with betasatellite of tomato yellow leaf curl virus Thailand (TYLCTHB) resulted in yellow mottling [9]. The molecular relationship of ToLCGV-[Vad], an isolate from Vadodara district of Gujarat, with other strains revealed that it belongs to Old World Begomoviruses and established a closely related cluster with other North Indian strains including ToLCGV-(Varanasi)-[Var] and ToLCGV-(Mirzapur)-[Mir] based on the DNA-A sequence alignment [10].

The measure “breeding for resistance” conceptualizes the introduction of resistance genes found in wild tomato species into tomato cultivars to develop resistance against diseases. Kunik et al. 1994 demonstrated that tomato plants transformed with TYLCV coat protein were found to be virus-resistant [11]. In India, Agrobacterium tumefaciens mediated transformation of coat protein gene was carried out to develop ToLCV tolerant/resistant transgenic tomato plants under glass house conditions [12]. Transgenic tomato plants containing cucumber mosaic virus coat protein gene was also successfully transformed [13]. An asymmetric synergism and virulent pseudorecombinant between ToLCNDV and ToLCGV was reported by Chakraborty et al. 2008 and found enhanced pathogenicity when tested in N. benthamiana, N. tabacum, y S. lycopersicum [14]. An evidence for natural recombination was observed between tomato leaf curl Bangalore virus (ToLCBV), ToLCBV [Ban 5], and ToLCBV [Kolar] and examined the possibility of recombination between strains/species that coexist within the same geographical location [15]. Hence, tremendous consideration should be given to study the biological and molecular properties of this newly emerging causal agent.

In the present study, we examined the evolutionary and molecular prospects of ToLCGV-[Vad] coat protein. Sequence analysis of coat protein revealed that amino acids essential for systemic infection, viral particle formation, and insect transmission to host cells were evolutionarily compatible when compared to non-Indian isolates giving clues of evolutionary conservativeness. Further, molecular modeling of coat protein provided a topology similar to characteristic Geminate viral particle. Electronic properties of coat protein facilitated its interaction with viral DNA with the loop element acting as molecular recognition interface which is one of the major findings of the present study.

2. Materiales y métodos

2.1. Protein Sequence Retrieval

The coat protein of ToLCGV-[Vad] (accession no. AAL78666.1) was retrieved from NCBI database (http://www.ncbi.nlm.nih.gov/) [16]. Coat proteins from Indian strains (Bangalore-CAA88227.1, Bangalore (Ban4)-AAD51286.1, Bangalore (Ban5)-AAK19178.1, Bangalore (Kolar)-AAL26553.1, Varanasi-AAO25668.1, Kelloo-AAM21566.1, Karnataka-AAB08929.1, New Delhi (Mild)-AAA92817.1, and Lucknow-CAA76209.1) were also obtained for multiple sequence alignment and phylogenetic analysis.

2.2. Protein Family Classification

The family of coat protein was studied using a combination of programs, namely, NCBI CD- Search (http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi, database searched: CDD v3.03–42251 PSSMs) [17], PSI-BLAST (http://blast.ncbi.nlm.nih.gov/Blast.cgi) [18], and Pfam (http://pfam.sanger.ac.uk/) [19]. CD-Search is a NCBI’s interface to search Conserved Domain Database (CDD) which utilizes RPS-BLAST (Reverse-PSI-BLAST a variant of PSI-BLAST) to scan a set of precalculated position specific scoring matrices (PSSMs) using a protein query. PSI-BLAST (position-specific-iterated BLAST) uses initial matches to query sequence to build scoring matrix and appends additional matches to the matrix by an iterative search method in order to detect remote homologs. Pfam designates protein family by HMM (Hidden Markov Model)-based search (default settings were chosen and Pfam-A significant matches were only considered) over known protein family classifiers.

2.3. Analysis of Nuclear Localization Signal and Its Prediction

Nuclear localization signals (NLSs) were predicted using cNLS Mapper (http://nls-mapper.iab.keio.ac.jp/) [20] as coat protein that is known to be karyophilic [21]. cNLS Mapper is a computer program that predicts NLS by activity-based profile search and an additivity-based motif scoring function in different classes of importin-α/β pathway-specific NLS. The prediction was made with a score cut-off of 5.0 and searched for both mono- and bipartite NLSs with a long linker (13–20 amino acid length) as ToLCGV possesses mono-bipartite genome organization [6]. Classic NLS typically rich in basic amino acids such as lysine and arginine, the counts of basic amino acids was performed manually in the above predicted NLSs. Comparison with literature-reported NLS specific to BR1 nuclear export family was carried out to examine the pattern of nuclear localization. This was achieved using pairwise sequence alignment using EMBOSS Stretcher (http://www.ebi.ac.uk/Tools/psa/emboss_stretcher/) [22] with a representative family protein member (BR1 nuclear shuttle protein from squash leaf curl virus(SqLCV) NCBI accession No. NP_047247.2) against the coat protein of study. Both sequences were aligned using EBLOSUM62 scoring matrix with a gap opening and extending penalty of 12 and 2.

2.4. Multiple Sequence Alignment and Phylogenetic Analysis of Coat Proteins

Coat protein sequences of Indian strains were used for the analysis of multiple sequence alignment (MSA). MSA was performed using EBI ClustalW program (http://www.ebi.ac.uk/Tools/msa/clustalw2/) [23] in which the sequences were aligned pairwise initially (gap open penalty = 10, gap extension penalty = 0.1, matrix = Gonnet) and then the best local pairs (gap open penalty = 10, gap extension penalty = 0.20, matrix = Gonnet) were clustered by Neighbour-joining (NJ) technique. Subsequently, an alignment file in ClustalW format was generated and specified as input to draw phylogenetic tree using Phylip version 3.68 package (http://evolution.genetics.washington.edu/phylip/) [24]. NJ algorithm was used to draw tree with inclusion of branch length.

2.5. Structure Modeling of Coat Protein

Sequence-based similarity searching was initially executed in NCBI nonredundant (NR) database using BLASTp program (http://blast.ncbi.nlm.nih.gov/Blast.cgi) [25] with default settings to find a close homolog with known 3D protein structure information is known. Similarly, BLAST based homolog search in RCSB Protein Data Bank (PDB http://www.rcsb.org/pdb/home/home.do) [26] was also carried out. Both of these procedures yielded no close homologs. So, we opted to model the coat protein using homology domain modeling and remote-based homology modeling.

2.6. Disorderness Prediction

In order to characterize regions of sequences in coat protein which can be efficiently modeled, disorderness prediction was made. Disordered residue was identified using DISOPRED server (http://bioinf.cs.ucl.ac.uk/disopred/) [27] with a filter threshold of 5% and a false positive threshold of 2%. The disorderness is predicted by scanning the available sequence records in the PDB and then matches the electron density map to identify the missing coordinates. As a result, atomic coordinates of such amino acids will not be available for modeling of the protein and has the greater possibility of producing an irregular loop region in the modeled coat protein. Thus, manual search (only at the N-and C-terminals) for disordered sequence window in DISOPRED predictions was performed with the intention of excluding the corresponding region for modeling the coat protein. It was also ensured that disordered residue reported in the intervening sequence positions was left out so that the structure model did not possess any gaps.

2.7. Homology Domain Modeling

Robetta server (http://robetta.bakerlab.org/) was used for modeling the coat protein in which Ginzu, a hierarchical domain parsing and modeling protocol was adopted [28]. The input sequence (coat protein excluded with disorderness) was initially searched using BLAST, PSI-BLAST, FFAS03 (http://ffas.burnham.org/), and 3D-Jury (http://meta.bioinfo.pl/) to obtain information on homologous regions which are then modeled with their comparative modeling protocol. Unassigned (i.e., nonhomologous as identified in the first stage) regions were then parsed to model as domain linkers using a combination of approaches, namely, HMMER search (http://hmmer.janelia.org/) over Pfam-A database and an MSA (produced from initial PSI-BLAST results) based search over NCBI NR database. Subsequently, K*Sync alignment method was utilized to predict elements that are obligated to the fold to produce a single default alignment by dynamic programming. Best five models were generated after loop modeling, domain assembly, and side-chain packing.

2.8. Remote-Based Homology Modeling

Efforts were also carried out to predict structure of coat protein using remote-based homology modeling approach with the help of protein homology/analogy recognition engine (Phyre) version 2.0 (http://www.sbg.bio.ic.ac.uk/phyre2/) [29]. In the first step, profile was constructed using five iterations of PSI-BLAST against NR sequence database. The query secondary structure was predicted using three independent prediction programs (PSI-PRED (http://bioinf.cs.ucl.ac.uk/psipred/), SSPro (http://download.igb.uci.edu/sspro4.html) and Jnet (http://www.compbio.dundee.ac.uk/Software/JNet/jnet.html)) and a consensus prediction was made consequently. This profile and secondary structure were then scanned against the fold library using a profile-profile alignment algorithm to generate 3D models. Followed by a reconstruction procedure in the last stage, side-chains are packed using rotamer library and best models (selected based on confidence and sequence coverage) were returned.

2.9. Energy Minimization and Structure Validation of Models

The modeled structures were energy minimized using a utility in Tripos Benchware 3D Explorer (academic version Tripos: A Certara company, http://www.tripos.com/) [30] with AMBER7 force field. Modeled structures were then validated for structure correctness and stereochemistry using Ramachandran plot [31] from RAMPAGE server (http://mordred.bioc.cam.ac.uk/

rapper/rampage.php) [32]. Based on the percentage of favourness and frequency of outliers, the models were selected and used for further analysis.

2.10. Prediction of Sequence- and Structure-Based DNA Binding Properties

In vitro studies showed that coat proteins from Geminiviridae family bind nonspecifically with both ss- and ds-viral DNA [21, 33, 34]. To elucidate the role of DNA binding abilities of coat protein, sequence- and structure-based approaches were used. BindN (http://bioinfo.ggc.org/bindn/) employs support vector machines (SVMs) trained from data instances such as side chain

value, hydrophobicity index, and molecular mass of an amino acid [35]. A specificity of 80% with a filter threshold of 5% was chosen to avoid overwhelmed predictions. PreDs (http://pre-s.protein.osaka-u.ac.jp/preds/) makes use of molecular surface to evaluate electrostatic potential, local, and global curvatures of the PDB queried structure to predict potential dsDNA binding sites [36]. The modeled coat protein was defined as input with validation chosen from scoring functions.

2.11. Viral DNA Structure Modeling and Docking with Coat Protein

Canonical viral DNA was modeled using 3D-DART (3DNA-Driven DNA Analysis and Rebuilding Tool http://haddock.chem.uu.nl/dna/dna.php) web service with default introduction of parameters for bends (roll, tilt, and twist) [37]. It uses 3DNA “fiber” module to generate canonical DNA structure and “find_pair” and “analyze” modules to produce a corresponding base pair (step) parameter file. The parameter file was used to set up local and global bends in the DNA structure file which are then remodeled finally using “rebuild” component to return PDB formatted DNA structure file. The docking phase was carried out using HADDOCK (High Ambiguity Driven biomolecular DOCKing http://haddock.chem.uu.nl/) program [38] with the modeled coat protein and ds-viral DNA as inputs. Residues encompassed in a DNA binding region predicted by PreDs with a Parea of greater than

was specified as active site residues whereas passive residues were automatically defined around the active site which forms the boundary of the DNA-binding region. This specification was introduced to enhance the conformational search space for docking simulation as well as to avoid blindfold docking experiments. Definition of residues takes the form of experimental data which were converted into ambiguous interaction restraints (AIRs) in order to generate topology of the structures subsequently. The docking procedure consists of three stages: an energy minimization in a rigid-body manner, a semiflexible refinement in torsional space, and a final refinement in explicit solvent. After execution of each of these stages, the resultant structures are scored and ranked and the best fitted structures are employed in next stages. The best docked conformation can be obtained (usually clustered at the top) by inspecting the HADDOCK score which is a summation of intermolecular energies, namely, van der Waals (vdW), electrostatic (Elec), desolvation (Dsolv) and AIRS together with buried surface area (BSA): rigid-body score = 1.0 * Elec + 1.0 * vdW−0.05 * BSA + 1.0 * Dsolv + 1.0 * AIR final score = 1.0 * Elec + 1.0 * vdW + 1.0 * Dsolv + 1.0 * AIR.

2.12. Generation of Electrostatic Potential Map for Docked Structures

The influence of electrostatics for enabling DNA-protein interaction was studied using continuum Poisson-Boltzmann (PB) electrostatic approach. It was achieved by PBEQ-Solver (PBEQuation-Solver http://www.charmm-gui.org/?doc=input/pbeqsolver) [39] for which PQR files were required as molecular inputs. Hence, the docked complexes in PDB format were converted into PQR format using PDB2PQR server (http://nbcr-222.ucsd.edu/pdb2pqr_1.8/) [40]. PQR format embodies the replacement of occupancy column in a PDB file (“

”) and the temperature factor column with the atomic radius (“

”). The inputted PDB file was subjected to following structural manipulations: rebuilding missing heavy atoms, building and optimizing hydrogens and assignment of atomic charges and radii based on force field parameters from CHARMM22 (selected option), AMBER99 or PARSE. All the PB calculations on PBEQ-Solver were performed in a coarse grid space (before focusing = 1.5 and after focusing = 1.0 ) and utilized molecular surface (computed with a probe radius of 1.4 ) to set up the dielectric boundary. The resultant electrostatic potential grid map in data explorer (

) format was recovered and specified as input to PyMol version 2.5 program (academic version Schrodinger LLC) [41] to view the PBEQ electrostatic map.

3. Resultados y discusión

3.1. Prediction of Protein Family of Coat Protein

The protein family of ToLCV coat protein was predicted using a combination of programs. NCBI CD-Search using protein sequence revealed that it belongs to Gemini-coat protein superfamily (Pfam entry: pfam00844, accession no. Q8QYY9). Upon carefully examining the sequence alignment generated (mi-value: 5.53e-100 bit score: 290.36) with SqLCV BR1 nuclear shuttle protein, it was studied that ToLCGV belongs to nuclear export factor BR1 family (Figure 1). BR1 is a ssDNA binding protein that shuttles between the nucleus and cytoplasm in plant cells [33].


Sequence alignment of ToLCGV-[Vad] coat protein with nuclear export factor of BR1 family (Pfam entry: 00844 recovered from NCBI CDD) and HMM profile of the geminivirus coat protein.

PSI-BLAST sequence hit (PSI-BLAST threshold: 0.005 maximum iterations: 7 mi-value: 1e-105 bit score: 383 sequence coverage in alignment: 99.64%) with a capsid protein of Begomovirus taxa (UniRef90 P03560 tomato golden mosaic virus) was observed. Further, sequence-based query over Pfam-A (Pfam-B not chosen as we focused on obtaining highly curated data) database produced a result similar to NCBI CD-Search. This HMM-based search provided an alignment with an mi-value of 2.3e-87 and bit score of 292.1 (Figure 1). Manual inspection of PubMed references in the pfam00844 entry in NCBI CDD disclosed that coat proteins of Geminiviridae family binds ss- and ds-viral DNA in vitro [42]. For instance, TYLCV coat protein [43], maize streak virus (MSV) coat protein [21], SqLCV nuclear shuttle protein [44], and bean dwarf mosaic geminivirus(BDMV) movement protein [34] have the same function of binding which helps them to establish infection by nuclear shuttling of viral DNA across cell boundaries. Besides, coat protein also possesses binding function necessary for encapsidation of viral DNA. It is well known that the genomic component DNA-B in bipartite Begomovirus such as ToLCNDV encodes two movement proteins, namely, nuclear shuttle protein (NSP) and cell-to-cell movement protein (MP) that direct the viral genome to the cortical cytoplasm and across the barrier of the cell wall for infection multiplication [45]. On the other hand, monopartite Begomovirus including ToLCGV [9] produces coat protein and other associated proteins to alleviate movement inside the host while coat protein acts as nuclear shuttler facilitating import and export of DNA [46]. Therefore, it is anticipated that coat protein of ToLCGV may also function as nuclear shuttler.

3.2. Prediction of NLS in the Coat Protein Sequence

Mutagenesis study on MSV coat protein [4] and TYLCV [5] NLS region resulted in the cytoplasmic accumulation of the mutant protein. Thus, ToLCV coat protein must possess a NLS region in its sequence in order to be translocated to nucleus. A NLS signal was predicted with a score 10.2 by the cNLS Mapper in the coat protein N-terminal with a composition of 20 amino acids (predicted bipartite NLS: MSKRPADMLIFTPASKVRRR, predicted monopartite NLS: none).

The occurrence of basic amino acids in the predicted NLS showed that lysine and arginine constituted 2 and 4 counts which proposed to have a classic NLS pattern (Table 1) and can be comparable to experimentally identified TYLCV coat protein NLS [5] (Figure 2(a)). Despite the impressive number of receptor-cargo interactions that have been studied, the prediction of NLSs in candidate proteins remains extremely difficult. So, we step forwarded our search in scientific literatures related to BR1 nuclear export family in order to infer the predictions made. Pairwise sequence alignment of NLS region from MSV and ToLCGV-[Vad] coat proteins resulted in an identity and similarity percentage of 25% and 33.3% with a score of −6 whereas TYLCV and ToLCGV-[Vad] yielded an identity and similarity percentage of 51.7% and 58.6% with a score of 49. This pairwise alignment suggested that ToLCV coat protein is much more conserved with TYLCV rather than SqLCV [3] (identity and similarity = 15%, score = −20), a representative protein member of BR1 family (pfam00844) in Pfam database.

OrganismoPredicted NLS patternFrequency of lysine residuesFrequency of arginine residues
SqLCV coat protein
KRSYGAARGDDRRRP
(Sanderfoot et al., 1996 [3])
15
MSV coat protein
MSTSKRKRGDDSNWSKRVTKKKPS
(Liu et al., 1999 [4])
6
3
TYLCV coat protein
MSKRPGDIIISTPVSKVRRRLNFDSPYSS
(Kunik et al., 1998 [5])
24
ToLCGV-


(a) MSA of predicted and experimental NLS of selected geminivirus coat proteins. (b) MSA of coat proteins from Indian and non-Indian strains corresponding to sequence region of interest containing the key amino acids (highlighted in larger fonts) required for systemic infection, viral particle formation, and insect transmission.
3.3. MSA and Phylogenetic Analysis of Indian Strains

ToLCV coat protein sequences from Indian strains were retrieved from NCBI database to construct MSA in order to study amino acids crucial in conserved domain and responsible for systemic infection, viral particle formation, and insect transmission. Norris et al. 1998 reported that a functional coat protein having amino acids in the following sequence positions, namely, Pro/Gln129, Gln/His134, and Glu/Asp152 on TYLCV isolates is essential for correct assembly of virions and transmission by the insect vector [47]. These key residues were identified by B. tabaci transmissibility studies in the field isolates of TYLCV-Sic (Sicily), TYLCV-Sar (Sardinia), and TYLCV-SicRv (engineered mutant of Sicily) [47]. Examination of corresponding positions in our MSA cluster revealed that Lys129, Ser/Thr134, and Asp151 (instead of 152nd position as a result of single residue deletion) were conserved amongst Indian strains in comparison to non-Indian isolates and are found to be wild-type. The comparison of chemical properties of the template with that of MSA showed that a positively charged amino acid (Lys129) was identified in the uncharged polar (Gln129) position. The second important residue (Ser/Thr134 in replacement with Gln/His134) was conserved in terms of polarity while a negatively charged residue (Glu/Asp152 Asp151) was preserved in the third crucial position (Figure 2(b)). This amino acids combination (Lys129, Ser/Thr134, and Asp121) is also conserved in coat proteins among different wild-type viruses, namely, tomato golden mosaic virus, tomato mottle virus-[Florida], sinaloatomato leaf curl virus, tomato leaf crumple virus, taino tomato mottle virus, abutilon mosaic virus-[Hawaii], bean golden mosaic virus-[Brazil], SqLCV and papaya leaf curl virus [47].

A phylogenetic tree based on NJ algorithm was constructed using Phylip version 3.68 to study the sequence conservativeness among Indian strains. Surprisingly, coat proteins characteristic from districts, namely, Vadodara, Varanasi, and Kelloo were clustered in a node with a branch length of 0.167. It should be noted that these members were representing different states in the Northern India contrasting to other members which were sufficiently diverged to each other. Besides the fact that Bangalore isolates were conserved among each other, they were distinct with one of the state member, Karnataka with a length of 0.011. Isolates from New Delhi and Lucknow were conserved as expected in terms of area nearness (Figure 3). The key amino acids required for biochemical functions were indeed conserved amongst each other with respect to the comparison using MSA made above.


3.4. Disorderness and Their Link with Predicted NLS

Disorderness was predicted in the coat protein to identify the sequence regions that cannot be modeled efficiently with the protein modeling procedures adopted by us. This scrutiny was taken to eliminate the loop region in the sequence terminals. Disorder profile produced with 5% filter threshold showed that a window with sequence positions from 1 to 50 was scattered with peaks demonstrating residue disorderness (Figure 4). This region corresponds to NLS in the N-terminal. There exists a relationship between the predicted NLS and the disorderness as the corresponding sequence position was predicted as loop region with a variety of secondary structure prediction programs including PSI-Pred, GORIV, and so forth. So, we decided to exclude NLS signal from the protein sequence for modeling due to the consideration of disordered profile and the increased possibility of generating loop geometry.


Disordered profile of ToLCV coat protein with disorderness in the sequence positions 1–50 which contains predicted NLS.
3.5. Structure Modeling of Coat Protein

No close template was obtained in an attempt to find structurally known homolog of ToLCV coat protein using BLASTp and sequence based BLAST search in PDB with default settings. Therefore, we decided to use homology domain modeling using Robetta program and remote-based homology modeling using Phyre program.

After evaluation of predictions related to secondary structure features, Ginzu, a domain parser of Robetta modeled two domains with a sequence span of 1–59 and 60–235 using Pfam and HHSearch as sources. K*Sync alignment method was employed subsequently to generate structurally good scoring decoys followed by loop modeling, domain assembly, and side-chain packing. This procedure yielded five models. Remote-based homology modeling using Phyre provided a model based on the Nucleoplasmin-like/viral protein (viral coat and capsid proteins) as folding unit (PDB ID: 2BUK chain A structure of satellite tobacco necrosis virus after crystallographic refinement at 2.5 resolution) [48] derived from satellite virus with a confidence of 97.3. Fortunately, Robetta used the same structural template for models generation. Phyre provided a list of other models sorted by its confidence level were found to only range from 8.03 to 23.9.

3.6. Selection of Best Scoring Models

A total of six coat protein models (five obtained from Robetta program and one from Phyre program) were subjected to energy minimization with AMBER7 force field and 250 as maximum number of evaluations using minimize energy module engineered in Tripos Benchware 3D Explorer. Energy minimized structures were then validated using stereochemistry check with the help of Ramachandran plot. The Robetta model (energy minimized to −2682.00 Kcal/mol) was chosen based on the residue occurrence of more than 95% estimated by summing up favorable and allowed regions (Figure 5) in

core areas and the presence of only one outlier (Glu204) whereas the best scored Phyre model was discarded due to the loose packing of loop regions and its close resemblance to Robetta model (root mean squared deviation (RMSD): 20.8578 over 1041 matched atoms). There is one more reason to unconsider the Phyre model as the N-terminus was constituted with loop elements, two helices in the intervening region (two helices expected at the N-terminal) and eleven β-strands (only eight were expected instead of eleven) as it was not complied with characteristic Geminate viral particle. So, we discarded these models for further analysis.


3.7. Resemblance to Geminate Viral Particle

The modeled ToLCV coat protein was compared with the structure of the MSV Geminate particle, a member of Geminiviridae family determined using cryo-electron microscopy and three-dimensional image reconstruction methods [49]. The modeled protein possessed an N-terminal helix with an eight-stranded antiparallel β-barrel motif characteristic of Geminate particle. los β-barrel motif is a dominant structural unit in all ssDNA virus structures that have been determined to atomic resolution. Unlike the model generated by Zhang et al. 2001 [49], our Robetta model has 7 reliable and 1 short (total 8 strands) antiparallel β-strands and 2 helices at the N-terminal instead of 1 in comparison to Zhang’s Geminate model. We also noticed 1 helix at the intervening region (Figure 6). We expected that this additional accumulation of secondary structural elements is beyond the evolution and may be an additional procurement in the dsDNA virus structures in disparity to ssDNA virus structures due to conservational pressures as described by Zhang et al. 2001 [49] or due to the insertional sequences or it may be due to the loop geometry as it was undistinguished by the present programs due to the nonavailability of experimental atomic information.


(a)
(B)
(a)
(B)


Ver el vídeo: LIBERALES VS CONSERVADORES (Mayo 2022).


Comentarios:

  1. Brasar

    Pido disculpas, pero, en mi opinión, no tienes razón. Estoy seguro. Vamos a discutir.

  2. Aoidh

    No estoy de acuerdo con lo que está escrito en tu primer párrafo. De dónde obtuviste esta información?

  3. Nochtli

    Tu idea será útil

  4. Tilton

    Por supuesto. Todo lo anterior es cierto.

  5. Southwell

    el pensamiento muy valioso



Escribe un mensaje