Sí, tal afirmación puede sorprenderte. Una vacuna es un líquido que se inyecta en la mano de una persona. ¿Qué tiene que ver el código fuente con eso?
Buena pregunta. Comenzaremos con una pequeña parte del mismo código fuente para la vacuna BioNTech / Pfizer, también conocida como BNT162b2 , también conocida como Tozinameran, también conocida como Comirnaty .
Primeros 500 caracteres del ARNm de BNT162b2.
En el corazón de la vacuna se encuentra este código digital. Tiene 4284 caracteres, por lo que puede caber en unos pocos tweets. Al comienzo del proceso de producción de la vacuna, alguien cargó este código en una impresora de ADN (sí), que, a su vez, convirtió los bytes del dispositivo de almacenamiento en moléculas de ADN reales.
Impresora de ADN Codex DNA BioXp 3200
De una máquina así, aparece una pequeña cantidad de ADN que, después de un procesamiento biológico y químico prolongado, se convierte en ARN en un vial con una vacuna. Una dosis de 30 μg contiene en realidad 30 μg de ARN. También tiene un inteligente sistema de empaquetado de lípidos (grasos) que entrega ARNm a nuestras células.
El ARN es una versión volátil del ADN, ya que se almacenó en la "memoria de trabajo". El ADN es como una memoria USB para la biología. El ADN es confiable, robusto e internamente redundante. Pero las computadoras tampoco ejecutan código directamente desde una unidad flash; antes de que todo comience, el código se copia en un sistema más rápido y flexible, pero también más frágil.
En las computadoras, esto es RAM, y en biología, es ARN. La similitud es impactante. A diferencia de la memoria flash, la RAM se degrada rápidamente si no se cuida con cuidado. La razón por la que la vacuna de ARN de Pfizer / BioNTech debe almacenarse a temperaturas muy bajas es la misma: el ARN es una flor delicada.
Cada símbolo de ARN pesa del orden de 0,53 × 10-21 gramos, es decir, una dosis de vacuna de 30 μg contiene 6 × 10 16 símbolos. En bytes, esto resultará en unos 25 PB, aunque en realidad la vacuna consta de 2000 mil millones de repeticiones de los mismos 4284 caracteres. El contenido real de la vacuna es de poco más de un kilobyte. El propio SARS-CoV-2 tiene un volumen de aproximadamente 7,5 KB.
Referencia rápida
El ADN es un código digital. Pero a diferencia de las computadoras que usan 0 y 1, usa los caracteres A, C, G y U / T ("nucleótidos", "nucleósidos" o "bases").
En las computadoras, 0 y 1 se almacenan en forma de presencia / ausencia de carga, corriente, unión magnética, voltaje, modulación de la señal o cambios en la reflexividad. En resumen, los 0 y los 1 no son abstracciones, viven en forma de electrones y muchas otras encarnaciones físicas.
En la naturaleza, A, C, G y U / T son moléculas almacenadas en ADN (o ARN) en cadenas.
En las computadoras, los 8 bits se agrupan en bytes y los datos generalmente se procesan por bytes.
La naturaleza agrupa tres nucleótidos en codones, que son las unidades típicas para procesar información genética. El codón contiene 6 bits de información (2 bits por símbolo de ADN, 3 caracteres = 6 bits). Esto significa que el codón puede tomar 2 6 = 64 valores diferentes.
Hasta ahora, todo es bastante digital. Quienes dudan pueden consultar el documento de la OMS que contiene el código digital.
Entonces, ¿qué hace este código?
La idea detrás de una vacuna es enseñar a nuestro sistema inmunológico a combatir un patógeno sin enfermarse realmente. Históricamente, para esto, se introducía en el cuerpo un virus debilitado o que no funcionaba, junto con un agente auxiliar, con el fin de vigorizar adecuadamente el sistema inmunológico, obligándolo a actuar. Era principalmente tecnología analógica, que utilizaba miles de millones de huevos (o insectos). También requirió mucha suerte y mucho tiempo. A veces, se utilizó un virus completamente diferente para esto.
El ARNm logra el mismo resultado (entrenamiento del sistema inmunológico), pero mucho más inteligente, como si se usara una mira láser. En todos los sentidos: un impacto estrecho pero poderoso.
Así es como funciona. La preparación contiene material genético inestable que describe la famosa proteína "pico" SARS-CoV-2. A través de reacciones químicas inteligentes, la vacuna entrega este material genético a algunas de nuestras células.
Luego, obedientemente, comienzan a producir las proteínas SARS-CoV-2, cuya cantidad es lo suficientemente grande como para iniciar nuestro sistema inmunológico. Frente a las proteínas de la espiga y los signos característicos de la infección celular, desarrolla una potente respuesta a las diversas propiedades de la proteína de la espiga y al proceso de su reproducción.
Así es como funciona la vacuna con una efectividad del 95%.
¡Fuente!
Empecemos por el mejor lugar, desde el principio. El documento de la OMS tiene la siguiente imagen útil:
Es una especie de contenido. Comencemos con el elemento "gorra", que está diseñado en forma de sombrero [eng. gorra - gorra, gorra, sombrero].
Así como en una computadora no se pueden escribir códigos de operación en un archivo y ejecutarlo, un sistema operativo biológico requiere encabezados, enlazadores y algo así como reglas de nomenclatura de variables.
El código de la vacuna comienza con los siguientes dos nucleótidos:
Georgia
Comparable a cualquier ejecutable de DOS y Windows que comience con los caracteres "MZ", o scripts de UNIX que comiencen con "#!". Tanto en la vida como en los sistemas operativos, estos dos personajes no se ejecutan. Pero deben estar allí, de lo contrario nada funcionará.
El encabezado de ARNm tiene varias funciones. Señala, por ejemplo, que el código proviene del kernel. En nuestro caso, este no es el caso: el código proviene naturalmente de la vacuna. Pero la célula no necesita saber esto. El sombrero le da credibilidad al código, protegiéndolo de la destrucción.
Además, los dos nucleótidos GA originales son químicamente ligeramente diferentes del resto del ARN. En este sentido, el GA incorpora una especie de señalización fuera de banda.
Región de cinco barras sin traducir
Un poco de jerga. Las moléculas de ARN se leen en una sola dirección. Un poco confuso es que la lectura comienza desde la parte llamada 5 ' . Y termina en la parte 3 '.
La vida está hecha de proteínas (y todo lo que está hecho de ellas). Estas proteínas se describen en ARN. La transformación de ARN en proteína se llama traducción .
A continuación, daré una región no traducida (UTR; región no traducida, UTR) 5 ', es decir, esta parte no pasa a la proteína:
GAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACC
Aquí nos espera la primera sorpresa. Los símbolos habituales para el ARN son A, C, G y U. En el ADN, U también se conoce como T. Pero luego aparece una especie de Ψ, ¿qué sucede?
Esta es una de las propiedades extremadamente complicadas de la vacuna. Nuestro cuerpo tiene un poderoso sistema antivirus. Gracias a ella, las células son extremadamente escépticas con respecto a los ARN extraños y se esfuerzan por destruirlos antes de hacer algo.
Este es un problema para una vacuna: debe pasar por nuestro sistema inmunológico. Durante muchos años de experimentos, se descubrió que si la U en el ARN se reemplaza con una molécula ligeramente modificada, nuestro sistema inmunológico pierde interés en ella. En absoluto.
Por lo tanto, en la vacuna BioNTech / Pfizer, cada U se reemplaza por 1-metil-3'-pseudouridina, que se denota por Ψ. El truco aquí es que, aunque tal reemplazo pacifica nuestro sistema inmunológico, las partes necesarias de las células lo perciben como una U ordinaria.
Este truco también se conoce en seguridad informática. A veces es posible transmitir una versión ligeramente distorsionada del mensaje que confunde a los firewalls y los sistemas de seguridad, pero es aceptada por los servidores back-end. Y luego pueden ser pirateados.
Hoy cosechamos los frutos de la investigación científica fundamental del pasado. Las personas que descubrieron esta Ψ-tecnología tuvieron que luchar para encontrar financiación y ganar reconocimiento. Deberíamos estarles agradecidos por esto, y estoy seguro de que el Premio Nobel eventualmente los encontrará .
, Ψ-, ? , . , 1--3'-. , , . , Ψ .
Volvamos a nuestro 5 'NTO. ¿Qué hacen estos 51 símbolos? Como casi todo en la naturaleza, no tienen una única función clara.
Cuando las células necesitan traducir el ARN en proteínas, se enciende una máquina llamada ribosoma. El ribosoma es como una impresora 3D de proteínas. Absorbe una parte de ARN y, sobre su base, libera una cadena de aminoácidos, que luego se dobla en proteína .
Este proceso se muestra en el video. La franja oscura de abajo es ARN. La raya en el fondo verde es la proteína formadora. Los gizmos entrantes y salientes son aminoácidos y adaptadores que les permiten encajar en el ARN.
Para que el ribosoma funcione, necesita asentarse físicamente sobre una pieza de ARN. Después de eso, puede comenzar a formar proteínas basándose en información proveniente de otros segmentos de ARN. Es decir, no puede leer las partes en las que primero necesita aterrizar. La "orientación" es proporcionada por NTO.
Además, la NTO contiene metadatos: ¿cuándo debe realizarse la transmisión? ¿Cuánto cuesta? Para la vacuna, los científicos encontraron una NTO, en la que el comando de transmisión se registró lo antes posible. Ella viene de gen alfa globina . Este gen es conocido por la producción confiable de grandes cantidades de proteínas. En el pasado, los científicos ya encontraron la oportunidad de optimizar aún más este UTR, por lo que se utilizó algo mejor para la vacuna, no un UTR de la alfa globina.
Secuencia señal de la glicoproteína S
Como se señaló, el objetivo de la vacuna es lograr que la célula produzca la proteína de pico SARS-CoV-2 a escala industrial. Hasta ahora, nos hemos ocupado principalmente de los metadatos y las convenciones de nomenclatura en el código fuente. Y ahora estamos entrando en territorio de proteínas virales.
Sin embargo, primero debemos pasar por otra capa de metadatos. Después de que el ribosoma (de la gran animación de arriba) produce una proteína, todavía necesita llegar a alguna parte. Este está codificado en la secuencia señal (péptido) de la glicoproteína S (en la secuencia líder extendida ).
Al comienzo de la proteína hay algo así como una etiqueta de dirección, codificada en la misma forma que la proteína completa. En este caso, la secuencia señal dice que la proteína debe salir de la célula del retículo endoplásmico . ¡Incluso Star Trek no tenía una jerga tan genial!
La secuencia de la señal no es muy larga, pero el ejemplo de código muestra la diferencia entre el ARN del virus y la vacuna. Para facilitar la comparación, reemplacé Ψ con la U habitual de ARN:
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Virus: AUG UUU GUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU
Vacuna: AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUU
! ! ! ! ! ! ! ! ! ! ! ! !
No estoy agrupando accidentalmente ARN por tres símbolos. Estos símbolos forman codones. Y cada codón codifica un aminoácido específico. La secuencia señal de la vacuna consta exactamente de los mismos aminoácidos que el propio virus.
¿Por qué el ARN es diferente?
Puede haber 4 3 = 64 codones , ya que el ARN tiene 4 símbolos, tres de los cuales forman un codón. Al mismo tiempo, solo hay 20 aminoácidos diferentes y resulta que varios codones codifican el mismo aminoácido.
Life utiliza la siguiente tabla, casi universal, para mapear codones de ARN en aminoácidos:
La tabla muestra que las modificaciones de la vacuna (UUU -> UUC) son sinónimos. El código de ARN de la vacuna es diferente, pero el resultado son los mismos aminoácidos y proteínas.
Un examen detenido muestra que la mayoría de los cambios están contenidos en el tercer codón, marcado con el número 3. Al comprobar la tabla de codones universales, veremos que esta tercera posición a menudo no afecta qué aminoácido se obtiene al final.
Pero si los cambios son sinónimos, ¿por qué son necesarios? Si observa detenidamente, todos los cambios menos uno aumentan el número de C y G.
¿Por qué es necesario? Como ya se señaló, nuestro sistema inmunológico es muy escéptico sobre el ARN "externo", es decir, el código que proviene del exterior de la célula. Para evitar la detección, ya hemos reemplazado U con Ψ.
Sin embargo, resulta que el ARN con una gran cantidad de G y C se convierte en proteínas con mayor frecuencia y eficacia. Con este fin, muchos símbolos de la vacuna de ARN se han reemplazado por G y C siempre que ha sido posible.
Ardilla real
Los siguientes 3777 caracteres de ARN de la vacuna también están "optimizados por codones" con el objetivo de agregar más C y G. No daré el código completo aquí, pero estudiaremos una parte especial. Es gracias a él que la vacuna funciona; es esta parte la que nos ayuda a volver a la vida normal:
* *
LDKVEAEVQIDRLITG
Virus: CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC
Vacuna: CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC
LDPPEAEVQIDRLITG
! !!! !! ! ! ! ! ! ! !
Aquí nuevamente son visibles los cambios habituales de ARN. Por ejemplo, en el primer codón, CUU fue reemplazado por CUG. Esto agrega otra G a la vacuna, lo que ayuda a impulsar la producción de proteínas. CUU y CUG codifican el aminoácido L, o leucina, por lo que nada cambia en la proteína.
Al comparar la proteína de pico con la vacuna, podemos ver que todos los cambios son sinónimos similares, excepto dos. Ambos son visibles en este fragmento.
Los codones tercero y cuarto contienen cambios reales. Los aminoácidos K y V se reemplazan por P o prolina. En el caso de K, se necesitaron tres cambios ('!!!'), y en el caso de V, dos ('!!'). Resulta que estos dos cambios mejoran increíblemente la vacuna.
Entonces, ¿qué está pasando aquí? Si observa una partícula de virus real, verá que la proteína de la punta es un grupo de espinas: las
puntas están adheridas al cuerpo del virus ("proteína de la nucleocápside"). Pero nuestra vacuna solo genera estas espinas por sí mismas y no las unimos a ningún cuerpo viral.
Resulta que las proteínas de pico existentes por separado colapsan en una estructura completamente diferente. Si se introdujeran como parte de una vacuna, nuestros cuerpos habrían desarrollado inmunidad a ellos, pero solo a los de su tipo colapsado. El coronavirus real hace alarde de picos rectos. De esta forma, la vacuna difícilmente funcionaría.
¿Entonces que estamos haciendo? En 2017 se describiócómo la doble sustitución de la prolina en el lugar correcto hace que las proteínas SARS-CoV-1 y MERS S tomen su forma "original", incluso sin unión al virus. Todo gracias a la fuerza de la prolina. Este aminoácido funciona como una férula, estabilizando la proteína en el estado en el que necesitamos presentarla al sistema inmunológico. Las personas que
descubrieron esto ahora necesitan palmearse los hombros constantemente y sonreír constantemente. Y todo esto será bien merecido. Después de que se publicó el primer borrador del artículo, hablé con personas del laboratorio de McLeillan y me dijeron que hasta ahora se suspendieron las palmadas en los hombros debido a la pandemia, pero están orgullosos de su contribución a la vacuna. Y enfatizar la importancia de que otros grupos y voluntarios trabajen en él.
Fin de la ardilla y próximos pasos
Si se desplaza por el código fuente hasta el final, veremos pequeños cambios al final de la proteína de pico:
VLKGVKLHYT s
Virus: GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA
Vacuna: GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA
VLKGVKLHYT ss
! ! ! ! ! ! ! !
Al final de la proteína hay un codón de "parada", marcado con la letra s. Esta es una forma educada de indicar el final de la proteína. El virus en sí usa el codón UAA como parada y la vacuna usa dos codones UGA. Quizás por si acaso.
Área sin traducir 3 '
Así como al final del 5 'encontramos el 5'-UTR requerido para la guía del ribosoma, al final de la proteína encontramos un constructo similar, el 3'-UTR.
Hay muchas palabras para escribir sobre ella, pero prefiero citarlas de Wikipedia. “3'-UTR juega un papel crítico en la expresión génica, afectando la localización, estabilidad, exportación y eficiencia de traducción del ARNm. A pesar de todo nuestro conocimiento actual de las 3'-NTO, su trabajo sigue siendo en gran parte misterioso ".
Sin embargo, sabemos que ciertas 3'-UTR son muy exitosas en la mediación de la expresión de proteínas. Según un documento de la OMS, el 3'-UTR contenido en la vacuna BioNTech / Pfizer se deriva del "potenciador amino-terminal del ARNm escindido (AES) y del ARN ribosómico 12S codificado por mitocondrias para garantizar la estabilidad del ARN y una alta expresión de proteína total". ¿Qué puedo decir? Bien hecho.
Y el fin de todo, AAAAAAAAAAAAAAAAAAAAAA
El mismo final del ARNm está poliadenilado . Esta es una forma florida de decir que termina con un montón de secuencias AAAAAAAAAAAAAAAAAA. Aparentemente, 2020 incluso eliminó ARNm.
El ARNm se puede reutilizar muchas veces, pero pierde algunas "A" de su extremo. Tan pronto como se agote la "A", el ARNm dejará de funcionar y será descartado. En este sentido, la cola poli-A lo protege de la degradación. Se llevaron a cabo estudios especiales para determinar la cantidad óptima de "A" al final de las vacunas de ARNm. En fuentes abiertas, leí que llegaron a su número de 120 piezas más o menos.
La vacuna BNT162b2 termina el
****** **** UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
30 "A", luego "nucleótido enlazador-10" (GCAUAUGACU), seguido de otros 70 "A".
Sospecho que la optimización patentada se está utilizando nuevamente para mejorar la expresión de proteínas.
Salir
Ahora sabemos exactamente qué contiene la vacuna BNT162b2 y, en su mayor parte, entendemos por qué funciona de esta manera:
- Tapa CAP que hace que el ARN parezca ARNm normal.
- 5'-NTO bien conocido, probado y optimizado con éxito.
- Secuencia de señales con codones optimizados que envía la proteína de pico al lugar correcto (copiada del propio virus).
- Una variante de la proteína espiga original con codones optimizados, con dos sustituciones de prolina para garantizar la forma correcta de la columna.
- 3'-NTO bien conocido, probado y optimizado con éxito.
- Una cola un poco misteriosa de poli-A con una especie de "enlazador".
La optimización de los codones agrega muchos G y C al ARNm. Usar Ψ (1-metil-3'-pseudouridina) en lugar de U ayuda a engañar al sistema inmunológico. Gracias a él, el ARNm existe el tiempo suficiente para entrenar nuestro sistema inmunológico.