PESQUISAS BASADAS EN LA CIENCIA, por el Prof. Dr. D. Alberto Requena, académico numerario

albertorequena

Los científicos valoran más lograr la verdad que alcanzar cualquier reconocimiento o gloria humana. Es algo consustancial: razonar como científicos. Los métodos que aplican para descubrir cosas y tomar decisiones son muy útiles, no solo en su labor de científicos, sino en cualquier otro “empleo” que pudieran desempeñar. Es decir, que lo que saben como científicos, en áreas no científicas queda relegado en segundo plano con respecto a los métodos que aplican para desentrañar conocimiento. La Naturaleza digital de la identificación mediante el ADN es un método muy poderoso al permitir cuantificar precisamente las diferencias entre individuos y especies.

 

El carácter único del ADN es una valoración estadística. Podría repetirse una secuencia genética, dado el carácter azaroso del proceso, aunque siendo muy improbable, implicaría a un número de personas mayor que el número de átomos del Universo. El ADN se mantiene inalterado en la mayor parte de las células, desde la infancia a la vejez. El número de bases que forman la cadena del ADN es tan enorme que se puede cuantificar las que se comparten con familiares o con grupos de población afines, de forma que la paternidad y las relaciones genéticas se pueden establecer con garantía. La revolución que gestaron Watson y Crick propició que un gen se pueda aislar. La comparación de un conjunto de genes de los padres y los de un niño permite establecer la ascendencia. La huella del ADN es más individual que las tradicionales huellas dactilares y cualquiera otra conocida. En este estado de cosas, ¿cuáles son las razones para que las pruebas del ADN puedan ponerse en entredicho?

 

El primer elemento de sospecha se puede basar en los errores de que puede ser objeto la secuenciación. El error humano subyacente en la equivocación o derivado del sabotaje pueden considerarse como en cualquier otro medio de identificación. Un arma que han tocado personas inocentes, además del asesino, puede llevar a cometer errores de identificación. Claro que, en el caso de manejar el ADN, las cosas son más sensibles, dado que una contaminación con sudor del técnico que conduce la prueba, puede confundir el resultado. La amplificación, que técnicamente se denomina PCR (Polymerasa Chain Reaction), inventada en 1983 por Mullis, consistente en obtener un gran número de copias de un fragmento de ADN, partiendo de un mínimo, con lo que facilita la tarea de identificación, es necesaria y deseable, pero los errores también se amplifican.

 

Desde luego si todas las pruebas de ADN hubiera que desestimarlas por los errores potenciales, con la misma razón habría que prescindir de los otros tipos de procedimientos de identificación. Hay dos tipos de fuentes de error estadísticos que Dawking denomina falso positivo y falso negativo, que equivalen a un culpable que se libra porque no se le identifica y a un inocente se le condena por identificarse como similar del culpable. Cuando se efectúa una rueda de identificación, la probabilidad de error es inversamente proporcional al número de personas presentadas en la misma. Veamos la situación equivalente en el caso del ADN. Si se transcribiera la secuencia de genes completa de las dos muestras que se comparen, la probabilidad de error sería de uno en miles de millones (el genoma haploide tiene una longitud total de unos 3000 millones de pares de bases). Salvo en el caso de gemelos idénticos, la probabilidad de que las secuencias de ADN de dos humanos sean coincidentes es, prácticamente, nula. No se puede pretender repetir el esfuerzo que se ha desarrollado en el proyecto del genoma humano, para cada caso judicial que requiera una identificación mediante prueba del ADN. Se considera suficiente concentrarse en esas zonas del genoma que varían mucho en la población. El genoma contiene sectores variables. Hay muchas zonas que nunca se leen y, por tanto, no se traducen en las proteínas respectivas. Es como si una gran parte de nuestros genes no hiciera nada. Estas zonas son las apropiadas para las pruebas del ADN. Ello conlleva el peligro de que dos individuos fueran idénticos en esa porción de ADN examinado. Cuanto mayor sea la sección de ADN, menor será la probabilidad de error (lo que ocurre en cualquier procedimiento de identificación como la aludida rueda).

 

Si tratamos digitalmente la información contenida en el ADN, podemos medirla en bit y bytes, como la memoria de los ordenadores. En el ordenador, la base que soporta, físicamente, el bit, es una ferrita, semiconductor, soporte magnético, óptico o combinaciones de ambos, capaz de mantener dos estados (0 y 1) y manipularlos mediante programas. En el ADN hay cuatro bases y podemos considerar que los 0 los convertimos en las bases A o C, mientras que los 1 los convertimos en G o T. Si atendemos a ello, el numero de diferentes “arreglos”, para almacenar números o información textual se trata de variaciones con repetición de dos elementos A-C (0) o G-T (1) tomados de 3000 millones en 3000 millones, es decir: 2^(3000.000.000), que ocupan en torno a 1.000.000 micrometros. Una cantidad astronómica. Se han conseguido almacenar en un gramo de ADN, la friolera de 720.000 Gigabytes (700 Terabytes, 2^(40) bytes). Queda mucho todavía por lograr. La bacteria Esterichia Coli tiene una ADN de 4000 kb(kilobases) de longitud, lo que equivale a 1360 micrometros. En un virus bacteriófago T2, T4, T6 unos 166 kb de longitud y unos 55 micrometros y en el virus de la peste aviar unos 280 kb y 193 micrometros.

 

El caso es que, de en torno a las 3000 millones de bases (megabases) del genoma humano, solamente un 1% codifica proteínas, contenido en unos 21.000 genes que codifican 90.000 proteínas, según ha puesto de relieve el proyecto ENCODE, que también ha identificado unas 70.000 regiones que se ligan a proteínas para controlar la expresión de los genes, unas 400.000 regiones que regulan la expresión de los genes y unos 2.9 millones de regiones a las que se ligan proteínas, pero solamente unas 3.700 de estas regiones son compartidas por todas las células. Se le viene denominando a esta parte del ADN, “basura”, aunque, como podemos ver, se le van encontrando otras funciones de interés para el organismo. Gran parte del ADN no codificante, que no se expresa en proteínas, está implicado en funciones de regulación, por tanto puede estar relacionado con enfermedades. No obstante puede que partes del ADN basura, sigan sin tener sentido, por ser repeticiones de pautas complicadas, incluso. Es probable que parte del ADN siga sin tener utilidad en la supervivencia del animal, pudiendo ser útil para el que sobrevive y puede efectuar copias de sí mismo. Claro que el ADN que no se utilice es susceptible de variar, no asi los genes útiles que están muy limitados en su capacidad de cambio. Una mutación de un gen reduce su eficacia y en la mayoría de casos, el animal muere sin transmitirlo a su descendencia. Pero si la mutación tiene lugar en el ADN basura, es posible, incluso que se den en una zona de repeticiones y no sean advertidas por el mecanismo de la selección natural. Esto es lo que ha propiciado elegir esta parte del ADN, para efectuar las pruebas de ADN, dado que aquí es donde se sitúa la mayor parte de las variaciones. Es más, si las repeticiones son en doblete, resultan particularmente útiles, porque suponen una variación del número de repeticiones, y esto es relativamente fácil medirlo.

 

Jeffreys, de la Universidad de Leicester propuso examinar las repeticiones en doblete, porque cada persona tiene un número diferente de repeticiones en un lugar concreto. En cada región de repeticiones, cada uno de nosotros tenemos un número diferente de ellas. Esto es, como una huella dactilar. Nuestros padres nos las transmiten, ya que los cromosomas se heredan completos, incluyendo las zonas de repetición en doblete. Como cada uno de los cromosomas paternos se alinea con los maternos y se intercambian fragmentos, antes de que un cromosoma compuesto pase al espermatozoide que actúa engendrando, cada uno de ellos y cada óvulo tienen una mezcla única de genes maternos y paternos. Esto, naturalmente afecta, tanto a las secciones cromosómicas con sentido, como a las secciones con repeticiones en doblete. Esto supone que las repeticiones en doblete se heredan, como cualquier otra característica o rasgo. Solamente hay una diferencia y es que mientras que los rasgos, como el color de ojos, supone una respuesta conjunta de genes paternos y maternos, mientras que las repeticiones en doblete son propiedades de los cromosomas mismos y no se pueden medir por separado en los paternos y maternos. Es decir, en la región de repetición en doblete, hay dos posibles lecturas correspondientes al número de repeticiones del cromosoma paterno y al materno. En los cromosomas, pueden darse mutaciones (naturales, aleatorias) en el número de repeticiones en doblete, o bien puede darse una división por entrecruzamiento cromosómico y esto justifica que haya variación en el número de repeticiones en doblete dentro de la población.

 

La cuestión es la facilidad con la que podemos medirlo. Ni siquiera hace falta determinar la secuencia detallada de las bases del ADN. Se recurre a una técnica que recuerda la determinación de áreas mediante pesada del recorte de la figura. Veamos en qué consiste, por lo ingenioso del procedimiento. Se prepara una sonda de ADN, que consiste en una secuencia de unas 20 bases, que encaja con la secuencia de la zona de repetición en doblete. Hoy día es muy fácil conseguir esto, porque se producen secuencias cortas de ADN con cualquier especificación. Incluso se incorporan marcadores radiactivos, que facilitan el proceso. Otra herramienta necesaria es la llamada “enzima de restricción” que permite reconocer y cortar el ADN en determinados lugares. Su función es localizar una secuencia concreta en un cromosoma y cortar donde se encuentre otra secuencia preestablecida, con otra enzima de restricción. Normalmente, proceden de bacterias que hacen esto como acto de defensa. Si seleccionamos una enzima de restricción, cuya secuencia diana no figure en la zona de repetición en doblete, el resultado será que el ADN completo resultará cortado en fragmentos cortos que terminan en la secuencia especifica de la enzima de restricción. Bien, de esta forma, no necesariamente todos los fragmentos contendrán repeticiones en doblete, pero algunos sí y la longitud de los fragmentos tendrá relación con el número de repeticiones que contenga. La longitud se mide en una columna electroforética empleando gel de agarosa o acrilamida. Se vierte en la columna una disolución conteniendo los fragmentos cortados del ADN y al aplicar la corriente eléctrica los fragmentos resultan atraídos por el otro extremo (negativo) de la columna, desplazándose a través del gel. La velocidad de desplazamiento está relacionada con el tamaño de los fragmentos, viajando más deprisa los más pequeños. Al cabo de un tiempo la columna contendrá una distribución de fragmentos de todos los tamaños. Para visualizarlos se emplean las sondas radiactivas. Si se extiende el contenido de la columna sobre papel secante, que se ha rociado con una disolución de la sonda radiactiva especifica de la zona de repetición en doblete, objeto de análisis, el contenido resultará absorbido en el papel secante, pero las moléculas de la sonda radiactiva se alinean a lo largo del papel secante, emparejándose siguiendo las reglas del apareamiento de bases del ADN, con sus números opuestos en las repeticiones en doblete. Tras lavar el papel, solamente permanecerán las moléculas radiactivas enlazadas con sus opuestos exactos. Ahora aplicamos al papel rayos X, tras situarlo sobre un trozo de película, con lo que resulta impresionada por la radiactividad, grabando una serie de bandas oscuras (como un código de barras), cuya pauta es la que leemos y resulta ser como la huella dactilar.

 

Una estrategia para aplicar el procedimiento al ADN con objeto de identificación, consiste en bombardearlo con muchas sondas simultáneamente, con lo que obtenemos una mezcla de bandas oscuras, que se confunden y se produce una mancha borrosa, procedente de todos los tamaños de los posibles fragmentos del ADN. Esta vía no es útil a efectos de identificación. Otra alternativa es utilizar una sonda cada vez, buscando un locus genético concreto. Ahora se producen barras nítidas, dado que medimos longitudes de fragmentos de dobletes repetitivos. En la práctica lo que se utiliza en medicina forense es una media docena de sondas distintas.

 

La probabilidad de error es baja, pero si precisamos que se trata de que la libertad de la gente depende de ello, hay que afinar. La prueba se emplea para declarar a un sospechoso inocente o señalarlo como culpable. Si efectuamos            una única sonda de ADN para investigar un locus de repetición en doblete y las muestras que se comparan son diferentes, el sospechoso es exonerado. No hace falta investigar un segundo locus.   Si comparten el mismo código de barras, es compatible con que el sujeto sea culpable, pero no lo prueba. Podría darse que nuestro sospechoso compartiera el mismo código de barras con el verdadero delincuente. Hay que investigar algunos loci más. Supongamos que siguen coincidiendo. Hay que analizar la cuestión estadísticamente, para valorar que la coincidencia sea fortuita. Partamos de la probabilidad que hay de que dos personas de la población en general, tengan el mismo locus analizado. Supongamos el caso en que solamente una persona en un millón, tiene el modelo de código de barras identificado. La probabilidad de condena errónea no es de uno en un millón, ya que el sospechoso puede pertenecer a un grupo minoritario de población, que por alguna razón sus antepasados se asentaron en el lugar en el que se investiga. Esto genera que una población tenga frecuencias altas de genes locales concretos. Si el sospechoso y el verdadero delincuente pertenecieran al mismo grupo poblacional, la probabilidad de confusión casual puede ser espectacularmente mayor que si nos referimos a la población en general. Ahora precisamos conocer la frecuencia del modelo del código de barras en el grupo al que pertenece el sospechoso. Evidentemente, en todo caso, siempre que se examinen un suficiente número de loci genéticos distintos, se puede reducir la posibilidad de identificación errónea, por debajo de cualquier otro método de identificación.

 

Vemos como la Ciencia aporta útiles herramientas para aplicarlas con garantía sobrada a resolver complejos problemas. Cabe resaltar que se trata no solo de aplicar lo que saben los científicos, que también, sino de los métodos que aplican en sus trabajos para descubrir cosas y contribuir a construir el conocimiento que nos permite y fomenta el progreso.