Cromosomas
El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares de
autosomas más 1 par de cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de tamaño en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21.
Representación gráfica del
cariotipo humano normal.(
Imagen 1).
Las células somáticas de un organismo poseen en su
núcleo un total de 46 cromosomas (23 pares): una dotación de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un
cromosoma X de la madre y un X o un
Y del padre.
(Ver imagen 1). Los
gametos -
óvulos y
espermatozoides- poseen una dotación
haploide de 23 cromosomas.
ADN intragénico
Un
gen es la unidad básica de la herencia, y porta la información genética necesaria para la síntesis de una
proteína (genes codificantes) o de un ARN no codificante (genes de ARN). Está formado por una secuencia
promotora, que regula su expresión, y una secuencia que se
transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la
traducción y la estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que serán eliminadas en el procesamiento del ARNm (
ayuste).
Este diagrama esquemático muestra un gen en relación a su estructura física (doble hélice de ADN) y a un cromosoma (derecha). Los intrones son regiones frecuentemente encontradas en los genes de eucariotas, que se
transcriben, pero son eliminadas en el procesamiento del ARN (
ayuste) para producir un
ARNm formado sólo por
exones, encargados de
traducir una proteína. Este diagrama es en exceso simplificado ya que muestra un gen compuesto por unos 40 pares de bases cuando en realidad su tamaño medio es de 20.000-30.000 pares de bases).
Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000
genes codificantes de proteínas, estimación muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes o más. Esto implica que el genoma humano tiene menos del doble de genes que organismos
eucariotas mucho más simples, como la mosca de la fruta o el
nematodo Caenorhabditis elegans. Sin embargo, las células humanas recurren ampliamente al
splicing (
ayuste) alternativo para producir varias proteínas distintas a partir de un mismo gen, como consecuencia de lo cual el
proteoma humano es más amplio que el de otros organismos mucho más simples. En la práctica, el genoma
tan sólo porta la información necesaria para una expresión perfectamente coordinada y regulada del conjunto de proteínas que conforman el proteoma, siendo éste el encargado de ejecutar la mayor parte de las funciones celulares.
Genes de ARN
Además de los genes codificantes de proteínas, el genoma humano contiene varios miles de
genes ARN, cuya
transcripción reproduce
ARN de transferencia (ARNt),
ARN ribosómico (ARNr),
microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosómico y de transferencia son esenciales en la constitución de los
ribosomas y en la
traducción de las proteínas. Por su parte, los microADN tienen gran importancia en la regulación de la expresión génica, estimándose que hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de interferencia por miARN. Hasta el momento se han identificado más de 300 genes de miARN y se estima que pueden existir unos 500-
ADN intergénico
Como se ha dicho, las regiones intergénicas o extragénicas comprenden la mayor parte de la secuencia del genoma humano, y su función es generalmente desconocida. Buena parte de estas regiones está compuesta por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas, aunque el resto de la secuencia no responde a un patrón definido y clasificable. Gran parte del ADN intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas
ADN "basura" (
Junk DNA), denominación que incluye también las secuencias intrónicas y pseudogenes. No obstante, esta denominación no es la más acertada dado el papel regulador conocido de muchas de estas secuencias. Además el notable grado de conservación evolutiva de algunas de estas secuencias parece indicar que poseen otras funciones esenciales aún desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura" incluye también transposones codificantes) o "ADN repetitivo". Algunas de estas regiones constituyen en realidad genes precursores para la síntesis te microARN (reguladores de la expresión génica y del silenciamiento génico).
ADN repetido disperso
Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45% del genoma humano. Los elementos cuantitativamente más importantes son los LINEs y SINEs, que se distinguen por el tamaño de la unidad repetida.
Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenómeno se produce con una baja frecuencia, estimándose que 1 de cada 100-200 neonatos portan una inserción nueva de un Alu o un L1, que pueden resultar
patogénicos por mutagénesis insercional, por desregulación de la expresión de genes próximos (por los propios promotores de los SINE y LINE) o por recombinación ilegítima entre dos copias idénticas de distinta localización cromosómica (recombinación intra o intercromosómica), especialmente entre elementos Alu