La estructura primaria de una proteína se corresponde con la secuencia lineal de aminoácidos codificada
en su correspondiente unidad de transcripción y suele representarse por medio de una cadena donde cada
letra identifica a un aminoácido o residuo. Por ejemplo, los primeros 30 aminoácidos de la proteína
insulina de la mosca Drosophila melanogaster son:
MFSQHNGAAV HGLRLQSLLI AAMLTAAMAM...
donde por ejemplo es metionina,
es glutamina o
es alanina (ver tabla 1.1). El sentido de la cadena
es desde el extremo aminoterminal hacia el carboxiloterminal.
De igual manera, la estructura primaria de los ácidos nucleicos es su secuencia de nucleótidos, que tiene un sentido
dado por la dirección de los enlaces fosfodiéster. De igual modo se suele representar de forma simplificada, asignando
una sola letra a cada nucleótido, o mejor dicho, a cada base nitrogenada. Además se suele usar el sentido 5'-3'.
Por ejemplo, el principio del gen de la insulina de la mosca Drosophila melanogaster tiene una secuencia similar a:
5' atgtttagcc agcacaacgg tgcagcagta 3'
donde es adenina,
timina,
citosina y
guanina. En el caso del ADN, que como veremos suele formar una doble hélice
antiparalela, se sobreentiende que hay una secuencia complementaria que corre en sentido opuesto. En este caso sería:
5' atgtttagcc agcacaacgg tgcagcagta 3'
3' tacaaatcgg tcgtgttgcc acgtcgtcat 5'