Hello !
Le code génétique, ainsi qu'un certain nombre de protéines à domaine trans-membranaires sont bien connues (et séquencés en AA ou en nucléotides).
Donc à partir des séquences d'ADN ou d'ARN on peut déterminer si l’on obtient un acide aminé hydrophile ou hydrophobe (et donc plutôt en position externe, ou interne/membranaire respectivement). De plus les domaines trans-membranaires sont en fait des motifs conservés d'une 20n d'acides aminés, tels que les hélices alpha, hélices beta, et tonneaux beta. D'autres structures sont typiques d'un ancrage dans la membrane plasmique. (voir ici :
http://fr.wikipedia.org/wiki/Prot%C3%A9ine_membranaire). Donc si l'on trouve la séquence codant un tel motif trans-membranaire on peut déjà en savoir plus. Enfin, comme on peut trouver des hélices alpha dans des protéines cytosoliques, je pense qu'on l'on peut aussi obtenir des informations à partir des séquences d'adressage co-traductionnel: peptide signal, et séquences d'arrêt du transfert (ici :
http://fr.wikipedia.org/wiki/Insertion_ ... mbranaires). Les séquences permettent également de savoir si c'est plutôt le coté N-terminal ou C-terminal qui est en position intra- ou extra-cellulaire
Le fait est que 0,1% des structures protéiques déterminées sont des protéines membranaires, alors qu'elles représentent 20 à 30% du total. Bref ce sont des protéines complexes et les prédictions à partir de modélisations informatiques restent encore limités...
Voilà pour mon idée sur le sujet...
PS/ tu peux jouer à Foldit pour te faire une idée sur les repliements de protéines et faire avancer la science en même temps:
http://fold.it/portal/