Inhaltsverzeichnis
Vorwort
Liste der Abkürzungen
1 Informationsmakromoleküle
1.1 Informationsverarbeitung und Molekularbiologie
1.2 Nukleinsäurestruktur und -funktion
1.3 Proteinstruktur und -funktion
2 Eigenschaften von Nukleinsäuren und eukaryotische Chromosomenstruktur
2.1 Chemische und physikalische Eigenschaften von Nukleinsäuren
2.2 Spektroskopische und thermische Eigenschaften von Nukleinsäuren
2.3 DNA-Superspiralisierung
2.4 Chromatinstruktur
2.5 Eukaryotische Chromosomenstruktur
3 DNA-Replikation
3.1 DNA-Replikation: eine Übersicht
3.2 Bakterielle DNA-Replikation
3.3 Eukaryotische DNA-Replikation
4 DNA-Schäden, -Reparatur und -Rekombination
4.1 DNA-Schäden
4.2 Mutagenese
4.3 DNA-Reparatur
5 Transkription in Bakterien
5.1 Grundlagen der Transkription
5.2 Escherichia coli-RNA-Polymerase
5.3 Der σ70-Promotor von E. coli
5.4 Transkriptionsinitiation, -elongation und -termination
6 Regulation der Transkription in Bakterien
6.1 Das lac-Operon
6.2 Das trp-Operon
7 Transkription in Eukaryoten und Regulation der eukaryotischen Transkription
7.1 Die drei RNA-Polymerasen: Charakterisierung und Funktion
7.2 RNA-Pol-I-Gene: die ribosomale Wiederholung
7.3 RNA-Pol-III-Gene: 5S- und tRNA-Transkription
7.4 RNA-Pol-II-Gene: Promotoren und Enhancer
7.5 Allgemeine Transkriptionsfaktoren und RNA-Pol-II-Initiation
7.6 Eukaryotische Transkriptionsfaktoren
8 Der genetische Code und tRNA
8.1 Der genetische Code
8.2 tRNA-Struktur und -funktion
9 Proteinsynthese
9.1 Aspekte der Proteinsynthese
9.2 Proteinsynthesemechanismus
9.3 Initiation in Eukaryoten
9.4 Translationskontrolle und posttranslationale Ereignisse
10 Genmanipulation
10.1 DNA-Klonierung: eine Übersicht
10.2 Präparation von DNA-Plasmiden
10.3 Restriktionsenzyme und Elektrophorese
10.4 Ligation, Transformation und Analyse von Rekombinanten
11 Klonierungsvektoren
11.1 Plasmidvektor-Design
11.2 Bakteriophagen, Cosmide, YACs und BACs
11.3 Eukaryotische Vektoren
12 Analyse und Verwendung klonierter DNA
12.1 Charakterisierung von Klonen
12.2 Nukleinsäuresequenzierung
12.3 Polymerase-Kettenreaktion
12.4 Analyse klonierter Gene
12.5 Mutagenese klonierter Gene
13 Funktionelle Genomik und die neuen Technologien
13.1 Einführung in die ’Omik-Wissenschaften
13.2 Allgemeine Genexpressionsanalyse
13.3 Proteomik
13.4 Zelluläre und molekulare Bildgebung
13.5 Transgene und Stammzelltechnologie
13.6 Bioinformatik
13.7 System- und synthetische Biologie
Richtig gelöst ...
1 Lehrbücher
2 Vertiefende Literatur
Stichwortverzeichnis
Beachten Sie bitte auch weitere interessante Titel zum Thema
Fletcher, H., Hickey, I.
Genetik
für Biologen, Biochemiker, Pharmazeuten und Mediziner
2013
978-3-527-33475-9, auch als E-Book
Alberts, B., Bray, D., Hopkin, K., Johnson, A., Lewis, J., Raff, M., Roberts, K., Walter, P.
Lehrbuch der Molekularen Zellbiologie
4. Auflage
2012
978-3-527-32824-6
Wink, M. (Hrsg.)
Molekulare Biotechnologie
Konzepte, Methoden und Anwendungen
2. Auflage
2011
978-3-527-32655-6
Gottschalk, G.
Welt der Bakterien
Die unsichtbaren Beherrscher unseres Planeten
2009
978-3-527-32520-7, auch als E-Book
Lüttge, U., Kluge, M.
Botanik – Die einführende Biologie der Pflanzen
6. Auflage
2012
978-3-527-33192-5
Titel der Originalausgabe
Molecular Biology, BIOS Instant Notes,
Fourth Edition
© 2013 by Garland Science, Taylor & Francis Group, LLC
All Rights Reserved. Authorised translation from the English language edition published by
Garland, a member of the Taylor & Francis Group.
Autoren
Alexander McLennan
University of Liverpool
Institute of Integrative Biology
Liverpool
United Kingdom
Andy Bates
University of Liverpool
Institute of Integrative Biology
Liverpool
United Kingdom
Phil Turner
University of Liverpool
Institute of Integrative Biology
Liverpool
United Kingdom
Mike White
University of Manchester
Faculty of Life Sciences
Manchester
United Kingdom
Übersetzt von
Dr. Bärbel Häcker
Feuerbacher Straße 14
71229 Leonberg
Cover
© Depositphotos.com/Daniel Cole;
Hintergrund: © Shutterstock
© Erhan Ergin / Fotolia.com für die in der Randspalte verwendeten Symbole
1. Auflage 2013
Alle Bücher von Wiley-VCH werden sorgfältig erarbeitet. Dennoch übernehmen Autoren, Herausgeber und Verlag in keinem Fall, einschließlich des vorliegenden Werkes, für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie für eventuelle Druckfehler irgendeine Haftung
Bibliograf ische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http://dnb.d-nb.de> abrufbar.
© 2013 Wiley-VCH Verlag & Co. KGaA, Boschstr. 12, 69469 Weinheim, Germany
Alle Rechte, insbesondere die der Übersetzung in andere Sprachen, vorbehalten. Kein Teil dieses Buches darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form – durch Photokopie, Mikroverfilmung oder irgendein anderes Verfahren – reproduziert oder in eine von Maschinen, insbesondere von Datenverarbeitungsmaschinen, verwendbare Sprache übertragen oder übersetzt werden. Die Wiedergabe von Warenbezeichnungen, Handelsnamen oder sonstigen Kennzeichen in diesem Buch berechtigt nicht zu der Annahme, dass diese von jedermann frei benutzt werden dürfen. Vielmehr kann es sich auch dann um eingetragene Warenzeichen oder sonstige gesetzlich geschützte Kennzeichen handeln, wenn sie nicht eigens als solche markiert sind.
Print ISBN: 978-3-527-33476-6
ePDF ISBN: 978-3-527-67210-3
ePub ISBN: 978-3-527-67209-7
mobi ISBN: 978-3-527-67208-0
Umschlaggestaltung Simone Benjamin, McLeese Lake, Canada
Satz Reemers Publishing Services GmbH, Krefeld
Vorwort
Es gibt nur wenige wissenschaftliche Disziplinen, die sich in den Jahren seit der letzten Auflage so rasch entwickelt haben wie die Molekularbiologie. Unsere Hoffnung, dass die Verbesserungen der letzten Auflage künftige Änderungen einfacher machen würden, war somit ziemlich naiv. Unsere Bearbeitung und Aktualisierung der 4. Auflage waren umfassend und betrafen alle Kapitel und Themen, so groß war die Geschwindigkeit des Fortschritts. Die ersten beiden Kapitel der 3. Auflage wurden kombiniert und vereinfacht, um Überlappungen mit anderen Titeln aus der Reihe Instant Notes zu verringern; andere Kapitel wurden neu geordnet und logischer umstrukturiert. Dies schuf Raum für die Betrachtung von Fortschritten bei Themen wie der Next-Generation-DNA-Sequenzierung und Genomik, der allgemeinen Genexpressionsanalyse, regulatorischer RNAs, Proteomik, Stammzellen, Systembiologie und vielen anderen Feldern. Eine Schwierigkeit bestand in der Beurteilung, was weggelassen werden konnte, um neuen Stoff unterzubringen. Wenn das Wissen sich erweitert, die Technik Fortschritte macht und die alten Methoden in „Ungnade fallen“, ist es eine Herausforderung, den Leser mit neuen Entdeckungen und mit der Leistungsfähigkeit neuer Methoden zu fesseln, jedoch gleichzeitig eine ausreichende Menge des traditionellen Hintergrundwissens beizubehalten, damit ein Thema vollständig verstanden werden kann. Wir sind uns dessen voll bewusst, dass es sich hier um ein einführendes Lehrbuch handelt, und haben deshalb versucht, unnötige Komplexität und Details zu vermeiden. Wir hoffen, dass uns dies gelungen ist. Wie immer sind wir auch diesmal den vielen Lesern, die Verbesserungsvorschläge gegenüber der Vorauflage gemacht haben, sehr dankbar. Besonderen Dank schulden wir Liz Owen und Vicki Noyes für ihre Geduld und ihr Verständnis während der Überarbeitung.
Alexander McLennan
Andy Bates
Phil Turner
Mike White
Liste der Abkürzungen
Wichtig zu wissen
In der Molekularbiologie und Genetik gibt es eine Reihe wichtiger Abkürzungen, die die Verständigung vereinfachen. Hier sind die in diesem Buch verwendeten Abkürzungen aufgeführt.
Kurz erklärt
ADP | Adenosin-5’-diphosphat |
AIDS | erworbenes Immunschwächesyndrom (aquired immunodeficiency syndrome) |
AMP | Adenosin-5’-monophosphat |
AP | apurinisch oder apyrimidinisch |
ARS | autonom replizierende Sequenz |
ATP | Adenosin-5’-triphosphat |
BAC | künstliches Bakterienchromosom, bacterial artificial chromosome |
BER | Basenexzisionsreparatur |
bHLH | basische HLH |
BLAST | Basic Local Alignment Search |
Bp | Basenpaare |
BRF | TFIIB-verwandter Faktor |
BSE | bovine spongiforme Enzephalopathie (Rinderwahnsinn) |
BUdR | Bromdesoxyuridin |
bZIP | basischer Leucin-Zipper |
cAMP | cyclisches Adenosinmonophosphat |
cDNA | komplementäre DNA |
CFTR | cystic fibrosis transmembran conductance regulator |
CHEF | contour clamped homogenous electric field, konturgespanntes elektrisches Feld |
ChIP | Chromatinimmunpräzipitation |
CJK | Creutzfeld-Jakob-Krankheit |
CMP | Cytidin-5’-monophosphat |
CTD | carboxyterminale Domäne |
Da | Dalton |
dATP | Desoxyadenosin-5’-triphosphat |
dCTP | Desoxycytidin-5’-triphosphat |
ddNTP | Didesoxynukleotid-5’-triphosphat |
dGDP | Desoxyguanosin-5’-diphosphat |
dGTP | Desoxyguanosin-5’-triphosphat |
DNA | Desoxyribonukleinsäure |
DNase I | Desoxyribonukease I |
dNTP | Desoxynukleosid-5’-triphosphat |
DOP-PCR | PCR, die degenerierte Oligonukleotid-Primer verwendet |
DSB | Doppelstrangbruch |
dsDNA | doppelsträngige DNA |
dsRNA | doppelsträngige RNA |
dTTP | Desoxythymidin-5’-triphosphat |
EDTA | Ethylendiamintetraessigsäure |
EF | Elongationsfaktor |
eIF | eukaryotischer Initiationsfaktor |
ER | endoplasmatisches Retikulum |
eRF | eukaryotischer Freisetzungsfaktor |
ES | embryonale Stammzelle |
ESI | Elektrosprayionisation |
EST | exprimierte Sequenzmarkierung |
EtBr | Ethidiumbromid |
FADH | Flavinadenindinukleotid |
FASTA | Fast-All |
FIGE | Feldinversionsgelelektrophorese |
FISH | Fluoreszenz-in-situ-Hybridisierung |
GFP | grün fluoreszierendes Protein |
GST | Glutathion-S-Transferase |
GTP | Guanosin-5’-triphosphat |
GVO | gentechnisch veränderter Organismus |
HAT | Histonacetyltransferase |
HDAC | Histondeacetylase |
HDL | Lipoprotein hoher Dichte |
HIV | menschliches Immunschwächevirus |
HLH | Helix-Schleife-Helix |
hnRNA | heterogene nukleäre RNA |
hnRNP | heterogenes nukleäres Ribonukleoprotein |
HR | homologe Rekombination |
HSP | Hitzeschockprotein |
HSVTK | Herpes-simplex-Virus-Thymidin-Kinase |
ICC | Immuncytochemie |
IF | Initiationsfaktor |
IgG | Immunglobulin G |
IHC | Immunhistochemie |
Int | Integrase |
IP | Immunpräzipitation |
iPS | induzierte pluripotente Stammzelle |
IPTG | Isopropyl-β-D-thiogalactopyranosid |
IRE | iron response element, Eisen-Response-Element |
IRES | interne Ribosomeneintrittsstelle |
IS | Insertionssequenz |
ISH | in situ-Hybridisierung |
ISP | iron sensing protein, Eisen erfassendes Protein |
KAP | Katabolit-Aktivatorprotein |
kb | Kilobasenpaare in doppelsträngiger Nukleinsäure, Kilobasen in einzelsträngiger Nukleinsäure |
kDA | Kilo-Dalton |
lncRNA | lange nicht codierende RNA |
LTR | long terminal repeat, lange terminale Wiederholung |
LUCA | last universal common ancestor, letzter gemeinsamer Vorfahre |
MALDI | matrix assisted laser desorption/ionization |
MBP | Maltose bindendes Protein |
MCS | multiple Klonierungsstelle |
MDa | Mega-Dalton |
Met-tRNA | Methionyl-tRNA |
MFC | Multifaktorkomplex |
miRNA | mikroRNA |
MMS | Methylmethansulfonat |
mRNA | messenger RNA, Boten-RNA |
MS | Massenspektrometrie |
NAD+ | Nikotinamidadenindinukleotid |
ncRNA | nicht codierende RNA |
NER | Nukleotid-Exzisionsreparatur |
NHEJ | nonhomologous end joining, nichthomologe Rekombination |
NMD | nonsense mediated decay, Mechanismus zum Abbau mutierter RNA |
NMN | Nikotinamidmononukleotid |
NMR | Kernmagnetresonanz |
Nt | Nukleotide |
NTP | Nukleosid-5’-triphosphat |
NTPase | Nukleotidtriphosphatase |
OE-PCR | overlap extension PCR, Überhang-Extension-PCR |
OMIM® | Online Mendelian Inheritance in Man-Datenbank |
ORC | origin recognition complex, Ursprungerkennungskomplex |
ORF | open reading frame, offenes Leseraster |
PABI | Poly(A)-Bindeprotein I |
PABII | Poly(A)-Bindeprotein II |
pADPR | Poly(ADP-Ribose) |
PAGE | Polyacrylamid-Gelelektrophorese |
PARPI | Poly(ADP-Ribose)Polymerase I |
PCNA | Proliferationszellkernantigen |
PCR | Polymerase-Kettenreaktion |
PDB | Proteindatenbank |
PDGF | platelet-derived growth factor, von Thrombocyten freigesetzter Wachstumsfaktor |
PFGE | Pulsfeldgelelektrophorese |
piRNA | piwi-assoziierte RNA |
PPi | Pyrophosphat |
prä-mRNA | mRNA-Vorläufer |
pri-mRNA | primäre miRNA |
qPCR | quantitative PCR |
RACE | rasche Amplifizierung (Vervielfältigung) von cDNA |
RBI | Retinoblastom-Gen |
RBS | Ribosomenbindungsstelle |
RF | release factor, Freisetzungsfaktor |
RFLP | Restriktionsfragmentlängenpolymorphismus |
RFP | rot fluoreszierendes Protein |
RISC | RNA-induzierter Stilllegungskomplex |
RITS | RNA-induzierte Transkriptionsstilllegung |
RNA | Ribonukleinsäure |
RNAi | RNA-Interferenz |
RNA-Pol I | RNA-Polymerase I |
RNA-Pol II | RNA-Polymerase II |
RNA-Pol III | RNA-Polymerase III |
RNaseA | Ribonuklease A |
RNP | Ribonukleoprotein |
ROS | reaktive Sauerstoffspezies |
RRF | Ribosomen-Recycling-Faktor |
rRNA | ribosomale RNA |
Rt | Reverse Transkriptase |
RT-PCR | Reverse Transkriptase-Polymerase-Kettenreaktion |
SCID | schwere kombinierte Immunschwäche |
SCNT | somatischer Zellkerntransfer |
SDA-PAGE | Natriumdodecylsulfat-Polyacrylamid-Gelelektrophorese |
SDS | Natriumdodecylsulfat |
SECIS | Selenocystein-Insertionssequenz |
SILAC | stable isotop labeling with amino acids in culture, Markierung von Aminosäuren in Zellkultur mit stabilen Isotopen |
SINEs | short interspersed elements, kurze eingestreute Elemente |
siRNA | kurze interferierende RNA |
SL1 | Selektionsfaktor 1 |
snoRNP | small nucleolar ribonucleoprotein particle, kleines nukleoläres Ribonukleoproteinpartikel |
SSB | Einzelstrangbruch |
Ssb | einzelsträngiges Bindeprotein |
ssDNA | einzelsträngige DNA |
SV40 | Simian(Affen)-Virus 40 |
TAF | TBP-assoziierter Faktor |
TAFI | TAFs für RNA-Pol I-Transkription |
TBP | TATA-Bindeprotein |
TdT | Terminale Desoxynukleotidyl-Transferase |
TLS | Transläsions-DNA-Synthese |
Tm | Schmelztemperatur |
tmRNA | transfer-messenger-RNA |
Tris | Tris(hydroxymethyl)aminomethan |
tRNA | Transfer-RNA |
UBF | upstream binding factor, stromaufwärtiger Bindungsfaktor |
UCE | upstream control element, stromaufwärtiges Kontrollelement |
URE | upstream regulatory element, stromaufwärtiges Regulationselement |
UTP | Uridin-5’-triphosphat |
UTR | nicht translatierte Region |
UV | ultraviolett |
Xist | X-inaktives spezifisches Transkript |
XP | Xeroderma pigmentosum |
XP-V | Xeroderma pigmentosum-Variante |
YAC | yeast artificial chromosome, künstliches Hefechromosom |
Yep | yeast episomal plasmid, episomales Hefeplasmid |
Y-Gal | 5-Brom-4-chlor-3-indolyl-β-D-galacto-pyranosid |
Die Molekularbiologie befasst sich mit den molekularen Wechselwirkungen, die den biologischen Funktionen zugrunde liegen. Sie überschneidet sich beträchtlich mit der Biochemie und der Genetik, und sie scheint sich hauptsächlich mit den strukturellen Grundlagen und der Kontrolle der Informationsverarbeitung in der Zelle zu beschäftigen sowie mit den für deren Untersuchung erforderlichen Technologien. Durch die Pionierarbeiten von Avery, MacLeod und McCarty sowie von Hershey und Chase in den 1940er- und 1950er-Jahren wurde klar bewiesen, dass die genetischen Anweisungen zur Erschaffung einer Zelle im Zellkern sitzen, innerhalb einer linearen Sequenz von Basen; diese wiederum sind Bestandteil der Struktur eines langen chemischen Polymers, der Desoxyribonukleinsäure (DNA). Im Jahre 1953 schlugen dann Crick und Watson die berühmte Doppelhelixstruktur der DNA vor, die genau darlegte, wie diese Information gespeichert und an nachfolgende Generationen weitergegeben wird. Um zu erklären, wie Zellen die im DNA-Genom verschlüsselten Anweisungen verwenden, postulierte Crick, dass der Fluss der genetischen Information in nur eine Richtung verläuft: von der DNA über eine zwischengeschaltete Nukleinsäure, die Ribonukleinsäure (RNA), zum Protein – d. h. „DNA macht RNA macht Protein“. Diese Aussage wurde zum zentralen Dogma der Molekularbiologie, ohne dass die einzelnen Schritte groß bewiesen wurden. Wir wissen heute, dass diese Aussage des zentralen Dogmas weitgehend korrekt ist, auch wenn das ursprüngliche Schema inzwischen mehrmals modifiziert worden ist. Abb. 1.1 zeigt ein Diagramm dieses Informationsflusses. Der Hauptweg führt von der DNA über die RNA zum Protein, und man weiß heute, dass dies auch für die DNA in den kleinen unabhängigen Genomen der Mitochondrien und Chloroplasten gilt. In allen Zellen wird die DNA konzeptionell (aber nicht physikalisch) in diskrete codierende Einheiten (Gene) eingeteilt, die die Information für die einzelnen Proteine enthalten. Diese DNA wird transkribiert (Kap. 5 und 7), sodass RNA-Moleküle entstehen (Boten- oder messenger-RNA, mRNA), die die gleiche Sequenzinformation wie die DNA enthalten; sie können als Arbeitskopien der Gene angesehen werden, die in der Haupt-DNABlaupause vorhanden sind. Diese mRNAs werden dann entsprechend dem genetischen Code (Abschnitt 8.1) in Aminosäuresequenzen von Proteinen translatiert (übersetzt) (Kap. 9). Die Kombination all dieser Prozesse, die erforderlich sind, um die Information der DNA zu entschlüsseln und ein funktionsfähiges Molekül zu erzeugen, heißt Genexpression. Wir können auch die DNA-Replikation (Kap. 3) in Abb. 1.1 mit einschließen, bei der durch Verdoppelung der Information in der Ausgangs-DNA zwei Tochter-DNA-Moleküle gebildet werden; dies hat den Informationsfluss und die Bewahrung der Information von einer Generation zur nächsten zur Folge.
Man hat jedoch einige Ausnahmen von diesem Grundschema identifiziert. Viele RNA-Moleküle werden nicht in ein Protein translatiert, sondern funktionieren eigenständig als RNAs (Abschnitt 9.4). Ihre Gene werden als RNA-Gene bezeichnet. Eine Reihe von Virusklassen besitzt keine DNA, sondern enthält ein Genom, das aus einem oder mehreren RNA-Molekülen besteht. Bei den Retroviren, zu denen auch das menschliche Immunschwächevirus (HIV, human immunodeficiency virus) gehört, der Verursacher des erworbenen Immunschwächesyndroms (AIDS, aquired immunodeficiency syndrome), wird das einzelsträngige RNA-Molekül in eine doppelsträngige DNA-Kopie überführt; diese wird dann in das Genom der Wirtszelle eingebaut. Dieser Vorgang wird als reverse Transkription bezeichnet. Man kennt auch eine Reihe von Viren, deren RNA-Genom direkt zu RNA kopiert wird, ohne Zuhilfenahme der DNA als Zwischenstufe (RNA-Replikation). Dazu zählen das Influenza- und das Hepatitis-C-Virus. Soweit bekannt, gibt es keine Beispiele dafür, dass ein Protein „rückwärts translatiert“ wird, um eine spezifische RNA- oder DNA-Sequenz zu erzeugen; somit scheint der Translationsschritt des zentralen Dogmas in nur eine Richtung zu gehen. Schließlich gibt es noch eine faszinierende Ausnahme von dem Dogma, dass die RNA- und Proteinsequenzen eindeutig in der DNA verschlüsselt (codiert) sind: der Prozess des RNA-Editing. Man kennt Beispiele (hauptsächlich in Eukaryoten), bei denen die Basensequenz einer RNA tatsächlich nach der Transkription der DNA verändert wird, sodass sie, und jedes Proteinprodukt im Falle einer mRNA, nicht mehr exakt der DNA entspricht.
Die Erörterung dieser Systeme im vorliegenden Buch basiert auf dem biologischen Klassifizierungssystem der drei Domänen, bei dem der letzte gemeinsame Vorfahre (LUCA, last universal common ancestor) allen Lebens sich zunächst in die Bakterien (Bacteria) und den gemeinsamen Vorfahren der Archaea und Eukarya aufspaltete. Die beiden Letztgenannten trennten sich später auf. Zwar sind Bakterien und Archaeen beide Prokaryoten, weil ihnen ein echter Zellkern fehlt, hinsichtlich vieler Aspekte der Informationsverarbeitung haben die Archaeen jedoch mehr Gemeinsamkeiten mit den kernhaltigen Eukaryoten. Die meisten Beispiele stammen von Bakterien und Eukaryoten.
In den späten 1970er-Jahren erlebte die Molekularbiologie große Fortschritte durch die Entwicklung der rekombinanten DNA-Technologie (Gentechnik). Sie erlaubte, dass Gene isoliert, sequenziert, modifiziert und von einem Organismus auf einen anderen übertragen werden; sie war von größter Bedeutung für das zunehmende Verständnis darüber, wie Zellen arbeiten. Zudem werden auf diese Weise erzeugte transgene Mikroorganismen heute routinemäßig eingesetzt, um menschliche Therapeutika im Großmaßstab herzustellen. Transgene Tiere und Pflanzen verfügen über ein großes Potenzial, sowohl die Spannbreite nützlicher Produkte zu vergrößern als auch verbessertes Wachstum, Krankheitsresistenz oder Modelle für menschliche Krankheiten usw. zu erreichen (Abschnitt 13.5). Die dauerhafte Korrektur einer Erbkrankheit mithilfe der Gentherapie ist jetzt ebenfalls eine realistische Möglichkeit. In den letzten Jahren ist die für die Bestimmung der DNA-Basen verantwortliche Technologie vorangeschritten und die Kosten sind so rasch gesunken, dass es schon bald praktikabel sein wird, das vollständige Genom eines Individuums zu sequenzieren und die Krankheitsanfälligkeit im Rahmen eines routinemäßigen Gesundheitsfürsorgeprogramms zu bestimmen. Inzwischen können sogar neue Gene chemisch synthetisiert und zu vollständigen Genomen zusammengefügt werden. Im Jahre 2010 bildeten J. Craig Venter und seine Kollegen die vollständige chromosomale DNA eines kleinen Mykoplasma-Bakteriums nach und fügten sie in eine „leere“ Zelle ein, deren eigenes Chromosom entfernt worden war; auf diese Weise schufen sie einen lebenden Organismus (Abschnitt 13.7). Dieses DNA-Molekül besaß auch einige neue Eigenschaften und ebnete damit den Weg für die zukünftige Möglichkeit, echtes synthetisches Leben zu erschaffen – „Designer“-Organismen mit künstlichen Genomen, die neue biochemische Funktionen ausführen können, die in der natürlichen Welt nicht vorkommen. Ziel ist dabei die Herstellung neuer Medikamente, Brennstoffe und anderer Produkte. Die Molekularbiologie und die um sie entstandenen Technologien haben eine zentrale Rolle bei der Entwicklung von Medikamenten für Mensch und Tier, in der Landwirtschaft und in der biotechnologischen Industrie gespielt; nun werden sie darauf angesetzt, die Herausforderungen der weltweiten Gesundheit, der Umweltveränderungen und der Lebensmittelsicherheit zu bewältigen, mit denen wir im 21. Jahrhundert konfrontiert sind.
Tipp
Verwandte Themen:
Die Basen der DNA und RNA sind heterozyklische (kohlenstoff- und stickstoffhaltige) aromatische Ringe, mit einer Reihe von Substituenten (Abb. 1.2). Bei Adenin (A) und Guanin (G) handelt es sich um Purine, bizyklische Strukturen mit zwei fusionierten Ringen; dagegen sind Cytosin (C), Uracil (U) und Thymin (T) Pyrimidine mit nur einem Ring. In der DNA ist die Base Uracil, die in der RNA vorkommt, durch Thymin ersetzt. Thymin unterscheidet sich von Uracil nur bezüglich einer Methylgruppe in der 5-Position, d. h. Thymin ist ein 5-Methyluracil.
In den Nukleinsäuren sind die Basen kovalent mit einem Pentosezuckerring an der 1’-Position verknüpft und bilden dabei ein Nukleosid (Abb. 1.3). Bei RNA ist der Zucker eine Ribose, bei DNA eine 2’-Desoxyribose, bei der die Hydroxylgruppe an der 2’-Position durch ein Wasserstoffatom ersetzt ist. Die Verknüpfung mit der Base findet an der 1-Position (N-1) der Pyrimidine und an der 9-Position (N-9) der Purine statt (Abb. 1.2). Die Kennzahl der Atome im Ribosering wird mit 1’-, 2’-usw. bezeichnet, einfach nur um sie von den Atomen der Base zu unterscheiden. Die Bindung zwischen den jeweiligen Basen und Zuckern ist eine glykosidische oder Glykosidbindung. Handelt es sich bei dem Zucker um Ribose, dann heißen die Nukleoside (technisch Ribonukleoside) Adenosin, Guanosin, Cytosin und Uridin. Ist der Zucker aber Desoxyribose (wie in der DNA), dann sind die Nukleoside (2’-Desoxyribonukleoside) Desoxyadenosin, Desoxyguanosin usw. Die Bezeichnungen „Thymidin“ und „Desoxythymidin“ können alternativ verwendet werden.
Ein Nukleotid ist ein Nukleosid mit einer oder mehreren Phosphatgruppen, die kovalent an der 3’-, 5’- oder (nur in manchen Ribonukleotiden) der 2’-Position verknüpft sind. Ist der Zucker Desoxyribose, dann heißen die Verbindungen 2’-Desoxyribonukleotide oder einfach Desoxyribonukleotide (Abb. 1.4). Chemisch gesehen sind die Verbindungen Phosphatester. Im Falle der 5’-Position können bis zu drei Phosphate verknüpft sein und bilden dann z. B. Adenosin-5’-triphosphat oder Desoxyguanosin-5’-triphosphat; die genannten Verbindungen werden üblicherweise mit ATP bzw. dGTP abgekürzt. Auf die gleiche Weise erhalten wir Desoxycytidintriphosphat (dCTP), Uridintriphosphat (UTP) und Desoxythymidintriphosphat (dTTP oder einfach TTP genannt). 5’-Mono- und -Diphosphate werden beispielsweise als AMP bzw. dGDP abgekürzt. Nukleosid-5’-triphosphate (NTPs) oder Desoxynukleosid-5’-triphosphate (dNTPs) sind die Bausteine der polymeren Nukleinsäuren. Im Verlauf der DNA- oder RNA-Synthese werden zwei Phosphate in Form von Pyrophosphat abgespalten und es verbleibt ein Phosphat pro Nukleotid, das in die Nukleinsäurekette eingebaut wird (Abschnitt 3.1 und 5.1). Damit ist die sich wiederholende Einheit einer DNA- oder RNA-Kette ein Nukleotid.
In einem DNA- oder RNA-Molekül sind die Desoxyribonukleotide bzw. die Ribonukleotide durch die kovalente Verknüpfung einer Phosphatgruppe mit der 5’-Hydroxylgruppe einer Ribose und der 3’-Hydroxylgruppe der nächsten Ribose zu einem Polymer verbunden (Abb. 1.5). Eine derartige Verknüpfung nennt man Phosphodiesterbindung, da das Phosphat chemisch als ein Diester vorliegt. Damit besitzt eine Nukleinsäure eine Richtung oder Polarität. Eine Nukleinsäurekette egal welcher Länge (solange sie nicht ringförmig ist, Abschnitt 2.3) hat ein freies 5’-Ende – das mit einer Phosphatgruppe verknüpft sein kann oder auch nicht – und ein freies 3’-Ende – das zumeist eine freie Hydroxylgruppe ist. Bei neutralem pH-Wert hat jede Phosphatgruppe eine einzelne negative Ladung. Aus diesem Grund heißen Nukleinsäuren „Säuren“; sie sind die Anionen starker Säuren. Damit sind Nukleinsäuren stark negativ geladene Polymere.
Die sich wiederholenden Monomere der DNA oder RNA werden vereinbarungsgemäß durch ihre Anfangsbuchstaben, A, T, G, C oder U, wiedergegeben. Zudem ist vereinbart, die Sequenzen so zu schreiben, dass sich das 5’-Ende links befindet. Somit kann man eine DNA-Sequenz z. B. als 5’-ATAAGCTC-3’ oder einfach ATAAGCTC schreiben. Eine RNA-Sequenz könnte lauten: 5’-AUAGCUUGA-3’. Man beachte, dass die Ausrichtung der Kette bedeutet, dass z. B. ATAAG nicht dasselbe ist wie GAATA.
DNA kommt in der Natur zumeist in Form der gut bekannten Doppelhelix vor. Die grundlegenden Eigenschaften dieser Struktur wurden im Jahre 1953 von James Watson und Francis Crick abgeleitet. Zwei getrennte DNA-Ketten winden sich umeinander, wobei jede eine Wendel (Spirale) bildet; daraus resultiert eine rechtsgängige Doppelhelix (Abb. 1.6a). Das negativ geladene Zucker-Phosphat-Rückgrat der Moleküle befindet sich außen und die planaren Basen jedes Strangs stapeln sich in der Mitte der Helix übereinander (Abb. 1.6b). Zwischen den Rückgratsträngen verlaufen die kleine und die große Furche, die ebenfalls einer helikalen Bahn folgen. Die Basen der sich gegenüberliegenden Stränge bilden miteinander Wasserstoffbrückenbindungen aus und verknüpfen damit die beiden Stränge nichtkovalent; auf diese Weise entstehen Basenpaare (Bp). Auf eine Windung der DNA-Doppelhelix kommen etwa 10 Bp. Die beiden Stränge sind hinsichtlich der 5’→3’-Richtung entgegensetzt ausgerichtet (antiparallel) und, was entscheidend ist, sie haben zueinander komplementäre Sequenzen. Die letztgenannte Eigenschaft kommt zustande, weil die Basenstrukturen und die Zwänge des DNA-Rückgrats vorschreiben, dass die Basen in Form von Purin-Pyrimidin-Paaren miteinander Wasserstoffbrückenbindungen ausbilden (Abschnitt 1.3); diese Paare besitzen eine sehr ähnliche Geometrie und Ausdehnung (Abb. 1.7). Guanin paart mit Cytosin (drei Wasserstoffbrückenbindungen), und Adenin paart mit Thymin (zwei Wasserstoffbrückenbindungen). So kann jede beliebige Sequenz innerhalb der regulären doppelsträngigen DNA-Struktur untergebracht werden. Die Sequenz des einen Strangs definiert eindeutig die Sequenz des anderen, und Watson und Crick erkannten schnell, dass dieser Umstand einen offensichtlichen Replikationsmechanismus für die DNA impliziert (Abschnitt 3.1). Natürlich beruht darauf auch der Mechanismus der Transkription der DNA-Sequenz in eine RNA (Abschnitt 5.1).
In der Tat hat man eine Reihe verschiedener Formen der Nukleinsäuredoppelhelix beobachtet und untersucht; alle haben das Grundmuster von zwei helikal gewundenen antiparallelen Strängen. Die von Watson und Crick identifizierte und oben beschriebene Struktur wird als B-DNA bezeichnet (Abb. 1.8a). Man glaubt, dass sie die idealisierte Strukturform ist, die praktisch von jeder DNA in vivo angenommen wird. Sie ist charakterisiert durch 10 Bp/Windung, durch die Anwesenheit von Basenpaaren, die auf der Helixachse und nahezu senkrecht zu ihr liegen, und durch die vorhandenen, klar definierten, tiefen großen und kleinen Furchen. Die eigentlichen DNA-Sequenzen haben genau genommen eine helikale Wiederholung, die näher bei 10,5 Bp liegt, und eine Vielzahl anderer struktureller Verformungen, die von der exakten Sequenz abhängen.
Bei geringer Feuchtigkeit kann die DNA dazu gebracht werden, eine alternative Helix, die A-Form, zu bilden (Abb. 1.8b). Die A-Form ist rechtsgängig, wie die BForm, besitzt aber eine breitere, stärker komprimierte Struktur, bei der die Basenpaare zur Helixachse hin gekippt sind und sogar außerhalb der Achse liegen (vom Ende her gesehen hat die A-Helix ein Loch in der Mitte). Die helikale Wiederholung der A-Form liegt bei etwa 11 Bp/Windung. Obwohl es sein kann, dass die A-Form oder eine Form, die ihr nahekommt, von der DNA in vivo unter ungewöhnlichen Umständen angenommen wird, hat sie hauptsächlich Bedeutung als Helixform für die RNA (s. unten) und für DNA-RNA-Hybride; es stellte sich heraus, dass die 2’-OH-Gruppe der RNA unmöglich in die ansonsten stabilere B-Form-Struktur passt.
Die DNA kann eine weitere ungewöhnliche Helixstruktur bilden. Die linksgängige Z-DNA (Abb. 1.8c) ist in synthetischer doppelsträngiger DNA stabil, die nur aus sich abwechselnden Pyrimidin-Purin-Sequenzen besteht (wie z. B. 5’-CGCGCG-3’, und natürlich das Gleiche im anderen Strang). Der Grund ist, dass in dieser Struktur die Pyrimidin- und Purinnukleotide ganz unterschiedliche Konformationen annehmen, im Gegensatz zur A- und B-Form, bei der jedes Nukleotid grundsätzlich immer die gleiche Konformation und die gleiche unmittelbare Umgebung hat. Genauer gesagt nehmen die Purinnukleotide in der Z-Form die syn-Konformation an, bei der die Purinbase direkt über dem Desoxyribosering liegt (man stelle sich die Base in Abb. 1.4 180° rotierend um die Glykosidbindung vor; die dort gezeigten Nukleotide sind in der alternativen anti-Konformation). Die Pyrimidinnukleotide in der Z-DNA und alle Nukleotide in der A- und B-Form nehmen die anti-Konformation an. Die Z-Form hat ein zickzackartiges Aussehen, mit 12 Bp/Umdrehung, obgleich es wahrscheinlich sinnvoll ist anzunehmen, dass sie aus sechs „Basenpaar-Dimeren“ pro Windung besteht. Die Wiederholungseinheit entlang eines jeden Stranges ist in Wirklichkeit ein Dinukleotid. In normaler DNA bildet sich die Z-Form sogar in Bereichen mit sich wiederholenden CGCGCG-Sequenzen nicht so leicht, da die Grenzbereiche zwischen der linksgängigen Z-Form und der umgebenden B-Form sehr instabil wären. Die Z-Form ist wahrscheinlich keine übliche Eigenschaft der DNA (oder RNA) in vivo, obwohl vorgeschlagen wurde, dass sie in einigen speziellen Fällen eine Rolle bei der Auflösung der Verdrehungsbelastung (Abschnitt 2.2) in der DNA während der Transkription spielt. Tabelle 1.1 vergleicht die A-, B- und Z-Helix miteinander.
RNA kommt normalerweise als einzelsträngiges Molekül vor und nimmt daher keine lange, regelmäßig helikale Struktur an wie die doppelsträngige DNA. Stattdessen bildet RNA relativ globuläre Konformationen, in denen lokale Bereiche mit helikaler Struktur gebildet werden; in diesen ist ein Teil der RNA-Kette komplementär zu einem anderen und bildet über intramolekulare Wasserstoffbrückenbindungen und Basenstapel innerhalb der einzelsträngigen Nukleinsäurekette Haarnadel- und Stamm-Schleife-Strukturen (Abschnitt 5.1, Abb. 5.3 und Abschnitt 8.2, Abb. 8.2). Diese Konformationsvariabilität spiegelt sich in den vielfältigeren Aufgaben der RNA im Vergleich zur DNA in der Zelle wider (s. unten).
Die chemische Modifikation von Basen oder Nukleotiden in Nukleinsäuren ist weit verbreitet und hat eine Reihe spezieller Aufgaben. In der zellulären DNA beschränken sich die Modifikationen auf die Methylierung der N-6-Position von Adenin und der N-4- und N-5-Position von Cytosin (Abb. 1.2), obgleich in der DNA mancher Phagen komplexere Modifikationen vorkommen. Diese Methylierungen spielen eine Rolle bei der Restriktionsmodifikation (Abschnitt 10.3), der Basenfehlpaarungsreparatur (Abschnitt 4.3) und der eukaryotischen Genomstruktur und -expression. Eine weit vielfältigere Spannbreite von Modifikationen kommt in der RNA nach der Transkription vor, was erneut die verschiedenen Aufgaben der RNA in der Zelle widerspiegelt. Diese werden in Abschnitt 8.2 ausführlicher behandelt.
DNA fungiert ausschließlich als Träger genetischer Information von einer Generation zur nächsten und im Zuge dieser Aufgabe dient sie als Matrize für die Synthese der komplementären RNA-Spezies. Obwohl RNA-Moleküle auch selbst als Genom oder Matrizen dienen können (z. B. bei RNA-Viren und Telomerase-RNA; Abschnitt 3.3) und als Zwischenschritte im Informationsfluss von der DNA zum Protein fungieren (mRNA; Abschnitt 1.1), sind sie im Gegensatz zur DNA wegen ihrer chemischen Instabilität weniger verlässliche permanente Informationsspeicher (Abschnitt 2.1). Sie können jedoch eine große Bandbreite von Tertiärstrukturen annehmen und mit DNA Basenpaarungen eingehen; viele RNAs haben zusätzliche Funktionen, die denen von Proteinen ähnlich sind. Diese zahlreich vorkommenden RNAs heißen nicht codierende RNAs (ncRNAs), da sie nicht in Proteine translatiert werden; ihre Gene werden als RNA-Gene bezeichnet. Viele sind Struktur- und Funktionsbestandteile der Prä-mRNA-Verarbeitungs- und Proteinsynthesemaschinerie (z. B. snRNA, tRNA, rRNA und 7SL-RNA; Kap. 9). Dagegen haben manche, als Ribozyme bezeichnete RNAs katalytische Aktivität (z. B. rRNA und RNase P; Abschnitt 9.2). In jüngster Zeit wurde klar, dass ein überraschend großer Teil des eukaryotischen Genoms für weitere ncRNAs codiert, die für die Kontrolle der Genexpression unverzichtbar sind. Sie werden unterteilt in lncRNAs (>200 Nt), die primär an der Transkriptionskontrolle beteiligt sind, und die kleineren (<200 Nt) miRNAs, siRNAs und piRNAs, die hauptsächlich in die Translationskontrolle einbezogen sind (Abschnitt 9.4), obwohl die Größen- und Funktionsunterschiede nicht absolut sind. Da RNA die Fähigkeit zur Speicherung genetischer Information und auch zur Katalyse und Kontrolle chemischer Reaktionen besitzt, basierte vielleicht das Leben zuerst auf RNA und erst später auf dem jetzt vorhandenen System, das auf DNA, RNA und Proteinen fußt.
Tipp
Verwandte Themen:
Proteine sind Polymere von L-Aminosäuren. Abgesehen von Prolin haben alle der in Proteinen vorkommenden 20 Aminosäuren eine gemeinsame Struktur: Ein Kohlenstoffatom (das α-Kohlenstoffatom) ist mit einer Carboxylgruppe, einer primären Aminogruppe, einem Proton und einer Seitenkette (R) verknüpft. Die Seitenkette ist bei jeder Aminosäure anders (Abb. 1.9). Außer bei Glycin ist das α-Kohlenstoffatom asymmetrisch – es ist mit vier chemisch verschiedenen Gruppen verknüpft. Aminosäuren können somit als optisch aktive Stereoisomerpaare (D- und L-) vorkommen. Nur die L-Isomere sind in Proteinen anzutreffen. Glycin, die einfachste Aminosäure, hat anstelle der Seitenkette ein Wasserstoffatom und ist optisch inaktiv. In wässriger Lösung sind Aminosäuren dipolare Ionen (Zwitterionen) und verhalten sich sowohl als Säuren als auch als Basen (sie sind amphoter). Die Seitenketten unterscheiden sich hinsichtlich Größe, Gestalt, Ladung und chemischer Reaktivität, und sie sind für die unterschiedlichen Eigenschaften der verschiedenen Proteine verantwortlich (Abb. 1.10). Viele Proteine enthalten auch Nichtstandard-Aminosäuren, wie z. B. 4-Hydroxyprolin und 5-Hydroxylysin in Kollagen. Diese entstehen hauptsächlich durch posttranslationale Modifikation der Ausgangsaminosäuren, z. B. Prolin und Lysin, im neu synthetisierten Protein (Abschnitt 9.4). Beim Selenocystein (kommt in einer Reihe von Enzymen vor) ist der S des Cysteins durch Se ersetzt. Pyrrolysin (ein modifiziertes Lysin, das nur in bestimmten Archaeen-Proteinen vorkommt) und Selenocystein werden beide aufgrund einer feinen Veränderung des genetischen Codes (Abschnitt 8.1) in die wachsenden Proteinketten eingebaut, und manche Wissenschaftler betrachten sie als die 21. und 22. „Standard“-Aminosäure.
Wenn man den pH-Wert von 7 als Bezugspunkt nimmt, dann haben mehrere Aminosäuren ionisierbare Gruppen in ihren Seitenketten, die bei diesem pH-Wert für eine zusätzliche positive oder negative Ladung sorgen. Die „sauren“ Aminosäuren, Asparaginsäure und Glutaminsäure, besitzen zusätzliche Carboxylgruppen, die in der Regel ionisiert (negativ geladen) sind. Die „basischen“Aminosäuren haben positiv geladene Gruppen: Lysin verfügt über eine zweite Aminogruppe, die mit dem -Kohlenstoffatom verknüpft ist, während Arginin eine Guanidinogruppe hat. Die Imidazolgruppe von Histidin hat einen nahezu neutralen pKs-Wert. Die reversible Protonierung dieser Gruppe unter physiologischen Bedingungen trägt zum Katalysemechanismus vieler Enzyme bei. Saure und basische Aminosäuren können in Proteinen miteinander wichtige Salzbrücken bilden.
Polare, ungeladene Seitenketten enthalten Gruppen, die mit Wasser Wasserstoffbrückenbindungen ausbilden können. Zusammen mit den geladenen Aminosäuren werden sie oft als hydrophil („wasserliebend“) beschrieben. Serin und Threonin haben Hydroxylgruppen, die durch Proteinkinasen reversibel phosphoryliert werden können (s. unten). Asparagin und Glutamin sind dagegen die Amidderivate der Asparagin- bzw. Glutaminsäure. Cystein besitzt eine Thiol-(Sulfhydryl)-gruppe, die oft zu Cystin oxidiert. In Cystin bilden zwei Cysteine eine strukturell wichtige Disulfidbrücke.
Phenylalanin, Tyrosin (das ebenfalls phosphoryliert werden kann) und Tryptophan haben sperrige hydrophobe („wasserabweisende“) Seitenketten, die an hydrophoben Wechselwirkungen in der Proteinstruktur teilnehmen (s. unten). Die aromatischen Strukturen von Tyrosin und Tryptophan sind hauptsächlich für die Absorption von ultraviolettem Licht (UV) durch Proteine verantwortlich; deren maximale Absorption liegt bei 280 nm. Die phenolischen Hydroxylgruppen von Tyrosin können ebenfalls Wasserstoffbrückenbindungen ausbilden. Zu den anderen unpolaren, hydrophoben Seitenketten zählen die aliphatischen Alkylgruppen von Alanin, Valin, Leucin, Isoleucin und Methionin (das ein Schwefelatom in einer Thioetherverbindung enthält) sowie der zyklische Ring von Prolin – Prolin ist eine ungewöhnliche Aminosäure, da es sich hier um eine sekundäre Amino- (oder Imino)säure handelt.
Zwei umfangreiche Proteinklassen lassen sich unterscheiden: Globuläre Proteine sind kompakt gefaltet und verhalten sich in Lösung mehr oder weniger wie kugelige Partikel; die meisten Enzyme sind globulärer Natur. Faserproteine besitzen ein hohes Achsenverhältnis (Länge/Breite) und sind häufig wichtige Strukturproteine, z. B. Seidenfibroin und Keratin in Haaren und Wolle. Die Molekularmasse reicht von wenigen Tausend Dalton (Da), wie z. B. beim Hormon Insulin mit 51 Aminosäuren und einer Molekülmasse von 5734 Da (5,7 Kilodalton, kDa), bis zu nahezu 4 Millionen Da (4 MDa) im Falle des Muskelproteins Titin. Manche Proteine enthalten Nichtprotein-Moleküle, entweder in Form kleiner prosthetischer Gruppen, die als Cofaktoren in enzymatischen Reaktionen mitwirken können, oder als große Anlagerungen (z. B. Lipide in Lipoproteinen oder Kohlenhydrate in Glykoproteinen).
Die α-Carboxylgruppe einer Aminosäure ist kovalent mit der α-Aminogruppe der nächsten Aminosäure über eine Amidbindung verknüpft; in Proteinen wird eine solche Verknüpfung gewöhnlich als Peptidbindung bezeichnet. Sind zwei Aminosäurereste auf diese Weise verknüpft, entsteht ein Dipeptid. Viele über Peptidbindungen verknüpfte Aminosäuren bilden ein Polypeptid (Abb. 1.11). Die sich wiederholende Abfolge der α-Kohlenstoffatome und Peptidbindungen liefert das strukturelle Rückgrat des Polypeptids, während die verschiedenen Aminosäure-Seitenketten dem Protein die Funktionalität verleihen. An einem Ende der Polypeptidkette hat die Aminosäure eine nicht verknüpfte α-Aminogruppe, während das andere Ende der Kette eine freie α-Carboxylgruppe besitzt. Somit sind Polypeptide gerichtet, mit einem N-Terminus und einem C-Terminus. Manchmal ist der N-Terminus blockiert, z. B. durch eine Acetylgruppe. Die Abfolge (Sequenz) der Aminosäuren vom N- zum C-Terminus ist die Primärstruktur des Polypeptids. Die typische Größe einer Polypeptidkette reicht von 100 bis 1500 Aminosäuren, obwohl es auch kürzere oder längere gibt; Titin hat z. B. 34 000 Aminosäuren.
Die dreidimensionale Struktur der Proteine und der großen proteinhaltigen Zusammenschlüsse wird durch viele verschiedene Wechselwirkungen aufrechterhalten. Elektrostatische Ladungs-Ladungs-Wechselwirkungen (Salzbrücken) wirken zwischen ionisierbaren Gruppen entgegengesetzter Ladung bei physiologischem pH-Wert, d. h. zwischen positiven Lysin- und Arginin-Seitenketten und negativen Glutamin- und Asparagin-Seitenketten oder negativen Phosphaten der DNA bei DNA-bindenden Proteinen wie den Histonen (Abschnitt 2.4). Ladungs-Dipol- und Dipol-Dipol-Wechselwirkungen sind schwächer und bilden sich, wenn ein oder beide Teilnehmer wegen der asymmetrischen Ladungsverteilung im Molekül Dipole sind (Abb. 1.12a). Sogar ungeladene Gruppen wie Methylgruppen können sich gegenseitig über vorübergehende Dipole, die durch die Bewegung ihrer Elektronen (Dispersionskräfte) entstehen, schwach anziehen.
Nichtkovalente Assoziationen zwischen elektrisch neutralen Molekülen sind allgemein unter der Bezeichnung van der Waals-Kräfte bekannt. Wasserstoffbrückenbindungen sind sehr wichtig. Sie bilden sich zwischen einem kovalent verknüpften Wasserstoffatom auf einer Donatorgruppe (z. B. –O-H oder –N-H) und einem Paar nicht bindender Elektronen auf einer Akzeptorgruppe (z. B. :O=C– oder :N–) (Abb. 1.12bhydrophobe;