Wolfgang Marks: Die Formatierte DNA

Zusammenfassung

Das menschliche Genom speichert Daten aus rund 4 Milliarden Jahren zellulärer Entwicklung in etwa 3,3 Millarden Basenpaaren. Obwohl das gesamte humane Genom sequenziert wurde, die Anordnung der DNA-Nukleotide also bekannt ist, ist man bisher nicht über Ansätze hinausgekommen, eine Struktur, eine Ordnung oder ein logisches Prinzip in dieser Ansammlung von Informationen zu erkennen. Wie es der Zelle gelingt, über Chromosomengrenzen hinweg zeitgleich und entwicklungsspezifisch Gene zu aktivieren und ihre Expression zu koordinieren, ist nicht verstanden. Zwar ist seit längerer Zeit vermutet worden, dass die Zelle neben dem genetischen Code ein zweites Verschlüsselungssystem benutzt, das sich in der Zusammensetzung der Histone des Nukleosomen-Cores (des Oktamers) und in ihren Modifikationen verbirgt, aber auch diese Vermutung, als Histon-Code-Hypothese bezeichnet, konnte bisher weder belegt, noch ein Konzept vorgelegt werden, das die Histon-Modifikationen in einen logischen Zusammenhang mit der differentiellen Expression eukariotischer Gene bringen könnte.

In dieser Arbeit werden zum ersten Mal Belege dafür erbracht, dass die DNA eine inhärente logische Struktur aufweist, die sich ausser in Chromosomenbändern auch in Transkriptionsgruppen, Chromatin-Domänen und in den vom Autor entdeckten Chromatin-Subdomänen dokumentiert. Zum ersten Mal ist es dem Autor auch gelungen, die SMARs, welche die DNA in die genannten funktionellen Abschnitte einteilen, zu charakterisieren, zu klassifizieren und ihre Funktion in einen logischen Zusammenhang mit dem Chromatin-remodeling und der Regulation der Genexpression zu bringen.

Durch genomweites screening nach Antisense-Promotoren sowohl auf dem plus- als auch auf dem minus-Strang der DNA ist dem Autor die Entdeckung zweier bisher unbekannter Gen-Systeme gelungen, deren eines - vom Autor REMA-Gen-System genannt - Enzyme kodiert, die sich zu remodeling-Maschinen zusammenschließen, während das andere – als ALU-Gen-System bezeichnet – Transkriptionsfaktoren (TAFs) kodiert, die entscheidend an der Definition von Primärtranskripten und deren Spleissen zu entwicklungs- und zellspezifischen messenger-RNAs beteiligt sind. Der Autor vermutet, dass das erste der beiden Netzwerke – das REMA-Gen-System -  auf Progenitoren von LINE-Sequenzen, das zweite - das ALU-Gen-System – dagegen auf Progenitoren von SINE-Elementen basiert.

Sowohl die Promotoren der REMA-Gene als auch die der ALU-Gene sind zum Teil in Homöoboxen eingebettet, an welche Hox-Proteine binden. Die Bindung von HOX-Proteinen an diese Homöoboxen stellt demnach den einfachsten Weg dar, diese beiden für die Expression der metabolen Gene entscheidenden Gensysteme genomweit synchronisiert zu steuern und repräsentiert daher zweifellos den lange gesuchten globalen Informationslayer, der die morphologische Entwicklung vieler Lebewesen - darunter die des Menschen - determiniert.

Es werden die Prozesse und die Logik beschrieben, welche der Synthese von remodeling-Maschinen zugrunde liegen und das epigenetische Programm, das zu ihrer koordinierten Aktivierung und zur Umstrukturierung des Chromatins in definierten Abschnitten der DNA durch Repositionierung der Nukleosomen führt. Dieser epigenetisch praedestinierte - programmierte Formatierung - genannte Prozess wird durch ein System von Formatierungshormonen induziert, zu denen auch die Releasinghormone gehören. 

Es wird postuliert, dass die Anordnung der Nukleosomen auf der DNA – die Formatierung der DNA – in definierten Abständen in Phase erfolgt und damit Regeln folgt, die sich mathematisch beschreiben lassen.  Aus diesen Regeln wird ein arithmetisches Nukleosomengrössen-System abgeleitet, das auf Computer-Berechnungen des Autors beruht.

Der Autor etabliert ein kaskadiertes 3-stufiges Hormonsystem, das auf jeder Stufe aus einer definierten Zahl von Komponenten besteht und beschreibt die logische und logistische Verknüpfung dieses Systems mit dem System der Architekturproteine und dem System der Nukleosomengrössen. Über Mediatoren und Mediatorenkomplexe wird gesprochen und postuliert, dass ein Großteil der Mediatoren mit Architekturproteinen identisch sein muss.

Schliesslich wird auf der Basis des Vorgetragenen ein revolutionäres, logisches Modell der Genexpression und  der Regulation der Transkription errichtet und am Beispiel des TPM1-Gens dargestellt, welche Proteine, Prozesse und Faktoren im Rahmen dieses Modells an der Definition einer stammzellspezifischen hnRNA und an deren Spleissen zu einer zellspezifischen mRNA beteiligt sind.

Die vorliegende Arbeit ist die erste auf durchgehend logischen Prizipien beruhende Gesamtschau des Systems “GENOM”. Sie ermöglicht einen analytisch-logischen Zugang zum Verständnis der Datenbank „Genom“ und eröffnet einen bisher nicht für möglich gehaltenen Einblick in ihre innere Struktur, ihre Organisation und darüberhinaus in die Logik, welche die verschiedenen Subsysteme des Systems „GENOM“ - wie zum Beispiel chromatin-remodeling, Replikation, Mitose oder die Genexpression - miteinander verknüpft.

 

Abstract

The human genome is saving data from about 4 billion years of cellular development in about 3.3 billions of basepairs. Despite the whole genome being sequenced, the arrangement of nucleotids therefore being known, one was not able until today to recognize or determine a structure, a principle of organisation or the logical concept behind this collection of informations.

The way, by which the human cell is successful in activating genes in a chronological and developmental coordinated manner beyond the borders of chromosomes, is not at all understood. Admittedly it being presumed for a longer time, that human cells are using a second ciphering system beyond the known genetic code, which is hidden in arrangement and modifications of the histones of the nucleosomic core (the octamer) this assumption, the so called histon-hypothesis, could until today wether be verified nor could anybody present a concept bringing these modifications in a logical connection with differential expression of eucariotic genes.

For the first time this work is presenting evidences for DNA possessing an inherent logical structure, which is documenting itself in chromosomal bands as well as in trancription groups, chromatin-domains and in chromatin-subdomains, the latter being revealed by the author.

For the first time the author was also successful in characterisation and classification of SMARs, dividing DNA in the above mentioned functional segments, and to bring their function in a logical connection with chromatin-remodeling and regulation of gene expression.

By genome-wide screening for antisense-promotors on plus- and minus strand of DNA the author succeeded in detection of two new, unknown gene systems – one of which, named REMAgene-system by the author, is coding enzymes forming remodeling machines – while the other, named ALUgene-system, is coding transcription factors (TAFs) being crucially involved in definition of primary transcripts and splicing of those transcripts to a cell- and developmentspecific mRNA. Author presums first of both networks – the REMAgene-system – being based on progenitors of LINE-sequences, the second – the ALUgene-system -  being evolved from progenitors of SINE-elements.

Detecting homoeoboxes not only in REMAgenes but also in ALUgenes the author postulates hox-system producing his effects upon morphogenesis by coordinated regulation of REMAgenes and ALUgenes and by this way controlling epigenetic chromatin-remodeling as well as activation of primary transcripts and their splicing to cellspecific mRNAs. Binding of HOX-proteines to REMA- and ALUgene promotors therefore represents without any doubt the most sought-after global information-layer determining morphogenesis of many beings – among those also humans.

The epigenetic network leading to synthesis of remodeling machines and the logical program leading to their coordinated activation and to reorganisation of chromatin in defined segments of DNA by repositioning of nucleosomes (histon octamers) is revealed. This process, being named by the author epigenetic predestinated (programmed) formatting, is induced by formattinghormones to which also belong the well known releasinghormones.

It is postulated, that arrangement of nucleosomes on DNA – the formatting – is taking place in distinct spacings and following rules, one is able to describe in a mathematical manner. Based on computational analysis, an arithmetic system of nucleosomic spacings is deduced from this rules.

Also in this work a cascaded 3-step hormonal system is established, consisting on every step of a defined number of components, and the logical and logistical correlation between this system and the system of architectural proteins and the nucleosomic spacing system is being described. The author refers about mediators and mediator complexes and postulates a main part of mediators being identic with those before mentioned architectural proteins.

Last but not least - based on the discourse in this work – a revolutionary, logical model of gene expression and regulation of transcription is constructed and its functioning demonstrated using TPM1 gene (tropomyosine alpha chain) as example. Using this model as a frame, the proteins, processes and main-actors are described, which are involved in definition of a stemcellspecific hnRNA (preRNA, primary transcript) and their splicing to a cellspecific mRNA.

The present paper presents the first synopsis of the system „genome“ totally based on logical rules. It allows for the first time an analytical and logical access to understanding the database „genome“ and opens new windows for an insight look in his inner structure and organisation and beyond this into the logistic system of proteins and factors coupling and regulating the different subsystems of system „genome“ like chromatin remodeling, replication, mitosis or gene expression.    
 

For my english-speaking readers:

English translation will follow soon. The basic ideas, theoremes and calculations mostly being provided with illustrations and graphics combined with english text, one should be able to follow the main stream of this work also in the german version. Make a try....