English
 
Help Privacy Policy Disclaimer
  Advanced SearchBrowse

Item

ITEM ACTIONSEXPORT
 
 
DownloadE-Mail
  Comparative sequence analysis and association mining in gene regulation

Dieterich, C. (2005). Comparative sequence analysis and association mining in gene regulation. PhD Thesis, Fachbereich Mathematik u. Informatik, Freie Universität Berlin, Berlin.

Item is

Files

show Files

Locators

show

Creators

show
hide
 Creators:
Dieterich, Christoph1, Author
Affiliations:
1Max Planck Society, ou_persistent13              

Content

show
hide
Free keywords: -
 Abstract: Diese Promotionsarbeit beschäftigt sich mit der Steuerung der Transkription von Genen in Vertebraten im Allgemeinen und Säugern im Speziellen. Der Vorgang der Transkription ist das Abschreiben von Genen in eine RNA Kopie und stellt den ersten Schritt auf dem Weg zum Genprodukt dar. Unmittelbar um den Transkriptionsstart liegen Sequenzelemente, die hauptsächlich für die Effizienz des Transkriptionsvorganges relevant sind. Diese Sequenzelemente werden als Promotoren bezeichnet. Die Ausdehnung von Genen und Bereichen zwischen den Genen ist in Säugetieren beträchtlich groß (bis zu 1 Mb). Transkriptionsstartpunkte und somit Promotoren lassen sich experimentell nur schwer erfassen. Mein Ansatz nutzt die vergleichende Analyse orthologer Sequenzbereiche aus verschiedenen Spezies. Die Grundidee ist das Aufspüren von konservierten regulatorischen Sequenzelementen und Promotorbereichen. Diese Elemente sind deshalb konserviert weil ein Ausfall oder Fehlen zur Fehlsteuerung des Genprodukts führen würde, das ähnliche Aufgaben in den entsprechenden Spezies verrichtet. Regulatorische Sequenzelemente stehen somit unter selektivem Druck. Mithilfe verschiedener etablierter und neu entwickelter Algorithmen wurde eine umfassende Sammlung solcher konservierter regulatorischer Elemente berechnet. Diese Daten wurden dann gegen bekannte Transkriptionsfaktorbindemuster abgeglichen. Die resultierenden Daten wurden rechnerisch mit den Resultaten anderer biologischer Experimente verknüpft. Aufbauend auf einer statistischen Analyse der Verteilung der relevanten Muster, läßt dies Schlußfolgerungen zur Funktionalität dieser Muster zu. Die Arbeit behandelt die folgenden Bereiche: 1. CORG Datenbank Das CORG (Comparative Regulatory Genomics) Projekt vereint eine Vielzahl an Methoden und Daten zur Vorhersage von Promotorbereichen. Zunächst werden Gruppen homologer Gene für die vergleichende Sequenzanalyse definiert. Upstreambereiche der Gene, die den eigentlichen Promotorbereich mit hoher Wahrscheinlichkeit enthalten, werden auf Sequenzebene miteinander verglichen. Hierzu wird der Waterman-Eggert Algorithmus zum Auffinden lokaler Sequenzähnlichkeiten herangezogen. Um eine Signifikanz der beobachteten Alignmentpunktzahl zu bestimmen wird die Verteilung aus zufälligen Alignments als Poissonverteilung approximiert. Nicht-translatierte Exons werden durch den Vergleich mit assemblierten EST Sequenzen detektiert. Transkriptionsfaktorbindestellen werden innerhalb konservierter Sequenzabschnitte durch Konsensmuster oder Gewichtsmatrizen vorhergesagt. Alle Daten sind in einer relationalen Datenbank abgelegt, die über eine graphische Benutzeroberfläche und PERL-Schnittstelle zugänglich ist. 2. Vorhersage von Zellzyklusregulatoren. Periodisch exprimierte Gene wurden in 5 Gruppen eingeteilt, die den Zellzyklusphasen M/G1, G1/S, S, G2 und G2/M entsprechen. Für jede dieser Gruppen wurde ein Profil der konservierten Bindungsstellen in den dazugehörenden Upstreambereichen erstellt. Die Verteilung der Bindungsstellen über alle Gengruppen wurde in Relation zu einem Nullmodel gesetzt. Das Nullmodell beruht auf der Annahme, dass zufällige Bindungsstellen proportional zur Größe des Sequenzsuchraums auftreten. Die Abweichung von beobachteter Verteilung von Bindungsstellen zu erwarteter Verteilung wurde mit einem exaktem und einem approximativen Test bewertet. 3. Detailstudie SRF-induzierter Gene. Der Serum Response Factor (SRF) ist an einer Vielzahl biologischer Prozesse beteiligt: u.a. Immunantwort, Herzentwicklung, embryonale Frühentwicklung und Neurogenese. Im Rahmen dieser Arbeit wurden die Promotoren von zwei Gengruppen studiert, welche durch SRF induziert wurden. Die erste Gruppe umfasst Gene, welche durch SRF in Srf -/- embryonalen Stammzellen der Maus induziert werden. Die zweite Gruppe beinhaltet Gene die durch Stimulation humaner dendritischer Zellen mit LPS als Teil der Immunantwort induziert werden. Die Rolle von SRF und die Qualität der CORG Promotoranalyse wurden zunächst eingehend in embryonale Stammzellen der Maus studiert. Die signifikante Anreicherung von konservierten SRF Bindungsstellen und deren experimentelle Validierung mittels Chromatin-Immunopräzipitation lassen auf eine hohe Güte der CORG Promotoranalyse schließen. Das CORG Projekt wurde im Rahmen dieser Promotionsarbeit etabliert und dessen Nutzen anhand von biologischen Fragestellungen klar belegt. Das CORG Rahmenwerk ist offen und flexible gestaltet. Neue Datenströme aus einer Vielzahl an Experimenten werden so noch den Weg in die CORG Architektur finden.

Details

show
hide
Language(s): eng - English
 Dates: 2005-06-03
 Publication Status: Accepted / In Press
 Pages: 73
 Publishing info: Berlin : Fachbereich Mathematik u. Informatik, Freie Universität Berlin
 Table of Contents: -
 Rev. Type: -
 Identifiers: eDoc: 273182
URI: http://www.diss.fu-berlin.de/2005/133/index.html
 Degree: PhD

Event

show

Legal Case

show

Project information

show

Source

show