EST-based detection and analysis of mammalian transcripts

Gupta, Shobhit

Item

ITEM ACTIONSEXPORT

Add to Basket

Local TagsRelease HistoryDetailsSummary

Released

Thesis

EST-based detection and analysis of mammalian transcripts

MPS-Authors

Gupta, Shobhit
Max Planck Society;

External Resource

No external resources are shared

Fulltext (restricted access)

There are currently no full texts shared for your IP range.

Fulltext (public)

There are no public fulltexts stored in PuRe

Supplementary Material (public)

There is no public supplementary material available

Citation

Gupta, S. (2005). EST-based detection and analysis of mammalian transcripts. PhD Thesis, Fachbereich Mathematik u. Informatik, Freie Universität Berlin, Berlin.

Cite as: https://hdl.handle.net/11858/00-001M-0000-0010-855D-8

Abstract

Alternatives Spleissen ermoeglicht, dass aus einem einzigen Gen mehrere mRNA Transkripte entstehen koennen. Dieser Vorgang kann die Vielfalt eukariotischer Transkriptome teilweise erklaeren. Daten ueber "Expressed Sequence Tags" (EST) bilden eine der Hauptinformationsquellen, die die Aufklaerung von Exon-Intron Strukturen solcher Transkripte ermoeglichen. Jedoch koennen verschiedene Artefakte, z.B. durch ungespleisste mRNA verunreinigte EST-Daten, Gaps im Sequenzalignment oder aehnliches zu ungenauen Vorhersagen von Exon-Intron Grenzen fuehren. Das Ziel der hier vorliegenden Arbeit ist es, verlaessliche Spleisstellen von technischen Artefakten zu trennen. Da der Prozess des Spleissens noch unzureichend verstanden ist, kann kein exaktes Modell zur Identifikation von Splicestellen auf streng mathematische Weise hergeleitet werden. In der hier vorliegenden Arbeit wird deshalb ein alternativer Ansatz angewendet, um mit Hilfe eines Fuzzy-Logic-Ansatzes EST-bezogene Parameter empirisch zu einer robusten Approximation eines Scores zu kombinieren. Validiert man diese Methode an Exons, von denen bekannt ist, dass sie alternativ gespleisst werden (AEDB Datenbank), so wird nahezu allen diesen Exons ein hoher Score-Wert zugeschrieben. EST-Datensaetze beinhalten Informationen bezueglich des (Tumor)-Gewebes, welches die Grundlage der cDNA-Bibliothek war, aus welcher die EST-Sequenzen generiert wurden. Diese Annotationen wurden verwendet, um die Gewebe- bzw. die Tumorspezifitaet der vorhergesagten alternativen Spleiss-Ereignisse zu bestimmen. Zur Validierung der vorhergesagten Expressionsmuster durchgefuehrte RT-PCR Experimente waren durchweg positiv. Zusaetzlich wurde die Expression vieler dieser Transkripte in weiteren, nicht vorhergesagten Geweben nachgewiesen. Dies kann unter anderem an einem Mangel an ESTs in speziellen Geweben bzw. An unterschiedlichen Protokollen zur EST-Gewinnung liegen. Gleichzeitig stellen solche Beobachtungen dar, wie wichtig die Integration unabhaengiger Datensaetze zur Charakterisierung von Expressionsmustern von mRNA-Transkripten ist. Um das Anwenden der EST-basierten Software-Werkzeuge auf externe Datensaetze zu erleichtern, wurden daher die in dieser Arbeit erzeugten Vorhersagen alternativer Transkripte (und deren Expressionsmuster) in ein relationales Datenbank-Schema implementiert (T-STAG: Tissue-Specific Transcripts And Genes). T-STAG bietet somit einen Zugang zu den zugrundeliegenden Datensaetzen. Das T-STAG Web-Interface wurde entwickelt, um verschiedene Datensaetze zu integrieren. Dadurch wird die Moeglichkeit geschaffen, mit gezielten Fragestellungen zur Funktion und Evolution von Transkripten anzugehen. So erleichtert T-STAG beispielsweise das Auffinden von in Tumoren differentiell exprimierten Genen, die Identifikation von in gleichen Geweben signifikant exprimierten orthologen Genen und die Bestimmung gewebespezifischer Transkripte. Durch die Integration verschiedener EST-bezogener Datensaetze bildet T-STAG eine Grundlage zur Analyse Gewebe-spezifischer Prozesse und metabolischer Netzwerke.