Shotgun Sequencing

Shotgun Sequencing

Shotgun Sequencing bzw. Schrotschusssequenzierung ist in der Molekularbiologie eine Methode zur Sequenzierung langer DNA-Stränge. Sie wurde von Frederick Sanger 1982 entwickelt. Hierbei wird die DNA mehrfach kopiert und die Kopien werden zufällig in zahlreiche kleine Fragmente von 300 - 1'000 bp fragmentiert, die anschließend sequenziert werden. Die Fragmente werden mit Methoden aus der Bioinformatik auf Überlappungen untersucht und automatisiert zu einer Konsensussequenz mit möglichst wenigen Lücken zusammengesetzt.

Das Verfahren ist viel schneller als herkömmliche Sequenzierungsalgorithmen. Craig Venter hat 1995 das Verfahren durch den Einsatz von Bioinformatik revolutioniert. Anstatt (wie bisher) die Fragmente kartieren zu müssen, um zu wissen, wo welches Fragment im Genom ist, benutzte Venter Computer zur Rekonstruktion des Genoms aus den nun völlig zufällig sequenzierten Bereichen des Genoms. Dies wurde möglich, da die Sequenziergeräte immer billiger und schneller wurden. Nur mit dieser Technik konnte das menschliche Genom sequenziert werden.

Inhaltsverzeichnis

Motivation

Mit aktuellen Sequenzierverfahren kann man Präfixe von DNA-Strängen von ca. 800 Basen an einem Stück sequenzieren. Danach bricht das Verfahren ab, oder die gewonnene Sequenzinformation wird zu ungenau. Das menschliche Genom ist ca. 3 Milliarden Basen, das Genom einer Fruchtfliege ist ca. 200 Millionen Basen und das Genom des Bakteriums Escherichia coli ist ca. 4,6 Millionen Basen lang. D.h. man kann Genome aufgrund ihrer Länge nicht einfach am Stück sequenzieren.

Verfahren

Die Sequenzierung mit dem Shotgun-Verfahren wird in mehrere Phasen eingeteilt:

  • Fragmentierung der DNA und Sequenzierung der Fragmente (Fragmentierungs-Phase)
  • Feststellung von Überlappungen zwischen den Fragment-Sequenzen (Overlap-Phase)
  • Berechnung eines multiplen Alignments der Fragmente (Layout-Phase)
  • Ermittlung der Konsensus-Sequenz (Konsensus-Phase)

Fragmentierungs-Phase

Die Fragmente werden zufällig erzeugt, in dem mechanische Scherkräfte auf die DNA einwirken (beispielsweise Ultraschall). Daher auch der Name Shotgun-Sequenzierung, da die Verteilung des Schrots im Ziel auch zufällig ist. Ein sequenziertes Fragment wird auch als read bezeichnet.

Overlap-Phase

Um den Überlapp zwischen n sequenzierten Fragmenten festzustellen, müssen \binom{n}{2}\in O(n^2) Vergleiche durchgeführt werden. Bei Verwendung von einem modifizierten Standard-DP-Sequenzalignment-Algorithmus, liegt ein Vergleich in O(m2), wobei m die maximale Fragmentlänge ist. Deshalb werden in der Praxis auch effizientere heuristische Techniken verwendet (z.B. durch Verwendung von BLAST).

Layout-Phase

Die Information der Overlap-phase wird verwendet um die Fragmente überlappend anzuordnen. Dieser Prozess wird mit Hilfe von Algorithmen der Bioinformatik automatisiert durchgeführt. In Abhängigkeit von der Abdeckung (coverage) der Eingabesequenz mit den zufällig erzeugten Fragmenten, sind nach der Anordnung der Fragmente Lücken in diesem Alignment der Fragmente (Layout) vorhanden. Diese durch Lücken voneinander getrennten Inseln von Fragment-Alignments werden auch als Contigs bezeichnet.

Wiederholungen in der Eingabe DNA-Sequenz (repeats) sind problematisch, da in der Layout-Phase die Fragmente die Stücke eines repeats enthalten, falsch angeordnet werden können. Es kann zu einer Komprimierung der konstruierten Konsensussequenz kommen. Durch statistische Verfahren (z.B. Poisson-Verteilung (Lander-Waterman Statistik)) können solche Stellen erkannt und gesondert behandelt werden.

Wenn auch bei einer hohen Abdeckung Lücken vorhanden sind, dann können Lücken durch andere Verfahren, beispielsweise durch Primer-Walking, geschlossen werden.

Varianten

Es wird zwischen whole-genome-shotgun-sequencing und clone-by-clone-sequencing unterschieden. Whole-genome-shotgun-sequencing wird auch als double-barrel-shotgun-sequencing bezeichnet, da hierbei die zufällig erzeugten Fragmente (> 2 x 800 Basen) von beiden Enden sequenziert werden. Die beiden Enden eines Fragments werden auch als mate pairs bezeichnet. Die Länge, und die beiden Endsequenzen jedes Fragmentes werden in der späteren Assemblierungsphase der Fragmente verwendet. Aus diesen Informationen wird ein Gerüst (scaffold) erstellt, an dem Inseln von überlappenen Fragmenten (contigs), ausgerichtet werden, wenn jeweils ein Fragment eines mate-pairs auf unterschiedlichen Contigs liegt.

Bei der clone-by-clone-Sequenzierung wird das Genom zuerst mit Restriktionsenzymen in mehrere überlappene Bereiche geschnitten. Die einzelnen Bereiche werden kloniert und es wird eine physikalische Karte der Klone in dem Genom erstellt (d.h. die Reihenfolge und die Orientierung der Sequenzen der Clone wird durch Untersuchung auf genetische Marker ermittelt, Physical Mapping). Danach wird jede Clone-Sequenz einzeln Shotgun-sequenziert und mit Hilfe der physikalischen Karte kann eine komplette Konsensussequenz abgeleitet werden.

Siehe auch

  • Celera Assembler - ein konkretes whole-Genome-shotgun-sequencing Programmpaket

Weblinks

Literatur

  • R. Merkl, S. Waack: Bioinformatik Interaktiv. WILEY-VCH, 2003, ISBN 3-527-30662-5, S. 313-324.
  • Dan Gusfield: Algorithms on strings, trees, and sequences. Cambridge University Press, 1999, ISBN 0-521-58519-8, S. 420ff (Shotgun Sequencing).
  • Rolf Knippers: Molekulare Genetik. 8. Auflage. Georg Thieme Verlag, 2001, ISBN 3-13-477008-3, S. 465-470.
  • S.B. Primrose, R.M. Twyman: Principles of Gene Manipulation and Genomics. 7. Auflage. Blackwell Publishing, 2006, ISBN 1-4051-3544-1, S. 362-371.

Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Shotgun sequencing — In genetics, shotgun sequencing, also known as shotgun cloning, is a method used for sequencing long DNA strands. It is named by analogy with the rapidly expanding, quasi random firing pattern of a shotgun.Since the chain termination method of… …   Wikipedia

  • Shotgun sequencing — An approach used to decode a genome by shredding ( shotgunning ) it into smaller fragments of DNA which can then be individually sequenced. The sequences of these fragments are then ordered, based on overlaps in the genetic code, and finally… …   Medical dictionary

  • shotgun sequencing — noun A DNA sequencing technique in which a large number of small fragments of a long DNA strand are generated at random, sequenced, and reassembled to form a sequence of the original strand …   Wiktionary

  • Shotgun proteomics — is a method of identifying proteins in complex mixtures using a combination of high performance liquid chromatography combined with mass spectrometry.cite journal |author=Hu L, Ye M, Jiang X, Feng S, Zou H |title=Advances in hyphenated analytical …   Wikipedia

  • whole-genome shotgun sequencing — An approach to genome sequencing in which the complete genome is broken into random fragments, which are then individually sequenced. Finally the fragments are placed in the proper order using sophisticated computer programs …   Dictionary of microbiology

  • Shotgun (disambiguation) — A shotgun may refer to:*Shotgun, a firearm *Shotgun (cannabis), one of a number of terms in the slang of cannabis users * Shotgun (film), a 1955 B Western starring Sterling Hayden * Shotgun , a song by the Canadian alternative rock band Moist *… …   Wikipedia

  • Shotgun lipidomics — In lipidomics, the process of shotgun lipidomics (named by analogy with shotgun sequencing uses analytical chemistry to investigate the biological function, significance, and sequelae of alterations in lipids and protein constituents mediating… …   Wikipedia

  • Shotgun — Der Begriff Shotgun (von engl. shotgun = Schrotflinte) bezeichnet: eine Flinte eine molekularbiologische Methode zur Entschlüsselung von Genomen, siehe Shotgun Sequencing einen Haustyp, der vor allem im Süden der USA verbreitet ist, siehe Shotgun …   Deutsch Wikipedia

  • shotgun genome sequencing — A strategy for sequencing a whole genome, in which the genomic DNA is initially fragmented into pieces small enough to be sequenced. Specialized computer software is then used to piece together the individual sequences to create long contiguous… …   Glossary of Biotechnology

  • Full genome sequencing — Genome sequencing redirects here. For the sequencing only of DNA, see DNA sequencing. An image of the 46 chromosomes, making up the diploid genome of human male. (The mitochondrial chromosome is not shown.) Full genome sequencing (FGS), also… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”