FastQC
FastQC ist eine Open-Source-Software zur Qualitätsprüfung von High-Throughput-Sequenzierungsdaten. Es wurde ursprünglich mit dem Ziel entwickelt, den Sequenzierungsprozess zu überwachen und potenzielle Qualitätsprobleme aufzudecken, die den Nachweis von Biomarkern oder anderen wichtigen biologischen Informationen beeinträchtigen können.
FastQC bietet eine Reihe von Funktionen, die darauf abzielen, eine umfassende Einschätzung der Qualität der Sequenzdaten zu erhalten. Diese Funktionen beinhalten:
1. Erkennung von Sequenzierungsartefakten: FastQC kann typische Artefakte der Sequenzierung erkennen, wie z.B. durch Bias verursachte Qualitätsabfälle, schlechte Sequenzqualität oder Sequenzdichteunterschiede.
2. Erkennung von Sequenzqualität: FastQC führt eine Baseline-Qualitätskontrolle durch, bei der die Qualität aller Sequenzen in einem Datensatz gemessen wird.
3. Erkennung von Sequenzuniformität: FastQC kann die Uniformität der sequenzierten Sequenzen untersuchen, um z.B. zu sehen, ob es eine übermäßige Anzahl von Sequenzen mit einem bestimmten Sequenzmuster gibt.
4. Erkennung von Sequenzabhängigkeiten: FastQC kann die Sequenzabhängigkeiten innerhalb eines Datensatzes untersuchen, um zu sehen, ob bestimmte Sequenzen häufiger vorkommen als andere.
5. Erkennung von Sequenzüberschneidungen: FastQC kann überprüfen, ob bestimmte Sequenzen überlappend in mehreren Lesungen vorkommen.
6. Erkennung von Sequenzgruppen: FastQC kann Gruppen von Sequenzen identifizieren, die ähnliche Sequenzmuster aufweisen, und kann auch Gruppen identifizieren, die möglicherweise nicht zusammenhängende Sequenzmuster aufweisen.
7. Erkennung von Sequenzinhalten: FastQC kann den Inhalt aller sequenzierten Sequenzen untersuchen, um z.B. die Anzahl der Nukleotide in einer Lesung zu bestimmen oder um zu sehen, ob ein bestimmtes Nukleotid häufiger oder seltener vorkommt als andere.
8. Erkennung von Signatursequenzen: FastQC kann bestimmte Sequenzen, die als Signatursequenzen bezeichnet werden, in den sequenzierten Daten erkennen.
9. Erkennung von Sequenzmuster: FastQC kann bestimmte Sequenzmuster in den sequenzierten Daten erkennen.
10. Erkennung von Sequenzflanken: FastQC kann die Länge und Sequenz der Flanken bestimmen, die einzelne Sequenzen flankieren.
11. Erkennung von Sequenzstörungen: FastQC kann auch Sequenzstörungen erkennen, die durch unerwartete Muster auf der Sequenz verursacht werden.
12. Erkennung von Sequenzinversionen: FastQC kann auch Sequenzinversionen erkennen, bei denen Teile der Sequenz in entgegengesetzter Orientierung vorkommen.
13. Erkennung von Sequenzvariabilität: FastQC kann auch die Variabilität der Sequenzen untersuchen, um z.B. zu sehen, ob bestimmte Sequenzen häufiger oder seltener variieren als andere.
14. Erkennung von Sequenzvariation: FastQC kann auch die Variation innerhalb einer Sequenz untersuchen, um z.B. zu sehen, ob es eine übermäßige Anzahl von Varianten eines bestimmten Nukleotids gibt.
15. Erkennung von Sequenzklonen: FastQC kann auch identifizieren, ob bestimmte Sequenzen identisch oder nur sehr ähnlich sind.
16. Erkennung von Sequenzabhängigkeiten: FastQC kann auch die Abhängigkeiten zwischen Sequenzen analysieren, um z.B. zu sehen, ob bestimmte Sequenzen häufiger zusammen auftreten als andere.
17. Erkennung von Sequenzfehlern: FastQC kann auch Sequenzfehler erkennen, die durch Sequenzierungsartefakte oder durch andere Faktoren verursacht werden.
Insgesamt bietet FastQC ein breites Spektrum an Funktionen, die das Verständnis der Qualität und Zusammensetzung von sequenzierten Daten erleichtern. FastQC ist ein sehr nützliches Werkzeug, um die Qualität eines Datensatzes zu überprüfen und Qualitätsprobleme aufzudecken, die den Nachweis von Biomarkern oder anderen wichtigen biologischen Informationen beeinträchtigen können. Es ist ein leistungsstarkes Werkzeug für die Qualitätskontrolle der High-Throughput-Sequenzierung und bietet eine umfassende Einschätzung der Qualität der Daten.
FastQC ist ein benutzerfreundliches Tool, das Ihnen hilft, die Qualität Ihrer NGS-Daten zu bewerten und zu überwachen.