Protein-Protein Interaktionen und Methylierungsmuster im menschlichen Genom
Bachelorthesis von Kim Hübner
Eine zentrale Thematik in der Epigenetik sind die verschiedenen Mechanismen, mit welchen ein Lebewesen sich gegenüber Umwelteinflüssen anpasst und dabei die eigenen Gene und ihre Expression reguliert. Dazu gehört die DNA-Methylierung, welche nachweislich die Gen Aktivität unterdrücken kann. Ein weiteres Maß für die Komplexität eines Organismus stellen Protein-Protein Interaktionen dar, welche in Netzwerken mit ihren Wechselwirkungen ebenfalls einen hohen Einfluss auf den Organismus einnehmen.
Die zugrundeliegende Bachelorarbeit beschäftigte sich deshalb mit einer statistischen Auswertung zu Protein-Protein Interaktionen(kurz PPI) und die Methylierung von Genen, welche für diese kodieren.
Methoden
Für die Methylierungen wurden fünf zufällig bestimmte Gewebeproben von einem Referenzgenom aus Encode genommen, die PPI entstammen der String DB und für eine Übersetzung wurde das Online-Tool Biomart von Ensembl genutzt.
In zwei Ansätzen, welche teilweise und vollständig methylierte Gene betrachten, wurde computergestützt die Anzahl von Interaktionen von jedem Chromosom bestimmt. Genutzt wurde die Programmiersprache Java und kleinere Skripten, welche die Datensätze vorsortierten und filterten.
Ein weniger rechenintensiver Versuch ist die Zählung von Interaktionen, welche von Genen kodieren, die nur teilweise methyliert sind.
Deutlich restriktiver ist die Zählung von Interaktionen, bei denen beide Protein-Partner mit ihren jeweils kodierenden Genen in methylierten Bereichen des Genoms liegen.
Ergebnis
In beiden Ansätzen wurde festgestellt, dass eine hohe Varianz zwischen den verschiedenen Gewebeproben besteht, auch wenn man ähnlich große Bereiche(Basentechnisch) betrachtet.
Chromosom 19 besitzt den größten Bereich an Methylierungen, während die anderen Chromosomen ähnlich große Bereiche prozentual zu ihrer Gesamtlänge vorweisen. Dies deckte sich nicht mit der Anzahl von PPI.
Bei dem zweiten Ansatz wurden erst PPI in allen 5 Proben bei einer zusätzlichen Reichweite von 5k Basen bestimmt. Dies galt sowohl bei hoher als auch niedriger Konfidenz seitens des Datensatzes von der String DB.
Es wurde ersichtlich, dass deutlich weniger Interaktionen in methylierten Bereichen des menschlichen Genoms vorliegen. Für weitere Zuordnungen in der Zukunft wäre es notwendig, zusätzliche rechenintensive Datensätze zu analysieren und dabei mehr Gewebeproben einer Art zu betrachten.