Franz-Josef-Strauß-Allee 11
93053 Regensburg
Veröffentlicht am 04.02.2021
Das menschliche Genom enthält etwa drei Milliarden Basenpaare . Im Durchschnitt unterscheiden sich die Genomsequenzen zweier Menschen in etwa einem von 1.000 Basenpaaren voneinander. Dabei treten unterschiedliche Varianten auf. Von ausgetauschten Basenpaaren bis hin zu ganzen fehlenden DNA-Abschnitten. Wissenschaftler des Regensburger Centrums für Interventionelle Immunologie (RCI) und des Berlin Institute of Health (BIH) haben gemeinsam mit isländischen Forschern „PopDel“ entwickelt, eine Software, die zuverlässig und schnell große Mutationen in Zehntausenden von Genomen gleichzeitig identifiziert. PopDel kann eine Grundlage für die Identifizierung von Deletionen sein, die die menschliche Gesundheit beeinflussen. Die Ergebnisse wurden nun in der Fachzeitschrift Nature Communications veröffentlicht.
Das menschliche Genom enthält rund drei Milliarden Basenpaare und ist auf 46 Chromosomen verteilt. Doch die genetische Variation von Mensch zu Mensch ist sehr gering:. Manchmal werden einzelne Basenpaare im Genom ausgetauscht, ein anderes Mal werden ganze Abschnitte verschoben. „Große strukturelle Veränderungen sind viel seltener als Veränderungen einzelner Basenpaare, aber sie haben oft einen größeren Einfluss auf die Ursache von Krankheiten", sagt Professor Dr. Birte Kehr, seit kurzem Professorin für Algorithmische Bioinformatik am Regensburger Centrum für Interventionelle Immunologie Diese Veränderungen sind jedoch schwieriger zu erkennen. Um mehr über diese größeren Veränderungen zu erfahren, ist es hilfreich, große Datenbanken zu nutzen. Über eine solche Datenbank verfügt die isländische Firma deCODE Genetics., deren Datenbank enthält rund 50.000 menschliche Genomsequenzen. „Wir hatten immer vor, in dieser Datenbank nach Mutationen zu suchen, aber wir hatten kein Programm, das diese riesigen Datenmengen zuverlässig und schnell verarbeiten konnte", erklärt Professor Kehr.
Die bisher verfügbaren Programme zur Identifizierung von Strukturvarianten konnten nur die Daten weniger Individuen gleichzeitig verarbeiten. Bei großen Datensätzen mussten die Ergebnisse dann kombiniert werden, was ein umständlicher und fehleranfälliger Prozess war. „Ziel war es, zunächst ein statistisches Modell zu entwickeln, mit dem wir Informationen aus allen Genomen gleichzeitig auswerten können", berichtet Sebastian Niehus, der Erstautor der Studie. „Dazu musste das Programm so gestaltet werden, dass ein Computer schnell große Datenmengen durchforsten kann."
Nachdem PopDel entwickelt war, musste es sich in verschiedenen Szenarien gegen andere Programme beweisen. “Es gelang uns zu zeigen, dass PopDel schnell, zuverlässig und ressourceneffizient gute Ergebnisse liefert, sowohl mit den Daten einer einzelnen Person als auch mit den Daten der größten Kohorten", so Niehus weiter. Kehr ergänzt: „PopDel brauchte nur zwei Tage, um die Genome von 150 Personen zu analysieren. Andere Programme nahmen dazu vier Wochen in Anspruch. Und auch die Ergebnisse von PopDel waren besser." Die Wissenschaftler haben PopDel nun über das Paketmanagementsystem „Conda“ für die wissenschaftliche Gemeinschaft öffentlich zugänglich gemacht. Der Quellcode ist auf Github unter https://github.com/kehrlab/PopDel zu finden.
Allerdings kann PopDel nur gelöschte DNA-Abschnitte erkennen, nicht aber genetische Varianten, bei denen Abschnitte verdoppelt, invertiert oder transloziert wurden. Die Forscher hoffen, die Software weiterentwickeln zu können, um künftig all diese Arten von genetischen Strukturvarianten zu erkennen. Langfristig sollen die gewonnenen Erkenntnisse zur Entwicklung neuer Therapien führen, hofft Professor Kehr.
„Wir hoffen, dass wir mit PopDel neue genetische Varianten identifizieren können, die für die Verbesserung von Immunzellfunktionen verantwortlich sind. Die Nachbildung solcher Mutationen mit Hilfe modernster Gen-Editing-Technologien würde dem RCI innovative zelluläre Plattformen für die Behandlung von Krebs und immunbezogenen Krankheiten wie Autoimmunität und Graft-versus-Host-Disease liefern", sagt Professor Philipp Beckhove, Direktor des RCI.
Über das RCI
Das RCI Regensburger Centrum für Interventionelle Immunologie ist ein außeruniversitäres Forschungszentrum mit Fokus auf die translationale Immunologie in den Bereichen Krebsimmuntherapie, chronische Entzündung und Autoimmunität. Ziel ist es, effektive zelluläre Immuntherapien in diesen Bereichen zu entwickeln.
PopDel, a new software to detect large DNA deletions
The human genome contains roughly three million letters. On average, the genome sequences of any two people differ from each other by about one in every 1,000 letters. Yet different variants occur, from substituted letters to entire missing sections of DNA. Scientists from the Regensburg Center for Interventional Immunology (RCI) and the Berlin Institute of Health (BIH) have teamed up with Icelandic researchers to develop PopDel, a software that reliably and quickly identifies large deletions in ten-thousands of genomes simultaneously. This tool can provide a basis for the identification of deletions affecting human health. The researchers have now published their findings in the journal Nature Communications.
The human genome contains roughly three million letters and is distributed over 46 chromosomes. Yet the genetic variation from person to person is very small: the genome sequences of any two people differ from each other by about one in every 1,000 letters. Sometimes single letters are exchanged in the genome, while other times whole sections are moved around. “Large structural changes are much rarer than changes in single letters, but they often have a bigger impact on the cause of diseases.” says Birte Kehr, a recently appointed professor of Algorithmic Bioinformatic at the Regensburg Center for Interventional Immunology (RCI). These changes, however, are harder to be detected. To learn more about these bigger changes, it is helpful to use large databases to search for them. That’s where the collaboration with the Icelandic company deCODE Genetics came in, whose database contains around 50,000 human genome sequences. “We always planned to search for deletions in this database, but we didn’t have a program capable of reliably and quickly processing such huge amounts of data.” says Kehr.
The programs previously available for identifying structural variants could only process data from a few individuals at a time. For large data sets, the results then had to be combined, which was a cumbersome and error-prone process. “We first wanted to develop a statistical model that would enable us to evaluate information from all genomes simultaneously.” Sebastian Niehus, the first author of the study reports. “To do this, the program had to be designed so that a computer could quickly sift through huge quantities of data.”
Once PopDel was developed, it had to prove itself against other programs in various scenarios. “We were able to show that PopDel produced good results in a quick, reliable and resource-efficient way, both with data from a single person and with data from the largest cohorts,” says Niehus. Kehr adds: “PopDel only needed two days to analyze the genomes of 150 individuals where other programs had taken four weeks. And PopDel’s results were better.” The scientists made PopDel now publicly available for the scientific community through the package management system Conda. The source code can be found on Github at https://github.com/kehrlab/PopDel
Nevertheless, PopDel can only detect deleted DNA segments but not genetic variants where segments have been duplicated, inverted or translocated. The researchers hope to continue developing the software to detect all these types of genetic structural variants. In the long run, Kehr hopes that the findings will lead to the development of new therapies.
“We hope that PopDel will enable us to identify new genetic variants that are responsible for enhancing immune cell functions. Recreating such mutations using state-of-the-art gene editing technologies would provide the RCI with innovative cellular platforms for the treatment of cancer and immune-related diseases such as autoimmunity and graft-versus-host disease.”, says Professor Philipp Beckhove, scientific Director of the RCI.
About RCI
The RCI Regensburg Center for Interventional Immunology, an extra-university research center, focuses on translational immunology in the fields of cancer immunotherapy, chronic inflammation and autoimmunity. Its objective is to develop effective cellular immunotherapies in these areas.