TU München | KI für die biomedizinische Forschung
Plattform zur Beschleunigung der biomedizinischen Forschung

Das Wichtigste in Kürze

Biocentral macht komplexe KI-Modelle für die biomedizinische Forschung erstmals zentral zugänglich und einfach nutzbar – ohne Programmierkenntnisse, aber mit maximalem Impact für Wissenschaft und Lehre.

Wie aus verstreuten Modellen eine zentrale Plattform für bessere Forschung wurde

In der biomedizinischen Forschung treffen zwei Entwicklungen aufeinander: Die verfügbaren Datenmengen wachsen rasant. Gleichzeitig sind die bestehenden Technologien und Werkzeuge, um diese Daten zu analysieren oft zu fragmentiert, technisch komplex oder nur eingeschränkt nutzbar. Forschende verbringen dadurch viel Zeit, Modelle zu suchen, technische Abhängigkeiten zu lösen oder Software manuell an ihre Bedürfnisse anzupassen.

Gerade im Bereich der KI-gestützten Analyse biomedizinischer Daten gibt es zwar viele leistungsfähige Modelle, doch diese sind verstreut über verschiedene Repositorien, in unterschiedlichen Programmiersprachen geschrieben und häufig nicht wartbar. Die Folge: enormes Potenzial, das ungenutzt bleibt, um beispielsweise schnell medizinische Wirkstoffe zu entwickeln.

Gemeinsam mit der Technischen Universität München hat iteratec dieses Problem gezielt adressiert und die bestehende offene Plattform Biocentral weiter aufgebaut. Ziel war eine skalierbare, intuitive und zukunftsfähige Lösung, die biomedizinische Datenanalyse zugänglicher und leistungsfähiger macht.

Biocentral macht KI für alle nutzbar

Das gemeinsame Team aus Forschenden der TU München und KI-Expert:innen von iteratec entwickelte Biocentral als offene Plattform, auf der leistungsstarke KI-Modelle für die biomedizinische Forschung einfach zugänglich gemacht werden. Ein Beispiel dafür ist das SETH-Modell, das ungeordnete Regionen in Proteinstrukturen in kurzer Zeit erkennen kann und u. a. für die Alzheimer-Forschung relevant ist. Im Zentrum stehen modernste Deep-Learning-Verfahren, insbesondere sogenannte Protein-Language-Models. Diese Modelle – inspiriert von Entwicklungen wie AlphaFold, das 2024 mit dem Nobelpreis gewürdigt wurde – ermöglichen eine neue Qualität in der Vorhersage und Analyse biologischer Strukturen.

Biocentral vereint diese hochspezialisierten Modelle in einer benutzerfreundlichen Umgebung, die sowohl in der Forschung als auch in der Lehre eingesetzt werden kann. Ziel war nicht nur die technische Zusammenführung, sondern eine echte Vereinfachung des Zugangs zu KI, ohne notwendige Programmierkenntnisse, ohne versteckte Abhängigkeiten.

Ein Meilenstein für offene, KI-gestützte Wissenschaft

Ein zentrales Element bei der Umsetzung war die Standardisierung der KI-Modelle: Ursprünglich mit PyTorch entwickelt, also einer Machine-Learning-Bibliothek, die in produktiven Umgebungen aufwendig zu warten ist, wurden sie von den iteratec Kolleg:innen konsequent in das offene ONNX-Format überführt. Das gewährleistet nicht nur Unabhängigkeit von proprietären Frameworks, sondern auch langfristige Wartbarkeit und Interoperabilität.

Dieser Schritt erforderte tiefgreifende technische Eingriffe – teilweise mussten PyTorch-Funktionalitäten neu programmiert werden, um ONNX-Kompatibilität herzustellen. Gemeinsam mit der TU München entwickelten unsere Kolleg:innen individuelle Lösungen. Neben der Modellstandardisierung übernahmen wir die entsprechenden Teile der Backendentwicklung der Plattform. Alle Modelle wurden nach höchsten Standards wissenschaftlicher Software eingebettet, sodass Reproduzierbarkeit, Validierung und Transparenz durchgängig gewährleistet sind.

Die Veröffentlichung als Open-Source-Plattform auf GitHub stellt sicher, dass die wissenschaftliche Community weltweit von der Lösung profitieren und sie weiterentwickeln kann. Biocentral ist somit nicht nur Forschungsprojekt, sondern eine Einladung zur Kollaboration und ein Katalysator für offene Wissenschaft.

Zum GitHub von Biocentral

Biocentral Datenvisualisierung

KI einsetzen ohne Code: Ein echter Gamechanger für Labore

Mit Biocentral erhalten Forschende erstmals einen zentralen Ort, an dem sie mit verschiedenen KI-Modellen arbeiten können, ohne sich in deren technische Funktionsweise einarbeiten oder sie selbst betreiben zu müssen. Die Plattform abstrahiert technische Komplexität und macht damit das Potenzial moderner KI tatsächlich nutzbar, auch für kleinere Forschungseinheiten oder universitäre Arbeitsgruppen.

Wissenschaftler:innen können bestehende Modelle direkt anwenden, Daten analysieren, Hypothesen validieren und neue Erkenntnisse generieren – schneller, zuverlässiger und standardisiert. Dabei profitieren insbesondere biochemische, pharmazeutische und medizinische Forschungsteams, die bislang mangels Ressourcen oder Know-how Machine Learning nicht anwenden konnten.

Benutzeroberfläche der Biocentral Datenbank

Biocentral wächst und mit ihr die Möglichkeiten

Die Entwicklung von Biocentral steht erst am Anfang: In Zukunft soll die Plattform um weitere biologische Datenquellen und Analysefunktionen erweitert werden. Die langfristige Vision ist eine zentrale, interdisziplinäre Arbeitsplattform, die nicht nur den wissenschaftlichen Austausch beschleunigt, sondern auch die Entwicklung neuer Wirkstoffe und die Planung präklinischer Studien unterstützt.

Die Zusammenarbeit mit der iteratec GmbH war sehr angenehm – es wurden zuverlässig und zielstrebig Lösungen für unangenehme Probleme entwickelt, was uns am Lehrstuhl viel Zeit gespart hat. Wir freuen uns über das Interesse an unserem Forschungsbereich der Bioinformatik und sind fest davon überzeugt, dass innovative Technologie gepaart mit aktueller Forschung optimale Synergien für beide Seiten freisetzt. Daher gerne wieder! 

Sebastian Franz TU München

Eingesetzte Technologien & Methoden

Python, PyTorch, ONNX, Flask, Jupyter Notebook

Unsere Leistungen im Überblick

  • Konvertieren existierender Open-Source-PyTorch-Modelle zu ONNX-Modellen, teilweise Reimplementierung PyTorch nativer Funktionalitäten, Sicherstellen konsistenter Modelergebnisse
  • Pull Requests an die Repositories der verwendeten Modelle, um den Code öffentlich verfügbar und nachvollziehbar zu machen
  • Entwurf einer Architektur, wie die vielen Modelle mit ihren unterschiedlichen Anforderungen an Ein- und Ausgabe so in den existierenden Server-Code eingebettet werden können, damit höchste Wartbarkeit gewährleistet ist
  • Implementierung entsprechend der vorgeschlagenen Architektur

Über Kunden

  • Die Technische Universität München (TUM) ist mit über 52.500 Student:innen die nach Studentenanzahl größte Technische Universität in Deutschland. Ihre Schwerpunkte liegen im Bereich der Ingenieurwissenschaften, Technologie, Medizin und angewandter Naturwissenschaften.
    Mehr zur TU München
     
  • Das Rostlab (TUM I12 – Lehrstuhl für Bioinformatik), benannt nach seinem Gründer Prof. Dr. Burkhard Rost, ist seit über 30 Jahren aktiv an den aktuellsten methodischen Entwicklungen im Bereich der Bioinformatik beteiligt. Unter anderem entwickelte es die Protein-Language-Modelle ProtT5 und ProstT5 und erstellt mittels neuster KI-Methoden Vorhersagemodelle für Proteineigenschaften. 

Ihr Ansprechpartner

Sie haben ein konkretes Anliegen oder Fragen zu möglichen AI- und Data Analytics-Projekten für Ihr Unternehmen? Senden Sie eine Anfrage und ich melde mich bei Ihnen.

Dr. Felix Böhmer, Director Al & Data Analytics

FAQ

Wie unterstützt Biocentral die biomedizinische Forschung an der TU München?

Biocentral macht leistungsstarke KI-Modelle für die biomedizinische Forschung zentral zugänglich und einfach nutzbar. Forschende können ohne Programmierkenntnisse biomedizinische Daten analysieren, Hypothesen validieren und neue Erkenntnisse gewinnen. Die Plattform wird sowohl in der Forschung als auch in der Lehre eingesetzt und beschleunigt so wissenschaftliche Arbeit.

Welche Rolle spielt iteratec bei der Entwicklung von Biocentral?

iteratec hat gemeinsam mit der Technischen Universität München die offene Plattform Biocentral weiterentwickelt. Unsere Kolleg:innen haben KI-Modelle standardisiert, Teile der Backendentwicklung übernommen und die Modelle nach hohen Standards wissenschaftlicher Software eingebettet. So wurde aus verstreuten, schwer wartbaren Modellen eine skalierbare, intuitive und zukunftsfähige Plattform.

Welche KI-Modelle kommen in Biocentral zum Einsatz?

Biocentral setzt auf moderne Deep-Learning-Verfahren, insbesondere Protein-Language-Models. Ein Beispiel ist das SETH-Modell, das ungeordnete Regionen in Proteinstrukturen in kurzer Zeit erkennen kann und unter anderem für die Alzheimer-Forschung relevant ist. Die Plattform ist inspiriert von Entwicklungen wie AlphaFold und ermöglicht eine neue Qualität in der Vorhersage und Analyse biologischer Strukturen.

Warum ist die Standardisierung auf ONNX für Biocentral so wichtig?

Viele der ursprünglichen Modelle wurden in PyTorch entwickelt und waren in produktiven Umgebungen schwer wartbar. Durch die konsequente Überführung in das offene ONNX-Format werden Abhängigkeiten von proprietären Frameworks reduziert. Das erhöht Wartbarkeit, Interoperabilität und Zukunftssicherheit der Plattform und erleichtert den Einsatz der Modelle in verschiedenen Umgebungen.

Wer kann Biocentral nutzen und welche Vorteile ergeben sich für Labore?

Biocentral richtet sich an biochemische, pharmazeutische und medizinische Forschungsteams sowie universitäre Arbeitsgruppen. Sie können KI-Modelle nutzen, ohne sich in deren technische Funktionsweise einarbeiten oder eigene Infrastruktur betreiben zu müssen. Das senkt Einstiegshürden, spart Zeit im Labor und macht moderne KI-Methoden auch für kleinere Forschungseinheiten nutzbar.