Die Automation im Laborbereich hat in den letzten Jahren einen rapiden Wandel erfahren. Neben dem Pipettieren, Rühren und Schütteln von Flüssigkeiten und Zellen werden längst hochkomplexe Komponenten wie Mikroskope, Massenspektrometer und Sequenziergeräte in den Automationsprozess integriert. Die Folgen sind markant. Die Kosten für die Sequenzierung eines menschlichen Genoms werden in absehbarer Zeit auf unter $100 sinken[1], die technologischen Fortschritte öffnen die Türe für neue Möglichkeiten der in-vitro Diagnostik, wie beispielsweise der Proteomik oder der Metabolomik Die Menge der generierte Daten per Testserie liegen im Terrabytebereich. Auch im Betrieb und der Qualitätssicherung fallen Daten an, welche es zu überwachen und auszuwerten gilt. Können bestehende Technologien im Big Data Bereich helfen, der Datenflut Herr zu werden? Und wie steht es um aktuelle Bemühungen in der Standardisierung der Labor Automatisierung (SiLA), können diese hier Hilfe bieten?
Big Data – das Durchforsten des Datendschungels auf der Suche nach neuen Erkenntnissen – erfreut sich aktuell grosser Beliebtheit und hält Einzug in sämtliche Branchen und Industrien. Die technischen Herausforderungen, welche das Suchen, Aufbereiten und Analysieren relevanter Datenquellen mit sich bringen, sind im Bereich Data Mining, Text Analyse, Machine Learning und Visualisierung anzusiedeln. In Ergänzung zu dieser klassischen Sichtweise auf die Big Data Thematik (“top down“), wird Big Data heute vermehrt bereits während der Entwicklung neuer Systeme berücksichtigt (“bottom up“). Daten werden nicht aufgestöbert sondern in grossem Umfang erhoben und frühzeitig für die Analyse bereitgestellt. In solchen Systemen stehen die Einbettung von Sensoren und Messeinheiten, sowie die Einbindung einzelner Systemkomponenten in eine vernetzte Umgebung im Vordergrund.
Auch die Laborautomation folgt dieser Entwicklung und gestaltet den Trend hin zu „embedded“ Big Data damit an vorderster Front. Produktionsprozesse werden gezielt mit elektronischen Systemen überwacht. Die detaillierte Erhebung und Auswertung der Daten bietet dem Laborbetreiber eine Vielzahl an Möglichkeiten die Produktion zu optimieren, Wartungsarbeiten zu koordinieren oder die Qualität der Produkte sicherzustellen.
Im Jahre 2009 wurde das SiLa Konsortium für Standardisierung in der Laborautomation ins Leben gerufen, um die Vernetzung unter den einzelnen Laborkomponenten zu harmonisieren und so die Automatisierung im Laborbetrieb voranzutreiben. Neben der Definition von Standardschnittstellen für einzelne Gerätetypen sind einheitliche Datenformate und Datenerfassungsstandards vorgesehen [2]. Dieser Vorstoss wird es in Zukunft nicht nur erlauben, Systemkomponenten unabhängig von Modell und Hersteller auszutauschen, sondern auch generische Lösungen für die Big Data Analyse in der Laborautomation zu entwickeln.
Big Data Analyse in der Laborautomation
In der Laborautomation werden Komponenten zur Probenaufbereitung, automatische Zell- und Gewebekulturen, Liquid Handling Plattformen, sowie Messeinheiten und bildgebende Verfahren zur Auswertung der Versuchsreihen zu Produktions- und Analyseanlagen konfiguriert. In einer solchen Automationskette ist jedes einzelne Gerät mit einer Vielzahl von Sensoren und Messeinheiten ausgestattet, um den Prozess von Anfang bis Ende detailliert zu überwachen. Die dabei anfallenden Datenmengen sind enorm und bewegen sich im Terrabyte Bereich [3]. Insbesondere Sequenzer und bildgebende Verfahren liefern grosse Datensätze. Hinzu kommen spezialisierte Auswerteverfahren der Bildanalyse, welche ein hohes Mass an Rechenleistung voraussetzen. Die folgenden Anwendungsbeispiele zeigen Möglichkeiten auf, diese Daten nutzenbringend zu analysieren.
Beispiel 1: Systemwartung
Die Zusammenführung und Echtzeitauswertung der Daten ermöglicht eine frühzeitige Fehlererkennung, eine effiziente Koordination der Wartungs- und Reparaturarbeiten und damit eine Steigerung der Produktivität. Durch Fernüberwachung der Prozesse kann sich der Betriebstechniker frühzeitig ein Bild der Situation machen und die entsprechenden Reparaturteile oder Ersatzgeräte beim nächsten Besuch mitführen. Die laborübergreifende Auswertung von Systemausfällen und Reparaturarbeiten ermöglicht es, Muster im Systembetrieb zu identifizieren, die auf einen bevorstehenden Defekt hindeuten. In der Folge können präventiv Wartungsarbeiten durchgeführt werden, bevor Produktionsausfälle eintreten und fehleranfällige Systemkonfigurationen behoben werden.
Beispiel 2: Qualitätssicherung
Diagnoseresultate und Produkte in der Laborautomation sind die Summe Ihrer Herstellungsschritte. Eine nachträgliche Qualitätsprüfung ist oft schwierig durchzuführen oder von eingeschränkter Aussagekraft. Die Verknüpfung von Sensor- und Messdaten mit den Produktionsschritten und Analyseresultaten bietet hier Hand in der Qualitätskontrolle. In einem reglementierten Umfeld, wie beispielsweise der Labordiagnostik, ist die Qualitätssicherung und Verfolgbarkeit der Analyseschritte gar Voraussetzung für die Zulassung einer Anlage. Dem Kunden oder Auftraggeber bietet die Verknüpfung von Produkten mit Messreihen aus dem Produktionsprozess zudem die Möglichkeit, eigene Qualitätskriterien nachträglich zu prüfen. Produkte minderer Qualität könnten in einem nicht reglementierten Umfeld zu einem reduzierten Preis angeboten werden. Treten bei der Weiterverwendung von Produkten Mängel oder Unregelmässigkeiten auf, so können deren Ursachen in der Produktion identifiziert und neue Qualitätskriterien definiert werden.
Beispiel 3: Integrative Datenanalyse
Einheitlich formatierte Datensätze bilden die Grundlage für eine integrative Datenanalyse, um Daten unterschiedlicher Analyseprozesse routinemässig zu verknüpfen. Beispielsweise könnte das Genom eines Patienten zusammen mit Gewebeschnitten und Oberflächenstrukturen eines Tumors und den Metaboliten im Tumorgewebe standardmässig und ganzheitlich auf Zusammenhänge untersucht und unter verschiedenen Patienten verglichen werden. Auch liessen sich Resultate aus verschiedenen Laboratorien oder von Geräten unterschiedlicher Hersteller einfach zusammentragen und gesamthaft analysieren. Dies ermöglicht nicht nur die Modularisierung von Arbeitsschritten innerhalb eines Labors, sondern auch die vereinfachte Dezentralisierung und Parallelisierung von diagnostischen Analysen in verschiedenen Labors.
Datensätze, wie sie die Sequenzierung und bildgebende Verfahren der Mikroskopie hervorbringen, sind oft gross und deren Information von geringer Struktur. Um die Resultate auswerten zu können, müssen die Rohdaten oft vorgängig strukturiert und zwischengespeichert werden. Stetige Fortschritte im Gebiet der Algorithmik, Bildverarbeitung und Datenanalyse erlauben eine zunehmend präzisere Analyse der Rohdaten. Dies setzt voraus, dass die Rohdaten auf lange Zeit sicher gespeichert werden und allgemein zugänglich sind. Verteilte Speicher- und Rechensysteme, wie beispielsweise Hadoop und MapReduce, aber auch Ansätze des Cloud Computings stehen bereit, um diese Herausforderungen anzugehen.
Voraussetzung für eine schnelle und unkomplizierte Integration verschiedener Laborkomponenten sind einheitliche Datenformate und Geräteschnittstellen, wie sie beispielsweise das Konsortium für Standards in Laboratory Automation (SiLA) propagiert und vorantreibt. Die Möglichkeit, Geräte verschiedener Modelle und Hersteller einfach untereinander zu verbinden und auszutauschen, erlaubt die Entwicklung von nachhaltigen Lösungen zur integrativen Datenanalyse in der Laborautomation.
SiLA als einheitliche Datenquelle
Die Vereinheitlichung von Schnittstellen und Datenformaten in der Laborautomation ermöglicht Laborbetreibern die Integration der neusten Entwicklungen und Technologien verschiedener Instrumentehersteller in ihre bestehende Plattform(en). Für die Laborbetreiber bedeutet dies eine grössere Unabhängigkeit von einzelnen Zulieferern. Auf der anderen Seite ermöglichen die Schnittstellen den Instrumenteherstellern eine Fokussierung und Spezialisierung, da Sie keine kompletten Automationssysteme aus einer Hand liefern müssen.
Der SiLA Interface Standard definiert generische Instrumenteklassen (Schüttler, Inkubator, Reader etc.), welche die Gesamtheit der Instrumente in der Laborautomation abdeckt. Für jede Geräteklasse ist ein dazugehöriger Befehlssatz definiert. Richtlinien für die Implementierung von zusätzlichen Befehlen und Parametern ermöglichen es den Herstellern, spezielle Gerätefeatures zu unterstützen. Neben der Definition von Befehlsschnittstellen sind ausserdem Datenschnittstellen und Datenformate vorgesehen, welche die Basis für eine standardisierte Suche und Analyse bilden. Die verschiedenen Interessen werden in standardisierten Arbeitsgruppen behandelt [2]:
- Device Control and Interface – Standardisiert Datenformate und Telegramme um Daten zwischen Prozess Management Systemen (PMS) und Instrumenten auszutauschen.
- Command Dictionary – Standardisiert, verpflichtende und optionale Befehle für die unterschiedlichen Instrumentenklasse.
- Labware Specification – Standardisiert Labware-Eigenschaften für Liquid Handling Platten.
- Certification – Rahmenvereinbarung für die Organisation von Zertifizierungsstätten und Prozeduren zum Test der Konformität der Standards sowie die Auditierung von Testcentern.
Folgende weitere Arbeitsgruppen sind aktuell in Planung [2]:
- Imaging – Standardisiert komplexe Bilddaten und Bildanalysefunktionalitäten.
- System Devices & Pipettor – Standardisiert allgemeingültige Funktionalitäten von Pipettiergeräten.
- Process Management Systems – Die Management-funktionalität SiLA-konformer Laboratorien auf Softwareebene soll einheitlich behandelt werden.
- Remote Services & Error Recovery – Standardisiert modulare Funktionsblöcke für die Definition von „high level“ Anwendungsprozessen und deren Funktionalitäten.
- Harmonized Data Storage – Standardisiert harmonisierte Datenspeicher und deren Integration mit Labor Integration Management Systemen (LIMS) und Electronic Laboratory Notebook (ELN) Systemen.
Die Implementation des SiLA Standards basiert auf Web Services und unterstützt drei unterschiedliche Integrationsstufen. SiLA Konformität eines Instruments kann mittels Treibern erreicht werden, welche auf der Betreiberplattform installiert sind (SiLA Compliant Driver). Alternativ kann ein “interface converter” als Middleware implementiert sein (SiLA Supported Equipment), oder das SiLA Interface wird direkt auf dem Instrument eingebettet (SiLA Certified Equipment). Dies ermöglicht es den Plattformherstellern sowie den Instrumenteherstellern und Laborbetreibern SiLA Schnittstellen zu implementieren. Die Konformität des Standards wird durch akkreditierte Zertifizierungsstellen gesichert.
Schlussfolgerung
SiLA leistet eine Vorreiterrolle in der Bemühung, Instrumenteschnittstellen für die Laborautomation zu definieren. Mit diesem Vorstoss bereitet SiLA nicht nur den Weg für die beschleunigte Integration von Laborautomationssystemen, sondern bildet ausserdem die Grundlage für die integrative Datenanalyse. Big Data Anwendungen, wie sie in diesem Bericht aufgeführt wurden, rücken in greifbare Nähe. Damit sind universell konfigurierbare Big Data Applikationen basierend auf standardisierten Schnittstellen denkbar. Noch einen Schritt weiter gehen Gedanken hin zu sich selbst regulierenden Automationsplattformen, die sich der Bidirektionalität der SiLA Schnittstellen bedienen und mittels Machine Learning Algorithmen und Feedbackloops ihre internen Betriebsprozesse autonom optimieren – Stichwort Industrie 4.0.
Es bleibt abzuwarten, ob und wie schnell sich der SiLA Standard in diesem dynamischen, global umkämpften Markt etablieren kann. Der rasante Anstieg an SiLA Mitgliedern und jüngste Bemühungen, in den USA Fuss zu fassen, lassen optimistisch in die Zukunft blicken.
[1] http://money.cnn.com/2013/06/25/technology/enterprise/low-cost-genome-sequencing/
[2] www.sila-standard.org
[3] http://www.faz.net/aktuell/wirtschaft/unternehmen/gesundheitsmarkt-medizin-im-rausch-der-daten-12047668.html