Analysieren Sie Ihre Daten – Schritt 2: Measure

Analysieren Sie Ihre Daten – Schritt 2: Measure

von 11. Oktober 2017

Der Schritt Define im Rückblick

Beitrag 3 – Im letzten Post haben wir uns mit dem Schritt Define beschäftigt. Hier haben Sie die Grundlagen für ein erfolgreiches Datenanalyseprojekt gelegt. Sie haben das Potential abgeschätzt, die Ziele formuliert, das Projekt strukturiert. Bestenfalls haben Sie nach einer umfassenden Beschreibung des Prozesses mit bekannten und vermuteten Abhängigkeiten bereits eine Zielfunktion definieren können. Diese stellt einen funktionalen Zusammenhang zwischen den Störgrößen und den manipulierbaren Variablen gegenüber den Zielgrößen dar. Im heutigen Post behandeln wir den Schritt Measure, also die Datenerfassung.

Weiter geht’s: Der Schritt Measure

Diese hat eine hohe Relevanz für den Erfolg des folgenden Schritts Analyse, der stark von der Qualität der Daten und der Frage abhängt, ob Sie tatsächlich alle wichtigen Parameter erfasst haben. Dieser Schritt ist auch für diejenigen interessant, die unabhängig von einer Datenanalyse ihre Datenqualität verbessern möchten.

BigData_Grafik_HighlightMeasure

Die Voraussetzungen

Bei der Akquise der Daten ist der Kontakt zum Betreiber von großer Wichtigkeit. Gerade zu Beginn sollten Sie für die Auswahl der richtigen Messstellen und deren Aufteilung in Störgrößen, manipulierbare Variablen und Zielgrößen die Betriebserfahrung möglichst umfassend abfragen. Wurden während des Schrittes Define noch nicht alle Fragen ausreichend geklärt, holen Sie dieses nun nach.

Die Wahl der Daten hängt von der Art Ihrer Zielsetzung ab. Steht die Online-Vorhersage des Prozessverlaufs und darauf aufbauend die Optimierung zwecks Kosteneinsparung und Betriebssicherheit im Vordergrund oder möchten Sie über die Analyse Zusammenhänge einzelner Größen in Ihrem Prozess evaluieren? Diese Frage ist entscheidend für die Auswahl der Parameter und die spätere Art der Datenaufbereitung. Bei einer Prozessoptimierung sollte weitestgehend auf Online-Daten zurückgegriffen werden. Diese stehen in der Regel in größerem Umfang zur Verfügung und können kostengünstiger erhoben werden. Bei der Evaluierung möglicher Zusammenhänge hingegen wird für Sie auch die Verwertung von Analysedaten aus dem Labor interessant sein. Die Einbeziehung beeinflusst die Datenaufbereitung und -analyse in sofern, dass hier die Anzahl der zur Verfügung stehenden Daten stark reduziert ist.

Stellen Sie zielgerichtete Fragen

Auch hier möchte ich Ihnen wieder grundlegende Fragen an die Hand geben und den Hintergrund ein wenig beleuchten:

Wo liegen Ihre Daten?

Die meisten Anlagen sind heute mit einer umfangreichen Messtechnik ausgestattet, so dass große Datenmengen vorliegen. Diese sind jedoch häufig über verschiedenste Systeme verteilt, was die Sammlung und Zusammenfassung der Daten erschwert, aber auch erhebliche Probleme in der Zuordnung der Daten verursachen kann. Auch kann in den Systemen bereits eine Vorverarbeitung der Daten, wie beispielsweise eine Mittelwertbildung durchgeführt werden, was gegebenenfalls zu einer Verringerung der Informationsdichte führt.

Welche Daten stehen Ihnen zur Verfügung und in welchem Zeitintervall werden sie aufgezeichnet bzw. im Labor gemessen?

Das Zeitintervall zwischen einzelnen Datensätzen sollte ausreichend klein sein, um die Dynamik des Prozesses abzubilden. Die Analysedaten sollten mit möglichst genauem Zeitstempel aufgezeichnet sein, um die Online-Daten genau zuordnen zu können.

Sind alle wichtigen Größen in ausreichender Häufigkeit erfasst?

Größtes Problem hier sind Aufzeichnungslücken oder eine fehlerhafte Aufzeichnung. Es kann aber auch sein, dass Sie Schlüsselgrößen gar nicht erfassen. Hier sollten Sie eine Erweiterung der Messtechnik in Betracht ziehen. Berücksichtigen Sie aber immer die Frage nach der Verfügbarkeit einer geeigneten Messtechnik, dem (Kosten-) Aufwand für den Einbau und der Zeitspanne für das Sammeln von ausreichend Daten. Außerdem kann eine Erweiterung der Laboranalytik über einen gewissen Zeitraum sinnvoll sein, um die Datendichte zu erhöhen und die Dynamik der Größe genauer abschätzen zu können.

Wie genau werden die Daten erfasst?

Da die Daten im laufenden Produktionsbetrieb erfasst werden, kann sich beispielsweise durch ungünstige Lage der Messstellen, fehlende Wartung oder nicht vermeidbare Außeneinflüsse eine verminderte Genauigkeit ergeben. Auch können Messergebnisse stark vom Probenehmer abhängen. Hier ist sicherzustellen, dass verschiedene Probenehmer bei gleichen Proben tatsächlich auch zum gleichen Ergebnis kommen oder ob ein Probenehmer reproduzierbare Werte bei mehrmaliger Untersuchung einer Probe ermittelt.

Sind alle Messwerte genau definiert bzw. können sie einem bestimmten Betriebszustand genau zugeordnet werden?

Dieses betrifft sehr häufig die Zuordenbarkeit von Laboranalysen zu Online-Messungen, für die eine genaue Erfassung des Probenahmezeitpunkts notwendig ist. Bestenfalls statten Sie Ihre Messgeräte mit einer automatischen Zeiterfassung der Probenahme aus. Auch bei Online-Daten können Zeitstempel fehlen, oder in mehreren Systemen unterschiedlich erfasst worden sein, so dass eine nachträgliche Zuordnung nicht mehr möglich ist. Problematisch ist auch die Aufzeichnung verschiedener Prozessbedingungen mit unterschiedlicher Wirkung unter einem Oberbegriff. Eine Trennung der Daten im Nachhinein ist dann mit hohem Aufwand verbunden oder schlimmstenfalls nicht mehr möglich.

Wie ist die Dynamik des Prozesses?

Dieses betrifft die anschließende Datenaufbereitung gerade in Bezug auf die Frage, ob Mittelwertbildungen sinnvoll sind oder wie der Zeitabstand zwischen Einzelwerten bei Online-Daten mindestens sein sollte.

Wie sieht die Varianz der Daten aus?

Beide Extrema, sowohl über weite Zeiträume konstant gehaltene Parameter oder Parameter mit großen Wertebereichen, können zu Problemen in der Modellierung führen. Beispielsweise können Sie aufgrund einer zu geringen Varianz eine Größe später nicht für eine Optimierung nutzen oder die Dynamik eines Parameters geht bei zu großen Wertebereichen im Rauschen unter.

Ist eine Produktverfolgung gegeben?

Für eine Datenanalyse müssen die Daten kausalrichtig zugeordnet werden, d. h. Ursache und Wirkung müssen in einem Datensatz vereint sein. Bei Stückgutprozessen ist eine Zuordnung über das Stückgut in der Regel gut zu bewerkstelligen. Bei kontinuierlichen Prozessen und Batchprozessen sind hingegen Modellannahmen notwendig. Erfassen Sie daher alle Größen, die zur Abschätzung der Verweilzeit oder zur Bestimmung von Lauf- oder Bearbeitungszeiten notwendig sind.

Welche Messgeräte werden eingesetzt und wie hoch ist deren Genauigkeit?

Diese Frage gibt schon im Vorfeld eine Information über das Rauschen der Daten.

Gibt es zusätzliche Dokumentationen?

Ein Produktionsprozess ist ständigen Änderungen unterworfen, wie beispielsweise Störungen, Rohstoff- oder Produktwechsel, Umbauten, Tausch von diversen Teilen oder Sonderfahrweisen. Achten Sie auf eine möglichst genaue Dokumentation, die Sie zur späteren Bewertung der Daten heranziehen können.

Werfen Sie einen ersten Blick in die Daten

Die oben genannten Fragen sollten Sie möglichst ausführlich behandeln, da die Datenlage über den Erfolg der Datenanalyse entscheidet. Schauen Sie sich daher im Rahmen der Akquise einen charakteristischer Datensatz über einen gewissen Zeitraum genauer an. Eine grobe statistische Auswertung der Minima, Maxima, Mittelwerte und Standardabweichungen gibt bereits einen guten Überblick. Auch ein Blick auf die Verteilung der Daten in Form von Histogrammen lohnt sich. Haben Sie Bedenken hinsichtlich der Qualität der Daten oder ist der Aufwand für eine Erweiterung der Datenbasis zu hoch, sollten Sie die Profitabilität des Projekts noch einmal hinterfragen. Da die Datenaufbereitung einen sehr großen Raum der Analyse einnimmt, kann eine schlechte Datenqualität schon zu Beginn den Aufwand und die Kosten des Projekts enorm erhöhen. Die gestellten Fragen sind im Wesentlichen anwendbar auf bestehende Anlagen, sollten aber auch als Grundlage für die Planung von (Versuchs-)Anlagen einbezogen werden.

Fassen wir kurz zusammen

Zusammenfassung_Measure

Sofern ich Sie nun nicht mit zu vielen Fallstricken hinsichtlich der Datenerhebung abgeschreckt habe, hoffe ich, dass Sie weiter dabei bleiben. Denn im nächsten Beitrag geht es im Schritt Analyse -wie der Name schon sagt- um die Analyse Ihrer Daten. Hier werde ich vor allem die Datenaufbereitung näher beleuchten, denn nur mit einem strukturierten Vorgehen und einer sauberen Vorarbeit schaffen Sie eine Grundlage für eine erfolgreiche Analyse.


Einen Beitrag verpasst?
Kein Problem, hier finden Sie alle Serienbeiträge aufgelistet:
– 1. Beitrag: “Analysieren Sie Ihre Daten – in 5 Schritten zum Erfolg
– vorheriger Beitrag: “Analysieren Sie Ihre Daten – Schritt 1: Define
– nächster Beitrag: “Analysieren Sie Ihre Daten – Schritt 3: Analyse
– 5. Beitrag: “Analysieren Sie Ihre Daten – Schritt 4: Improve
– 6. Beitrag: “Analysieren Sie Ihre Daten – Schritt 5: Control(wird veröffentlicht am 22.11.2017)

Kommentare

Schreibe einen Kommentar
  1. AH99
    #1 AH99 12 Oktober, 2017, 05:16

    Hallo Fr. Müller.

    wenn wir in einer verfahrenstechnischen Produktion messen, dann geschieht das ja oft übers Prozessleitsystem, wird also “sowieso” durchgeführt.
    Dann ist zum Zeitpunkt des Messens ja noch nicht klar, was genau später mit den Messwerten gemacht werden soll.

    Wer hat da eigentlich die Verantwortung für Fragen wie:
    – Mit welcher Genauigkeit u. Qualität wird aufgezeichnet?
    – Wird komprimiert?
    – Welche Abtastrate?
    – Wie wird archiviert?
    – Wer bekommt überhaupt zunächst mal Zugang zu den Daten?
    – …

    Beste Grüße, Andreas Helget

    —————-
    p.s.: Tolle Artikelserie

    Reply this comment
    • Silke Müller
      Silke Müller Author 13 Oktober, 2017, 14:07

      Hallo Herr Helget,

      Sie sprechen da einen Aspekt an, der sicher einen eigenen Beitrag wert wäre. In der Regel sind es die MSR-Abteilungen, die diese Dinge festlegen. Und hier liegt ein Knackpunkt, denn durch diese Konstellation entstehen immer wieder Insellösungen, die im Sinne einer digitalen Transformation schwer unter einen Hut zu bringen sind. Um die digitale Transformation jedoch erfolgreich zu meistern, bedarf es neuer, übergreifender Strukturen, auch über Geschäftsbereiche und Unternehmensgrenzen hinweg. Daher geht der Trend gerade in großen Unternehmen dahin, einen Chief Data Officer (CDO) zu etablieren, der die Verantwortung für den Rohstoff Daten zentral auf Führungsebene übernimmt.

      Viele Grüße
      Silke Müller

      Reply this comment

Ihre Daten sind sicher!Ihre E-Mail wird nicht veröffentlicht. Es werden keine Daten mit Dritten geteilt.