Wir nutzen Cookies, um Ihren Besuch auf unserer Website und unseren Service zu optimieren.
Wir betrachten die weitere Nutzung unserer Website als Zustimmung zu der Verwendung von Cookies.
PortalDerWirtschaft.de



Suchmaschinenoptimierung mit PdW
mit Content-Marketing - Ihre News
English

❌ Anonymisierung von PHI ❌ Blurring auf Zeilenebene statt auf Spaltenebene bei gleichzeitiger Beibehaltung des Intervalls zwischen diesen Daten ❗

Von JET-Software GmbH

Mit einer konfigurierbaren Option für geschützte Testdaten für bspw. klinische Forschungs- oder Testdatenszenarien ❗

. Verschieben von Datumsangaben unter Beibehaltung von Intervallen: Eine der Anforderungen an die Datenmaskierung für IRI FieldShield, die wir in Anwendungsfällen der PHI-Anonymisierung sehen, beinhaltet das Blurring (Unschärfe/Verwischen) von Daten...

Babenhausen, 09.07.2021 (PresseBox) - .

Verschieben von Datumsangaben unter Beibehaltung von Intervallen:

Eine der Anforderungen an die Datenmaskierung für IRI FieldShield, die wir in Anwendungsfällen der PHI-Anonymisierung sehen, beinhaltet das Blurring (Unschärfe/Verwischen) von Daten auf Zeilenebene statt auf Spaltenebene bei gleichzeitiger Bereitstellung einer konfigurierbaren Option zur Beibehaltung des Intervalls zwischen diesen Daten. Dies wird typischerweise in klinischen Forschungs- oder Testdatenszenarien benötigt, bei denen bestimmte Intervalle zwischen den Daten für die Aufnahme oder Entlassung in ein Krankenhaus oder den Beginn und das Ende einer Behandlung eingehalten werden müssen.

Nehmen wir an, dass eine Tabelle oder Datei in der Produktion eine Spalte "StartDate" und "EndDate" enthält. Die Werte beider Daten müssen anonymisiert, aber um die gleiche konstante Anzahl von Tagen verschoben werden, damit sich die Dauer des Ereignisses nicht ändert. Für jeden Datensatz kann eine neue Zufallszahl innerhalb des gewünschten Bereichs verwendet werden, wobei der Ablauf voraussichtlich wie folgt ist:

Benutzer wählt die Eingangsdatenquelle (Tabelle oder Datei)

Benutzer wählt die Spalten aus, die den Anfang und das Ende des Intervalls definieren

Benutzer gibt den Bereich des Shift-Faktors vor (z. B. -10 bis +10)

Die Software wählt eine Zufallszahl innerhalb der Verschiebung

In jeder Zeile werden die Anfangs- und Endwerte um den Zufallswert verschoben, wobei das Intervall erhalten bleibt

Das FieldShield-Skript verarbeitet dies mit einem separat generierten Zufallszahlen-Offset innerhalb eines vorgegebenen Bereichs. Ein schönes Merkmal dieses Ansatzes ist, dass mit unseren datums- und zeitbasierten mathematischen Funktionen der Offset als Sekunden, Minuten, Stunden, Tage, Wochen, Monate oder Jahre definiert werden kann. Der Offset kann auf jeden zeitbasierten Datentyp, wie z. B. ein Datum, eine Uhrzeit oder einen Zeitstempel, angewendet werden.

Dieses Beispiel verarbeitet eine CSV-Datei, aber das gleiche Prinzip gilt für eine Datenbanktabelle oder jede andere strukturierte Datenquelle, die von der FieldShield-Datenverarbeitungs-Engine, SortCL, unterstützt wird. Und natürlich könnten verschiedene Maskierungsfunktionen auf andere Felder im selben Jobskript angewendet werden; zum Beispiel Pseudonymisierung der Namen und/oder Unschärfe der Alterswerte.

Alle weiteren technischen Details zu diesem Anwendungsfall finden Sie hier im Blog-Artikel!

Weltweite Referenzen: Seit über 40 Jahren nutzen unsere Kunden wie die NASA, American Airlines, Walt Disney, Comcast, Universal Music, Reuters, das Kraftfahrtbundesamt, das Bundeskriminalamt, die Bundesagentur für Arbeit, Rolex, Commerzbank, Lufthansa, Mercedes Benz, Osram,.. aktiv unsere Software für Big Data Wrangling und Schutz! Sie finden viele unserer weltweiten Referenzen hier und eine Auswahl deutscher Referenzen hier.

Partnerschaft mit IRI: Seit 1993 besteht unsere Kooperation mit IRI (Innovative Routines International Inc.) aus Florida, USA. Damit haben wir unser Portfolio um die Produkte CoSort, Voracity, DarkShield, FieldShield, RowGen, NextForm, FACT und CellShield erweitert. Nur die JET-Software GmbH besitzt die deutschen Vertriebsrechte für diese Produkte. Weitere Details zu unserem Partner IRI Inc. hier.

09. Jul 2021

Bewerten Sie diesen Artikel

Noch nicht bewertet

Teilen Sie diesen Artikel

Keywords

Hinweis

Für den Inhalt der Pressemitteilung ist der Einsteller, PresseBox.de, verantwortlich.

Pressemitteilungstext: 432 Wörter, 4031 Zeichen. Artikel reklamieren

Über JET-Software GmbH


Kommentar hinzufügen

Name*
E-Mail*
Institution
Website
Ihr Kommentar*
Bitte lösen Sie 8 + 5

Weitere Pressemeldungen von JET-Software GmbH


❌ Test Data für DevOps ❌ Erstellung von synthetischen, sicheren und intelligenten Testdaten in einer CI/CD-Pipeline für DevOps❗

Testadatengenerierung und Datenmaskierung um bspw. GitLab-Pipeline mit intelligenten Daten zu füllen, die in Tests nach der Bereitstellung verwendet werden können ❗

04.08.2021
04.08.2021: Babenhausen, 04.08.2021 (PresseBox) - Erstellung von Testdaten in einer CI/ CD-Pipeline: Die Grundlage der DevOps-Automatisierung besteht darin, zu automatisieren, wo und wann man kann. Die Möglichkeit, IRI-Jobskriptausführungen, die Testdaten maskieren oder synthetisieren, in der CI/ CD-Pipeline zu verarbeiten, unterstützt dieses Bestreben.Dieser Artikel veranschaulicht ein End-to-End-Beispiel für eine erfolgreiche Integration! In diesem Artikel wurde gezeigt, wie die Ausführung von IRI-Aufträgen zur Erzeugung von Testdaten innerhalb einer GitLab CI/ CD-Pipeline automatisiert werden kan... | Weiterlesen

❌ IBM DataStage ❌ Unkompliziert 10x schnellere Datenmanipulation für ETL-Tool InfoSphere DataStage ❗

Enorme Einsparungen: schnellere Big Data Transformationen, PII-Datenmaskierung und synthetische Testdatengenerierung ❗

30.07.2021
30.07.2021: Babenhausen, 30.07.2021 (PresseBox) - Herausforderungen: Auch nach der Beratung und dem Tuning können große Datenmengen (d.h. mehr als eine Million Zeilen) nur langsam transformiert werden, insbesondere ohne ein teures Hardware- oder Versions-Upgrade von DataStage.Große Datenengpässe sind große Sortierungen, Joins, Aggregationen, Ladungen und manchmal auch Entladungen. Die Parallelisierung oder Optimierung in anderen Ebenen oder Tools kann unhandlich, wenn nicht sogar teuer sein und die Leistung für andere Benutzer beeinträchtigen.Aus Sicherheitssicht können die Datenmaskierungslösung... | Weiterlesen

❌ Schnelleres ETL und ELT ❌ Die Big Data Sortier-, Join- und Aggregationsjobs erheblich beschleunigen, ohne RDB oder Budget zu belasten ❗

Erschwingliche Datenintegration und bis zu 15x schneller für bspw. Informatica, Pentaho, DataStage, Talend oder SSIS ❗

28.06.2021
28.06.2021: Babenhausen, 28.06.2021 (PresseBox) - Big Data Integration: Erschwingliche ETL-Beschleuniger & Alternativen!Schnelleres E, T & L: Die meisten Datenintegrationsaufgaben werden in älteren ETL- oder ELT-Tools durchgeführt, die auf kompilierten Java-Programmen oder ineffizienten In-DB-Transformationen beruhen. Der Entwurf und die Ausführungszeit von Jobs leidet darunter. Dies gilt auch für alle nachgeschalteten Abfragen und Anwendungen, die von diesen Jobs abhängen. Details hier!Die erschwingliche Alternative: Hunderttausende von Euros und viele Monate werden für den Aufbau und die Unterstü... | Weiterlesen