betrügerischen Fake-Shops &
schädlichen Android Apps auf der Spur

Das MAL2 Dataset ist ab sofort per Download-Anfrage verfügbar

Anfrageformular

Das MAL2 Dataset ist ab sofort per Download-Anfrage verfügbar

Ab heute ist das fast 900GB große Dataset auf unserer Webseite online. Der Inhalt des Datasets lässt sich in zwei unterschiedliche Bereiche unterteilen – Fake Shop Website Dataset & Android Malware APK.

Was umfassen diese Datensätze?

Der Fake-Shop Website Datensatz entsteht, indem KonsumentInnen Verdachtsfälle von betrügerische Online-Shops bei Watchlist-Internet melden. Die ExpertInnen des ÖIAT überprüfen diese Meldungen in einem händischen und mehrstufigen Verfahren. Die Ergebnisse des expertengestützten Fake-Shop Bewertungsverfahren sind Teil des Fake-Shop Datensatzes. 2.756 Fake-Shops sowie 283 seriöse Online-Shops wurden für die Machine-Learning Anwendung des MAL2-Projekts archiviert. Als seriöse Shops zählen Anbieter, die mit dem österreichischen E-Commerce-Gütezeichen ausgezeichnet sind.

Der zweite Datensatz, der sich mit der Malware befasst, wurde in zwei Iterationen erarbeitet. Die erste Iteration war mit 56.392 APKs klein gehalten und diente zum Test des Proof-Of-Concept Prototypen im Projekt. In der finalen Iteration wurden 790 Tausend APK Datensätze, bestehend aus Malware, Adware, Probably Clean und Google Play Samples gesammelt und deren korrekte Zuordnung über die Nutzung des IKARUS Scanners verifiziert. Dadurch ist der Malware Datensatz der deutlich größere Datensatz mit 860GB, im Gegenzug der Fake Shop Website Datensatz „nur“ 20GB umfasst.

Wie kann man selbst diese Daten erhalten und diese nutzen?

Damit auch zukünftige Forschungsprojekte und Innovationen in der Fake-Shop und Malware-Bekämpfung von der Arbeit des MAL2 Projektes langfristig profitieren, können Sie sich hier für den Erhalt der open-source Daten bewerben. Es gibt die Möglichkeit mit dem neuen Formular auf unserer Webseite eine Anfrage für das "MAL2 Ground-Truth Dataset" zu erstellen. Dieses Formular finden Sie im Menü unter „Anfrage“, welches man bei Belieben in Deutsch oder in Englisch mit den beiden Links „DE | EN“ in die jeweilige Sprache übersetzen lassen kann. Um den Anfrageprozess zu starten, müssen die entsprechenden Felder ausgefüllt, die Sicherheitsfragen bestätigt und der gewünschte Datensatz ausgewählt werden. Nach dem Absenden wird im Hintergrund ein Personenkreis, bestehend jeweils aus einer Person aus den Projektpartnern, über eine Freigabe der Daten entschieden. Sobald eine positive Entscheidung gefallen ist, wird eine E-Mail mit dem entsprechenden Download Link, der 5 Tage lang gültig ist, an die BewerbInnen geschickt. Die Daten können im Anschluss verwendet werden und eine öffentliche Nennung der angefragten Person oder Institution erfolgt auf der Webseite.

Falls Sie nun einen der genannten Datensätze erhalten möchten, dann gelangen Sie hier zum entsprechenden Formular.