Friday, July 5th, 2019 (Data Sorting, Labeling App, Feature Extr. Methods, Holiday Orga)¶

Michael, Richard, Malin, Maren, Sophia, Josefine, Axel und Ulf(Meeting in German)

Zusammenfassung letzte Woche¶

Schritte, was wir machen können
Ordner sortieren für Datenbasis
Preprocessing (anfangen)
Michael hat die Preprocessing Methode/Label App verbessert, sieht aus als sollte es (bald) nutzbar sein
müsste noch machen: aus Datei rauslesen, sodass man die Spargelklassen benennen kann
überlegen, wieviele handgelabelte Daten wir haben wollen
wenn Bilder sortiert sind, können wir schauen, wieviele gelabelte Daten wir schon haben (und ob es schon geht, weiterzuarbeiten mit den bereits gelabelten Daten)
Zugriff auf Bilder (Uni-Server): Sortieren der Ordner ist etwas langsam
Es ist noch eine Festplatte in Rheine angeschlossen

Bilder sortieren

Jedes Bild hat F00, F01 oder F02 am Namensanfang und suggertiert Zusammengehörigkeit dieser Bilder zu einem Spargel
Dann gibt es eine Zahl, die einzigartig ist für jeden Spargel (die dann bei allen drei Bildern steht)
Spargel, der leicht quer auf den Schalen liegt, wird zur Zeit weggeschnitten; den Rahmen aber gleich zu behalten macht weniger Arbeit auf die Anzahl an Spargeln, bei denen das der Fall ist, gesehen; können die Bilder erstmal in eigenen Ordner schieben und später überlegen, was wir damit machen

Labelling App

Eingetragene Zeichen sind gerade kleine Zahlen, vielleicht kann mand as noch ändern zu leeren Flächen, NaN, oder -1
Bevor wir die App starten müssen wir die Feature Extraction (Dicke etc.) noch anpassen, um Sortieren zu erleichtern
Idee für Report am Ende: Vergleich von Labelling von Mensch und Maschine
Viele der Feature Extraction Methoden sind schon fertig: Rost, Blume und Violett sind noch nicht fertig

Labelling + Feature Extraction

Wie sinnvoll ist es die App jetzt schon zu benutzen und bauen die Features später ein? – Zwei verschiedene Ansätze, hat Vor- und Nachteile
Klassifikation per Auge, gemischt mit Klassifikation von Feature Extraction Methode

Wieviele gelabelte Daten brauchen wir?

Je mehr Parameter, desto mehr Daten werden gebraucht, es gibt keine pauschale Antwort auf Frage, wieviele Trainingsdaten wir brauchen (e.g. ImageNet 1000 Bilder pro Klasse)
Durch Data Augmentation bekomment wir auch noch mehr
Vielleicht erstmal ‘fauler’ Ansatz und 100 gelabelte Bilder von jeder Klasse nehmen, augmentieren sodass es 500 pro Klasse sind und einfach schonmal testen, was passiert

Github Sortierung: Feature Extraction

Manual Feature Extractor: Github Ordner zum Sammeln der Feature Extraction Methoden, dass z.B. die Labeling App extern darauf zugreifen kann und nicht Code manuell eingefüg wird
App in Github pushen
Neues Repository beinhaltet alle Dateien, aber mit neuer Sortierung der Ordner

Arbeitseinteilung (im Sommer)

Block Sessions in den Ferien abhalten, in denen wir am Stück zusammen am Projekt arbeiten
Modus für Semesterferien zu überlegen macht Sinn
Wöchentliche Treffen mit Ulf und Axel machen nur Sinn, wenn es auch etwas zu besprechen gibt
Schedule auf dem Google Kalender soll Auskunft über Anwesenheit von Teilnehmern geben
Erste/zweite Septemberwoche als Blockwoche eingetragen

Allgemeine Punkte von Ulf

Asparagus Classification Report

Wurde bereits begonnen zu schreiben, ist aber offen für alle und soll auch gerne von allen genutzt werden
Bericht zum Notieren, was wir bereits gemacht haben