Friday, July 5th, 2019 (Data Sorting, Labeling App, Feature Extr. Methods, Holiday Orga)

Michael, Richard, Malin, Maren, Sophia, Josefine, Axel und Ulf(Meeting in German)

Zusammenfassung letzte Woche

  • Schritte, was wir machen können

  • Ordner sortieren für Datenbasis

  • Preprocessing (anfangen)

  • Michael hat die Preprocessing Methode/Label App verbessert, sieht aus als sollte es (bald) nutzbar sein

  • müsste noch machen: aus Datei rauslesen, sodass man die Spargelklassen benennen kann

  • überlegen, wieviele handgelabelte Daten wir haben wollen

  • wenn Bilder sortiert sind, können wir schauen, wieviele gelabelte Daten wir schon haben (und ob es schon geht, weiterzuarbeiten mit den bereits gelabelten Daten)

  • Zugriff auf Bilder (Uni-Server): Sortieren der Ordner ist etwas langsam

  • Es ist noch eine Festplatte in Rheine angeschlossen

Datensortierung

Bilder sortieren

  • Jedes Bild hat F00, F01 oder F02 am Namensanfang und suggertiert Zusammengehörigkeit dieser Bilder zu einem Spargel

  • Dann gibt es eine Zahl, die einzigartig ist für jeden Spargel (die dann bei allen drei Bildern steht)

  • Spargel, der leicht quer auf den Schalen liegt, wird zur Zeit weggeschnitten; den Rahmen aber gleich zu behalten macht weniger Arbeit auf die Anzahl an Spargeln, bei denen das der Fall ist, gesehen; können die Bilder erstmal in eigenen Ordner schieben und später überlegen, was wir damit machen

Labelling App

  • Eingetragene Zeichen sind gerade kleine Zahlen, vielleicht kann mand as noch ändern zu leeren Flächen, NaN, oder -1

  • Bevor wir die App starten müssen wir die Feature Extraction (Dicke etc.) noch anpassen, um Sortieren zu erleichtern

  • Idee für Report am Ende: Vergleich von Labelling von Mensch und Maschine

  • Viele der Feature Extraction Methoden sind schon fertig: Rost, Blume und Violett sind noch nicht fertig

Labelling + Feature Extraction

  • Wie sinnvoll ist es die App jetzt schon zu benutzen und bauen die Features später ein? – Zwei verschiedene Ansätze, hat Vor- und Nachteile

  • Klassifikation per Auge, gemischt mit Klassifikation von Feature Extraction Methode

Wieviele gelabelte Daten brauchen wir?

  • Je mehr Parameter, desto mehr Daten werden gebraucht, es gibt keine pauschale Antwort auf Frage, wieviele Trainingsdaten wir brauchen (e.g. ImageNet 1000 Bilder pro Klasse)

  • Durch Data Augmentation bekomment wir auch noch mehr

  • Vielleicht erstmal ‘fauler’ Ansatz und 100 gelabelte Bilder von jeder Klasse nehmen, augmentieren sodass es 500 pro Klasse sind und einfach schonmal testen, was passiert

Organisatorisches

Github Sortierung: Feature Extraction

  • Manual Feature Extractor: Github Ordner zum Sammeln der Feature Extraction Methoden, dass z.B. die Labeling App extern darauf zugreifen kann und nicht Code manuell eingefüg wird

  • App in Github pushen

  • Neues Repository beinhaltet alle Dateien, aber mit neuer Sortierung der Ordner

Arbeitseinteilung (im Sommer)

  • Block Sessions in den Ferien abhalten, in denen wir am Stück zusammen am Projekt arbeiten

  • Modus für Semesterferien zu überlegen macht Sinn

  • Wöchentliche Treffen mit Ulf und Axel machen nur Sinn, wenn es auch etwas zu besprechen gibt

  • Schedule auf dem Google Kalender soll Auskunft über Anwesenheit von Teilnehmern geben

  • Erste/zweite Septemberwoche als Blockwoche eingetragen

Allgemeine Punkte von Ulf

  • Lehrevaluationsbogen noch ausfüllen, damit er ausgewertet werden kann

  • Es werden noch Tutoren gesucht für die Computer Vision Lecture

Asparagus Classification Report

  • Wurde bereits begonnen zu schreiben, ist aber offen für alle und soll auch gerne von allen genutzt werden

  • Bericht zum Notieren, was wir bereits gemacht haben