Erzähl‘ mir mehr.

AI for Windows, Smart Home, Arduino and Raspberry Pi

Was gibt es hier?

Zum einen bist du hier richtig, wenn du dich für neuronale Netzwerke und Embedded Systems interessierst – wie dem Arduino oder dem NVIDIA Jetson Nano – deshalb jedoch nicht mit Programmieren anfangen möchtest oder erst einmal in die Materie schnuppern willst. Außerdem möchtest du dabei nicht auf Windows verzichten, sondern wünscht dir ein Programm, das die wesentlichen Möglichkeiten bildverarbeitender neuronaler Netzwerke bereitstellt und mit wenigen Mausklicks zugänglich macht.

Zum anderen bist du hier richtig, wenn du ein Programm zur Sprachauswertung suchst, welches Audiodateien nach Keywords durchsucht, die Audiodateien an bestimmten Stellen teilt, konvertiert oder zusammenfügt.

FAQ - Bestellung und Download

Kann ich den AiDiTT nach meiner Bestellung mehrmals downloaden?

Ja. Es wird automatisch ein Kundenkopnto angelegt und die Zugangsdaten per Email gesendet. Du kannst jederzeit wiederkommen und den AiDiTT erneut downloaden.

Der AiDiTT ist DRM-frei.

Welchen DRM-Bedingungen unterliegt der AiDiTT?

Die Downloaddatei ist eine ausführbare Datei. Muss ich den AiDiTT installieren und wieviel Speicherplatz wird benötigt?

Es handelt sich um ein selbstentpackendes Archiv. Es werden mindestens 2,02 GB Speicherplatz zum Entpacken benötigt. Eine Installation ist nicht erforderlich. Bedenke, dass durch die Erstellung eigener Klassifikatoren oder Detektoren schnell einige zusätzliche Gigabyte zusammenkommen können.

FAQ - Wie funktioniert der AiDiTT

Während des Erstellens eines Datensatzes werden Dateien angelegt, die sich auf den jeweiligen Bildpfad zum Zeitpunkt des Erstellens beziehen. Wird der Datensatz verschoben, sind diese Pfade nicht mehr gültig. Lösung: Mit einem Texteditor die Textdateien im Datensatz-Verzeichnis öffnen und mit der Funktion „suchen und ersetzen“ alle Pfade der Textdatei an den neuen Pfad anpassen.

Ich habe ein Datensatz zum Training eines CNN/RCNNs erstellt und den AiDiTT an einen anderen Ort auf der Festplatte verschoben. Nun funktioniert das Training nicht. Warum?

Was ist der ImageDitt, was ist der AudioDitt?

Der AudioDitt ist innerhalb des AiDiTTs der Überbegriff für alles, was mit Spracherkennung in Zusammenhang steht. Der ImageDitt steht für Belange der Bildverarbeitung.

Ja, zusätzlich zur GUI-Ausgabe der Ergebnisse wird bei der Bildklassifizierung eine Textdatei angelegt, in der die einzelnen Ergebnisse der untersuchten Bilder gespeichert werden. Die Textdatei ist mit dem Zeitpunkt der Suche benannt. Wird ein Objekterkennung durchgeführt, werden zusätzlich Bilder mit den erkannten Objekten gespeichert.

Werden die Ergebnisse des ImageDitts gespeichert?

Wo werden die Ergebnisse des ImageDitts gespeichert?

Im Verzeichnis „AiDitt/ImageDitt/Detection/results/“ oder  unter „AiDitt/ImageDitt/Detection/Jetson/“, wenn ein Jetson Nano eingebunden war.

Zurzeit werden folgende Klassifikator-Netzwerke bereitgestellt:

AlexNet, VGG, ResNet, SqueezeNet, DenseNet, Inception V3, GoogLeNet, ShuffleNet v2, MobileNet v2, ResNext, WideResNet, MNASNet

Welche CNNs unterstützt der AiDiTT?

Welche RCNNs sind enthalten?

Aktuell ist YOLOv3 als Objektdetector implementiert.

Das kommt ganz auf deine Hardware an, speziell auf deine Grafikkarte – ob du eine NVIDIA in deinem PC/Laptop arbeitet und ob diese CUDA unterstützt.

Ist die Echtzeitanalyse eines Videos oder Livestreams mit dem ImageDitt auf meinem PC oder Laptop möglich?

NVIDIA Jetson Nano? Was bringt der Anschluss eines solchen Gerätes?

Der nano schafft ca. 10 – 15 Bilder Bildklassifizierungen pro Sekunde oder ca. 1-2 Objekterkennungen je Sekunde. Ein AMD FX-8320 8-Core Prozessor benötigt für eine Objekterkennung beispielsweise über drei Sekunden und ist dabei zu fast 100 % ausgelastet, kann also nicht viel anderes nebenbei erledigen. Der Jetson Nano übernimmt die Arbeit, ist schneller und verbraucht deutlich weniger Energie als eine CPU permanent auf Vollast zu fahren.

Nein. Wird der AiDiTT beendet, beendet sich auch der Vorgang auf dem Nano.

Kann ich den PC ausschalten, während der Jetson Nano arbeitet, beispielsweie ein Video auswertet?

Benötige ich eine Internetverbindung?

Bei der Erstbenutzung der CNNs ist dies notwendig, da diese Netzwerke erst heruntergeladen werden müssen. Für die Installation aller erforderlichen Pakete auf dem Jetson Nano wird ebenfalls eine Internetverbindung benötigt.
Ist dies geschehen, kann der Nano vom Netzwerk getrennt werden. Für eine SSH-Verbindung mit dem AiDiTT wird jedoch eine lokale Netzwerkverbindung vorausgesetzt.

Ist die Bezeichnung für den Prozess, in dem alle Trainingsdaten das neuronale Netzwerk (CNN/R-CNN) einmal passieren.

Was ist ein „Epoch“?

Was ist ein Batch?

Trainingsdaten können als Pakete geschnürt und so durch das neuronale Netzwerk (DNN) geschickt werden. Ein höherer Batch steigert in der Regel die Präzision und die Qualität der  Ergebnisse. Je höher der Batch, desto mehr RAM wird benötigt.

Aktuell ist dies leider nicht möglich. Die Batchsize ist auf Batch=32  für CNNs fest voreingestellt.

Kann die Batchgröße für Transfer Learning von CNNs verändert werden?

Ist die Batchsize beim Erstellen eines eigenen Object Detectors (R-CNNs) möglich?

Diese Option befindet sich unter „Erweiterte Einstellungen“ im Menu „Eigenen ObjectDetector erstellen“.

In der Voreinstellung ist mit Batchsize = 1 definiert, da es sonst zu abstürzen des Jetson Nanos kommen kann.

Welcher Batchsize wird für das Training eines R-CNNs auf dem Jetson Nano empfohlen?

Wie lange muss ein CNN/R-CNN trainiert werden, um vernünftige Ergebnisse zu erhalten?

Das ist sehr unterschiedlich: Ein CNN kann mit Transfer Learning und 30 Epochs richtig gute Ergebnisse erzielen.
Ein R-CNN zu trainieren benötigt deutlich mehr Zeit und Ressourcen. Es sollte mit 50 Epochs begonnen werden und eventuell nach oben korrigiert werden. Wettbewerbsfähige R-CNNs werden mit 300+ Epochs auf Hochleistungsrechnern trainiert.
Für Transfer Learning eines CNNs ca. 100+ Bilder als Trainingsdaten plus zusätzlichen 10 % an Validierungsdaten.
Um einen Object Detector zu erstellen sollten es 1000+ Bilder an Trainingsdaten sein + 10 % Validierungsbilder.
Grundsätzlich gilt: Je mehr Trainingsdaten, desto besser die Ergebnisse. Die Trainingsdaten sollten zudem möglichst unterschiedlich sein.

Wie viele Trainingsdaten werden benötigt?

Wenn ein CNN/R-CNN auf dem Jeson Nano trainiert wurde: Wie komme ich an das modizierte Netzwerk?

Die Daten werden automatisch vom Jetson Nano kopiert und im angegebenen Dataset-Verzeichnis gespeichert. Sollte es zur Unterbrechung der SSH-Verbindung während des Kopiervorgangs kommen, sind die Daten auf dem Jetson Nano unter Rx/dataset/modelDir oder Rx/dataset/checkpoints zu finden.

Die Speicherkarte sollte 128 GB groß sein, minimal 64 GB. Beim Training werden Zwischenzustände des neuronalen Netzes gespeichert, die bis zu  250 MB pro Datei groß sein können.

Welche Speicherkartengröße wird für den Jetson Nano empfohlen?