digiKam 7.0.0 verbessert Gesichtserkennung

Quelle: digikam.org

Die Entwickler der Qt-basierten Fotoverwaltung digiKam haben sich Zeit gelassen mit der Veröffentlichung der stabilen Version von digiKam 7.0.0. Vor rund einem Jahr begann die Entwicklung, erste Beta erschien bereits kurz vor Weihnachten.

Ein Jahr Entwicklung

Jetzt wurde die stabile Version digiKam 7.0.0 freigegeben, die einige wichtige neue Funktionen mitbringt. Zudem wurden über 750 Fehler beseitigt. Bereits seit einigen Jahren bietet digiKam eine Funktion, die sich als Opt-in der Erkennung von Gesichtern auf Fotos widmet.

Veraltete Algorithmen

Die im Hintergrund verwendeten Algorithmen waren veraltet und seit digiKam 2.0.0 unverändert. Sie waren für die aktuelle Version nicht leistungsfähig genug, um den Arbeitsablauf der Verwaltung der Gesichtserkennung zu automatisieren.

Zum GSoC 2019 neu geschrieben

Beim Google Summer of Code 2017 arbeitete der Student Yingjie Liu an der Integration Neuraler Netzwerke in die Gesichtserkennung. Die Ergebnisse, basierend auf der Dlib-Bibliothek, waren eher experimenteller Natur und erreichte nicht die nötige Geschwindigkeit. Beim GSoC 2019 wurde der Code von Thanh Trung Dinh komplett neugeschrieben.

Deep Learning

Ziel des Projekts war es, all die alten Ideen hinter sich zu lassen und die Erkennungs-Engines auf modernere Ansätze des Deep Learning umzustellen. Der neue Code in digiKam 7.0.0, der auf neueren Deep-NeuralNetwork-Funktionen aus der OpenCV-Bibliothek basiert, verwendet neuronale Netzwerke mit zuvor erlernten Datenmodellen. Die Erkennungsrate konnte auf 97 Prozent angehoben werden und schließt nun auch die Erkennung von Tieren ein.

Das verwendete neuronale Netzmodell erkennt auch unscharfe, und verdeckte Gesichter, Profile von Gesichtern, gedruckte Gesichter, abgewandte Gesichter und Teilgesichter, erfordert aber eine Lernphase.

Speicherlecks geschlossen

Zudem gelang es, schwerwiegende Speicherlecks in der Gesichtserkennungs-Pipeline zu stopfen. Das nahm laut der Ankündigung einige Monate in Anspruch, da die Fehler schwer zu reproduzieren waren. wie dieser Bugreport belegt. Die Lösung des Problems ermöglichte es, eine lange Liste älterer Bugs im Zusammenhang mit der Gesichtserkennung zu schließen.

Daten von über 1.100 RAW-Formaten

Weitere Änderungen betreffen die Unterstützung für noch mehr RAW-Dateien von zusätzlichen 40 Digitalkameras, unter anderem Canon CR3 und Sony A7R4, sowie verbesserte Unterstützung des HEIF-Bilddateiformats, Verbesserungen am Flatpak-Build, ein neues Photomosaik-Tool und viele andere Änderungen. Mit letzterem soll sich ein Bild als Mosaik aus vielen anderen Bildern nachbilden lassen.

digiKam 7.0.0 kann von der KDE-Webseite für Linux, macOS und Windows heruntergeladen werden. Zudem steht auf Flathub ein Flatpak bereit, dass allerdings noch RC-Status hat. Völlig ohne Installation kommt das AppImage aus.

Kommentare

10 Antworten zu „digiKam 7.0.0 verbessert Gesichtserkennung“

  1. Avatar von Kaja
    Kaja

    Das verwendete neuronale Netzmodell erkennt auch unscharfe, und verdeckte Gesichter, Profile von Gesichtern, gedruckte Gesichter, abgewandte Gesichter und Teilgesichter, erfordert aber eine Lernphase.

    Das hört sich alles sehr interessant an, werde ich mal ausprobieren. Danke für den Artikel!

  2. Avatar von harley-peter
    harley-peter

    Gibt es so eine Gesichtserkennung auch für Xfce? Ich möchte mir nicht für dieses eine Programm das halbe KDE installlieren.

    1. Avatar von Ferdinand

      Musst du ja nicht. es gibt Flatpak und AppImage.

      1. Avatar von kamome
        kamome

        Nein, das halbe KDE muss man nicht installieren, es reicht durchaus das (gefühlt) ganze 😉

        423M   /var/lib/flatpak/app
        104K   /var/lib/flatpak/exports
        1,4G   /var/lib/flatpak/repo
        46M    /var/lib/flatpak/runtime
        
        1. Avatar von Ferdinand

          Aber nicht beim AppImage.

          1. Avatar von kamome
            kamome

            Gut, da ist es mit knapp 300 MB dann wirklich nur halb 😉
            Aber heutzutage sind 300 MB für eine App ja nix mehr, dank Elektron und so – wobei digikam hier vielleicht etwas Sinnvolleres als Elektron einpackt … nur erfahre ich das nicht mit dem „.meta4“-Paket, da bei mir „Syntaxfehler“, erst das manuell heruntergeladene Appimage lässt sich ausführen.
            Aber sei’s drum – ich verwende eh lieber die Version der Distri.

    2. Avatar von tuxflo
      tuxflo

      Diese Annahmen, dass KDE Programme viel Zeug mit sich ziehen, sind spätestens seit der 5er Version von KDE auch überhaupt nicht mehr zeitgemäß. KDE hat hart daran gearbeitet alle möglichen Abhängigkeiten zu minimieren. Anwendungen wie digikam (oder auch KDEnlive) haben kaum noch Abhängigkeiten zum KDE Desktop.

  3. Avatar von Nils
    Nils

    Ich muss ehrlich sagen, dass ich noch nicht so überzeugt bin. Ich habe einen ganzen Haufen Bilder von den gleichen Personen und ich habe diese schon X-Fach bestätigt bzw. Unbekannten Gesichtern zugewiesen und sie werden immer noch falsch erkannt oder anderen Personen zugewiesen.

  4. Avatar von micha
    micha

    Hallo, ich möchte, dass das erkannte Gesicht (max, Müller) automatisch in die Dateiinfo geschrieben wird und das Bild anschließend in Max Müller umbenannt wird. Hat hier jemand eine Idee, wie das gehen könnte?

    1. Avatar von Matthias Bendewald
      Matthias Bendewald

      Das ginge z.B. indem du die Erkennung laufen lässt, alle Bilder mit Max Müller in einem Ordner exportierst und dann anschließend umbenennst (zur Not per Skript, falls dein Dateibrowser das nicht vernünftig für viele Dateien auf einmal kann).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert