• Neuer Gutscheincode unseres Partners Schutzfolien24:
    DSLR-Forum2025
    Dauerhaft 10% Rabatt auf alle Displayschutzfolien und Schutzgläser der Eigenmarken
    "Upscreen", "Screenleaf", BROTECT" und "Savvies".
    Der Code ist für alle Geräteklassen gültig.
  • Mitmachen beim DSLR-Forum Fotowettbewerb Mai 2025.
    Thema: "Grün"

    Jeden Monat attraktive Gewinnprämien, gesponsert von unserem Partner PixelfotoExpress.
    Alle Infos zum Mai-Wettbewerb hier!
  • In eigener Sache!

    Liebe Mitglieder, liebe Besucher und Gäste
    ich weiß, es ist ein leidiges Thema, aber ich muss es ansprechen: Werbung, Werbeblocker und Finanzierung des Forums.
    Bitte hier weiterlesen ...

  • Nicht erreichbare Adressen im Benutzerkonto
    Wir bekommen zurzeit eine große Anzahl an E-Mails, die das System zum Beispiel als Benachrichtigungen an Nutzer verschickt,
    als unzustellbar zurück, weil z.B. die Adressen nicht erreichbar sind oder das Postfach gar nicht existiert.
    Stellt doch bitte sicher, dass die Benachrichtigungen, die ihr vom System erwartet, auch zugestellt werden können.
    Nicht erreichbare E-Mail-Adressen sind dazu wenig hilfreich.
    Danke!
  • Unlauterer Verkäufer wieder unterwegs!

    Liebe Mitglieder,
    Florian Franzek, der seit Jahren mit verschiedensten Usernamen in allen möglichen Foren und auf etlichen Verkaufsplattformen auftritt,
    ist wieder hier im Forum und versucht, ehrliche Käufer zu betrügen.
    Wir können wenig tun, außer bei Bekanntwerden einer weiteren Registrierung eines Accounts für seine Machenschaften, diese umgehend zu sperren.
    Ich empfehle, bei Kontakt umgehend die Polizei einzuschalten.

WERBUNG

Freeware WIA-Loader, neue Version

So, mittlerweile habe ich Version 2.9.0.0 fertig gemacht und auf die Homepage geladen bzw. beim Microsoft App-Store eingereicht.

Neben ein paar kleineren Bugfixes ist da in erster Linie eine weitere Möglichkeit hinzugekommen, Bilder automatisch Beschriften bzw. Taggen zu lassen: per lokal laufendem LLaVA KI Modell. Das heisst es entstehen keine weiteren Kosten und die Bilder verlassen nicht den Rechner in Richtung Microsoft oder OpenAI. lediglich eine NVIDIA Grafikkarte wird optimalerweise benötigt. Es geht theoretisch zwar auch ohne bzw. mit Karten anderer Hersteller, aber das dürfte langsam sein und kann ich auch gerade nicht testen. Auf meiner RTX 4060 braucht WIA-Loader für ein Bild zwischen 2 und 6 Sekunden.

Die Ergebnisse sind ähnlich gut wie bei OpenAI und deutlich besser als mit dem Azure oder dem ONNX Modell. Das Setup funktioniert ähnlich wie beim ONNX Modell, d.h. es müssen 2 Dateien heruntergeladen werden und in den Einstellungen von WIA-Loader hinterlegt werden. Um das alles noch einfacher zu machen habe ich eine Funktion eingebaut, die auch diesen Prozess automatisch vornimmt.

Die einfachste Möglichkeit, die Funktion schnell einmal auszuprobieren ist über das Kontext-Menü:

1715890567864.png

Hier noch ein paar Beispiele für das was die KI so in den Bildern erkennt:
1715890716070.png1715890761376.png1715890842917.png

Das funktioniert tatsächlich sogar so gut, dass ich nicht so wirklich weis ob ich noch Zeit in die Weiterentwicklung der anderen Tagging Methoden investieren soll. Azure und OpenAI liefern zwar gute Ergebnisse, kosten aber extra und das ONNX Modell ist zwar schnell und kostenlos, aber hinkt beim Ergebnis um Welten hinterher.

Edit:
Die Tagging Funktion mittels ChatGPT habe ich auf das neue Modell GPT-4o umgestellt. Das ist schneller und günstiger.
 
Zuletzt bearbeitet:
Version 2.9.1.0 ist nun auf dem Weg in den AppStore und auf meiner Homepage.
Neben kleineren Korrekturen habe ich in erster Linie nochmal am automatischen Tagging bzw. Beschriften mit dem LLaVA Modell gearbeitet. Vor allem das dazu leider notwendige CUDA Toolkit kann nun von WIA-Loader automatisch installiert werden. Weiterhin sollte das Tagging nun auch funktionieren, wenn keine NVIDIA Grafikkarte vorhanden ist, dann allerdings auch deutlich langsamer!
 
Und dann habe ich noch ein kleines Problem. Manchmal kommen die Tags an und die Description nie. Dann habe ich bei den "EXIFTool Änderungen" die Checkbox "Leere Felder überspringen" entmarkiert und erhalte jetzt folgenden Fehler. BTW, den Text finde ich wirklich gelungen, bis auf das "Wolkenlos" ... einen Screenshot vom Bild habe ich noch dazu gepackt.
1719047819260.png 1719047920488.png

Es sieht für mich so aus, als findet er in dem NEF-File das Feld "Description" nicht.
 
Zuletzt bearbeitet:
Hier ein anderes Beispiel bei aktiviertem MWG-Modus:

1719050032071.png 1719050002973.png

Und ExifTool 12.87 sieht
1719050120282.png
1719050205315.png
Das heißt in diesem Fall sind die Keywords auf dem Feld "Subject" gelandet

Ohne "MWG Modus" gibt es das Exif-Feld "ImageDescription" nicht, aber immer noch das XMP-Feld "Description". Es gibt jetzt nicht mehr das XMP-Feld "Subject", davür gibt es jetzt aber
1719050643992.png
 
Sodele, ich denke ich habe eine vernünftige Lösung für mich gefunden. Damit erhalte ich immer das Exif-Feld "ImageDescription" und das IPTC-Feld "Keywords".
1719052725380.png


Vielleicht hilft das anderen auch weiter :)
 
Ich glaube der Fehler in #1024 ist ein Feldüberlauf. Ich habe den Prompt für die Beschreibung abgeändert zu "Describe the image with up to 50 words. Be brief and precise". Damit ist der Fehler mit dem PopUp weg. Die Keywords gehen verloren, ab dem 18. Bild in ein und der selben Session.
 
Ich habe noch etwas experimentiert und habe mich dabei auf die beiden Felder "iptc:caption_abstract" und "iptc:keywords" beschränkt. Das erste der beiden Felder hat laut https://www.iptc.org/std/IIM/4.2/specification/IIMV4.2.pdf eine maximale Länge von 2000 Bytes (octets). Da ich u.a Umlaute haben möchte, habe ich in einem dritten Feld "iptc:CodedCharacterSet" den Wert "ESC % G" eingefügt, der die Bedeutung hat: alle Texte sind in UTF8 codiert.

Ich gehe jetzt vom Worst-Case aus und habe den Prompt für die KI wie folgt geändert: "Describe the image with up to 1000 characters. Be brief and precise".

Ich gebe dem WIA-Loader 5 NEF-Files. Beim ersten Bild kommt im Schritt "ExifTool Änderungen" folgender Abbruch
1719143850743.png

Ich breche hier ab.

Im WIA Loader hovere ich auf dem ersten Bild. Hier der Screenshot
1719143931619.png
Man sieht hier deutlich, dass die KI 1027 Zeichen in der Beschreibung zurück gibt (also mehr als 1000) und wie eingestellt 10 Tags. Angezeigt werden aber 20 Tags.

Wenn ich im Prompt sage "bis zu 300 characters, dann läuft alles durch. Mit der Maus auf dem 1. Bild sieht es jetzt so aus
1719144336482.png

Der ExifToolGui zeigt mir beim gespeicherten Bild
1719144425695.png
Das Feld "iptc:Caption-Abstract" sieht gut aus, aber wo sind die Keywords. Ich hätte da jetzt 9 erwartet. Hier noch der Inhalt vom Schritt "ExifTool Änderungen"
1719144583238.png
1719144600652.png

Ich helfe gerne bei der Fehlersuche. Ich kann die auch gerne die 5 NEF-Files und mein Profil schicken.
 

Anhänge

Ha, ich glaube der Fehler ist viel einfacher zu lösen als erwartet. Nach einigen weiteren Tests ist mir aufgefallen, dass immer da, wo in der Fehlermeldung die Zeichenkette "File not found" steht, die AI einen Zeilenvorschub verwendet. Sprich es werden mehrere Paragraphen geliefert. Deshalb habe ich den Prompt geändert zu "Describe the image with one paragraph. Be brief and precise".

Sieht gut aus so.
 
Ich habe jetzt 300 Bilder prozessiert. Bei ca 5-10% davon kommen aus der AI trotzdem mehrere Absätze raus. Da muss also auf jeden Fall die Übergabe an das ExifTool überarbeitet werden.
 
Zu deiner Frage bzgl. der Tags: nein, aktuell lässt sich nur die englische oder die übersetzte Version benutzen, aber ich überlege mir was!

Zu den anderen Problemen:
Ja, zu lange Antworten der KI sind noch ein Problem, da tüftele ich auch noch. Leider hält sich die KI auch nicht immer exakt an die ihr gegebenen Anweisungen. Ich versuche so viele Ausnahmesituationen wie möglich schon im Code abzufangen, aber bislang die beste Lösung ist, die KI dazu anzuhalten sich kurz zu fassen. Mit der nächsten Version wird es da aber hoffentlich auch noch Verbesserungen geben.
 
Eine neue beta Version ist auf der Homepage!
Es gibt ein von ExifTool vorgesehenes Handling für CR/LF, das habe ich nun umgesetzt. Alternativ kann man CR/LF auch komplette wegfiltern.
Die nicht-übersetzten Tags bekommst du nun per Variable <TAGS2> und für da LLaVA Modell habe ich die Parameter Context Size und Temperature einstellbar gemacht.

Ja, das ist schon beeindruckend, was die AI in dem kleinen Bildchen erkennt. Durch bessere Modelle sollte sich das Ergebnisse auch nochmal deutlich verbessern lassen.
 
Bei der Context-Size bin ich mir noch nicht ganz sicher, inwiefern sich das auf die Bilderkennung auswirkt. Bei reinen Text erzeugenden Modellen gibt man damit in etwa an wieviel Text der vorangegangenen Unterhaltung für die Generierung der Antwort verwendet wird, bzw. wie viele Basisinformationen der KI mitgegeben können. Im WiA-Loader dürfte das nur eine Auswirkung auf die maximale Länge des Prompts haben, da ansonsten ja der KI keine weiteren Informationen mitgegeben werden und das Bild selbst da nicht mitzählt (glaube ich! Bin aber auch noch am lernen was das angeht)

Mit der Temperatur stellt du ein, wie vorhersehbar bzw. zufällig eine Ausgabe wird. Je höher die Temperatur, desto zufälliger, je niedriger desto vorhersehbarer. Default in WIA-Loader ist 0.1 und vermutlich macht es auch wenig Sinn, den Wert zu erhöhen, aber zum experimentieren wollte ich es wenigstens möglich machen.
 
Ja, mit der 2.9.1.1 beta von der Homepage hatte ich das Problem nicht mehr. Hast du im Import-Schritt 'ExifTool Änderungen' das Häkchen 'Zeichen für Zeilenvorschub etc. filtern' ?
 
WERBUNG
Zurück
Oben Unten