mortara
Themenersteller
So, mittlerweile habe ich Version 2.9.0.0 fertig gemacht und auf die Homepage geladen bzw. beim Microsoft App-Store eingereicht.
Neben ein paar kleineren Bugfixes ist da in erster Linie eine weitere Möglichkeit hinzugekommen, Bilder automatisch Beschriften bzw. Taggen zu lassen: per lokal laufendem LLaVA KI Modell. Das heisst es entstehen keine weiteren Kosten und die Bilder verlassen nicht den Rechner in Richtung Microsoft oder OpenAI. lediglich eine NVIDIA Grafikkarte wird optimalerweise benötigt. Es geht theoretisch zwar auch ohne bzw. mit Karten anderer Hersteller, aber das dürfte langsam sein und kann ich auch gerade nicht testen. Auf meiner RTX 4060 braucht WIA-Loader für ein Bild zwischen 2 und 6 Sekunden.
Die Ergebnisse sind ähnlich gut wie bei OpenAI und deutlich besser als mit dem Azure oder dem ONNX Modell. Das Setup funktioniert ähnlich wie beim ONNX Modell, d.h. es müssen 2 Dateien heruntergeladen werden und in den Einstellungen von WIA-Loader hinterlegt werden. Um das alles noch einfacher zu machen habe ich eine Funktion eingebaut, die auch diesen Prozess automatisch vornimmt.
Die einfachste Möglichkeit, die Funktion schnell einmal auszuprobieren ist über das Kontext-Menü:

Hier noch ein paar Beispiele für das was die KI so in den Bildern erkennt:



Das funktioniert tatsächlich sogar so gut, dass ich nicht so wirklich weis ob ich noch Zeit in die Weiterentwicklung der anderen Tagging Methoden investieren soll. Azure und OpenAI liefern zwar gute Ergebnisse, kosten aber extra und das ONNX Modell ist zwar schnell und kostenlos, aber hinkt beim Ergebnis um Welten hinterher.
Edit:
Die Tagging Funktion mittels ChatGPT habe ich auf das neue Modell GPT-4o umgestellt. Das ist schneller und günstiger.
Neben ein paar kleineren Bugfixes ist da in erster Linie eine weitere Möglichkeit hinzugekommen, Bilder automatisch Beschriften bzw. Taggen zu lassen: per lokal laufendem LLaVA KI Modell. Das heisst es entstehen keine weiteren Kosten und die Bilder verlassen nicht den Rechner in Richtung Microsoft oder OpenAI. lediglich eine NVIDIA Grafikkarte wird optimalerweise benötigt. Es geht theoretisch zwar auch ohne bzw. mit Karten anderer Hersteller, aber das dürfte langsam sein und kann ich auch gerade nicht testen. Auf meiner RTX 4060 braucht WIA-Loader für ein Bild zwischen 2 und 6 Sekunden.
Die Ergebnisse sind ähnlich gut wie bei OpenAI und deutlich besser als mit dem Azure oder dem ONNX Modell. Das Setup funktioniert ähnlich wie beim ONNX Modell, d.h. es müssen 2 Dateien heruntergeladen werden und in den Einstellungen von WIA-Loader hinterlegt werden. Um das alles noch einfacher zu machen habe ich eine Funktion eingebaut, die auch diesen Prozess automatisch vornimmt.
Die einfachste Möglichkeit, die Funktion schnell einmal auszuprobieren ist über das Kontext-Menü:

Hier noch ein paar Beispiele für das was die KI so in den Bildern erkennt:



Das funktioniert tatsächlich sogar so gut, dass ich nicht so wirklich weis ob ich noch Zeit in die Weiterentwicklung der anderen Tagging Methoden investieren soll. Azure und OpenAI liefern zwar gute Ergebnisse, kosten aber extra und das ONNX Modell ist zwar schnell und kostenlos, aber hinkt beim Ergebnis um Welten hinterher.
Edit:
Die Tagging Funktion mittels ChatGPT habe ich auf das neue Modell GPT-4o umgestellt. Das ist schneller und günstiger.
Zuletzt bearbeitet: