• Neuer Gutscheincode unseres Partners Schutzfolien24:
    DSLR-Forum2025
    Dauerhaft 10% Rabatt auf alle Displayschutzfolien und Schutzgläser der Eigenmarken
    "Upscreen", "Screenleaf", BROTECT" und "Savvies".
    Der Code ist für alle Geräteklassen gültig.
  • Stimmt ab über die Sieger des DSLR-Forum Fotowettbewerbs September 2025.
    Thema: "Straßenfotografie s/w"

    Nur noch bis zum 30.09.2025 23:59!
    Jeder darf abstimmen!
    Zur Abstimmung und Bewertung hier lang
  • Ich freue mich bekannt geben zu können, dass das DSLR-Forum einen neuen Aktionspartner gewinnen konnte.

    Saal Digital bietet Fotoprodukte in HighEnd-Qualität.
    Alle Informationen dazu gibt es demnächst hier.
  • In eigener Sache!

    Liebe Mitglieder, liebe Besucher und Gäste
    ich weiß, es ist ein leidiges Thema, aber ich muss es ansprechen: Werbung, Werbeblocker und Finanzierung des Forums.
    Bitte hier weiterlesen ...

  • Nicht erreichbare Adressen im Benutzerkonto
    Wir bekommen zurzeit eine große Anzahl an E-Mails, die das System zum Beispiel als Benachrichtigungen an Nutzer verschickt,
    als unzustellbar zurück, weil z.B. die Adressen nicht erreichbar sind oder das Postfach gar nicht existiert.
    Stellt doch bitte sicher, dass die Benachrichtigungen, die ihr vom System erwartet, auch zugestellt werden können.
    Nicht erreichbare E-Mail-Adressen sind dazu wenig hilfreich.
    Danke!
WERBUNG

LR Plugin LrGeniusTagAI - Lokale KI in Lightroom tagt Bilder

sunraid

Themenersteller
Heute durch Zufall das o. g. Lightroom Plugin gefunden. Hat schon jemand von euch das mal ausprobiert und kann Erfahrungen damit hier posten.
Komme selber erst im Laufe der nächsten Woche dazu es auszuprobieren,
 
Gut, ist sicher wie alle Ki-Funktionalitäten von der Rechner-Power abhängig, aber wie lange dauert die Verschlagwortung so im Allgemeinen?
 
Mehrere in einem Rutsch geht, nach dem Import habe ich nicht getestet, wüsste aber spontan nicht wie das gehen soll. Performance ist bei mir extrem lahm, so 5min pro Bild.
Ollama scheint meine GPU nicht zu verwenden, daher dauert es 5min mit meinem alten i7 7700K . Hatte jetzt noch keine Zeit nach der Ursache zu suchen.
 
Und die Verschlagwortung der Bilder passt dann aber gut zum Bild?
Aber ich sehe schon, wenn man keine potente Maschine hat, die gut mit lokalen KI Modellen umgehen kann, dann wird es eher über den Teststatus bei mir nicht rauskommen.
 
Also allgemeine Verschlagwortung ist schon ziemlich gut und die Beschreibung finde ich auch immer recht gelungen.
Bei konkreten Sachen passt es nicht immer, wird aber deutlich besser, wenn man einen konkreten Kontext mitgibt, aber auch nicht immer.
Eine Bergkette auf Senja wird dann als Berg auf den Lofoten erkannt, aber immerhin passt Norwegen, ich würde ja nicht erwarten, dass jeder Berg erkannt wird.
Da aber alle Bilder aus der Serie dann z.b. auf Senja entstanden sind, kann ich das als Kontext mitgeben, wenn keine GPS Daten vorliegen.
Moschusochsen Bilder werden leider als Bison erkannt, auch wenn der Aufnahmeort mitgegeben wird, bei dem dann klar sein müsste, dass es keine Bisons sein können.
Also schon noch Optimierungsbedarf, aber mir gefällt das, da ich es sonst immer vergesse zu machen oder zu faul bin. Ich habe auch nicht viele Bilder, von einer Reise mit 3000 Bilder bearbeite ich vielleicht 50 Bilder die dann getagged werden sollen und dann kann ich beim Export einzelner Bilder auch noch die KI Verschlagwortung drüberlaufen lassen.
 
KI kann nie 100%,also muss ich gleich kontrollieren.
Gibt man den Bildern schon beim Import die Stichwörter mit, die für alle Bilder oder Bildergruppen identisch sind und den Rest während dem ausmisten, hat man meist schon den größten Teil erledigt und zwar korrekt ohne Fehler.
 
So, hier mal meine Eindrücke:

Installation auf dem Mac ein Kinderspiel und schnell erledigt.
Leider auf dem MBP M1 2020 mit 8MB Speicher bei jedem Bild ein Timeout, hab aber erst danach gelesen, dass bei Apple Silicon 16 MB Speicher vorhanden sein müssen.

Auf dem MAC Studio M4 läuft es sehr gut, pro Bild dauert der Vorgang so zwischen 17 bis 22 Sekunden.

Bildbeschreibung, die Ortsdaten kommen aus den manuell vergebenen Stichworten

1751790263625.png

1751790382195.png

Das Bild könnte man so interpretieren :angel:
1751790415314.png

In der 1.3 Version des Plugins waren die Kategorien mit deutschen Bezeichnungen versehen. In der 1.4.1 Version sind es nun englische Begriffe. Vielleicht habe ich das Update nicht korrekt eingefügt?
Hat auf der Testumgebung natürlich für etwas durcheinander gesorgt. Hab es nun bei den englischen Begrifflichkeiten gelassen.

Bei den Stichworten passt es grundsätzlich auch ganz gut
(es wurde sogar die Armbanduhr am Handgelenk eines Spielers erkannt.)

Action wird in den Beschreibungen genannt, aber nicht bei den Stichwörtern
Dynamisch hätte ich auch erwartet
Netz? Im Bild nicht zu sehen, aber ein Stabmattenzaun im Hintergrund wird dann wohl als Netz interpretiert


1751790678509.png

Bin echt beeindruckt von den Ergebnissen und werde wohl nach der Testphase das Plugin kaufen. Mal schauen, wie sich die Sache noch entwickeln wird. Der Author scheint ja momentan sehr aktiv zu sein.
Donnerstag hatte ich die Version 1.3 gesehen und heute gibt es schon die 1.4.1
 
Das Tool ist eine optimale Ergänzung zu Excire. In manchen Bereichen ist die Verschlagwortung wesentlich besser. Wenn man Gemini oder ChatGPT verwendet, ist die Verschlagwortung deutlich schneller als über Ollama, welches halt schon ganz ordentlich eigene Rechenpower benötigt.

Heute gab es übrigens ein Update auf 1.4.1

so weitMaico
 
Ich habe den Eindruck, das wird sehr kleinteilig. Braucht man wirklich das Tag Netz für ein Foto vom Volleyball? Muss man zwischen Beachvolleyballspieler und Volleyballspieler unterscheiden? Mit echter Intelligenz würden doch wohl eher die Kategorien Volleyball, Beach, Spieler (oder besser Sportler) vergeben. Ich möchte mir nicht vorstellen wieviele Tags daraus werden, wenn ich das auf 40.000 Bilder loslasse. Findet man dann für die Suche überhaupt noch die relevanten Tags oder benötigt man dann dafür auch eine KI?

Sinnvoll wäre es dann eher, wenn die KI die vorhandenen Kategorien vorrangig nutzt und dann ggf. sinnig ergänzt.
Wenn es also eine Ober-Kategorie Sport gibt, die Fußball, Schwimmen, Fechten enthält, darf die KI die dann natürlich sinnig durch Volleyball ergänzen.
Ich halte es auch für hilfreich, wenn die KI weitere Tags vorschlägt, aber bitte nicht ungefragt einsetzt, sondern der echten Intelligenz noch die Möglichkeit eines kurativen Eingriffs ermöglicht.
 
Muss man zwischen Beachvolleyballspieler und Volleyballspieler unterscheiden?
habe den Eindruck, das wird sehr kleinteilig.
Das war schon bei Exile Search und auch jetzt hier mein Eindruck. Da kommt einiges an Stichworten zusammen. Habs bislang nur mit ein paar Bildern rumprobiert. Aber trotzdem beeindruckend.

Warum bei den paar Bildern teilweise zwischen Beach- und Volleyballspieler unterschieden wird, keine Ahnung. Alle Bilder waren hier im gleichen Kontext mit ganz viel Beach im Blick

Ich lasse es gerade mal über ein Beachshootig komplett laufen, mal schauen, was dabei so rauskommt.
Gemini oder ChatGPT verwendet,
Muss man sich da irgendwie registrieren und entstehen dabei dann ggf. Kosten?

Ein Vergleich der Ergebnisse für ein Bild bei Nutzung von Ollama und Gemini/ChatGPT wäre ja mal interessant.
 
Muss man sich da irgendwie registrieren und entstehen dabei dann ggf. Kosten?

Ein Vergleich der Ergebnisse für ein Bild bei Nutzung von Ollama und Gemini/ChatGPT wäre ja mal interessant.

Ja, für Gemini oder ChatGPT entfallen die üblichen Kosten eines Monatsabos. Ich hab das noch derzeit "umsonst", weil es 1 Jahr Gemini bei Pixel 9Pro dazu gab. Die Ergebnisse sind im Vergleich zu Ollama präziser.

so weit
Maico
 
Nach 48 Minuten sind 177 Bilder (jpg) eines Mixed Volleyballturniers durch...
Zumindest kann man sagen, dass KI sehr kreativ ist...
Hier mal die Personenzuordnung

1751799655865.png
Für die Praxis sicher nicht wirklich zu gebrauchen.
Wobei die generierten Texte sind soweit ok. Ab und an aber in den alternativen Texten in englischer Sprache, obwohl "German" eingestellt ist.
 
Bin gerade zufällig über den Thread gestolpert, und melde mich mal direkt zu Wort. Bin der Autor von LrGeniusTagAI.

Nach 48 Minuten sind 177 Bilder (jpg) eines Mixed Volleyballturniers durch...
Zumindest kann man sagen, dass KI sehr kreativ ist...
Hier mal die Personenzuordnung


Für die Praxis sicher nicht wirklich zu gebrauchen.
Wobei die generierten Texte sind soweit ok. Ab und an aber in den alternativen Texten in englischer Sprache, obwohl "German" eingestellt ist.
Also wenn die KI die Sprache durcheinander bringt, kann das im wesentlichen zwei Ursachen haben:
  1. Es sind Stichwortkategorien aktiviert, und die sind nicht auf Deutsch gestellt. Das kann man im Zusatzmodul-Manager unter "Bearbeite Stichwort Kategorien" prüfen. Einfach anpassen, oder "Auf Standard zurücksetzen" klicken.
  2. Der Schieberegler für "KI Verhalten" ist zu weit rechts. Gerade bei Verwendung von Ollama Modellen, kann es dann zu Abweichungen vom gewünschten Format/Ergebnis kommen. Im Zweifelsfall den Regler einfach mal ganz nach links auf Wert 0, das liefert mit Ollama oft die besten Ergebnisse.
Thema Performance: Ja das Gemma3 Modell ist nicht gerade ressourcenschonend. Aber demnächst wird mit Gemma3n ein Nachfolger rauskommen, der sehr viel effizienter arbeiten soll. Wenn das soweit ist, werde ich per Newsletter informieren, so dass alle Käufer automatisch informiert werden.

Ja, für Gemini oder ChatGPT entfallen die üblichen Kosten eines Monatsabos. Ich hab das noch derzeit "umsonst", weil es 1 Jahr Gemini bei Pixel 9Pro dazu gab. Die Ergebnisse sind im Vergleich zu Ollama präziser.

so weit
Maico

Ja, es entstehen Kosten bei der Nutzung. Allerdings ist das unabhängig von einem Abo. Man muss eine Kreditkarte oder PayPal hinterlegen, und dann wird auf Basis der verwendeten Tokens abgerechnet. In den allermeisten Fällen sind die Kosten bei unter einem Cent pro Bild, hängt von verwendeten Modell und Anbieter ab. Es können jedoch Budgets, Limits etc. bei den Anbieter eingerichtet werden. Also arm wird man davon in der Regel nicht. Gemini-2.5 Pro ist aktuell die Referenz in Sachen Bildanalyse. Auch ohne GPS Koordinaten wurden in Tests von mir historische Cafés in Bagdad erkannt, oder Felsformationen in der Wüste.

Zum Schluss wollte ich noch darauf hinweisen, dass ich immer bereit bin Fragen unter support@lrgenius.com zu beantworten. Ich versuche in Zukunft die gängigen Foren im Blick zu behalten, aber da kann immer was durchrutschen.
 
@BastiMachek

Schön, dass du hier mitliest! Aufgrund deiner Tipps hat sich das Sprachproblem mittlerweile erledigt. Ich finde das Plugin echt cool, leider aber die Ergebnisse, die die KI zu meinen Bildern (Beachvolleyball) liefert nicht wirklich brauchbar, da innerhalb der Kategorie viel zu kleinteilig.

Alles in einer Serie von Bildern und einem Durchlauf, KI-Verhalten=0
Hier z. B.
1752205548038.png
Bei 14 Volleyballbilder wir weiblich/männlich erkannt und das 15. plötzlich Mann/Frau

Oder
Mixedturnier, Mixed Turnier und Mixed-Turnier
und dann auch nicht für alle 15 sondern nur jeweils einmal, obwohl als Vorgabe für die Serie mitgegeben.

1752206263136.png

Grundsätzlich beeindruckend, aber m. E. mit so einer Bandbreite von Zuweisungen für eine eindeutige Szene auf den Bildern nicht wirklich für eine sinnvolle Verschlagwortung zu gebrauchen. Da muss die KI noch viel lernen.

Werde das Ganze erstmal nur weiter beobachten und nicht nutzen.
 
@BastiMachek

Schön, dass du hier mitliest! Aufgrund deiner Tipps hat sich das Sprachproblem mittlerweile erledigt. Ich finde das Plugin echt cool, leider aber die Ergebnisse, die die KI zu meinen Bildern (Beachvolleyball) liefert nicht wirklich brauchbar, da innerhalb der Kategorie viel zu kleinteilig.

Alles in einer Serie von Bildern und einem Durchlauf, KI-Verhalten=0
Hier z. B.
Anhang anzeigen 4748702
Bei 14 Volleyballbilder wir weiblich/männlich erkannt und das 15. plötzlich Mann/Frau

Oder
Mixedturnier, Mixed Turnier und Mixed-Turnier
und dann auch nicht für alle 15 sondern nur jeweils einmal, obwohl als Vorgabe für die Serie mitgegeben.

Anhang anzeigen 4748703

Grundsätzlich beeindruckend, aber m. E. mit so einer Bandbreite von Zuweisungen für eine eindeutige Szene auf den Bildern nicht wirklich für eine sinnvolle Verschlagwortung zu gebrauchen. Da muss die KI noch viel lernen.

Werde das Ganze erstmal nur weiter beobachten und nicht nutzen.

Eventuell lässt sich das auch durch Programmierung lösen, indem man den bestehenden Stichwortkatalog der KI als Grundlage mitgibt. Das ist jetzt zwar nichts, was mal eben schnell implementiert ist. Aber Wünsche / Vorschläge in dieser Richtung sind jetzt schon paar Mal gemacht worden, so dass ich das eventuell in einer neuen Version einbauen werde. Also weiter beobachten lohnt sich in jedem Fall. :)
 
Vielen Dank für den interessanten Thread. Ich hab dann auch gleich eine Lizenz erworben und getestet.
Mein Primärfokus war das Taggen von Bildern aus dem Hundesport, da dort pro Session typischerweise 3000 bis 15000 Bilder entstehen.
U.a. hatte ich gehofft, dass die Hunderassen korrekt erkannt werden, aber das ist leider nicht der Fall (bei einigen wird immerhin "Windhund" oder "Greyhound" erkannt).

Trotzdem werde ich weiter testen und auch einmal die anderen Modelle bemühen (aktuelle Test liefen mit Ollama).

Auf jeden Fall bin ich sehr gespannt, wo die Reise beim AI-Tagging hingeht. :)
 
dass die Hunderassen korrekt erkannt werden, aber das ist leider nicht der Fall (bei einigen wird immerhin "Windhund" oder "Greyhound" erkannt).
Die Erfahrung habe ich auch gemacht!
Für mich stellt sich die Frage, warum es bei sehr ähnlichen Bildern aus einer Reihe so eine Unschärfe gibt!
Aus meinem Beispiel oben, warum werden auf 15 Bildern über die die KI läuft 14 mal männlich/weiblich erkannt und beim 15. Bild aus der Reihe dann Mann/Frau...

Um das für mich zu beheben, habe ich den Prompt angepasst... "Gib für die Kategorie Geschlecht nur männlich/weiblich zurück"
Danach war es dann ok

Ich werde das Plugin wohl auch kaufen, um weiter zu testen!
 
Für mich stellt sich die Frage, warum es bei sehr ähnlichen Bildern aus einer Reihe so eine Unschärfe gibt!

Der Fall liegt da bei mir etwas anders. Auch wenn es den Oberbegriff "Windhunde" gibt, hatte ich mir erhofft, dass die Rasse (z.B. Greyhound) erkannt wird. Das ist nicht der Fall.
Ein Tagging mit "Windhunde" nutzt mir nichts, da ich ja weiß, dass es solche sind. Ich hatte halt gehofft, dass die KI/AI erkennt, ob es ein Saluki, Whippet, Silken Windsprite, Italienisches Windspiel, Galgo, Greyhound, Sloughi etc. ist.
 
WERBUNG
Zurück
Oben Unten