KI Tutorials

Success Story: KI-gestützte Medienkonsolidierung beim E/D/E

Millionen Bilder aus unterschiedlichen Quellen, fehlende Standards und ein anstehender Systemwechsel: Mit KI-gestützter Automatisierung wurde ein historisch gewachsener Medienbestand konsolidiert – und eine belastbare, barrierefreie Medienbasis geschaffen.

Ausgangslage – gewachsene Strukturen und steigende Anforderungen

Das E/D/E (Einkaufsbüro Deutscher Eisenhändler) stellt seinen angeschlossenen Fachgroßhändlern umfangreiche Produkt- und Mediendaten zur Verfügung und schafft damit eine zentrale Grundlage für Vermarktung, Information und digitale Prozesse. Mit dem wachsenden Leistungsumfang und der stetig zunehmenden Datenmenge stiegen auch die Anforderungen an Qualität, Aktualität und Konsistenz der Inhalte.

Über Jahre hinweg war ein umfangreicher Medienbestand entstanden, der sich über mehrere unabhängige Systemlandschaften verteilte. Mehr als 11 Millionen Bildverlinkungen verwiesen auf rund 3,3 Millionen Medienassets, die sich in unterschiedlichen Ausprägungen und Qualitäten befanden. Uneinheitliche Benennungen und zahlreiche Dubletten erschwerten die Übersicht und eine verlässliche Nutzung erheblich.

Mit dem geplanten Wechsel von einem proprietären Altsystem zur Katalogerstellung, unterschiedlichen PIM-Systemen und einer filebasierten Medienablage hin zu einer modernen, konsolidierten PIM-Umgebung wurde deutlich: Der Medienbestand sollte nicht einfach übernommen, sondern grundlegend bereinigt und neu strukturiert werden.

Fachliche Anforderungen – Qualität, Skalierbarkeit und Zukunftsfähigkeit

Die Herausforderung lag nicht in einem einzelnen System, sondern in der Kombination aus enormer Datenmenge, hoher Heterogenität und fehlenden Standards. Ein Datenvolumen von mehreren Terabyte machte klassische, manuelle Dublettenprüfungen unmöglich. Unterschiedliche Formate, Namenslogiken und Bildvarianten verhinderten eine eindeutige Zuordnung der Assets.

Zudem fehlten zentrale Qualitätsmerkmale, die für eine nachhaltige Nutzung der Mediendaten erforderlich sind. Konkret ging es um:

  • belastbare Metadaten als Grundlage für Suche, Ausspielung und Automatisierung
  • aussagekräftige Alt-Texte und strukturierte Tags für Qualität und Barrierefreiheit
  • mehrsprachige Beschreibungen für die internationale Nutzung
  • barrierefreie Inhalte gemäß aktuellen Anforderungen

Der Lösungsansatz musste diese Anforderungen skalierbar abbilden, verlässlich entscheiden und zugleich wirtschaftlich umsetzbar bleiben.

Konsolidierung und Bereinigung – Automatisierung mit klaren Entscheidungsregeln

Gemeinsam mit dem E/D/E entwickelte forbeyond eine intelligente, automatisierte Lösung, die technologische Verfahren mit fachlicher Logik verbindet. Der Fokus lag zunächst auf der systematischen Konsolidierung und Bereinigung des gesamten Medienbestands.

Mithilfe einer skalierbaren Pipeline aus regelbasierten Verfahren, Embedding-Technologie und KI-Modellen konnten Millionen Bilder automatisiert analysiert, verglichen und bewertet werden. Dabei wurden Dubletten und Varianten präzise erkannt und anhand gemeinsam definierter fachlicher Regeln konsolidiert. Auf diese Weise ließ sich der überwiegende Teil der 3,3 Millionen geprüften Assets automatisiert verarbeiten.

Klärung von Zweifelsfällen – Human-in-the-Loop als gezielte Ausnahme

Nur ein kleiner Teil der Medien ließ sich nicht eindeutig automatisiert entscheiden. Diese verbleibenden Zweifelsfälle wurden gezielt an E/D/E-Experten übergeben und mithilfe eines eigens entwickelten Human-in-the-Loop-Tools bewertet.

Intuitive, paarweise Bildvergleiche mit Swipe-Mechanik, sortiert nach Ähnlichkeit und Relevanz, ermöglichten schnelle und konsistente Entscheidungen. So konnte auch dieser Restbestand effizient geklärt werden, ohne den Gesamtprozess zu verlangsamen oder zusätzliche Komplexität zu erzeugen.

Anreicherung der Mediendaten – Qualität über die Konsolidierung hinaus

Nach der Bereinigung wurden alle verbleibenden Medienassets automatisiert angereichert. Jedes Bild erhielt strukturierte Tags, aussagekräftige Alt-Texte sowie Übersetzungen in Deutsch, Englisch, Französisch und Spanisch. Damit wurden 100 % der konsolidierten Assets erstmals barrierefrei und international nutzbar.

Ergebnis – konsolidiert, angereichert, einsatzbereit

Im Verlauf des Projekts konnten rund 390.000 nicht führende Bildvarianten aus dem Bestand entfernt und mehr als 700.000 Bildverlinkungen an Artikeln bereinigt werden – ohne Informationsverlust für die angeschlossenen Produktdaten. Alle verbleibenden Medienassets wurden vollständig angereichert und qualitativ aufbereitet.

Innerhalb von nur vier Monaten entstand so eine konsolidierte Media-Asset-Basis, die den Systemwechsel absichert und als skalierbare Grundlage für zukünftige digitale Anforderungen dient.

Haben Sie eine datengetriebene Herausforderung? Lassen Sie uns über mögliche KI-Use Cases und Lösungsansätze sprechen.