dam
8 min
DOPPELTE DATEIEN FINDEN
So sieht die optimale Dubletten-Prüfung bei Bildern aus
Dubletten stören das Tagesgeschäft, verbrauchen unnötigen Speicherplatz und verursachen Fehler. Das gilt für alle Arten von Dateien, so auch für doppelte Bilder. In diesem Artikel erfahren Sie, wie Sie doppelte Dateien finden, löschen und der erneuten Entstehung von Duplikaten vorbeugen. Außerdem erklären wir Ihnen, wie Sie Ihre CMS-Datenbank effektiv von Dubletten befreien.
Inhaltsverzeichnis
Was sind Dubletten?
Dubletten sind Datensätze oder Dateien, die in einem Unternehmen mehrfach (also redundant) vorhanden sind. Sie werden auch Duplikate oder doppelte Dateien genannt. Eine Dublette muss nicht unbedingt denselben Dateinamen haben wie das Original. Jedoch ist ihr Inhalt (annähernd) identisch.
Wie entstehen Dubletten?
Dubletten, im speziellen doppelte Bilder, entstehen in Unternehmen auf verschiedene Weise. Klassisch sind folgende Umstände:
- Dateien werden gleichzeitig an mehreren Speicherorten abgelegt (z. B. verschiedene Ordner, verschiedene Systeme)
- Benennung von Dateien ist uneinheitlich geregelt
- Im Arbeitsprozess entstehen unterschiedliche Varianten und Versionen der Bilder, die inhaltlich (fast) identisch sind
- Objekt wurde vom Fotografen mehrfach aufgenommen
Welche Probleme verursachen doppelte Bilder?
Doppelte Bilder und Fotos erschweren die Suche nach dem passenden Bild erheblich. Gerade bei großen Datenbeständen können Marketing-Teams, Content Manager, Produktmanager und weitere Bereiche oft kaum noch beurteilen, welche die korrekte und aktuelle Version eines Bildes ist. Vor allem bei vorherrschenden Datensilos besteht zudem die Gefahr, dass die Mitarbeiter falsche Dateien (veraltete Versionen, nicht freigegebene Bilder, unlizenzierte Fotos, ungeeignete Auflösung etc.) verwenden. Davon abgesehen verbrauchen Dubletten unnötig Speicherplatz und mindern die Performance von Systemen. Gerade bei speicherintensiven Dateien wie hochauflösenden Bildern darf dieser Punkt nicht unterschätzt werden.
Wenn Sie also Zeit bei der Dateisuche einsparen, Fehler minimieren und Ihre Speicherressourcen entlasten möchten, sollten Sie doppelte Bilder finden und löschen. Sehen wir uns deshalb an, welche Möglichkeiten der Dublettenprüfung und -löschung Sie nutzen können.
Doppelte Dateien finden und löschen
Diese Möglichkeiten gibt es:
Betriebssysteme wie Windows bringen keine geeigneten Bordmittel wie eine Dublettenprüfung mit. Sie benötigen also eine zusätzliche Software, die Dubletten findet. Oft stehen solche Tools als Freeware zur Verfügung. Der Funktionsumfang ist unterschiedlich. Einige Lösungen beschränken sich darauf, Dateien mit gleichem Dateinamen zu identifizieren. Andere Werkzeuge unterstützen eine mehrstufige und somit genauere Dublettenprüfung. Hierbei werden mehrere Schritte durchlaufen, um das Ergebnis immer weiter zu verfeinern. Beispielsweise greifen dabei folgende Kriterien:
- Dateiname
- Format
- Dateigröße
- Erstellungsdatum oder Änderungsdatum
Im Ergebnis präsentieren die Tools eine Liste aller gefundenen Dubletten. Nun können Benutzer die doppelten Fotos löschen – oft mit wenigen Klicks. Diese Aktion sollte allerdings wohlüberlegt sein. Denn in Unternehmen sind Fehler an dieser Stelle nicht nur ärgerlich, sondern können zum Verlust wertvoller Assets führen. Insofern sollten Sie ausschließlich Lösungen nutzen, die doppelte Bilder zweifelsfrei identifizieren. Hierfür ist es notwendig, dass nicht nur die oben genannten Kriterien verglichen werden, sondern auch die Bildinhalte – und zwar Pixel für Pixel. Möglich machen dies vor allen Dingen leistungsfähige DAM-Systeme. Sie beinhalten nicht nur Tools, um Duplikate zu finden und zu eliminieren. Sie verhindern die Entstehung einer Dublette von Beginn an. Damit sind wir direkt beim nächsten Thema angelangt: der Dubletten-Prävention.
Dubletten vermeiden: 3 Tipps zur Vorbeugung
Natürlich macht es Sinn, Ihre Server und (CMS-)Systeme (wie Typo3, WordPress, Drupal) regelmäßig nach doppelten Dateien zu durchsuchen und eine Datenbankbereinigung durchzuführen. Noch besser ist es jedoch, wenn Dubletten gar nicht erst entstehen. Mit den folgenden drei Tipps können Sie dieses Ziel erreichen.
Tipp Nr. 1: Datensilos auflösen
Die Basismaßnahme der Vermeidung von Doppelten Dateien besteht darin, Datensilos aufzulösen. Das heißt: Alle dezentralen Speicherorte (lokale Festplatten, unterschiedliche Datenbanken) werden aufgelöst, sodass sich sämtliche Bilder an einem zentralen Ort befinden.
Tipp Nr. 2: Software mit Versionierung nutzen
Die Versionsverwaltung von Bildern rein über den Dateinamen zu lösen, ist nicht empfehlenswert. Denn durch dieses Vorgehen entstehen typische Benennungen wie Version2.psd, V3.psd, final.jpg, final2.jpg und dergleichen. Dies birgt das Risiko von Unklarheiten und fördert die Entstehung von Dubletten. Besser nutzen Sie eine Software, die Dateien automatisch versioniert – beispielsweise eine Bilddatenbank. Damit wird sichergestellt, dass die Mitarbeiter ausschließlich die aktuelle Version eines Bildes verwenden. Zudem hilft eine Versionshistorie dabei, die Änderungen im Zeitverlauf nachzuvollziehen.
Tipp Nr. 3: DAM-System einführen
Der sicherste Weg, Dubletten zu vermeiden, ist die Einführung eines geeigneten DAM-Systems. Lösungen dieser Art zentralisieren die Datenhaltung und unterstützen die Versionierung. Sie leisten im Hinblick auf die Dublettenvermeidung jedoch noch mehr: Bei jedem Upload prüfen Sie, ob eine entsprechende Datei bereits vorhanden ist. Dies erfolgt nicht nur anhand des Dateinamens, sondern auch inhaltlich – also auf Pixelebene. Wurde eine Dublette identifiziert, werden Nutzer direkt gewarnt und können den Upload-Vorgang abbrechen. Somit ist gewährleistet, dass Bild-Duplikate gar nicht erst entstehen.
Tipp: Auch ein Product Information Management System (PIM-System) mit integriertem DAM bringt diese Features mit.
Die wichtigsten Datenbanken im Unternehmen von Dubletten befreien
Problematisch sind Bild-Dubletten vor allen Dingen in Web-Content-Management-Systemen. Befassen wir uns deshalb noch mit der Frage, wie sich die Datenbanken der gängigsten CMS und Shopsysteme (wie Shopware und Magento) von Dubletten befreien lassen.
WordPress-Datenbank bereinigen
Wenn Sie WordPress bereits länger für Ihre Website nutzen, befinden sich zahlreiche Bilder in der Mediathek des CMS. Einige davon sind sicherlich redundant. Um doppelte Dateien zu finden und die WordPress-Datenbank bereinigen, können Sie spezielle Plugins verwenden. Bekannt ist beispielsweise „Media Depuder“. Dank „Smart Delete“ werden bei diesem Tool nur diejenigen Dateien gelöscht, die aktuell auf der WordPress-Webseite nicht in Verwendung sind.
Typo3-Datenbank bereinigen
Auch in Typo3 gibt es spezielle Extensions, mit denen sich doppelte Bilder finden und löschen lassen. Daneben verfügt das CMS über das interne Modul „Database Relations“. Dieses kann einerseits alle Dateien anzeigen, die nirgends verwendet werden. Auf der anderen Seite listet es auch Dateien, die doppelt referenziert sind. Eine echte Dublettenprüfung ist dies allerdings nicht. Insofern sollte anderweitig sichergestellt werden, dass Dateien nicht doppelt in das CMS gelangen und externe Bereinigungsaktionen automatisch auch in Typo3 wirken.
Datenbankbereinigung im Shopsystem
In Shopsystemen wie Magento existieren keine Bordmittel zum Finden und Löschen doppelter Bilder. Hier führt also kein Weg daran vorbei, die Dublettenprüfung mit einem externen Werkzeug durchzuführen. Alternativ können Sie jedoch auch ganz auf die Nutzung der Shop-System-Datenbank verzichten und Bilder direkt aus einem DAM-System einbinden. Natürlich sollte das Digital Asset Management System in diesem Fall Features für die Dublettenvermeidung und -bereinigung bieten.
DAM als optimaler Weg der Dubletten-Bereinigung
Fassen wir zusammen, so sollten Dubletten nach Möglichkeit erst gar nicht entstehen. Ergänzend zur Prävention ist es empfehlenswert, regelmäßig eine Dublettenprüfung durchzuführen und doppelte Dateien zu löschen. Allerdings muss vorher sichergestellt sein, dass nicht versehentlich wertvolle, noch benötigte Assets verloren gehen. Der beste Weg, diese Ziele zu erreichen, ist die Einführung eines DAM-Systems wie dem 4ALLPORTAL. Denn die Lösung verfügt über Schnittstellen zu allen gängigen CMS- und Shopsystemen. Sie fungiert als zentraler Datenspeicherort und ersetzt damit das Medienarchiv aller angebundenen Systeme. Wenn in der DAM-Software Dubletten bereinigt werden, dann automatisch auch in WordPress, Typo3, Magento und Co. Somit sorgt das System für einen sauberen, aktuellen Datenbestand für alle Beteiligten.
More Blogs For You
Die häufigsten Fragen zu Dubletten bei Bildern
Um doppelte Fotos finden und löschen zu können, benötigen Sie spezielle Software. Neben Freeware gibt es hierzu professionelle Lösungen für Unternehmen - darunter Bilddatenbanken und DAM-Systeme.
Es gibt mehrere Gratis-Programme, die doppelte Bilder finden. Einige Beispiele sind AllDup, VisiPics und SimilarImages. Für Profis und Unternehmen empfehlen sich DAM-Systeme und Bilddatenbanken.
Bevor Sie doppelte Dateien löschen, sollten sie sicherstellen, dass es sich um echte Dubletten handelt und die Dateien nirgends verwendet werden. Dies gilt besonders für Bilder, die Unternehmen auf Websites, in Shops und anderen Kanälen verwenden.