Wie funktioniert Shazam eigentlich genau?

Gepostet von  15 Juni, 2009

Seitdem ich ein Review über Shazam veröffentlicht habe, besuchen immer wieder User meinen Blog, die etwas über die Funktionsweise dieses tollen Programms erfahren wollen. Der Originalbeitrag gibt darüber nicht wirklich Auskunft. Daher versuche ich mal an dieser Stelle die Arbeitsweise ein wenig tiefer zu durchleuchten.

Im Netz, gerade im deutschsprachigen, gibt es nicht viel Information über Shazam zu erfahren. Ich habe aber mal die gesammelten Infos von diversen Seiten zusammengetragen.

    Grundlage der Software ist eine Datenbank mit aktuell ca. 6 Millionen einträgen.
    Diese Datenbank enthält akkustische Fingerprints zu jedem gespeicherten Titel.
    Die verwendete Erkennungs-Technologie von Shazam gehört der Firmwa Landmark Digital. Diese basiert auf einer patentierten Fingerprinttechnik, die prinzipiell jedes Audiostück innerhalb der Datenbank wiedererkennen kann. Dieses geschieht auch noch sehr schnell und mit nur einem kurzen Audioausschnitt.
    Die Technologie ist in der Lage das Musikstück trotz Hintergrundgeräusche, "schlechten" Telefon-Mikros oder verrauschten Radiosendern zu identifizieren.
    Jedes Audiostück wurde "fingerprinted". Ein Prozess in dem die benötigten Audio-Informationen extrahiert werden. Dazu gehört z.B. eine Zeit-Frequenz-Analyse.
    Die Software erkennt also im Prinzip unverwechselbare charakteristische Merkmale des Songs. Daher ist es auch prinzipiell egal an welcher Stelle des Songs die Erkennung startet.
    Die Schnelligkeit der Software kommt daher, dass nur ein kurzer Ausschnitt des Musiktitels mitgeschnitten werden muss. Dieser wird dann über das Internet an Shazam geschickt. Die Software extrahiert dann auf einem leistungsstarken Rechner die benötigten Informationen und erstellt den Fingerprint. Dieser Fingerprint wird anschließend in der Datenbank gesucht. Wird das Stück identifiziert sendet der Server die vorhandenen Informationen, wie z.B Titel, Interpet und Name es Albums zurück an den Suchenden.

Die Informationen oben geben einen guten Überblick über die generelle Arbeitsweise von Shazam wieder. Wer es wirklich im Detail wissen möchte und speziell an der Erstellung der Fingerprints interessiert ist, dem lege ich ans Herz, die verlinkte PDF-Datei unten im Quellenbereich zu lesen. Dort wird die Funktionsweise von Shazam und anderen Musikerkennungsprogrammen auf Basis dieser Technologie sehr genau beschrieben.

Quellen:
Wikipedia
Piratec.net
http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf

Suchbegriffe:

Ähnliche Artikel:

  1. Shazam: .. Liederkennung vom Feinsten!
  2. Nachtrag zu Shazam: Das Programm zur Lied-Erkennung
  3. Midomi: Ähnlich wie Shazam aber mit zusätzlichen Funktionen
  4. Ist das iPhone 3G S eigentlich auch wasserdicht?
  5. iPhone als Dokumentenscanner verwenden

Kategorien : Anwendungen,Hintergrund,Nützliches Tags :

Kommentare

8 Kommentare zu “Wie funktioniert Shazam eigentlich genau?”
  • Kampfkeks sagt:

    vielen dank für die aufschlussreiche erklärung der funktionsweise.
    Haben die denn über 6 mio songs auf deren platten? wieviel speicherplatz die dann wohl brauchen

  • admin sagt:

    @kampfkeks

    die datenbank wird vermutlich regelmässig erweitert, so dass jetzt vermutlich bereits weit mehr als 6 millionen titel verfügbar sind. der speicherplatz sollte nicht das problem sein, der kostet heute nix mehr. allerdings brauchen die mit sicherheit richtig dicke server, um die fingerprints zu den empfangenen anfragen erzeugen zu können. shazam gibt es fast für jedes smartphone und auch für andere systeme. da laufen bestimmt eine ganze menge anfragen pro sekunde auf.

  • patrick sagt:

    leider ist das tempo des lieds bestandteil des fingerprints. die identifizierung von gemixten songs aus elektro mixen o.ä. ist unmöglich, weil fast immer gepitched.

    gibt es da alternativen? oder ideen?

  • admin sagt:

    @patrick

    bei stücken jenseits des mainstreams ist die trefferquote leider in der tat noch sehr dürftig. ich denke der hauptgrund liegt darin, dass entsprechende stücke einfach nicht in der datenbank vorhanden sind. selbst bei veröffentlichen techno, goa o.ä. cds wird selten was gefunden. wenn es sich dann noch um gemixte musik handelt wird es wirklich unmöglich. besser ist da vielleicht midomi geeignet, das auch stücke erkennt, die man selber vorgesummt hat. da dürfte eine gemixte aufnahme wahrscheinlich nichts ausmachen… ich denke aber auch hier wird es wohl in der regel daran scheitern, dass das stück gar nicht in der datenbank vorhanden ist.

  • ahmet sagt:

    tja sazam hat bei mir versagt.ehrlich gesagt suche ich ein soundtrack von addidas die herausforderung (werbung) 1min30 auf youtube.keiner und kein programm konnte mir helfen die hintergrund musik(soundtrack) zu ermitteln wirklich arm ey! habe sogar addidas persöhnlich angeschrieben und keine antwort erhalten echt traurig! komisch haben die das selber komponiert ,wenn ja dann so kurz. ohne jegliche stimme zwischen dem classischen lied gibs diesen sound nicht.

  • admin sagt:

    Shazam funktioniert nur bei Titeln, die genauso aufgenommen bzw. veröffentlicht wurden. Bei Live-Aufnahmen oder ähnliches funktioniert Shazam leider nicht

  • Uli sagt:

    Hallo Ahmet,

    der Musiktrack in dem Werbevideo von Adidas wurde mit Sicherheit dafür produziert. Das wirst du im handel nicht finden. Du könntest versuchen die Firlmproduktionsfirma herauszufinden, die das Video gemacht hat. Aber selbst die dürfen den Audiotrack nicht rausrücken, da Adidas daran die Rechte hat.

Trackbacks

Andere Seiten schrieben dies...


Kommentar schreiben

(erforderlich)

(erforderlich)