Blogverzeichnis Bloggerei.de
top of page

Wenn der Algorithmus den Chor sortiert: Warum Musikstreaming Vielfalt verspricht und oft dieselben Stimmen verstärkt

Ein leuchtendes Smartphone mit Musikempfehlungen steht zwischen hell ausgeleuchteten und im Hintergrund verblassenden Musikerinnen und Musikern; darüber steht Wer hört wen? und auf einem roten Banner Algorithmen sortieren Musik.

Es beginnt oft mit einem Gefühl, das schwer zu fassen ist. Die Musikplattform wirkt riesig, fast grenzenlos, und trotzdem tauchen in den personalisierten Empfehlungen erstaunlich oft dieselben Arten von Stimmen auf: ähnliche Produktionen, ähnliche Karrieren, ähnliche Bekanntheitsgrade. Man klickt sich durch Mixe, Radios und Entdecker-Playlists und merkt irgendwann, dass aus Fülle noch keine Vielfalt geworden ist.


Das ist keine Nebensache. Laut IFPI entfielen im Jahr 2024 bereits 69,0 Prozent der weltweiten Umsätze der aufgenommenen Musik auf Streaming, bei 752 Millionen bezahlten Abonnements. Wer heute Musik sucht, findet sie meistens nicht mehr im Plattenladen, im Musikmagazin oder beim Zufallsgespräch nach dem Konzert. Der wichtigste Türsteher sitzt in einer Empfehlungslogik.


Die gute Nachricht zuerst: Solche Systeme können echte Entdeckungen ermöglichen. Spotify verweist etwa darauf, dass über Discover Weekly inzwischen mehr als 100 Milliarden Tracks gestreamt wurden und jede Woche Millionen neue Artist-Entdeckungen stattfinden. Das ist real. Aber daneben läuft eine zweite Geschichte: Empfehlungsmaschinen helfen nicht nur beim Finden. Sie sortieren Aufmerksamkeit. Und genau dort entsteht Bias.


Bias heißt nicht Betrug, sondern Schieflage


Wenn Forschende von Empfehlungsbias sprechen, meinen sie meist keine böswillige Manipulation, sondern systematische Schieflagen in der Verteilung von Sichtbarkeit. Im Musikbereich ist besonders der sogenannte Popularity Bias gut dokumentiert. Die Studie Exploring Popularity Bias in Music Recommendation Models and Commercial Steaming Services beschreibt ihn knapp: Systeme bevorzugen übermäßig populäre Artists. Das ist deshalb brisant, weil ausgerechnet das im Test akkurateste Modell zugleich die stärkste Popularitätsverzerrung zeigte.


Das klingt zunächst technisch, hat aber eine einfache Logik. Wer bereits viele Streams, viele Saves, viele Playlist-Platzierungen und viele Interaktionen hat, produziert mehr Signale. Mehr Signale machen einen Act für das System leichter lesbar. Leichter lesbare Acts werden häufiger empfohlen. Häufigere Empfehlungen erzeugen wieder mehr Interaktionen. Aus Sicht der Maschine sieht das nach Erfolg aus. Aus Sicht der Kultur ist es oft nur eine sauber beschleunigte Rückkopplung.


Die Reproduktionsstudie The Unfairness of Popularity Bias in Music Recommendation zeigt zusätzlich, dass diese Schieflage nicht nur Artists trifft. Hörerinnen und Hörer mit geringer Mainstream-Nähe erhalten im Schnitt die schlechtesten Empfehlungen. Anders gesagt: Wer ohnehin etwas Abseitigeres, Lokaleres oder Stilistisch Spezifischeres sucht, bekommt häufig gerade nicht die bessere Kuratierung, sondern die schwächere.


Das ist ein wichtiger Punkt, weil er einen verbreiteten Irrtum korrigiert. Empfehlungsbias bedeutet nicht bloß, dass unbekannte Künstlerinnen und Künstler unfair behandelt werden. Er bedeutet auch, dass die Plattform den Geschmack ihrer Nutzerinnen und Nutzer oft in Richtung des bereits Bewährten zurückbiegt.


Der Katalog ist groß, aber die Wege hindurch sind eng


Streamingplattformen werben gern mit nahezu unbegrenzter Auswahl. Tatsächlich ist die Zahl verfügbarer Songs so groß, dass ohne Filter kaum jemand sinnvoll suchen könnte. Genau deshalb ist die Frage, wie diese Filter gebaut sind, nicht technisches Kleingeld, sondern kulturelle Infrastruktur. Wer einmal verstehen will, warum gute Auswahlsysteme nie neutral sind, landet schnell auch bei Fragen, die weit über Musik hinausreichen, etwa bei guten Filtern in Shops und Datenbanken, wo dieselben Grundprobleme von Logik, Sichtbarkeit und Vorauswahl auftauchen.


In der Musik kommt noch etwas hinzu: Empfehlungen verarbeiten nicht nur Klangähnlichkeit. Sie verarbeiten Verhalten. Welche Tracks wurden gemeinsam gehört? Welche Songs wurden geskippt? Welche Acts schaffen es in kuratierte Listen? Welche Knoten liegen in dichten Netzwerken? Das Ergebnis ist kein neutraler Spiegel von Musik, sondern eine verdichtete Karte vergangener Aufmerksamkeit.


Spotify-Forschung selbst hat in Algorithmic Effects on the Diversity of Consumption on Spotify gezeigt, dass organisches Hören für die Mehrheit der Nutzer diverser ist als algorithmisch programmiertes Hören. Wer also stärker aus eigenen Sammlungen, selbstgebauten Playlists oder direkter Suche hört, bewegt sich im Schnitt breiter als jemand, der sich hauptsächlich vom System treiben lässt. Zugleich waren Nutzerinnen und Nutzer mit vielfältigerem Hörverhalten langfristig loyaler. Vielfalt ist also nicht bloß ein kultureller Luxus. Sie korreliert sogar mit stabilerer Bindung.


Das legt einen Zielkonflikt offen. Empfehlungsalgorithmen sind oft gut darin, kurzfristig passende Vorschläge zu machen. Aber genau diese Nähe zum bereits Bekannten kann langfristig die Hörbreite verengen. Oder genauer: Sie kann das Entdecken so komfortabel machen, dass Überraschung nur noch in einem sicheren Korridor stattfindet.


Manche Artists verschwinden nicht wegen Qualität, sondern wegen Struktur


Besonders aufschlussreich ist hier die Studie “Splendid Isolation”: The reproduction of music industry inequalities in Spotify’s recommendation system. Sie zeigt an einer Fallstudie zu ungarischen Metal-Bands, dass algorithmische Vernetzung stark mit bereits bestehenden internationalen Labelverbindungen zusammenhängt. Bands mit internationalen Labels hatten mehr wechselseitige internationale Verbindungen und wurden eher entlang echter Genreähnlichkeit empfohlen. Lokal gebundene oder selbst veröffentlichte Bands wurden häufiger entlang ihrer Herkunft gekoppelt.


Das ist deshalb so wichtig, weil es ein Missverständnis über Plattformen zerstört. Der Algorithmus sitzt nicht über der Musikindustrie wie ein neutraler Richter. Er wächst aus ihr heraus. Wenn das Eingangsmaterial bereits ungleich verteilt ist, wenn Marketingbudgets, Labelnetzwerke, Metadatenqualität, regionale Reichweite und frühere Sichtbarkeit ungleich sind, dann wird auch das Empfehlungssystem diese Unterschiede nicht automatisch glätten. Es kann sie sogar stabilisieren.


Die große Streaming-Erzählung lautete einmal: Das Netz demokratisiert Musik. Jeder Upload kann sein Publikum finden. Das war nie völlig falsch, aber es war auch nie die ganze Wahrheit. Plattformen haben Hürden gesenkt. Sie haben zugleich neue Engstellen gebaut: Ranking, Playlisting, Empfehlungsflächen, algorithmische Radios, Autoplay-Ketten. Die Macht ist nicht verschwunden. Sie hat nur ihre Form geändert.


Wer Musikstreaming schon länger beobachtet, kennt diese Ambivalenz aus einem anderen Winkel: Playlists für jede Lage haben Musik in ein Werkzeug der Alltagssteuerung verwandelt. Genau darin liegt ihr Nutzen. Aber je stärker Musik zum situativen Funktionsmedium wird, desto größer wird auch der Anreiz für Plattformen, nicht das Überraschendste zu empfehlen, sondern das Reibungsärmste.


Sichtbarkeit ist auch eine Frage von Geschlecht


Bias in Musikempfehlungen verläuft nicht nur entlang von Bekanntheit. Er kann auch entlang sozialer Muster wie Geschlecht sichtbar werden. Die Studie Tracking Gendered Streams fand in einem Bot-Experiment zwar keine starken Hinweise darauf, dass männlich und weiblich registrierte Nutzer grundsätzlich völlig unterschiedlich profiliert werden. Auffällig war aber etwas anderes: Die empfohlenen Artists waren stark männlich überrepräsentiert. Im ausgewerteten Datensatz waren rund 80 Prozent der empfohlenen Acts männlich codiert, nur etwa 15 Prozent weiblich codiert, der Rest gemischt.


Noch deutlicher wird die strukturelle Seite in Break the Loop: Gender Imbalance in Music Recommenders. Dort benennen befragte Artists Geschlechterfairness selbst als zentrales Problem und weisen darauf hin, dass Empfehlungssysteme vorhandene Ungleichgewichte nicht einfach abbilden, sondern durch Feedbackschleifen verlängern können.


Das ist ein heikler Punkt, weil Plattformen gern mit dem Argument arbeiten, man zeige eben, was gut funktioniere. Aber diese Formulierung ist oft zu bequem. Was gut funktioniert, ist nicht einfach Natur. Es ist das Ergebnis früherer Investitionen, historischer Kanons, Labelpolitik, redaktioneller Entscheidungen, sozialer Normen und algorithmischer Verstärkung. Wenn ein System dann vor allem jene Muster weiter hochzieht, nennt man das nicht Neutralität, sondern Pfadabhängigkeit.


Das Interface lenkt mit, auch wenn es still bleibt


Viele dieser Steuerungsleistungen bleiben unsichtbar. Nutzerinnen und Nutzer sehen eine hübsche Oberfläche, ein paar Playlists, vielleicht neue Genre-Buttons, dazu eine vermeintlich persönliche Ansprache. Die eigentliche Ordnung liegt darunter: Welche Flächen sind prominent? Welche Optionen verlangen aktives Suchen? Wo ist der Skip billig, wo die Überraschung aufwendig? In digitalen Umgebungen ist Sichtbarkeit fast immer auch eine Frage des Interface-Designs. Wer wissen will, wie stark uns solche stillen Systeme führen können, findet eine erhellende Parallele bei Videospiel-UI, die Ordnung, Stress und Immersion zugleich steuert.


Musikplattformen arbeiten ähnlich sanft. Sie drängen nicht. Sie legen Pfade. Und diese Pfade haben Folgen. Wer überwiegend auf vorgefertigte Empfehlungen hört, trainiert das System mit. Wer häufiger dieselben Signale bestätigt, macht ähnliche Vorschläge in Zukunft wahrscheinlicher. Personalisierung ist deshalb keine Einbahnstraße, in der eine Maschine uns bloß erkennt. Sie ist eine Schleife, in der wir gemeinsam mit der Maschine einen bestimmten Hörkorridor stabilisieren.


Merksatz: Empfehlungsbias ist selten der eine große Fehler.


Meist ist er die Summe vieler kleiner Designentscheidungen: Welche Daten zählen, welche Ziele optimiert werden, wie Erfolg gemessen wird und welche Formen von Vielfalt überhaupt im System sichtbar werden.


Warum Plattformen nicht einfach auf Vielfalt optimieren


Hier wäre der moralisch einfache Satz verlockend: Dann sollen Plattformen doch einfach diverser empfehlen. Aber so simpel ist es nicht. Empfehlungssysteme müssen mehrere Ziele gleichzeitig bedienen. Sie sollen Reibung senken, Zufriedenheit erzeugen, Hörzeit erhöhen, Abwanderung verhindern, neue Inhalte einführen und dabei Millionen sehr unterschiedlicher Menschen ansprechen.


Gerade deshalb ist die Literaturübersicht The Impact of Algorithmically Driven Recommendation Systems on Music Consumption and Production so hilfreich. Sie zeigt, dass es zwar viel Forschung zu Fairness und Bias gibt, aber erstaunlich wenig öffentliche Einblicke in die reale Funktionsweise kommerzieller Musikrecommender. Wir wissen also einiges über Probleme, aber deutlich weniger über die konkreten Zielkonflikte, Gewichtungen und Eingriffe im industriellen Alltag.


Plattformen haben allerdings durchaus Handlungsspielräume. Spotify selbst führt inzwischen bei Discover Weekly zusätzliche Genre-Steuerungen ein. Das ist kein Allheilmittel, aber ein interessantes Signal: Nutzerkontrolle wird als Teil guter Personalisierung ernster genommen. Die Frage ist nur, ob solche Schalter an der Oberfläche reichen, wenn die Grundlogik darunter weiterhin Popularität besonders effizient belohnt.


Was ein besseres System leisten müsste


Eine überzeugende Antwort dürfte nicht in der Abschaffung von Empfehlungen liegen, sondern in ihrem Umbau. Die Übersicht Diversity by Design in Music Recommender Systems argumentiert genau in diese Richtung: Diversität sollte nicht als dekorative Zusatzmetrik behandelt werden, sondern als Designprinzip.


Praktisch hieße das mindestens vier Dinge.


Erstens: Plattformen müssten Erfolg breiter messen. Nicht nur Klick, Skip und Verweildauer, sondern auch, ob Empfehlungen langfristig Hörbreite fördern, ob sie neue Regionen, Szenen oder Artist-Typen sichtbar machen und ob sie Nischenhörer nicht systematisch schlechter bedienen.


Zweitens: Anbieter sollten offener erklären, welche Formen von Fairness und Vielfalt ihre Systeme überhaupt berücksichtigen. Die Debatte um Model Cards und Datenblätter für KI-Systeme zeigt, dass Transparenz nicht jede Verzerrung löst, aber Verantwortlichkeit überhaupt erst diskutierbar macht. Für Musikplattformen könnte das heißen: Welche Signale dominieren Empfehlungen? Welche Rolle spielen Popularität, Editorials, Similarity, Region, Release-Dynamik oder Nutzerfeedback?


Drittens: Nutzerinnen und Nutzer brauchen echte Steuerungsmöglichkeiten. Nicht nur Genre-Schalter, sondern vielleicht Modi wie „mehr Neuheit“, „mehr lokale Szenen“, „weniger Mainstream“, „mehr Debüts“ oder „mehr Label-Unabhängigkeit“. Personalisierung wäre dann nicht bloß ein Urteil der Plattform über uns, sondern eine verhandelbare Einstellung.


Viertens: Empfehlungsforschung sollte provider fairness ernster nehmen. Wenn ein System nur danach beurteilt wird, ob Nutzer schnell etwas finden, blendet es aus, dass auch Artists, Labels und Szenen vom Verteilungssystem abhängen. Musik ist kein neutraler Produktkatalog. Sie ist ein kulturelles Feld, in dem Sichtbarkeit Karrieren baut.


Die eigentliche Frage ist nicht, ob Algorithmen Musik empfehlen dürfen


Sie dürfen. Und oft tun sie das nützlich. Die entscheidende Frage lautet anders: Welche Kultur entsteht, wenn der Hauptzugang zu Musik von Systemen organisiert wird, die Bekanntes, Messbares und bereits Anschlussfähiges bevorzugen?


Ein schlechter Recommender nervt. Ein guter Recommender spart Zeit. Aber ein mächtiger Recommender formt Hörgewohnheiten, Karrierechancen und kulturelle Erinnerung. Er entscheidet mit, welche Stimmen als naheliegend gelten und welche als Randfall. Das ist mehr als Komfort. Das ist eine Sortierung des Hörbaren.


Deshalb sollte man Empfehlungsbias nicht nur als Technikproblem lesen. Er ist auch ein Kulturproblem. Und vielleicht sogar ein demokratisches Problem im kleinen Maßstab: Wenn öffentliche Sichtbarkeit immer stärker über proprietäre Sortiermaschinen läuft, dann wird Vielfalt nicht mehr nur produziert, sondern aktiv vermittelt oder blockiert.


Die Musikplattform der Zukunft müsste deshalb mehr können als uns passende Songs vorzuspielen. Sie müsste uns auch helfen, den eigenen Geschmack nicht bloß bestätigt, sondern erweitert zu bekommen. Nicht jede Woche radikal. Aber regelmäßig genug, damit aus Bequemlichkeit nicht langsam kulturelle Verarmung wird.



Weiterlesen


Kommentare

Mit 0 von 5 Sternen bewertet.
Noch keine Ratings

Rating hinzufügen


Mehr aus dem Blog
 

bottom of page