Stručný přehled změn v populární hudbě za poslední desetiletí: 2008 vs 2018

Mezi další nezapomenutelné citáty o hymně Rockstar z roku 2018, moderní filosof Post Malone, vyslovil „Muž, který se cítím jako rocková hvězda“. Vyzbrojeni vášní pro data, která jsme se rozhodli prozkoumat: je rap opravdu nová skála? Nebo nový pop? Je rock stále relevantní? Co nejlépe popisuje typické popové texty? Prozkoumáme grafy-toppery 2008 a 2018 s několika vizualizacemi.

Metoda:

Mysleli jsme si, že dobrým výchozím bodem bude koncem roku Billboard Hot 100, který měří nejoblíbenější skladby podle rozhlasového vysílání, streamování dat a prodeje (výřez k Billboardu, grafy jsou k dispozici zde). Abychom získali tato data, vytvořili jsme jednoduchou webovou škrabku. S použitím 100 nejlepších skladeb z let 2018 a 2008 bylo naším konečným cílem ponořit se o něco hlouběji a odhalit velké změny v hudebním průmyslu. Abychom mohli provést smysluplnou analýzu, potřebovali jsme texty a žánry každé písně. Web AZLyrics (shoutout!) Odvádí skvělou práci při údržbě databáze textů, kterou lze snadno odstranit. ale ze strachu, že jsme se možná snažili vytvořit konkurenční web s jejich drahocennými údaji, nás zakázali, když jsme se pokusili oškrábat texty těchto 200 písní. Poslední smích jsme však měli, když jsme se vrátili s nepatrně chytřejší (číst: těžší detekci) škrabkou a VPN. [celý dataset a škrabka jsou na Githubu pro zájemce]

Výsledky:

Několik věcí, které je třeba poznamenat: místo toho, abychom se zabývali více podžánry, jako je trap-rap, EDM-pop atd., Rozhodli jsme se začlenit písně do širokých žánrů rapu, R&B, popu, země a rocku (s nějakou manipulací s Pandas). Například jsme označili Indie / Alternativní písně jako rock.

Hot 100:

Zaprvé máme rozpis nejlepších 100s podle žánru: Nejzajímavější je zde - podle našeho názoru - výskyt rapu a pomalý úpadek skály. Následující výsečové grafy zobrazují podíly žánrů v horkých 100 billboardech za roky 2018 a 2008.

Rap téměř zdvojnásobil svůj podíl na prvních 100, zatímco rock klesl z pouhých 12% v roce 2008 na 5% v roce 2018. Ve skutečnosti bychom tvrdili, že rap je nyní dominantním žánrem, a to i přes pop (populární hudba od definice). Tyto grafy jsou však nejlépe prohlíženy ve spojení s těmito rozptyly, které ukazují šíření čísel grafů napříč žánry.

Rozptylové dávají představu o tom, jak populární byly žánry v každém roce.

Když se podíváme na spiknutí z roku 2008, můžeme dojít k závěru, že pouze několik rapových písní prasklo top 40 - 6, abych byl přesný - ale pop měl 20 zásahů v tomto rozsahu. Nyní po deseti letech počet rapových hitů v top 40 explodoval na 20 a počet popových písní v top 40 se odpovídajícím způsobem snížil na 16. Rock, 4. nejoblíbenější žánr v roce 2008, měl 16 songů v horkých 100; nicméně, to byl nejméně populární žánr v roce 2018, přispívat k pouze 5 z 100 nejlepších.

Text:

Nyní pro zajímavou část: texty populárních písní. Udělali jsme boxploty ukazující počet slov v typické písni každého žánru. Jak bylo očekáváno, s více pozitivním rytmem a četností slov je průměr rapových skladeb průměrný (medián) nejvíce - kolem 600 slov / píseň v roce 2008 i 18. Další žánry jsou také konzistentní mezi 2 roky: pop a R&B kolem 400 slov / píseň , rock a země kolem 300.

Mysleli jsme si, že dalším skvělým vhledem bude porovnání počtu různých slov v písních (opakování ignorována). Věděli jsme, že rap bude žánrem odměňujícím za opakování, ale byli jsme ohromeni, když jsme zjistili, že navzdory tomu, že většina slov má zdaleka nejvíc, v obou letech ne průměroval nejvíce jedinečných slov na píseň. Ve skutečnosti v roce 2008 dosahovaly rapové skladby v průměru více než 100 jedinečných slov na píseň, ale v roce 2018 to kleslo na asi 80 (máme podezření z důvodu nárůstu vysoce opakujícího se mumla rapu, díky Migos!)

Word Clouds:

Nakonec jsme si mysleli, že by bylo zajímavé vytvořit slovo cloud (vizualizovat nejčastěji se vyskytující slova v textech žánru). Náš závěr: dává smysl, že rodiče chtějí, aby se jejich děti držely dál od rapu. Je zajímavé, že cloudové slovo rapu z roku 2008 se téměř zdá být téměř Shakespeareanem ve srovnání s rokem 2018, který je posílen výplněmi a hanlivými termíny. Zdá se tedy, že rapové texty se zhoršují z hlediska vyčerpávajícího obsahu. Několik bonusových poznatků: popové skladby jsou nejlépe charakterizovány slovy jako „láska“, „vědět“, „chtějí“ a „cítit“ a texty R&B jsou někde mezi Popem a Rapem.

Tato analýza zjevně zdaleka není dokonalá, ale bavili jsme se a mysleli jsme, že jsme přitáhli několik zajímavých poznatků. Pokud se chcete dozvědět, jak webový scrape nebo udělat některé z těchto grafů, veškerý náš kód a data jsou na Githubu. Děkuji za přečtení! Dále: pomocí Machine Learning se snažíme předpovídat žánr písně z jeho textů (samozřejmě s více daty). Zůstaňte naladěni!