上周在解析Music2.0互联网音乐调查报告时,我们明确看到用户对喜欢的音乐类型的描述时用了自己的理解。Web2.0概念兴起时出现的一个典型应用—用户自定义Tag标签,理论上说来同样可以用来被用户描述音乐,大多数网站使用后的效果也都不太理想。
Last.fm在音乐标签应用方面可以算是最成功的例子了。正好近来拿到了一些关于Last.fm的tag数据表,就顺便说几句。
音乐Tag的价值
其中有一份是音乐家的tag表,包含了95万条唯一的数据记录。我抽取较为典型的主流乐队Coldplay的数据共170条:
rock 3149
alternative 2791
britpop 2094
alternative rock 1225
indie 1540
Coldplay 985
pop 960
seen live 940
british 565
indie rock 488
Mellow 158
chill 157
favorites 145
emo 117
chillout 112
pop rock 103
这是Coldplay乐队超过100次标记的标签,后面的数字正是标记此tag的次数。这些tag中大多数还是采用了音乐类型加以标记,多样化的音乐类型对乐队的描述的确会更为科学。另一部分则体现的是歌迷们直接的感受,像favorites等。当然也出现了一些难以被理解的tag,比如有49次给他们加注female vocalists标签,难道是说主唱像女声?36次标记Jazz,19次标记ska….
我们在Last.fm的Coldplay乐队页面上看到的标签组显示的正好是前五个答案:
音乐Tag的过滤
同样抽取了72条S.H.E组合的数据,网页上显示的5个tag与前五条数据一样。这基本可以说明Last.fm在Tag显示上并没采用复杂的过滤,但是却能保障这些显示tag的价值。当然也不是完全没有干预,其中有“all things annoying in the world put together into one stupid bitch”这样一个Tag在总体数据表中出现984次,列于流行Tag前500内,但并未出现在网站的tag页面上。个人认为关键在于三点:1是Last.fm的用户中聚集了大批音乐Geeker,他们对音乐有较多的理解同时又乐于为网站贡献;2是Last.fm的用户基数已经足够庞大;3是在加注标签时可直接从该乐队流行的标签中选择。
音乐Tag的参与率
Radiohead加注的Tag数量为25231,当前听众数是1471988位,也就是说即使每个参与的用户只加一个标签,也只有1.7%的用户参与了。
Pink Floyd的Tag数为20372,参与率1.8左右;
Megadeth的Tag数为6966,参与率也在1.9%左右;
Sarah Brightman的tag数994,参与率只有0.6%
数据表中20907位音乐家的Tag参与率基本上都低于2%,其中超过1000个tag的音乐家只有1434位,半数以上低于100个tag。
这份数据是截至到2008年6月,以上计算中忽略近一个月的变化。
此外在Last.fm中发现tag应用中不甚妥当的地方。例如在Cpop的tag页面中显示的“相似艺术家”:






