我的安河桥北和你的外滩18号:京沪歌词分析中的爱恨别离

百家 作者:大数据文摘 2017-08-25 11:27:34


北京与上海,这两个城市有着太多共同点,又截然不同。


看似同样的灯红酒绿与车水马龙,却孕育着不同的文化与历史。这种“差异”不止体现在上海姑娘的吴侬软语和北京爷们的手串里,也浸润进了每一首吟唱它们的歌曲中。


“晚安,北京,晚安,所有未眠的人们”,到“我在人民广场吃着炸鸡,而此时此刻你在哪里”在与京沪相关的歌词里,藏着太多的故事和爱恨。



天安门、百花深处,外滩、苏州河 歌词中频繁出现的文化地标体现了怎样的城市文明?

离别驻留、哭笑爱恨,这些歌词又体现着京沪人对这两座城市什么样的情感?

不同时间段两座城市的变化在歌词中又得到了怎样的体现?

带着这些疑问,我们抓取了虾米上包含“北京”、“上海”关键词的354 首歌(有关北京256 首,有关上海 98 首),运用文本分词、关键词词频统计、文本情感值算法计算等几种基础的文本挖掘方式,用数据对这几个问题作出了我们的回答。


另:所有爬下来的数据和分析代码我们都妥妥保存着,想要拿来玩儿的盆友可以添加文摘君微信(微信id:superbigdata)备注:【歌词】,进群一起玩儿。



“相聚又别离”的北京与”笑着哭“的上海:歌词词频中的爱恨纠葛


“许多人来来去去,相聚又别离,也有人匆匆逃离,这一个人的北京。”


“我不知道你在想什么,还是那个地点那条街,那缠绵的地点,难道是爱的天平已经倾斜。”


印象中,写北京的歌词总是有太多的聚散别离。这样的叙事却在有关上海的歌词中不太常见,及时行乐、纵情声色似乎才是属于魔都的主题。


为了进一步挖掘这些发生在京沪的故事,我们提取了相关歌词中的动词,进行词频统计,并最终选取具有叙事含义明显的词组进行词频对比。


让我们透过歌词的叙事分析,带你读一读漂泊京沪的音乐人的故事。



通过相对词频比较,我们发现“离开”与“留下”在北京相关歌曲的出现频率都远高于上海相关歌曲。


听着写北京的歌曲,你的眼前是挤在狭小的出租屋中的北漂青年男女,是背一身行囊压着、孑然逃离北京的背影。而当中,弥漫着不可即的梦想和游离的情感。


正如好妹妹乐队在《一个人的北京》中所唱道的,那些放弃了满天的繁星人们,纷至沓来,走进帝都夜晚的片片霓虹。他们喝醉、哭泣,成功、失意,或逃离、或老去,大多悄无声息。


当然,秦昊和张小厚再也不用背着吉他四处卖歌了,可还有其他无数个”好妹妹乐队“,你甚至没有听过他们的一首歌。


“离开”与“留下”的背后,是太多在北京悄然发生的选择。这样的叙事,却并没有在上海得到太多的体现。


让我再接着看另外两组对比。




在北京相关的歌曲中,“哭”这一动作出现的频率高于上海,而“笑”则远不如在上海相关歌曲中出现得频繁。


有意思的是,“爱”在北京歌词中也出现得更多,而上海歌词中的“恨”则远高于北京。


在“哭”、“笑”词频统计中,上海整体歌曲中及时行乐的文化氛围得到了印证。而对比“爱”、“恨”的词频统计,上海歌词文化中的情感认知又体现了深深的矛盾性。


你可以想象,一方面,上海音乐人们在外滩的灯红酒绿里纵情声色。而另一方面,梦醒过后的车水马龙又让他们为这座城市、和城市中的自己默默叹惋。


北京的安河桥北和上海的外滩十八号:地标分布中的“帝都”“魔都”双城记


“啊啊啊啊五环,你比四环多一环。啊啊啊啊五环 ,你比六环少一环。”


“我在人民广场吃着炸鸡,而此时此刻你在哪里,虽然或许你在声东击西,但疲倦已让我懒得怀疑。”


即使你从未在京沪生活过,这些地名对你来说应该也毫不陌生。


如果我们计算出这些文化地标的相对词频,并在一张地图中将它们标出,会得到怎样的结果呢?


带着这样的疑问,我们对爬取的354 首歌的歌词文本进行分词,提取合并地点类名词,并进行相关词频统计,最终保留相对词频高于2%的文化地标,为北京和上海分别绘制了两张歌词地图。



先来看看歌词文化地标在北京的分布。


我们可以发现,北京的文化地标在西城区相对比较集中,如天安门、店门、故宫等。这反映出老城区文化积淀对文化感知的影响。而近年来(2010年以后),通州、五环作为文化地标的兴起,也表现出城市外延的生长对文化感知的影响。



不同于北京地标的分散,上海歌曲中文化地标则更为集中主要集中在中静安、黄埔区域及周边。


对比京沪文化地标分布,我们发现,北京文化地标更多基于皇城建筑群落生成,而上海文化地标表现出更明显的依存于水系发育的地理分布特点。这展示出了两个城市独特的生长脉络。


此外,上海的文化地标更多为商业活动繁荣的地区,而北京文化地标中政治性则表现更为明显。这反映了两市文化氛围中存在着对政治和经济的不同侧重。


值得注意的是,北京的五环、上海的人民广场作为文化地标出现在歌词中,都同样是由于个别广为传唱的歌曲作品的流行(北京《五环之歌》、《感觉身体被掏空》,上海《我在人民广场吃炸鸡》)。这两处文化地标,较之其他,更能体现出一种风格活泼、内容生活化的平民文化,甚至可以说是年轻人文化对城市文化渗透。


与以天安门为代表的政治文化地标,以百花深处为代表的艺术文化地标,和以淮海路、三里屯为代表的消费文化地标不同,五环和人民广场在歌曲中各种体现出歌者和传唱者对自身生活问题的一种调侃。


“每天爱你多一点”的北京与“爱着爱着就淡了”的上海:歌词情感与时间变化趋势


京沪两地的城市发展都经历了多次大事记,人在城市的情感也随时间产生了不同的变化。


为了解人们在北京与上海的情感变化趋势,我们用BosonNLP情感值算法对每首歌进行了情感值打分,并得到了每首歌曲的平均情感值(0< 平均情感值<1,0.5为完全中立情感)。



通过统计我们发现,北京歌词的平均情感值保持稳定在0.6左右,整体偏中性偏正向的情感。


值得注意的是,平均情感值在2006-2010年组达到了最高水平。适值2008年北京奥运会期间,大量情感绝对正向的奥运宣传歌曲大量创作推出。


而在此之后的2011年-2015年,平均情感值有较为明显的下降,这体现了后奥运时代歌词创作内容出现的情感低沉。在奥运这种大规模“文化兴奋期”过后,人们感知到的文化随着兴奋的平复,经历了一段时间的低潮。


让我们再转向对上海的分析。



上海歌曲的平均情感值在15年之前保持在0.65左右,与北京近似;但是在2016年至今年代组,平均情感值明显下降,低至0.36左右,已达到负面情绪界限。


近两年部分地下乐队与乐手在歌词创作中对上海进行了疯狂的吐槽,或许能够解释情感值在今年的变化。当然这一组歌曲相对数量较少,也放大了这种影响。尽管如此,这依然能够在一定程度上表现出近年来音乐人对上海的感知转为消极的倾向。


京沪漂泊,音乐人讲不完的故事


至此,我们通过对京沪两地相关歌曲的文本分析,为这两座城市、和城市中的人们绘制出了一幅幅画像。


诚然,音乐人们在歌词中的情绪与故事为我们提供了丰富的城市文化感知素材。然而,歌曲作为市场化娱乐产品的一部分,也同时受到市场、营销、商业运作的限制,部分歌词抽象、含蓄的方式表达内容,也为我们的分析带来了很大的困难。


何勇在《钟鼓楼》中唱道:


我的家就在二环路的里边

这里的人们有着那么多的时间

他们正在说着谁家的三长两短

他们正在看着你掏出什么牌子的烟


通篇几乎没有显露情绪的关键词。然而,对比他之前痛快发泄的朋克音乐,你却能听出他重回钟鼓楼后,对往事如梦的感慨。


在《奋斗》中,佟大为说:“全中国,只有北京才能养得起那么多艺术家。” 而由北京南下,一路至上海。这里也有一群音乐人们诉说着他们与上海的故事,从过去一直唱到了今天。


在京沪的漂泊的音乐人,在这两座城市留下了太多的记忆。在与京沪相关的歌词里,也依旧藏了太多的故事和情绪值得我们去挖掘。


文 | 钱天培、魏子敏

----------------------------


文摘菌邀请了本文歌词爬取分析的技术主力,下周二(8月29日)晚8点半,为大家直播分享爬取心得,想要一起玩儿歌词数据的盆友可以添加文摘君微信(微信id:superbigdata备注:【歌词】,进群一起玩儿


*本文所有数据爬取与分析由北京城市象限科技有限公司完成(微信公众号ID:urbanxyz),并发表在论文《歌词中的城市文化感知:城市文化地标、叙事和情感》中。作者 | 张希煜、茅明睿、陈鹏、刘溦、王伊依、叶南启,特此感谢。


?戳下方二维码,和文摘菌一起玩音乐!


往期精彩文章


点击图片阅读

爱票子也爱妹子:300万字歌词分析看中国rapper到底在唱什么



关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接