这里是普通文章模块栏目内容页
四万字歌词分析:那些年,我们一起追的五月天到底在唱什么?

数据分析/五月天

数据文摘出品

作者:蒋宝尚、曹培信

你见过自带荧光棒、中途大合唱、放完不离场的电影观众么?

如果你去电影院看了《五月天人生无限公司》,那么,你一定明白文摘菌在说什么。

如果你还没有看过,文摘菌这里弱剧透一下,电影的情节是,呃——5位平均年龄超过四十岁的中年男人,靠唱歌打败了怪兽。

这样的狗血桥段,你一般会打几分?然而就靠着这样的剧情,华丽的演唱会真实画面也让五迷们把豆瓣的评分刷到了8.7!五星的超过一半,同时还有八千多条短评和两百多条影评。(职业病,习惯性码数据)

文摘菌看完之后也是果断反手就是一个五星,好吧,摊牌了,文摘菌也是铁杆五迷!

四万字歌词分析:那些年,我们一起追的五月天到底在唱什么?

从1999年发布第一张创作专辑,到2019年《五月天人生无限公司》收获了大批眼泪尖叫,这五位大男孩不仅创造了华人摇滚乐团的奇迹,也成为了无数人心目中的“青春”。

五月天也从此成为了一种文化的代名词,不管是歌词还是曲风,或者每一位乐队成员,都有着自己浓浓的特色。

在五月天最新电影发布的这个契机,文摘菌想用数据试着去分析一下这个不老的乐队,看看这些年陪伴我们的这五月天,到底在唱些什么?

数据介绍

首先,先来看看我们的数据。

四万字歌词分析:那些年,我们一起追的五月天到底在唱什么?

从Github上,我们发现了林永佳先生在2017年做的一个五月天歌词分析项目,他爬取了截止到2017年3月五月天所有的歌的歌词,并且做了分词和词频的词云。文摘菌在和他沟通后,在他的基础上更新了数据集,一共107首歌。

当然,林永佳也用Python对歌词做了初步的统计,包括词频、词云等,文摘菌在此基础上进一步处理了数据,并做了数据可视化以及情感分析。

此次数据分析经过了严谨的数据清洗,同一个词汇如果在一首歌中出现多次,词频统计只计入一次。另外,删除了“的”、“我”等停用词。

数据集链接:https://github.com/YogaLin/mayday_lyric_analyze

另外我们还从维基百科爬取了五月天演唱会的信息。

https://zh.wikipedia.org/wiki/%E4%BA%94%E6%9C%88%E5%A4%A9%E6%BC%94%E5%94%B1%E6%9C%83%E5%88%97%E8%A1%A8#%E4%BA%BA%E7%94%9F%E7%84%A1%E9%99%90%E5%85%AC%E5%8F%B8%E4%B8%96%E7%95%8C%E5%B7%A1%E8%BF%B4%E6%BC%94%E5%94%B1%E6%9C%83_MAYDAY_LIFE_TOUR%EF%BC%882017%E5%B9%B4-2019%E5%B9%B4%EF%BC%89(122%E5%A0%B4)

陪我们的这些年,五月天都在唱什么?

数据分析/五月天

作为红遍大江南北的乐队,五月天的歌曲,就像一首首写在我们青春里最动人的诗,不论是梦想还是爱情,总有一首能表达出你内心的情感。

从“你的世界,就让你拥有,不打扰,是我的温柔。”到“我和我最后的倔强,握紧双手绝对不放。”五月天的歌词中总藏着“爱”,可以爱温柔也可以爱倔强。总是感叹人生都太短暂,五月天的歌词人生出现了接近30次,也就是说,107首歌中有30首歌提到了人生。地老天荒,人生最好时光,无论朋友还是亲人都应该用心对待。

面对困难,正如歌中所唱“等一天/黑暗过去/苦尽甘来 ”。

所以,通过对歌词的整体分析,以及世界、爱、人生、笑、心等作为最高频出现在歌词中的情况,我们可以给五月天的音乐定一个风格:积极向上、乐观豁达、美好人生。

“雅”“俗”共赏

数据分析/五月天

从意象方面来看,五月天歌曲选取的意象可以概括为自然类意象和人文类意象两大类,歌词“雅”的方面主要由自然类意象体现,“俗”的方面主要由人文类意象体现,其间也有例外情况。五月天歌词中常见的自然意象主要有:天空、风雨、云、彩虹、星星、太阳、夜等。

#p#分页标题#e#

这些词也是我国古典诗歌中出现频率较高的意象,其中不少意象本身就非常有意境,比如风:“你是一种感觉/写在夏夜晚风里面”(《疯狂世界》),“晚风吻尽/荷花叶”(《拥抱》)。这两处写到的都是“晚风”,除了透露出风这一意象本身带有的不定、空灵的意境外。

又如星星:天上的星星,笑地上的人(《知足》);多幸运有你一起看星星在争宠(《私奔到月球》) 。这两处的星星所表达的都是同了一意境。

另外,天空、云、彩虹、夜也是歌曲中出现了较多的次数,包含天空的歌曲数目为21、风雨为21、云为4、彩虹为5、夜为9、星星为8。

数据分析/五月天

常见的人文类意象有:眼泪,笑,眼睛,孩子,梦,梦想、酒。在人文意象的运用下偏重指对世俗生活凡尘琐事的关注,这类词往往在“俗”的表象下渗透出对现实的反思有时甚至是讽刺。

例如:“咸鱼就算翻身/还是只咸鱼”。在这首歌里词人并没有着力营造诗意的美感,遣词造句用的都是直白的口语,揭露着跟歌词一样直白的道理:你笑得像个孩子\每个平凡小事\变成永恒故事\世界纷纷扰扰喧喧闹闹\什么是真实\为你跌跌撞撞傻傻笑笑\买一杯果汁,直白的用词赋予了歌曲更直接的感染力。

类似的还有:孤单的大床 谁贴近我 脸庞\有没有人 也笑忆过往\跌跌撞撞 当时的蠢样\最平凡日子 最卑微梦想\何时才发现 最值得珍藏。

五月天歌词情绪分析:有正面也有负面

接下来,文摘菌开始了对歌名、歌词的情绪分析,通过对这些歌词的自然语言处理,我知道了不同歌手们吟唱的到底是开心还是不开心的事情。

情绪分析调用Bosonnlp中文语义分析接口,新手注册每天有500次免费的分析机会。分析结果有两个0和1之间的值,一个代表正面情绪值,另一个代表负面情绪值。两个值加起来等于1。文摘菌把得到的正面情绪得分减掉0.5。这样如果得分大于零就是正面情绪,如果小于零就是负面情绪。

四万字歌词分析:那些年,我们一起追的五月天到底在唱什么?

先对歌名进行分析,如上所示,正面情绪的歌名占大多数,其中《不见不散》得分最低为0.016正面度,而《最好的一天》正面度最高为0.998。

数据分析/五月天

接下来是对歌词内容进行情绪分析,发现歌词和歌名的评分有出入,有些歌名是正面,但是歌词的内容却是负面。如:《孙悟空》《夜访吸血鬼》等,这类作品所描写的对象虽然是人们熟悉的人物,但是角度却新颖。拿《孙悟空》来说,这个作品并没有从我们对这两个人物固有的理解角度出发,而是改变切入点写出了英雄人物和平常人一样在现实面前的无力和无奈,就算是英雄也有无能为力,就算是神仙也有难以改变的现实。

演唱会多香港,家家贡献最多助阵

今年5月12日在香港迪士尼,五月天对演唱会的观众承诺,要为大家唱到80岁。从1999年到2019年,二十年的时间里,五月天的足迹遍布世界四大洲,七十多个城市。文摘菌爬取了五月天所有的演唱会数据,一共413场次,快来看看都有哪些好玩到结果吧!

数据分析/五月天

从地理位置上来看,五月天在香港开演唱会的场次最多,其次就是台北,但是近几年在内地开演唱会也是越来越多了,2016年8月26、27、28日的世界巡回演唱会北京站在鸟巢连开3场,30万张门票完售,打破歌手在该场地开场的场次及观赏人数纪录。

另外,我们还统计了演唱会上助阵的嘉宾。

数据分析/五月天

经统计,参加过五月天演唱会的歌手和乐队嘉宾数量高达150!我们在这里给大家列出了前八强。其中参加次数最多的是家家(台湾女歌手),总计参加过五月天42场演唱会,文摘菌真是实名羡慕她!

“多听五月天,必成好青年”

#p#分页标题#e#

75年出生的陈信宏其实也已经是一个年过四十的中年了,但总有一种错觉,他们都还只是一群20来岁在舞台上尽情挥洒的少年!一路追他们的人,现在也都步入中年了,各自奋斗在自己的工作岗位上,也许还遇到了事业的瓶颈,但是就像《倔强》里唱的:“逆风的方向,更适合飞翔”。听五月天的人,不会轻易认输!

最后,我们依然以一个词云结束这篇文章。

四万字歌词分析:那些年,我们一起追的五月天到底在唱什么?

【本文是51CTO专栏机构大数据文摘的原创文章,微信公众号“大数据文摘( id: BigDataDigest)”】

大数据文摘二维码

收藏
0
有帮助
0
没帮助
0