当前位置 > 首页 > 数据分析人才库 > 好看的《后浪》评论千千万万,有趣的文本分析百里挑一【前方高能】

好看的《后浪》评论千千万万,有趣的文本分析百里挑一【前方高能】

来源:中国数据分析行业网 | 时间:2022-07-20 | 作者:数据委

鱼大数据 
5月3日17点,bilibili官方发布献给新一代的演讲《后浪》。国家一级演员何冰老师走上舞台,认可、赞美与寄语年轻一代。

《后浪》发布之后,在各大平台引发广泛讨论。以B站自身平台为例,《后浪》全站日排名、周排名、月排名均为第一,获得2363W播放和5.2W评论(截止本文发布之前)。
B站大本营中,后浪们都在评论什么?通过采集、分析B站上《后浪》的评论数据,我们发现了很多有趣的东西。
评论采集
数据来源https://www.bilibili.com/video/BV1FV411d7u7. bilibili官网《后浪》视频的评论,共30412条

. 全部评论者主页的信息,共30412条

. 何冰老师相关评论的追评,共565条

采集时间

2020/5/7 17点

评论分析
一. 评论用户画像1. 客户端分布2. 等级分布

3. 粉丝数分布

4. 会员分布

二. 评论文本分析

1. 评论的典型意见

2. 评论的高频词

三. 追评文本分析

1. 追评的典型意见

2. 追评的高频词

四. 评论时间分布

1. 评论时间分布脉冲图

2. 评论时间分布动态柱状图

分析结论
1. B站《后浪》的评论,多由其核心用户发出。2. B站《后浪》的评论基本上都是正向的,与其评论主体多为核心用户相关。3. 何冰老师的演技和台词备受好评,其作品《大宋提刑官》深入人心。

4. 一场现象级营销发酵的黄金时间是发布后的2-3天。

一. 评论用户画像
1. 客户端分布
60%左右的评论从「安卓客户端」发出。
2. 等级分布
LV2以上等级方可发表评论,因此等级统计从 LV2开始统计。
评论用户中,LV5占比最高(37%);LV4次之(28%);LV6因为门槛很高,占比最低(3%)。
3. 粉丝数分布
评论用户中,粉丝数1W-10W的204个,10-100W的71个,100W以上的有13个。
4. 会员分布
21.8%的评论用户为年度大会员,13.68%的评论用户为大会员。
结论:
从LV6/LV5/LV4高等级占比近70%;粉丝数1W以上的有288个;会员占比近35%的数据来看,B站《后浪》的评论,多由其核心用户发出。
二. 评论文本分析
1. 评论的典型意见
使用聚类算法,从30412条评论文本中提取出100条典型意见,以词云图形式展示:
典型意见Top 20 可分为4类:

7条直接与《后浪》文案相关:奔涌吧后浪;心里有火眼里有光;热爱可抵岁月漫长;赞美和鼓励;君子美美与共和而不同;有幸遇见这样的时代;我们有了更多的选择。

4条与品牌相关:哔哩哔哩干杯;bilibili,乾杯~;小破站不错;哔哩哔哩是年轻人。

7条为观后感:这才是真正的中国青年;少年强则国强;五四青年节快乐;不错不错的演讲;大家一起加油;加油吧少年;看哭了很。

2条与演讲人相关:何冰老师不错;大宋提刑官。

2. 评论的高频词
从30412条评论文本中提取中前100个高频词,以词云图形式展示:
高频词Top 20 为:我们、后浪、加油、干杯、年轻人、你们、自己、青年、中国、乾杯、生活、和而不同、现在、因为、不是、但是、他们、真的、时代、就是。在做词云图的时候,筛掉了一些在此语境下无意义的词(我们、你们等)。
3. 评论的成语大赛
《后浪》的文案亲切,昂扬,同时体现出深厚的中华文化沉淀。
向上滑动阅览
《后浪》文案by 南方来的北先生那些口口声声,

一代不如一代的人,应该看着你们;

像我一样,我看着你们,满怀羡慕。

人类积攒了几千年的财富,

所有的知识、见识、智慧和艺术,

像是专门为你们准备的礼物;

科技繁荣、文化繁茂、城市繁华,

现代文明的成果被层层打开,可以尽情地享用;

自由学习一门语言、学习一门手艺、欣赏一部电影、去遥远的地方旅行。

很多人,从小你们就在自由探索自己的兴趣;

很多人在童年就进入了不惑之年;

不惑于自己喜欢什么,不喜欢什么。

人与人之间的壁垒被打破,

你们只凭相同的爱好,

就能结交千万个值得干杯的朋友,

你们拥有了,我们曾经梦寐以求的权利——选择的权利

你所热爱的就是你的生活,你们有幸遇见这样的时代;

但是时代更有幸,遇见这样的你们。

我看着你们,满怀敬意。

向你们的专业态度致敬,

你们正在把传统的变成现代的,把经典的变成流行的;

把学术的变成大众的,把民族变成世界的;

你们把自己的热爱变成了一个和成千上万的人分享快乐的事业,

向你们的自信致敬。

弱小的人,才习惯嘲讽和否定;

内心强大的人,从不吝啬赞美和鼓励。

向你们的大气致敬,

小人同而不和,君子美美与共,和而不同。

更年轻的身体,更容得下多元的文化审美和价值观。

有一天我终于发现,

不只是我们在如何教你们生活,

你们也在启发我们,怎样去更好的生活。

那些抱怨一代不如一代的人,应该看看你们;

就像我一样,我看着你们满怀感激;

因为你们这个世界会更喜欢中国,

因为一个国家好看的风景,

就是这个国家的年轻人。

因为你们,

这世上的小说、音乐、电影所表现的青春

就不再是忧伤迷茫,而是善良、勇敢、无私、无所畏惧。

是心里有火,眼里有光。

不用活成我们想象中的样子,

我们这一代人的想象力不足以想象你们的未来;

如果你们依然需要我们的祝福,

那么,

奔涌吧,后浪

我们在同一条奔涌的河流。

在此文化氛围中,后浪们纷纷效仿,在评论区展开一波成语大赛,以表心中豪情。其中受欢迎的成语Top 20是:和而不同、无所畏惧、不惑之年、热血沸腾、热泪盈眶、一代不如一代(结合上下文看,并非负面评论)、长江后浪推前浪、忧国忧民、来日方长、心潮澎湃、风华正茂、勇往直前、脚踏实地、朝气蓬勃、河出伏流、星星之火、怨天尤人、不好意思、后浪推前浪、一往无前。
一代不如一代、不好意思居然是成语!河出伏流 这个成语我居然没有听说过!
流下了没有文化的眼泪.gif
he
chu
fu
liu
释义:比喻潜在力量爆发,其势猛不可挡。出自《淮南子·坠形训》。
结论:
在B站大本营,对《后浪》的评论基本上都是正向的,大家认同《后浪》传递出的价值观,将自我带入视频中「拥有更多选择」、「你热爱的就是生活」、「善良、勇敢、无私、无所畏惧」的年轻一代,引发「加油」、「热血沸腾」、「热泪盈眶」等积极情绪。
原因:
结合第一部分「评论用户画像」的结论:评论多由其核心用户发出,代表核心用户的声音。他们本身就对B站有强烈的认同感和归属感。在此基础上,《后浪》这种主旋律为「认可、赞美与寄语年轻一代」的内容,评论基本上都是正向也很好理解。从品牌营销和固粉层面讲,可以说是非常成功,非常有排面儿了。
稍微发散一下,与B站大本营的全员好评不同,知乎/微博等其他平台上则出现了不少质疑之声。因为时间原因,没有采集和分析知乎/微博相关数据,稍有遗憾。有兴趣的小伙伴可以一试,结果应该会很有意思。
三. 追评文本分析
作为演讲者的何冰老师,评论区收获一条高赞安利。以下将分析此条评论下的追评,康康大家对何冰老师的印象。
表个白先:演讲者选的也太太太太太太太合适了,在娓娓道来的节奏里,我迷醉了,你呢?
1. 追评的典型意见
使用聚类算法, 从565条追评文本中提取出100条典型意见,以词云图形式展示:
典型意见Top 20,几乎都是围绕何冰老师的作品、角色、演技和台词展开,真.实力演员。
2. 追评的高频词
从565条追评文本中提取中前100个高频词,以词云图形式展示:
高频词Top 20 为:老师、提刑官、何冰、大宋、傻柱、真的、喜欢、四合院、鹿子霖、十二、眼熟、宋、宋慈、情满、好看、公民、提刑、笑、演、台词、宋提刑。
结论:
何冰老师的演技和台词备受好评,演绎的经典作品和角色给后浪们留下深刻印象。电视剧《大宋提刑官》的宋慈
深入人心,成为热门C位。《情满四合院》的傻柱也很受欢迎。

  左:《大宋提刑官》的宋慈

右:《情满四合院》的傻柱

四. 评论时间分布
1. 评论时间分布脉冲图
《后浪》于5月3日17点发布,从大趋势看,发布当日和次日评论很多,第3日后趋于平缓。
2. 评论时间分布动态柱状图
从具体数据看,发布后7小时内为评论高峰(评论数稳定在1000-1400),到24点短暂下降。
次日10点-13点持续发力,超过发布当日,于13点达到顶峰(评论数1563),随后下降。18时-24时再次出现一个小高峰(评论数600-1000)。
第3日12点再次出现一个小小高峰(评论数300左右),随后趋于平缓,热度逐渐消失。
结论:
参考B站评论的时间分布来看,一场现象级营销热度最多持续2-3天。品牌在安排营销活动时,需抓住这2-3天的黄金时间。当然,仅看B站数据比较单薄。如果有知乎/微博等其他平台数据支持更好。
本文意在提供数据采集、分析的思路和方法,从数据维度发现一些有意思的事情。但因时间有限,策划较简单,数据较片面,可能造成分析结论有失偏颇。如有不足,敬请见谅,同时欢迎大家在评论区交流补充。
资源下载
全部数据+采集规则+文本分析结果+可视化图表,扫描以下二维码,免费下载:数据采集

使用「八爪鱼」完成数据采集。「八爪鱼」是通用的网页数据采集平台,连续5年蝉联互联网数据采集榜单第一名。通过「八爪鱼」,简单几步即可配置出一个采集规则,轻松采集数据。

文本分析

使用公司人工智能团队NLP算法专家贡献的无监督算法,本身多用于电商评论的观点提取,情感正负向分析等。本次借来分析《后浪》评论文本,感谢支持。

可视化

词云图:Python

动态柱状图:Play Axis视觉对象(PowerBI)

脉冲图:Pulse Chart视觉对象(PowerBI)

评论用户画像图表:PowerBI基础视觉对象

策划:半仙
数据采集:Aisling  Jack.Y
文本分析:Yeee  Yuhui
可视化:Yuhui Jack.Y
文章:Aisling