学习视频弹幕互动分析

学习嬲弹m互动斤学习视频数据源选择弹幕视频利用Python获取弹幕文本数据的来源,关系着弹幕的质量,乃至会影响最终的研究结果。本文结合弹幕 视频网站上学习视频的特点选择网络公开课视频作为弹幕文本数据的

学习嬲弹互动斤 m 学习视频数据源选择 弹幕视频利用获取弹幕文本数据的来源,关系着弹幕的质量,乃至会影响最终的研究结果。本文结合弹幕视频网站上学习视频的 Python 特点选择网络公开课视频作为弹幕文本数据的来源。 从视频网站公开课频道播放量高的视频中,选取不同类型的学习视频作为弹幕数据的来源,分别为学科类公开课视频、声乐学习类公开 X 课视频、语言学习类公开课视频、软件学习类公开课视频、考证考试类公开课视频、演讲类公开课视频、编程语言学习类公开课视频等,共个 16 视频公开课。 弹幕数据收集及预处理 爬虫程序原理 语言简单易用,现成的爬虫框架和工具包降低了使用门槛,具体使用时配合正则表达式的运用,使得数据抓取工作变得简便。 Python 数据预处理 1 .数据的选取 通过爬虫获得的弹幕数据中,包含与弹幕相关的多个字段,最终爬取到的数据有个弹幕数据类型。本文选取了“弹幕文 Python14 本”“弹幕发送时间”“弹幕“分这几类弹幕数据信息进行后续的分析研究。 ID”p” 2 .对获得的弹幕文本数据进行分词处理 分词是将连续的中文字符串序列切分成若干个独立的词的过程。本文采用的分词方法是中的分词。 Pythonjieba 分词提供了三种常用的分词模式,本文为了避免重复,方便进行统计分析,使用精确分词模式。 jieba 弹幕数据的统计分析 基于代码对获取的不同类型弹幕数据进行统计处理,分别生成对用户性别的统计绘图工作、弹幕数量时间段的统计和折线图的绘 Python 图工作、弹幕文本分词后词频统计并制作词云图、弹幕文本分词后的情感评分分析并绘制情感评分饼状图等图。 弹幕交互用户维度 1 .用户性别统计分析 在中编写用于性别统计分析的程序。在获取的数据中共有用户名,其中在公布性别的名用户中,男性用户 Python86587113783296 为人,占全部性别用户的占全部公布性别用户的女性用户为人,占全部性别用户的占全部公 196650822.71%,51.98%181678820.98%, ; 布性别用户的。 48.02% 2 .弹幕发送时间段统计分析 公开课视频用户发表弹幕的时间可以展现出学习者观看学习视频公开课活跃的时间。本部分对时间进行分段,统计发送的弹幕数量,分 析视频公开课中学习者的弹幕互动活跃时间。 对整体数据进行分析 (1) 对公开课视频的用户发表弹幕的时间进行分段,统计每小时内的弹幕数量,在中具体实现并生成文件。为了方便观察, Pythonexcel 进一步分析研究,可以借助生成折^图。 pyecharts

腾讯文库学习视频弹幕互动分析