摘要
随着5G网络技术的提升和视频 App 针对移动端的优化与升级,用户沉浸手机的时间大幅度提升,娱乐类视频和短视频App已经成为用户消磨时间和多感官满足的主要选择,而哔哩哔哩网站(以下简称B站)以高质量视频内容和独有的观看体验成为了大多数年轻人的首要选择。
B站公司成立于2009年,即哔哩哔哩弹幕网,公司早期成立主要是从事漫画,游戏,动漫,鬼畜等内容的创作和分享,具有免费无广告的特征,相比于同类视频网站腾讯视频、爱奇艺、优酷等,拥有良好的用户体验和氛围,随着企业规模不断增大,逐步进行转型,扩大了新的视频模块,围绕用户和创作者构建出一个不断产出高质量内容原创性作品的产业生态。随着B站涉及的领域也在不断增多,不断积攒大量人气,目前已涵盖了超过8000多个个兴趣层及文化社区,其中粉丝群体以年轻用户为主。在90后、00后甚至10后群体中,最具影响力的当属“弹幕”这一互动性极强的视频功能特征。良好的“弹幕”氛围不断的给视频增光添彩,而这相当于给视频进行二次创作,不断为视频引入流量,这是其它视频社区中根本无法获取的观看体验,两者互相依赖,形成共享共创共赢的关系
为了提升竞争力,B站采取了各种手段提高平台吸引力,增强受众尤其是年轻群体的信息渠道粘性。例如,举办“新星计划”扶持大量新生视频创作者、新增新媒体创新技术应用,提高用户观看体验、举办“百大UP主评选活动”刺激新人创作者不断推陈出新,积极创作。这些手段的核心都是满足不断用户的体验和需求,正如B站推广语所说“你感兴趣的视频都在B站”。
自2010年以来,中国的网络视频企业如乐视网、优酷网和土豆网相继在中国或美国上市。网络视频行业的行业竞争加剧,自由竞争的视频行业市场模式逐步演变为寡头竞争模式。由于内容的同质化竞争,行业巨头开始通过不断投资版权,争抢影视资源和独家直播权,以吸引更多网络用户,以谋求独特的竞争优势。部分网络视频企业,逐渐实现产业的多元化,打造完整的企业生态链,进军影视、音乐、体育、智能终端、金额、汽车等领域,以谋求更为强大的生命力。
因此哔哩哔哩公司于2018年在美国纳斯达克上市,并于2021年在香港二次上市。在近十年的发展中一直保持稳点的增长,在B站2021年二季度财报中,公司营收达44.9亿元,特别是业务的增长速率远超比同类视频网站,其增长的内在动力值得探究。
对于B站每天产生的海量的视频数据,如何使用合理的方案进行数据挖掘和处理显得尤为关键。由于海量的信息过载,每日能产生PT级别的数据,单机设备的挖掘和处理显得明显的力不从心。本文将选取部分关键的视频数据进行挖掘和分析,并搭建相关的分析平台系统用于展示。该系统旨在将B站视频和博主的诗句以可视化图表的形式展现出来,实现不同纬度的在线数据分析和检测,通过充分挖掘、分析和利用视频数据,对博主和移动平台具有重要意义
研究目的和意义
随着移动互联网的兴起,依靠手机端的视频App的高速增长,在诸多视频平台中,B站是依靠弹幕和ACG文化起家的视频社区,近几年,B站发展愈发壮大,它已经成为移动互联网不可忽略的流量池,有流量的地方就有资金。为了更好的了解B站内容创作和帮助创作解决运营创作中,热点难捕捉,用户群体不明确,运营情况不清晰的问题。目前需要搭建一个B站视频信息分析系统,来帮助用户和创作者来更好的进行运营和创作,获取精确目标用户群体,捕捉潜在用户和高质量内容创作素材,提升自身的业务效率。
通过挖掘B站的视频、创作者的数据,构建大数据视频模型,为创作者和自媒体在各个领域了解B站内容发展的趋势,以及用户群体的偏好提供了一个数据分析平台。可以通过视频排行榜,涨粉排行榜,热词图等方式,了解视频价值信息,创作者综合实力,个人影响力,账户健康程度,互动趋势。建立小圈层自营业的信息平台,然后通过视频播放量、点赞投币收藏数等渠道进行流量变现,用较少的资本通过视频创意实现了较大商业收益。借助B站数据分析平台,可以节省大量的时间和人力成本,对于视频创作者和广告投放商来说,还可以使内容根加精确和高质量
B站视频数据分析系统,是为B站创作者、自媒体、广告商和用户分析和决策的一个系统,它囊括了B站部分的视频数据,部分创作者数据及部分内容素材数据。通过设计一款B站视频数据分析系统,旨在将B站视频数据及素材内容以可视化的表格和图表的形式展现出来,实现不同纬度的在线实时检测和数据分析,对于利用视频数据和内容素材的创作者、广告主和内容平台具有重要意义
内容介绍
本文主要研究基于云函数和Springboot的B站数据分析系统的设计与实现。数据分析系统是做B站视频数据的挖掘,数据分析和数据存储。并把视频数据和热点素材以多维度的方式展示出来。
从业务角度出发,系统内容主要是分成3个部分:数据挖掘部分,数据分析部分和系统管理部分。需求分析阶段,需要使用流程图,用例图去描述每一个需求的内容和功能点,并设计出具体的业务架构模型,做出具体的需求分析。系统设计阶段,针对这些需求,设计出整体系统的技术架构以及在针对业务架构模型设计出数据模型,并用ER图表示出这些数据模型的关系。然后要对系统进行功能性设计,对前后端交互接口进行设计。功能实现上,针对这些需求,使用对应的技术栈进行功能性的实现,并使用流程图、时序图、类图等说明实现过程的步骤和流程。功能测试部分,先对系统进行功能性和非功能性测试,在针对之前设计的每一个功能点进行单元测试和回归性测试,保证实现功能满足业务需求。结论和分析部分,针对挖掘的数据进行数据分析,得出相关结论。最后针对目前系统和业务的局限性提出可以改进和提升的点,并做出对应的规划
本文组织结构
文章主要分为七个章节,每个章节的内容如下:
第一章 绪论:主要是将整个题目的背景进行大致的介绍,并说明论文研究的目的以及相关意义,此外对论文的内容进行概括说明。
第二章 需求分析:主要是针对论题进行系统化的分析,解析其中的诉求和需求,针对性的设计相关的功能和采用的技术栈,尽可能的符合论题要求,拒绝浮想联翩的设想,要落地可实现的功能。
第三章 系统设计:针对需求进行系统的话的设计,从系统架构、数据模型、业务模型和相关接口上进行设计建模。并对每一个模型架构进行详细系统的说明,明确系统所要满足的达到的要求。
第四章 功能实现:根据需求分析和系统设计,主要分为这些功能点:数据挖掘、权限控制、数据可视化展示、日志异步化存储、自动化部署、访问统计和搜索。针对这些功能点进行详细的设计和实现,并说明每一个功能实现的过程和内容。
第五章 功能测试:基于以上功能的实现,对系统进行系统化的测试,看看在功能上和性能上是否符合需求分析的要求
第六章 结论与分析:根据完成的系统,提出目前系统的不足以及待完善的点,针对这些并对系统未来的设计和发展提出相关构想,
第七章 致谢:最后对笔者这大学四年进行简要概括和感谢
下图为文章内容概括