2.1功能分析
因为需要设计成实时系统,而目前所拥有的服务器资源只有两台2核4G的,资源有限,无法进行大规模的数据挖掘,所以选取部分视频数据信息进行数据挖掘和数据分析,目前采用的方案是使用热门视频和排行榜视频的数据,该部分的视频数据是经过B站筛选过滤的,具有采集意义。故数据挖掘部分选取B站热门和排行榜的数据。
为了区分用户群体并针对不同用户展示不同的页面内容,需要针对用户进行权限分离,区别用户身份。目前需要进行快速上线,多租户的数据模型暂时不考虑,目前只需要搭建简单用户权限模型。若后续用户数量庞大之后,可以在进行构建多租户模型
为了实现数据精准获取,以及趋势分析,需要针对存储好相关数据,以表格和图表的形式进行数据可视化展示,其中需要进行展示的数据内容主要是:“视频数据”,“创作者数据”,“热词数据”,“标签数据”,“视频增长数据”,“视频时长与播放量关系”。
为了提高开发者的效率,针对系统的构建和运行,需要搭建自动化部署平台,实现自动化运维,提高开发运维效率,实现快速构建,快速上线。
对于系统内部的操作和流程的流转,需要将这些记录以日志的形式保存下来,方便开发者针对后续问题的排查并提高了运维效率
为了后续网站用户的发展并了解系统后续发展潜力,系统内部也需要进行数据的统计和展示,目前以系统访问量进行统计和分析,了解系统的流量大小,以及未来投入资源的情况
为了快速的检索数据,对于展示出的视频数据需要进行搜索查询,需要针对“视频标题”“视频标签”“视频id”“视频描述”“视频创作者”“视频创作者id”“视频播放量”内容进行搜索查询,而且需要支持模糊搜索。
2.2系统分析
结合目前业务的需求,在系统层面上实现这些需求,需要合理的对系统进行设计和分析。目前拥有资源有限,为了实现快速上线必定会牺牲一定的质量,所以需要考虑未来系统架构的鲁棒性,可拓展性,以及稳定性,尽可能的满足设计模式中的六大基本原则:里氏替换原则、、单一原则、接口隔离原则、依赖倒置原则、开闭原则、迪米特原则、。并且要提升整体开发效率和质量,需要使用Devops自动化部署和阿里巴巴代码规约扫描插件。
对于以上需求,需要构建相关模型其中包括:视频数据模型、内容素材模型、视频创作者模型、日志模型、用户模型、数据展示模型以及系统数据模型