本项目旨在通过收集整理A-SOUL直播、短视频、动态等相关数据来为au提供量化的数据,并通过可视化工具制作成图表和视频,让粉丝能够更全面地了解A-SOUL。
除了直接呈现客观数据外,使用这些数据还可以管中窥豹,尝试推测A-SOUL成员的工作情况。例如:只看直播,大多时候每位成员都是五个小时左右;然而假如某位成员本周表演了a支歌曲b支舞蹈,就可以通过假定每首歌曲所需的平均练习时间x和每支舞蹈的平均练习时间y,进而估算出在直播以外的训练时间a*x+b*y。
本项目力求保证数据准确、客观。准确,即记录的数据和客观情况相符;客观,即只考虑客观存在的数据和通过人为总结的客观数据,如某位成员在某周的总直播时长、表演内容和长度,不包括成员/企划/粉丝的任何说法。后者将被作为补充数据记录。
在取得客观数据的基础上通过提出主观的问题进行探索性数据分析(EDA),以周、月、年为单位进行区段总结等,将数据和数据能够揭示的内容呈现出来。
由于A-SOUL直播至今已有近两年,对数据的收集和整理不可一蹴而就,因此本项目的流程是循环式的,即:数据收集→数据分析与可视化→数据发布三个阶段进行循环。而不同阶段的分工协作模式将由项目组工作人员数量决定。
目前暂定使用csv文件存储数据,便于使用各种数据分析工具读取,如Python, R, Julia, Matlib。
位于analysis folder内
目前可用的数据有三个csv文件:
- /calendar/calendar_raw.csv统计了出道至2023年3月20日左右的直播标题与时间
- /calendar/calendar_minimal_members_to510.csv统计了截止至2022年5月10日的直播标题、参与成员与时间
- /stream/stream_to510.csv统计了截止至2022年5月10日的直播标题、时间、参与成员、推流起始时间、推流解释时间、营收
除此以外,A-SOUL_Official的全部动态信息存储在/dynamics/result.json内,也可以直接使用dynamics_display.html查看