本人在学习优达的数据工程师课程期间的练习和项目。
做音乐服务的某初创企业,想知道用户都喜欢听哪些歌曲,哪位歌手的歌曲最受欢迎。用户的歌曲信息和听歌日志以JSON格式存放在服务器上。他们需要将数据以结构化的方式存储到数据库,便于日后的查询与分析。于是我用Python解析这些JSON日志,并以星型模式存放到PostgreSQL。由于数据量不是非常大,直接用Pandas读取,并进行数据清洗和转换。
主要技术点:Python, Postgres, Pandas, JSON。
本人在学习优达的数据工程师课程期间的练习和项目。
做音乐服务的某初创企业,想知道用户都喜欢听哪些歌曲,哪位歌手的歌曲最受欢迎。用户的歌曲信息和听歌日志以JSON格式存放在服务器上。他们需要将数据以结构化的方式存储到数据库,便于日后的查询与分析。于是我用Python解析这些JSON日志,并以星型模式存放到PostgreSQL。由于数据量不是非常大,直接用Pandas读取,并进行数据清洗和转换。
主要技术点:Python, Postgres, Pandas, JSON。