/analytics_unstructured_data

Ingestion and analytics scripts for semistructured and unstructured data in HDFS

Primary LanguagePython

Project Description

Semistructured Data

Berisi folder contoh semistructured data (json dan xml) dan Python scripts untuk ingestion ke HDFS lalu dibuat external tables.

Unstructured Data

Berisi folder contoh unstructured data (image dan video) dan Python scripts untuk ingestino ke HDFS dan analytics.

Analytics Process

Untuk proses analisis terhadap dua analisis

Metadata Ingestion

Ingest metadata (seperti nama file, ukuran file, dll.) pada suatu unstructured data ke HDFS lalu dibuat external table.