shubhammirajkar

Aspiring Data Engineer

Nipani,Karnataka

Pinned Repositories

banks_webscraping_etl_project
Python script for ETL operations on the world's largest banks' data, utilizing web scraping to extract information from a Wikipedia page, performing data transformations, and storing results in CSV and SQLite.
Language:Python0 1 00
etl_using_spark
Language:Jupyter Notebook0 1 00
machine_learning__practice_repo
Language:Jupyter Notebook0 1 00
PySpark-Practice-Projects
PySpark Practice Projects
Language:Jupyter Notebook0 1 00
sales-outlet-etl-pipeline
An end-to-end ETL pipeline that extracts data from an Azure SQL Server database, transforms the data using Databricks, and loads the transformed dataset into Azure Data Lake Storage (ADLS).
Language:Jupyter Notebook0 1 00
superstore_azure_de_project
Copying data from Amazon S3 bucket to Azure Blob container by using Azure Data Factory pipeline. This Data is mounted to Databricks and further analysis is done using Spark SQL.
Language:Python0 1 00
tokyo_olympics_de_project
Explore the Tokyo Olympics data journey! We ingested a GitHub CSV into Azure via Data Factory, stored it in Data Lake Storage Gen2, performed transformations in Databricks, conducted advanced analytics in Azure Synapse, and visualized insights in Synapse or Power BI.
Language:Jupyter Notebook3 1 02
uber_etl_data_engineering_project
An ETL Pipeline built over GCP and orchestrated by Mage, which involves Extracting Data from GCS Bucket, building Dimensional Model, loading the Data into BigQuery and a Looker Dashboard for further analysis.
Language:Jupyter Notebook2 1 00

shubhammirajkar's Repositories

shubhammirajkar/tokyo_olympics_de_project
Explore the Tokyo Olympics data journey! We ingested a GitHub CSV into Azure via Data Factory, stored it in Data Lake Storage Gen2, performed transformations in Databricks, conducted advanced analytics in Azure Synapse, and visualized insights in Synapse or Power BI.
Language:Jupyter Notebook3 1 02
shubhammirajkar/uber_etl_data_engineering_project
An ETL Pipeline built over GCP and orchestrated by Mage, which involves Extracting Data from GCS Bucket, building Dimensional Model, loading the Data into BigQuery and a Looker Dashboard for further analysis.
Language:Jupyter Notebook2 1 00
shubhammirajkar/banks_webscraping_etl_project
Python script for ETL operations on the world's largest banks' data, utilizing web scraping to extract information from a Wikipedia page, performing data transformations, and storing results in CSV and SQLite.
Language:Python0 1 00
shubhammirajkar/etl_using_spark
Language:Jupyter Notebook0 1 00
shubhammirajkar/machine_learning__practice_repo
Language:Jupyter Notebook0 1 00
shubhammirajkar/PySpark-Practice-Projects
PySpark Practice Projects
Language:Jupyter Notebook0 1 00
shubhammirajkar/sales-outlet-etl-pipeline
An end-to-end ETL pipeline that extracts data from an Azure SQL Server database, transforms the data using Databricks, and loads the transformed dataset into Azure Data Lake Storage (ADLS).
Language:Jupyter Notebook0 1 00
shubhammirajkar/superstore_azure_de_project
Copying data from Amazon S3 bucket to Azure Blob container by using Azure Data Factory pipeline. This Data is mounted to Databricks and further analysis is done using Spark SQL.
Language:Python0 1 00

shubhammirajkar

Pinned Repositories

banks_webscraping_etl_project

etl_using_spark

machine_learning__practice_repo

PySpark-Practice-Projects

sales-outlet-etl-pipeline

superstore_azure_de_project

tokyo_olympics_de_project

uber_etl_data_engineering_project

shubhammirajkar's Repositories

shubhammirajkar/tokyo_olympics_de_project

shubhammirajkar/uber_etl_data_engineering_project

shubhammirajkar/banks_webscraping_etl_project

shubhammirajkar/etl_using_spark

shubhammirajkar/machine_learning__practice_repo

shubhammirajkar/PySpark-Practice-Projects

shubhammirajkar/sales-outlet-etl-pipeline

shubhammirajkar/superstore_azure_de_project