Data Engineering

1 Data Modeling

1.1 Relational and NoSQL data models to fit the diverse needs of data

  Data Modeling using Postgres (Fact and Dimension data model)
  Data Modeling using Apache Cassandra
  When to use and limitations of RDBMS (OLTP, OLAP) or NoSQL data models.

Data modeling project reads are at :

2 Cloud Data Warehouses and Data Lake

Big data ecosystem and how to use Spark to work with massive datasets.
Difference between Data warehouse and Data lake - Business need and justification

2.1 Cloud Data Warehouse

    RedShift, AWS

Cloud Data Warehouses project read is at :

https://github.com/Kameshwarsingh/data-engineering-nanodegree-udacity/blob/main/cloud-data-warehouse/Data_Warehouse_Project/README.md

3 Data Lake

  Why traditional Data warehouse approach does not meet demands of Data scientist and realtime business analytics?

3.1 Data Lake with Spark

        EMR Cluster Spark, AWS

Data Lake project read is at :

https://github.com/Kameshwarsingh/data-engineering-nanodegree-udacity/blob/main/dataLakes-Spark/project-dataLake-Spark/README.md

4 Data Pipeline

4.1 Data Pipeline using Apache Airflow

How Airflow simplifies Bigdata workflow and fits well in Cloud and BigData context?

  Data Pipelines with Airflow (DAG, Operators, Hooks), AWS
  Store big data in a data lake and query it with Spark, AWS
  Run data quality checks, track data lineage, and work with data pipelines in production.

Data Pipeline project read is at :

https://github.com/Kameshwarsingh/data-engineering-nanodegree-udacity/blob/main/dataPipelines-airflow/project_datapipelines_airflow/README.md

5 Capstone Project

  Data Enginnering Capstone

Capstone project read is at:

https://github.com/Kameshwarsingh/data-engineering-nanodegree-udacity/blob/main/capstone-project/README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Data Engineering

1 Data Modeling

1.1 Relational and NoSQL data models to fit the diverse needs of data

Data modeling project reads are at :

2 Cloud Data Warehouses and Data Lake

2.1 Cloud Data Warehouse

Cloud Data Warehouses project read is at :

3 Data Lake

3.1 Data Lake with Spark

Data Lake project read is at :

4 Data Pipeline

4.1 Data Pipeline using Apache Airflow

Data Pipeline project read is at :

5 Capstone Project

Capstone project read is at:

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
capstone-project		capstone-project
cloud-data-warehouse/Data_Warehouse_Project		cloud-data-warehouse/Data_Warehouse_Project
data-modeling		data-modeling
dataLakes-Spark/project-dataLake-Spark		dataLakes-Spark/project-dataLake-Spark
dataPipelines-airflow/project_datapipelines_airflow		dataPipelines-airflow/project_datapipelines_airflow
README.md		README.md

Kameshwarsingh/data-engineering-nanodegree-udacity

Folders and files

Latest commit

History

Repository files navigation

Data Engineering

1 Data Modeling

1.1 Relational and NoSQL data models to fit the diverse needs of data

Data modeling project reads are at :

2 Cloud Data Warehouses and Data Lake

2.1 Cloud Data Warehouse

Cloud Data Warehouses project read is at :

3 Data Lake

3.1 Data Lake with Spark

Data Lake project read is at :

4 Data Pipeline

4.1 Data Pipeline using Apache Airflow

Data Pipeline project read is at :

5 Capstone Project

Capstone project read is at:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages