Projeto DBT-Core para Data Warehouse de Commodities

Projeto DW C/ DBT-Core

Projeto DBT-Core para Data Warehouse de Commodities

Este projeto utiliza DBT (Data Build Tool) para gerenciar e transformar dados de um Data Warehouse (DW) de commodities. O objetivo é criar um pipeline de dados que trata e organiza os dados de commodities e suas movimentações para análise.

Estrutura do Projeto

graph TD
    A[Início] --> B[Extrair Dados das Commodities]
    B --> C[Transformar Dados das Commodities]
    C --> D[Carregar Dados no PostgreSQL]
    D --> E[Fim]

    subgraph Extrair
        B1[Buscar Dados de Cada Commodity]
        B2[Adicionar Dados na Lista]
    end

    subgraph Transformar
        C1[Concatenar Todos os Dados]
        C2[Preparar DataFrame]
    end

    subgraph Carregar
        D1[Salvar DataFrame no PostgreSQL]
    end

    B --> B1
    B1 --> B2
    B2 --> C
    C --> C1
    C1 --> C2
    C2 --> D
    D --> D1

1. Seeds

Os seeds são dados estáticos que são carregados no Data Warehouse a partir de arquivos CSV. Neste projeto, usamos seeds para carregar dados de movimentações de commodities.

2. Models

Os models definem as transformações de dados usando SQL. Eles são divididos em duas camadas principais: staging e datamart.

Staging

A camada de staging é responsável por preparar e limpar os dados antes que eles sejam carregados nas tabelas finais de análise.

stg_commodities.sql: Trata e formata os dados das commodities extraídos da API.
stg_commodities_movement.sql: Trata e formata os dados de movimentações das commodities.

Datamart

A camada de datamart é onde os dados finais de análise são armazenados. Eles são baseados nos dados preparados pela camada de staging.

dm_commodities.sql: Integra os dados tratados das commodities e das movimentações, criando um modelo de dados final para análise.

3. Sources

Os sources são as tabelas ou arquivos de origem dos dados que o DBT utiliza para realizar as transformações.

4. Snapshots

Os snapshots são utilizados para manter um histórico de como os dados mudam ao longo do tempo.

Estrutura de Diretórios

├── models
│   ├── staging
│   │   ├── stg_commodities.sql
│   │   └── stg_commodities_movement.sql
│   └── datamart
│       └── dm_commodities.sql
├── seeds
│   └── commodities_movement.csv
├── dbt_project.yml
└── README.md

Executando o Projeto

Requisitos

Python 3.7+
DBT

Passos para Execução

Clonar o Repositório:

git clone <URL-do-Repositório>
cd <Nome-do-Repositório>

Instalar o DBT:
```
pip install dbt-core dbt-postgres
```

Configurar o DBT:

Configure o arquivo profiles.yml para se conectar ao seu Data Warehouse. O arquivo deve estar no diretório ~/.dbt/ ou no diretório especificado pela variável de ambiente DBT_PROFILES_DIR.

Exemplo de profiles.yml:

databasesales:
  target: dev
  outputs:
    dev:
      type: postgres
      host: <DB_HOST_PROD>
      user: <DB_USER_PROD>
      password: <DB_PASS_PROD>
      port: <DB_PORT_PROD>
      dbname: <DB_NAME_PROD>
      schema: <DB_SCHEMA_PROD>
      threads: 1

Executar os Seeds do DBT:
```
dbt seed
```
Executar as Transformações do DBT:
```
dbt run
```
Verificar o Estado do Projeto:
```
dbt test
```

Contribuição

Para contribuir com o projeto, por favor, faça um fork do repositório e envie um pull request com suas alterações.

Descrição dos Models

stg_commodities.sql

Este model é responsável por tratar e formatar os dados das commodities extraídos da API. Ele faz a limpeza e transformação necessárias para preparar os dados para o datamart.

stg_commodities_movement.sql

Este model é responsável por tratar e formatar os dados de movimentações das commodities. Ele faz a limpeza e transformação necessárias para preparar os dados para o datamart.

dm_commodities.sql

Este model integra os dados tratados das commodities e das movimentações, criando um modelo de dados final para análise. Ele calcula métricas e agrega os dados para facilitar a análise no dashboard.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
app		app
datawarehouse		datawarehouse
logs		logs
src		src
.gitignore		.gitignore
README.MD		README.MD
profiles.yml		profiles.yml
template.env		template.env

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projeto DW C/ DBT-Core

Projeto DBT-Core para Data Warehouse de Commodities

Estrutura do Projeto

1. Seeds

2. Models

Staging

Datamart

3. Sources

4. Snapshots

Estrutura de Diretórios

Executando o Projeto

Requisitos

Passos para Execução

Contribuição

Descrição dos Models

stg_commodities.sql

stg_commodities_movement.sql

dm_commodities.sql

About

Releases

Packages

Languages

Gustavo-B-Morales-S/Data_Warehouse-C-DBT_Core

Folders and files

Latest commit

History

Repository files navigation

Projeto DW C/ DBT-Core

Projeto DBT-Core para Data Warehouse de Commodities

Estrutura do Projeto

1. Seeds

2. Models

Staging

Datamart

3. Sources

4. Snapshots

Estrutura de Diretórios

Executando o Projeto

Requisitos

Passos para Execução

Contribuição

Descrição dos Models

stg_commodities.sql

stg_commodities_movement.sql

dm_commodities.sql

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages