Contribuindo com a Minha Receita

Escreva testes e rode os testes, use autoformatação e linter:

$ gofmt ./
$ staticcheck ./...
$ go test ./...

Os testes requerem um banco de dados de teste, com acesso configurado em TEST_DATABASE_URL como no exemplo em .env.

Docker

Apenas para o banco de dados

Caso queira utilizar o Docker apenas para subir o banco de dados, utilize:

$ docker-compose up -d postgres

Existe também um banco de dados para teste, que não persiste dados e que loga todas as queries:

$ docker-compose up -d postgres_test

Para visualizar as queries efetuadas:

$ docker-compose logs postgres_test

As configurações padrão desses bancos são:

Serviço	Ambiente	Variável de ambiente	Valor
`postgres`	Desenvolvimento	`DATABASE_URL`	`postgres://minhareceita:minhareceita@localhost:5432/minhareceita?sslmode=disable`
`postgres_test`	Testes	`TEST_DATABASE_URL`	`postgres://minhareceita:minhareceita@localhost:5555/minhareceita?sslmode=disable`

Rodando o projeto todo com Docker

Se for utilizar Docker para rodar o projeto todo, copie o arquivo .env.sample como .env — e ajuste, se necessário.

O banco de dados de sua escolha (padrão, que persiste dados; ou de testes, que não persiste dados) tem que ser iniciado isoladamente.

Arquitetura: número do CNPJ e estrutura do pacote `transform`

Todos os dados manipulados por esse pacote vem da Receita Federal.

Contexto

Um número de CNPJ tem 3 partes, e isso é importante pois influencia a forma que a Receita Federal disponibiliza os dados:

base
ordem
dígitos verificadores

Por exemplo, em 19.131.243/0001-97 o número base é 19.131.243, a ordem é 0001 e 97 são os dígitos verificadores.

Uma mesma pessoa jurídica tem sempre a mesma base, e só varia a ordem (nas filiais dessa mesma pessoa jurídica, por exemplo), e os dígitos verificadores.

Dados

O grosso dos dados está nos arquivos CSV de estabelecimentos que tem Estabelecimentos* como prefixo, e as linhas desses arquivos tem um número de CNPJ completo como chave.

Dados que tem o CNPJ base (apenas 8 primeiros dígitos do número de CNPJ) como chave

Arquivos com o prefixo Empresas* tem o básico dos dados, como razão social, natureza jurídica e porte.
Arquivos com o prefixo Socios* tem informações sobre o quadro societário de cada pessoa jurídica.
Arquivo Simples.zip tem informações sobre adesão das pessoas jurídicas ao Simples e MEI.

Dados com outras chaves

Na leitura desses arquivos existem campos que contém um código numérico, mas sem descrição do significado (por exemplo, temos o código 9701 para o município de Brasília). Esses arquivos são chamados de tabelas de look up:

Arquivo Cnaes.zip com descrição dos CNAEs
Arquivo Motivos.zip com descrição dos motivos cadastrais
Arquivo Municipios.zip com o nome dos municípios
Arquivo Paises.zip com o nome dos países
Arquivo Naturezas.zip com o nome da natureza jurídica
Arquivo Qualificacoes.zip com a descrição da qualificação de cada pessoa do quadro societário
Arquivo do Tesouro Nacional com os códigos dos municípios do IBGE

Estratégia de carregamento dos dados no PostgreSQL

A etapa de transformação dos dados, começa criando armazenamentos de chave e valor, com acesso rápido, para completar os dados dos CSVs principais, Estabelecimentos*. Isso é feito em memória para os dados que tem outras chaves, e em disco para os dados que tem como chave a base do CNPJ.

A partir daí, cada linha dos Estabelecimentos* é lida, enriquecida com esses pares de chave e valor armazenados anteriormente, e então enviada para o banco de dados.

Resumindo:

Armazena pares de chave e valor em memória para os dados de: Cnaes.zip, Motivos.zip, Municipios.zip, Paises.zip, Naturezas.zip, Qualificacoes.zip e códigos dos municípios do IBGE
Armazena pares de chave e valor em disco para os dados de:
1. Empresas* enriquecidas com pares de chave e valor de Cnaes.zip, Motivos.zip, Municipios.zip, Paises.zip, Naturezas.zip, Qualificacoes.zip e códigos dos municípios do IBGE
2. Socios* enriquecidos com pares de chave e valor de Qualificacoes.zip
3. Simples.zip e enriquecer as linhas do banco de dados com essas informações
Lê os arquivos Estabelecimentos*
“Enriquece” cada linha deles com os pares de chave e valor
Persiste essa informação no banco de dados

Amostra dos arquivos para testes

Como o processo todo de ETL (o comando transform) demora demais, caso queira testar manualmente com uma amostra dos dados, utilize o comando sample para gera arquivos limitados a 10 mil linhas (assim o processo todo roda em cerca de 1 minuto, por exemplo). Após fazer o download dos dados:

$ ./minha-receita sample
$ ./minha-receita transform -d data/sample

Explore mais opções com --help.

Inconsistências podem acontecer no banco de dados de testes, e ./minha-receita drop -u $TEST_DATABASE_URL é uma boa forma de evitar isso.

pREST

No ambiente de desenvolvimento com Docker Compose existe o serviço pREST. Ele está em fase de testes, e mais detalhes podem ser encontrados na issue sobre o assunto.

Agora preciso rodar o serviço pREST para a Minha Receita funcionar?

Não, ele ainda é opcional.

Para quê serve o pREST no Minha Receita?

A ideia é sibstituir o módulo da API web pelo pREST. Isso reduz a base de código para manutenção no projeto, e facilita novas possibilidades como filtragem por UF ou CNAE, incluindo paginação.

Como eu rodo o pREST sem ser por Docker?

Você pode baixar o binário executável e seguir a documentação do pREST.

Como eu uso o Minha Receita pelo pREST, não pela API antiga?

Por exemplo, com http://localhost:8081/minhareceita/public/cnpj?id=33683111000280, mas essa resposta é diferente da original:

Ela é um array e não um objeto
Ela tem tanto a coluna id quanto a cnpj

Ou seja, dado que a resposta do pREST seja uma variável resp, o resultado de https://minhareceita.org/33683111000280 deve ser igual a resp[0].json.

Documentação

Utilizamos o Material for MkDocs:

$ docker pull squidfunk/mkdocs-material
$ docker run --rm -v $(pwd):/docs squidfunk/mkdocs-material build

A documentação vai ser gerada em site/index.html. Para servir enquanto desenvolve:

$ docker run -p 8000:8000 --rm -v $(pwd):/docs squidfunk/mkdocs-material serve --dev-addr 0.0.0.0:8000

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Contribuindo com a Minha Receita

Docker

Apenas para o banco de dados

Rodando o projeto todo com Docker

Arquitetura: número do CNPJ e estrutura do pacote `transform`

Contexto

Dados

Dados que tem o CNPJ base (apenas 8 primeiros dígitos do número de CNPJ) como chave

Dados com outras chaves

Estratégia de carregamento dos dados no PostgreSQL

Amostra dos arquivos para testes

pREST

Agora preciso rodar o serviço pREST para a Minha Receita funcionar?

Para quê serve o pREST no Minha Receita?

Como eu rodo o pREST sem ser por Docker?

Como eu uso o Minha Receita pelo pREST, não pela API antiga?

Documentação

FilesExpand file tree

CONTRIBUTING.md

Latest commit

History

CONTRIBUTING.md

File metadata and controls

Contribuindo com a Minha Receita

Docker

Apenas para o banco de dados

Rodando o projeto todo com Docker

Arquitetura: número do CNPJ e estrutura do pacote transform

Contexto

Dados

Dados que tem o CNPJ base (apenas 8 primeiros dígitos do número de CNPJ) como chave

Dados com outras chaves

Estratégia de carregamento dos dados no PostgreSQL

Amostra dos arquivos para testes

pREST

Agora preciso rodar o serviço pREST para a Minha Receita funcionar?

Para quê serve o pREST no Minha Receita?

Como eu rodo o pREST sem ser por Docker?

Como eu uso o Minha Receita pelo pREST, não pela API antiga?

Documentação

Arquitetura: número do CNPJ e estrutura do pacote `transform`