Data Lake
???
Construção de um repositório centralizado de dados, visando a facilitação da distribuição, propagação e utilização dos mesmos, conhecido como Data Lake¹ que contemple todos os dados gerenciados pela SETIC.
A maior demanda da Coordenadoria de Análise e Gestão de Dados é devido à desorganização e descentralização dos dados. A ausência de um repositório central dificulta a distribuição de dados para outras secretarias interessadas, como também dificulta a análise e apresentação dos mesmos.
Com um Data Lake¹, se torna extremamente mais eficiente toda a etapa do ciclo de vida dos dados² que ocorre após a sua criação:
- A análise de dados tem facilitada a análise, uma vez que é possível encontrar em um lugar só dados das fontes e contextos mais diversos, facilitando a geração de novos insights e potencializando o desenvolvimento de inteligências artificiais.
- A comunicação/entrega dos dados também torna-se mais fácil, uma vez que a centralização dos dados possibilita a construção das estruturas necessárias para se desenvolver painéis(também conhecidos como Dashboards) de maneira mais ágil.
Os objetivos estão listados em ordem de execução. Novas idealizações serão marcadas à medida que o desenvolvimento e entrega avançarem para detalhar os outros objetivos. É importante lembrar que a lista de objetivos pode ser atualizada conforme necessário.
- Centralizar os dados gerenciados na SETIC.
- Prover os dados de maneira ordenada.
- Tornar-se a fonte central dos dados que a SETIC pode prover.
- Armazenar dados de maneira eficiente e performática.
- Pessoal
- Infraestrutura tecnológica
- Setores de TI que consomem dados disponibilizados através da SETIC
- Secretarias que possuem dados gerenciados pela SETIC
- A maioria dos setores da SETIC
- Gerente de Projetos: ?
- Liderança Técnica: João T. S. Telles
- Desenvolvedores: Time Auto
- PG?
- Coordenador COGE?
- Carrijo?
A ser definido na documentação do projeto.