Data Lake Setic
MVP Data Lake
Construir uma estrutura sustentável de alocação de dados (Data Lake) com foco principal na criação de base estrutural necessária para integrações futuras. Neste momento, o projeto será direcionado à integração e organização dos dados de recursos humanos contidos nos sistemas geridos pela SETIC. A proposta será implementada como um Produto Mínimo Viável (MVP), servindo também como modelo de estudo para futuras melhorias e expansões na gestão e uso dos dados institucionais.
Atualmente a Setic não possui uma estrutura de alocação de dados, impactando na eficiência operacional e dificultando o atendimento de demandas específicas. Por essa razão, propõe-se a implantação de um repositório centralizado de dados (Data-Lake), com objetivo de minimizar ou eliminar a necessidade de acesso a múltiplas fontes de dados distintas dos sistemas de informação geridos pela Setic. A iniciativa visa também facilitar a distribuição e a utilização das informações, além de viabilizar a aplicação de controles de qualidade e práticas de governança de dados, promovendo maior confiabilidade, padronização e eficiência na gestão das informações.
O projeto justifica-se por:
1. Melhoria da eficiência operacional: Ao centralizar os dados em um único local, a SETIC poderá eliminar a necessidade de acessar várias fontes de dados dispersas. Isso reduzirá o tempo e o esforço necessários para localizar e acessar os dados, resultando em uma maior eficiência operacional.
2. Facilitação da colaboração e compartilhamento de dados: Com o Data Lake, os diferentes departamentos e equipes da SETIC poderão acessar os mesmos conjuntos de dados de forma centralizada. Isso promoverá a colaboração entre as equipes, permitindo que elas compartilhem informações e insights de maneira mais eficiente.
3. Melhoria da qualidade e consistência dos dados: Ao centralizar os dados no Data Lake, a SETIC poderá implementar controles e processos de qualidade de dados mais rigorosos. Isso ajudará a garantir a consistência, a integridade e a precisão dos dados, resultando em uma base de dados confiável e de alta qualidade.
4. Facilitação da análise de dados e tomada de decisões: Com todos os dados centralizados em um único local, a SETIC poderá realizar análises mais abrangentes e avançadas. Isso permitirá a identificação de padrões, tendências e insights valiosos que podem apoiar a tomada de decisões estratégicas e operacionais mais informadas.
5. Fortalecimento da segurança e conformidade dos dados: Ao centralizar os dados no Data Lake, a SETIC poderá implementar medidas de segurança e privacidade mais robustas. Isso inclui a aplicação de controles de acesso, criptografia de dados e monitoramento de atividades suspeitas. Além disso, o Data Lake pode ajudar a garantir a conformidade com regulamentações de proteção de dados, como a LGPD.
6. Redução de custos de armazenamento e gerenciamento de dados: Com o Data Lake, a SETIC poderá otimizar o armazenamento e o gerenciamento dos dados. Isso pode resultar em uma redução de custos, pois elimina a necessidade de manter várias infraestruturas de armazenamento e simplifica os processos de gerenciamento de dados.
Mitigação:
Estabelecer uma estratégia de gestão de mudanças com critérios claros de aprovação e avaliação de impacto. Utilizar ferramentas de controle de escopo e realizar reuniões regulares de alinhamento.
2. Limitações da Infraestrutura Atual
Mitigação:
Realizar análise técnica detalhada no início do projeto. Identificar antecipadamente as necessidades e incluir no plano de aquisição/expansão da infraestrutura. Priorizar o uso de soluções escaláveis.
3. Falta de Pessoal Técnico e Especializado
Mitigação:
Mapear competências essenciais e estabelecer plano de capacitação. Documentar processos e práticas. Definir planos de contingência para substituições.
4. Ausência de Governança de Dados
Mitigação:
Definir modelo de governança desde o início, com papéis, políticas e padrões de qualidade de dados. Envolver as áreas responsáveis na criação e validação dessas regras.
5. Sobrecarga da Infraestrutura Existente
Mitigação:
Planejar testes de carga e desempenho. Utilizar ambientes segregados para desenvolvimento e homologação. Monitorar continuamente o uso de recursos.
6. Falta de Documentação e Gestão do Conhecimento
Mitigação:
Estabelecer rotinas obrigatórias de documentação e versionamento. Designar responsáveis por registrar decisões técnicas e operacionais.
7. Rotatividade de Equipe
Mitigação:
Criar e manter um repositório centralizado de conhecimento do projeto (wiki) Definir procedimentos de “passagem de bastão”.
8. Confusão de Papéis e Responsabilidades
Mitigação:
9. Ineditismo do Projeto na Setic
Mitigação: Estudar boas práticas de mercado. Buscar apoio técnico externo ou benchmark com outras instituições. Adotar abordagem iterativa (ex: MVP) para aprendizado contínuo.
Liderança Técnica: Henrique Ferreira
Gerente de Projetos: Valéria Rodrigues
Stakeholders: Delner Freire (Setic), Gabriel Carrijo (Setic), Leonardo Courinos (Setic), Jean Franco (Setic) Pedro Gomes (Setic)
| Data Planejada | Data Real | Status | ||||
| Atividade ou Tarefa do Projeto | Responsável | Início | Fim | Início | Fim | A fazer; | 
| INICIAÇÃO | ||||||
| Levantamento de requisitos | GPROJ - Valéria | 20/03/2025 | 07/04/25 | 20/03/2025 | 10/04/2025 | Concluído | 
| Identificação dos stakeholders | GPROJ - Valéria | 20/03/2025 | 07/04/25 | 20/03/2025 | 10/04/2025 | Concluído | 
| Alinhamento com stakeholders | GPROJ - Valéria | 12/03/2025 | 14/05/2025 | 12/03/2025 | ||
| PLANEJAMENTO | ||||||
| Abertura do TAP | GPROJ - Valéria | 14/05/25 | 02/06/2025 | 14/05/25 | 05/06/2025 | Concluído | 
| Assinatura do TAP | GPROJ - Valéria | 03/06/2025 | 05/06/2025 | 03/06/2025 | 05/06/2025 | Concluído | 
| Desenvolvimento do plano de gerenciamento do projeto | GPROJ - Valéria | 05/06/2025 | 21/06/2025 | |||
| Alinhamento da definição de responsabilidades estudo de ferramentas/soluções | GPROJ - Valéria | 20/06/2025 | 27/06/2025 | |||
| Planejamento da arquitetura/estrutura do Data lake | CAGD - Henrique | |||||
| Mapeamento de competências e plano de capacitação | GPROJ - Valéria | |||||
| Aprovação formal das entregas da etapa | GABINETE | |||||
| EXECUÇÃO | ||||||
| Montagem da estrutura física e lógica do Data Lake | ||||||
| Extração dos dados de RH | ||||||
| Implementação da estrutura de segurança | ||||||
| Organização inicial dos dados | ||||||
| Planejamento e implementação da continuidade da organização dos dados | ||||||
| Organização e análise dos dados | ||||||
| Registro da documentação técnica | ||||||
| Testes de integridade dos dados carregados | ||||||
| Treinamento e transferência de conhecimento aos usuários finais | ||||||
| Aprovação formal das entregas por etapa | ||||||
| MONITORAMENTO | ||||||
| Acompanhamento do cronograma do projeto | ||||||
| Monitoramento da qualidade dos dados extraídos | ||||||
| Monitoramento da performance do Data Lake | ||||||
| Monitoramento da segurança e compliance dos dados | ||||||
| Auditoria das padronizações aplicadas | ||||||
| Verificação do plano de continuidade dos dados | ||||||
| Acompanhamento da execução do plano de capacitação | ||||||
| Aprovação formal das entregas por etapa | ||||||
| ENCERRAMENTO | ||||||
| Critérios de Encerramento | ||||||
| Termo de Encerramento | ||||||
Modelo de Matriz de Comunicação:
| Tipo de Comunicação | Objetivo | Meio | Frequência | Audiência | Dono | Entregas | 
| Reunião de início | Apresentar a equipe e o projeto. Revisar os objetivos do projeto e a abordagem de gestão | Presencial | Uma vez | Time do projeto Stakeholders | Gerente do Projeto | Ata de Reunião | 
| Reuniões da equipe de projeto | Revisar o status do projeto com a equipe. | Presencial Conferência | Semanalmente | Time do projeto | Gerente do Projeto | Ata de Reunião | 
| Reuniões técnicas de design | Discutir e desenvolver o design técnico da solução do projeto | Presencial | Quando preciso | Pessoal Técnico do Projeto | Ata de Reunião | |
| Reuniões de status mensal do projeto | Relatar o status do projeto para a gestão. | Presencial Conferência | Mensal | Gerente do Projeto | ||
| Relatórios de status do projeto | Relatar o status do projeto, incluindo atividades, progresso, custos e problemas. | Mensal | Time do projeto Stakeholders P.O | Gerente do Projeto | Relatório de status do Projeto |