Data Lake Setic
MVP Data Lake
Construir uma estrutura sustentável de alocação de dados (Data Lake) com foco principal na criação de base estrutural necessária para integrações futuras. Neste momento, o projeto será direcionado à integração e organização dos dados de recursos humanos contidos nos sistemas geridos pela SETIC. A proposta será implementada como um Produto Mínimo Viável (MVP), servindo também como modelo de estudo para futuras melhorias e expansões na gestão e uso dos dados institucionais.
Atualmente a Setic não possui uma estrutura de alocação de dados, impactando na eficiência operacional e dificultando o atendimento de demandas específicas. Por essa razão, propõe-se a implantação de um repositório centralizado de dados (Data-Lake), com objetivo de minimizar ou eliminar a necessidade de acesso a múltiplas fontes de dados distintas dos sistemas de informação geridos pela Setic. A iniciativa visa também facilitar a distribuição e a utilização das informações, além de viabilizar a aplicação de controles de qualidade e práticas de governança de dados, promovendo maior confiabilidade, padronização e eficiência na gestão das informações.
O projeto justifica-se por:
1. Melhoria da eficiência operacional: Ao centralizar os dados em um único local, a SETIC poderá eliminar a necessidade de acessar várias fontes de dados dispersas. Isso reduzirá o tempo e o esforço necessários para localizar e acessar os dados, resultando em uma maior eficiência operacional.
2. Facilitação da colaboração e compartilhamento de dados: Com o Data Lake, os diferentes departamentos e equipes da SETIC poderão acessar os mesmos conjuntos de dados de forma centralizada. Isso promoverá a colaboração entre as equipes, permitindo que elas compartilhem informações e insights de maneira mais eficiente.
3. Melhoria da qualidade e consistência dos dados: Ao centralizar os dados no Data Lake, a SETIC poderá implementar controles e processos de qualidade de dados mais rigorosos. Isso ajudará a garantir a consistência, a integridade e a precisão dos dados, resultando em uma base de dados confiável e de alta qualidade.
4. Facilitação da análise de dados e tomada de decisões: Com todos os dados centralizados em um único local, a SETIC poderá realizar análises mais abrangentes e avançadas. Isso permitirá a identificação de padrões, tendências e insights valiosos que podem apoiar a tomada de decisões estratégicas e operacionais mais informadas.
5. Fortalecimento da segurança e conformidade dos dados: Ao centralizar os dados no Data Lake, a SETIC poderá implementar medidas de segurança e privacidade mais robustas. Isso inclui a aplicação de controles de acesso, criptografia de dados e monitoramento de atividades suspeitas. Além disso, o Data Lake pode ajudar a garantir a conformidade com regulamentações de proteção de dados, como a LGPD.
6. Redução de custos de armazenamento e gerenciamento de dados: Com o Data Lake, a SETIC poderá otimizar o armazenamento e o gerenciamento dos dados. Isso pode resultar em uma redução de custos, pois elimina a necessidade de manter várias infraestruturas de armazenamento e simplifica os processos de gerenciamento de dados.
Mitigação:
Estabelecer uma estratégia de gestão de mudanças com critérios claros de aprovação e avaliação de impacto. Utilizar ferramentas de controle de escopo e realizar reuniões regulares de alinhamento.
2. Limitações da Infraestrutura Atual
Mitigação:
Realizar análise técnica detalhada no início do projeto. Identificar antecipadamente as necessidades e incluir no plano de aquisição/expansão da infraestrutura. Priorizar o uso de soluções escaláveis.
3. Falta de Pessoal Técnico e Especializado
Mitigação:
Mapear competências essenciais e estabelecer plano de capacitação. Documentar processos e práticas. Definir planos de contingência para substituições.
4. Ausência de Governança de Dados
Mitigação:
Definir modelo de governança desde o início, com papéis, políticas e padrões de qualidade de dados. Envolver as áreas responsáveis na criação e validação dessas regras.
5. Sobrecarga da Infraestrutura Existente
Mitigação:
Planejar testes de carga e desempenho. Utilizar ambientes segregados para desenvolvimento e homologação. Monitorar continuamente o uso de recursos.
6. Falta de Documentação e Gestão do Conhecimento
Mitigação:
Estabelecer rotinas obrigatórias de documentação e versionamento. Designar responsáveis por registrar decisões técnicas e operacionais.
7. Rotatividade de Equipe
Mitigação:
Criar e manter um repositório centralizado de conhecimento do projeto (wiki) Definir procedimentos de “passagem de bastão”.
8. Confusão de Papéis e Responsabilidades
Mitigação:
9. Ineditismo do Projeto na Setic
Mitigação: Estudar boas práticas de mercado. Buscar apoio técnico externo ou benchmark com outras instituições. Adotar abordagem iterativa (ex: MVP) para aprendizado contínuo.
Data Planejada |
Data Real |
Status |
||||
Atividade ou Tarefa do Projeto |
Responsável |
Início |
Fim |
Início |
Fim |
A fazer; |
INICIAÇÃO | ||||||
Levantamento de requisitos | GPROJ - Valéria | 20/03/2025 | 07/04/25 | 20/03/2025 | 10/04/2025 | Concluído |
Identificação dos stakeholders | GPROJ - Valéria | 20/03/2025 | 07/04/25 | 20/03/2025 | 10/04/2025 | Concluído |
Alinhamento com stakeholders | GPROJ - Valéria | 12/03/2025 | 14/05/2025 | 12/03/2025 | ||
PLANEJAMENTO | ||||||
Abertura do TAP | GPROJ - Valéria | 14/05/25 | 02/06/2025 | |||
Assinatura do TAP | GPROJ - Valéria | 03/06/2025 | 05/06/2025 | |||
Desenvolvimento do plano de gerenciamento do projeto | GPROJ - Valéria | 05/06/2025 | 21/06/2025 | |||
Alinhamento da definição de responsabilidades estudo de ferramentas/soluções | GPROJ - Valéria | 20/06/2025 | 27/06/2025 | |||
Planejamento da arquitetura/estrutura do Data lake | CAGD - Henrique | |||||
Mapeamento de competências e plano de capacitação | GPROJ - Valéria | |||||
Aprovação formal das entregas da etapa | GABINETE | |||||
EXECUÇÃO | ||||||
Montagem da estrutura física e lógica do Data Lake | ||||||
Extração dos dados de RH | ||||||
Implementação da estrutura de segurança | ||||||
Organização inicial dos dados | ||||||
Planejamento e implementação da continuidade da organização dos dados | ||||||
Organização e análise dos dados | ||||||
Registro da documentação técnica | ||||||
Testes de integridade dos dados carregados | ||||||
Treinamento e transferência de conhecimento aos usuários finais | ||||||
Aprovação formal das entregas por etapa | ||||||
MONITORAMENTO | ||||||
Acompanhamento do cronograma do projeto | ||||||
Monitoramento da qualidade dos dados extraídos | ||||||
Monitoramento da performance do Data Lake | ||||||
Monitoramento da segurança e compliance dos dados | ||||||
Auditoria das padronizações aplicadas | ||||||
Verificação do plano de continuidade dos dados | ||||||
Acompanhamento da execução do plano de capacitação | ||||||
Aprovação formal das entregas por etapa | ||||||
ENCERRAMENTO | ||||||
Critérios de Encerramento | ||||||
Termo de Encerramento |