
Como é a nossa área de Dados?
A área de Dados do Pag é estratégica para o negócio, ligada diretamente ao CEO e atua como uma bastiã da nossa cultura data driven. A área é composta por Data Engineering, Data Science e Data Analytics. Hoje são mais de 20 excelentes pessoas e a equipe não para de crescer. A sinergia do time nos dá a possibilidade de ganharmos uma velocidade ímpar na construção e entrega de soluções baseadas em dados.
Os pilares da área são a excelência do time, liberdade pra inovar e construir a melhor solução para um problema e o excelente ambiente de trabalho que construímos.
Nosso Data Lake está 100% na nuvem da AWS e trabalhamos com uma stack de tecnologias de ponta pra fornecermos dados para todas as áreas da empresa. Centralizamos todas as nossas rotinas em Python e SQL de forma que sabendo as duas linguagens você consiga desde orquestrar uma DAG até construir e entregar um modelo em produção.
Responsabilidades e atribuições
Quais serão os seus desafios?
O seu dia a dia vai ser dentro de um time multidisciplinar com um problema desafiador a ser resolvido. E esperado que já nos primeiros meses você tenha tido impacto na forma como conduzimos nossos negócios, de uma forma totalmente remota. Te daremos a liberdade, os desafios e o suporte para entregar o seu melhor! Seja melhorando nosso processo de onboarding, integrando uma nova fonte de dados que vai ser usada pra melhorar a vida dos nossos clientes, conseguindo conceder mais crédito com menos risco, etc Aqui vivenciamos o impacto que a autonomia e empoderamento de pessoas excelentes traz ao negocio No seu dia a dia, esperamos que seu tempo seja dividido entre as tarefas abaixo
- Administrar a infra de dados consumida pelos times de Analytics e Data Scientists. You build it you run it. Acreditamos nisso;
- Monitorar a saúde das aplicações que fazem Stream e Batch dos dados que são armazenados no Data Lake;
- Desenvolver e manter os fluxos de cargas;
- Documentar os dados armazenados processos;
- Desenvolver testes unitários e de integração. Qualidade de código e validação de dados importam!;
- Interagir com os times internos de negocio para polimento e solução de de problemas que possam envolver integração de novas fontes de dados ou alteração de fluxos existente.
Requisitos e qualificações
Para isso, você vai precisar ter:
- Graduação completa em Ciência da Computação, Engenharias ou áreas correlatas;
- Inglês (leitura fluente, no mínimo);
- Python;
- Spark;
- SQL;
- NOSQL;
- Streaming e Ingestão de Dados em bases não relacionais
- Git para versionamento de código;
- Bash básico;
- Docker;
- Facilidade em se relacionar com diferentes pessoas/times e boa comunicação.
E será um diferencial se você tiver:
- Experiencia em ambientes Cloud (AWS é um diferencial);
Ei, sabemos que você não é um robô e tem vida. Se não for expert em alguma das áreas, aplica e te ensinamos aquil Não dá pra ser expert em tudo, né?! :)
0 Comentários