Hello,

Welcome to my projects portfolio.

On this page, I present my abilities to solve business problems using concepts and tools from data science, analysis and engineering through projects with public data.
You will also find my professional experiences, skills, tools and concepts involving the data area.
Feel free to contact me through the links at the bottom of the page.

About me

My name is Eron Oliveira

I'm a highly skilled data analyst and project manager with a robust data analysis, transformation, and visualisation background. With over nine years of experience in the field, I have a proven track record of success in delivering data-driven solutions that drive business growth and improve organisational efficiency. I have expertise in various tools and technologies, including SQL, Python, Power BI, and DAX. I have a solid ability to extract insights from data and communicate them effectively to stakeholders. I'm always looking for new opportunities to use my skills and expertise to make a positive impact.

Skills

Linguagens de Programação e Banco de Dados

- Python com foco em análise de dados;
- Web scraping com Python;
- SQL para extração de dados;
- Banco de Dados SQLite e Postgres.

Estatística e Machine Learning

- Estatística descritiva (localização, dispersão, assimetria, kurtosis, densidade);
- Algoritmos de Regressão, classificação, clusterização e "learn to rank";
- Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade;
- Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score e DB-Index);
- Pacotes de Machine Learning: Sklearn e Scipy.

Visualização de Dados

- Matplotlib, Seaborn e Plotly;
- PowerBI.

Engenharia de Software

- Git, Github, Gitlab, Cookiecutter e Virtual Environment;
- Streamlit e Flask;
- Cloud Heroku e Google Cloud Platform.

Experiência Profissional

3 Projetos completos em Ciência de Dados

Construção de soluções de dados para problemas de negócio, próximos dos desafios reais das empresas, utilizando dados públicos de competições de Ciência de Dados, onde eu abordei o problema desde a concepção do desafio de negócio até a publicação do algoritmo treinado em produção, utilizando ferramentas de Cloud Computing.

6+ anos como Analista de Dados

Obtenção, transformação, análise e apresentação de dados relacionados aos custos de funcionamento da Instituição, distribuição de Recursos Humanos e cargas de trabalho.

6+ anos como Gestor de Projetos

Construção e registro da documentação dos projetos estratégicos, acompanhamento das equipes na implementação das ações planejadas e apresentação dos resultados aos stakeholders estratégicos.

Projetos em Ciência de Dados

Github

Definição de preço para comércio eletrônico

Desenvolvi uma ferramenta de Webscraping em Python para obter informações dos principais concorrentes de uma empresa de comércio eletrônico que pretende entrar no mercado americano de vestuário. O código extrai, transforma e carrega (ETL) as informações em uma base de dados e, através das medianas, calcula os resultados que serão entregues através de uma aplicação no Streamlit.

Principais ferramentas utilizadas:
  • Python;
  • Git e Github;
  • JupyterLab;
  • SQLite;
  • Webscrapping libraries (Beautiful Soup);
  • Cron job, Airflow;
  • Streamlit.
Github

Venda Cruzada de Seguros

Construí uma solução que indicava se os clientes de uma empresa de seguros estavam ou não interessados na aquisição de um segundo produto da empresa, neste caso, um seguro para o automóvel. Com base na solução, a equipa de vendas pode dar prioridade às pessoas mais interessadas no novo produto e assim otimizar a campanha de vendas.

Principais ferramentas utilizadas:
  • Python, Pandas, Matplotlib e Seaborn;
  • Git e Github;
  • JupyterLab;
  • Modelos de Machine Learning (KNN Classifier, Logistic Regression, Random Forest Classifier, Naive Bayes Classifier e XGBoost Classifier);
  • Heroku;
  • Google Sheets.

Previsão do volume de vendas

Criei um modelo inteligente que utiliza a receita e as principais características de uma rede de lojas para prever os resultados das vendas num período futuro de seis semanas. Os resultados são entregues através de um Bot do Telegram para agilizar e facilitar o acesso à informação.

Principais ferramentas utilizadas:
  • Python, Pandas, Matplotlib e Seaborn;
  • Git e Github;
  • JupyterLab;
  • Modelos de Machine Learning (Linear Regression Model, Linear Regression Regularized Model – LASSO, Random Forest Regressor e XGBoost Regressor);
  • Flask;
  • Heroku;
  • Telegram.

Contatos

Sinta-se à vontade para, em caso de dúvidas ou sugestões, entrar em contato.