Projeto autônomo, visando demonstrar conhecimento teórico e prático nos tópicos descritos abaixo.
- Extração, pré-processamento, análise, visualização, geração de insights, machine learning. O projeto visa aplicar os dados à um modelo de recomendação de compra, calculado com algoritmo APRIORI, encontrando associações entre itens frequentes em compras on-line.
Objetivo: em um primeiro momento, conhecer os dados, e, concluir se estão em ordem para aplicação em um modelo. Em um segundo momento, as regras de recomendação serão calculadas e exportadas em um arquivo .csv.
Fonte dos dados:
1 - Dados foram obtidos no UCI Machine Learning Repository.
-
R para:
-
Pré-processamento.
-
Análise exploratória, visualização e geração de insights.
-
Aplicação do modelo (APRIORI)
-
Principais pacotes utilizados:arules, arulesViz, htmlwidgets, data.table, reshape2, tidyr, dplyr.
-
-
Conceitos aplicados:
-
Pré-processamento de dados
-
Data-wrangling
-
Data-Viz
-
Machine learning (com APRIORI)
-
Expressões regulares
-
- A analise foi conduzida para, ao final, proporcionar a recomendação de compra, por cliente, com grande probabilidade.
1 - Acesse clicando no arquivo acima com extensão '.ipynb', neste repositório, ou
2 - Faça o clone do repositório para participar deste projeto.
Como resultado da análise, idenfificamos as regras de associação entre os top_10 produtos mais frequentes na lista de compras de clientes, do site em questão:
I - itens frequentes:
II - Regras:
Informações relacionadas às vendas puderam ser visualizadas, brevemente, na fase exploratória:
Como resultado, temos um arquivo contendo a regra mais forte para cada um dos itens mais frequentes da nossa base de dados. Estas informações podem fomentar, por exemplo, e-mails marketing ou recomendações on-line.
Fonte dos dados: