Using Decision Trees to forecast real estate rentals in the city of São Paulo, SP
DOI:
https://doi.org/10.26853/Refas_ISSN-2359-182X_v12n04_01Palavras-chave:
Real Estate Market, Decision Tree, Random ForestResumo
The real estate market stands out from economies for its huge importance in social and economic aspects of life. It represents an important part of growth and development of the countries, reflecting on the job market, collected taxes and banks´ role. The goal of this research is to verify the decision trees´ machine learning models to predict rent prices in São Paulo city. A regression methodology has been used in the algorithms of Decision Trees, Random Forest, and Gradient Boosting to predict the values of rent, taking as a parameter the variables on real estate company’s sites, separating data in training and test. Among the models, the Random Forest algorithm produces a smaller residual error and higher r-squared metrics, which means the prediction obtained is closer to real data. The result of this research shows that ensemble models were better than Decision Tree model when using the hiperparameters tunning, providing this way a more accurate prediction about properties rental prices.
Downloads
Referências
APPORAS. What is the difference between Bagging and Boosting? 2016. Available at: https://quantdare.com/what-is-the-difference-between-bagging-and-boosting/. Accessed on: Jun. 20, 2024.
ARRAES, R. A.; SOUZA, F. E. Externalidades e formação de preços no mercado imobiliário urbano brasileiro: um estudo de caso. Economia Aplicada, v. 12, p. 289-319, 2008.
BREIMAN, L. Bagging predictors. Machine Learning, v. 24, p. 123-140, 1996.
CHOUDHURY. What is Gradient Boosting? How is it different from Ada Boost? Available at: https://medium.com/analytics-vidhya/what-is-gradient-boosting-how-is-it-different-from-ada-boost-2d5ff5767cb2. Accessed on: Jun. 10, 2024.
DAMASO, O. R. O potencial do mercado de locação residencial no Brasil. Conjuntura da Construção, p. 8-9, 2008.
FÁVERO, L. P. L.; BELFIORE, P. P.; LIMA, G. A. S. F. Modelos de precificação hedônica de imóveis residenciais na Região Metropolitana de São Paulo: uma abordagem sob as perspectivas da demanda e da oferta. Estudos Econômicos, v. 38, p. 73-96, 2008.
GONÇALVES, M. M. Precificação de imóveis utilizando regressão linear múltipla e árvores de decisão. Universidade de Santa Catarina, 2022. 75 p.
KUMAR, A. Available at: https://vitalflux.com/mse-vs-rmse-vs-mae-vs-mape-vs-r-squared-when-to-use/.
MICHEL, R. Optimizing hyperparameters the right way. Medium, 2020. Available at: https://towardsdatascience.com/optimizing-hyperparameters-the-right-way-3c9cafc279cc. Accessed on: Sep. 22, 2024.
OLIVEIRA, C. Métricas para regressão: entendendo as métricas R², MAE, MAPE, MSE e RMSE. 2021. Available at: https://medium.com/data-hackers/prevendo-n%C3%BAmeros-entendendo-m%C3%A9tricas-de-regress%C3%A3o-35545e011e70.
PINIEWEB. Mercado imobiliário de aluguel está aquecido em São Paulo. 2024. Available at: https://piniweb.com.br/mercado-imobiliario-de-aluguel-esta-aquecido-em-sao-paulo/. Accessed on: Apr. 01, 2024.
PYTHONGEEKS, Team. Gradient boosting algorithm in machine learning. 2024. Available at: https://pythongeeks.org/gradient-boosting-algorithm-in-machine-learning/. Accessed on: Sep. 20, 2024.
RITA, Pedro Artur Alves. Aplicação data mining para análise e previsão das estratégias de pricing em companhias aéreas: estudo de caso: registos das tarifas da rota SSA-LIS. 2018. 92 f. Dissertation (Master’s) – Curso de Gestão de Informação com Especialização em Gestão do Conhecimento e Business Intelligence, Universidade Nova de Lisboa, Lisboa, 2018.
ROLNIK, Raquel. Mercado de aluguel de imóveis em São Paulo está sob tensão. Jornal da USP, 2023. Available at: https://jornal.usp.br/radio-usp/mercado-de-aluguel-de-imoveis-em-sao-paulo-esta-sob-tensao/. Accessed on: Sep. 16, 2024.
SRUTHI, E. Understand random forest algorithm with examples. 2024. Available at: https://www.analyticsvidhya.com/blog/2021/06/understanding-random-forest/. Accessed on: May 29, 2024.
WISSENBACH, Tomás Cortez. A cidade e o mercado imobiliário: uma análise da incorporação residencial paulistana entre 1992 e 2007. 2008. 142 f. Dissertation (Master’s) – Curso de Geografia, Universidade de São Paulo, São Paulo, 2008.
YIU, T. Understanding random forest. Towards Data Science, 2021. Available at: https://towardsdatascience.com/understanding-random-forest-58381e0602d2. Accessed on: May 14, 2024.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2026 Refas - Revista Fatec Zona Sul

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
1 - As fontes dos dados, as autorizações pertinentes e os textos publicados na revista são de inteira responsabilidade de seus autores.
2 - É permitida a reprodução, desde que citada a fonte e o autor.
3 - Após o artigo aprovado, o autor principal deverá enviar declaração, conforme o modelo:
Refas - Revista Fatec Zona Sul
Autorização par publicação
(Nome do autor), (no caso de vários autores citar todos), autorizo (ou autorizam, no caso de diversos autores) a publicação do artigo (nome do artigo), com exclusividade para a primeira publicação pela Revista Fatec Zona Sul, em meio eletrônico.
A contribuição é original e inédita, e não está sendo avaliada para publicação por outra revista; caso contrário, deve-se justificar em "Comentários ao editor".
Dados de todos os autores:
Nome completo:
Instituição:
E-mail:
Telefone:
Obs.: Informar os códigos dos serviços DDD e DDI.
Assinatura do autor principal: ____________________________________
Aviso de Direito Autoral
Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
b) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.
c)Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons CC Attribution 4.0, acessável em Licença Creative Commons Attribution, que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.