Aplicação de regressão linear múltipla para analisar a relação entre buscas por palavras-chave na internet e casos de COVID-19 no Brasil

Autores

DOI:

https://doi.org/10.5585/exactaep.2022.20401

Palavras-chave:

COVID-19. Regressão linear múltipla. Ciência de dados. Google Trends.

Resumo

Esforços em diversas áreas do conhecimento científico, sobretudo na de infodemiologia, têm se dedicado a propor soluções para os problemas socioeconômicos provocados pela pandemia da SARS-CoV-2 e do isolamento social decorrente dela. O estudo de insights sobre como a COVID-19 está se disseminando em determinadas regiões é uma alternativa eficaz para lidar com este desafio. Este artigo analisa, de forma exploratória, a relação entre os dados publicamente disponíveis de índices relativos de busca por palavras-chave no Google Trends® e os dados governamentais de notificação de infectados pela doença em Minas Gerais, Rio de Janeiro e São Paulo. Em uma análise longitudinal, constata-se que as pesquisas por “Teste de COVID” e “Sintomas de COVID” são explicativas para o número de casos notificados nestas localidades. Este estudo fornece percepções iniciais para auxiliar pesquisas no uso das buscas online, relacionadas à doença, como variáveis explicativas adicionais a modelos preditivos, resguardadas suas devidas limitações

Downloads

Não há dados estatísticos.

Biografia do Autor

Letícia Alexandre Furletti, Pontificia Universidade Catolica de Minas Gerais - PUC Minas / Belo Horizonte (MG)

Graduanda em Engenharia de Produção pela Pontificia Universidade Catolica de Minas Gerais. Atua como desenvolvedora no Grupo de Engenharia de Dados (PUC-MG), onde programa em linguagem R desde 2020. Tambem atuou por 2 anos como pesquisadora e gestora de projetos no Grupo de Empreendedorismo Tecnológico e Inovação (PUC-MG).

Ítalo Lelis De Carvalho, Pontificia Universidade Catolica de Minas Gerais - PUC Minas / Belo Horizonte (MG)

Bacharelando em Engenharia de Software pela PUC-Minas. Participação em competições nacionais (OBR e CBR) e internacionais (LARC e RoboCup) de Robótica e do Grupo de Estudo de Engenharia de Dados (GED) da PUC-Minas. Possui experiência como Bolsista de Iniciação Científica na área de robótica cooperativa.

Hendrigo Batista Da Silva, Pontificia Universidade Catolica de Minas Gerais - PUC Minas / Belo Horizonte (MG)

Orientador no Grupo de Engenharia de Dados e professor no Departamento de Engenharia de Produção.

Letícia de Castro Peixoto, Pontificia Universidade Catolica de Minas Gerais - PUC Minas / Belo Horizonte (MG)

Doutora em Ciência da Informação pela UFMG, é Engenheira Química pela pela Universidade Federal de Minas Gerais, Mestre em Administração pela PUC MINAS/FDC. Cursou MBA pela University of Technology, Sidney (UTS) e Master of Engineering pela University of Technology, Sidney (UTS). Possui mais de 20 anos de experiência profissional sendo 12 deles na área de consultoria de Business Intelligence (BI), atuando na gestão de projetos e nas frentes de consultoria de processos e das ferramentas tecnológicas de BI da SAP que apóiam o processo de planejamento. Trabalhou em consultorias portuguesas (Grupo Tecnidata), americanas (Bearing Point) e indianas (Infosys) realizando projetos nas empresas: Novartis, Souza Cruz (BAT), Cosan, Camargo Corrêa, ArcelorMittal, Schincariol, Zilor, Holcim, Veracel, Cimpor, Zillo Lorenzeti, Cintra, Schincariol, Gerdau e outras. No início da carreira, trabalhou 4 anos como engenheira de projetos na AmBev. Leciona na PUC Minas desde 2009 nos departamento de Engenharia de Produção do Campus Praça da Liberdade, onde é coordenadora de pesquisa do curso e coordena projeto de Extensão de gameficação em Engenharia de Produção. Participa do Núcleo Docente Estruturante (NDE) do curso.

Referências

Angus, D. C. (2020). Optimizing the trade-off between learning and doing in a pandemic. Jama, 323(19), 1895-1896. https://doi:10.1001/jama.2020.4984

Ayyoubzadeh, S. M., Ayyoubzadeh, S. M., Zahedi, H., Ahmadi, M., & Kalhori, S. R. N. (2020). Predicting COVID-19 incidence through analysis of google trends data in iran: data mining and deep learning pilot study. JMIR public health and surveillance, 6(2), e18828. https://doi.org/10.2196/18828

Bakker, K. M., Martinez-Bakker, M. E., Helm, B., & Stevenson, T. J. (2016). Digital epidemiology reveals global childhood disease seasonality and the effects of immunization. Proceedings of the National Academy of Sciences, 113(24), 6689-6694. https://doi.org/10.1073/pnas.1523941113

Brasil, & Brasil. (2021). Conselho Nacional dos Secretários de Saúde (CONASS). Atenção Primária e promoção da Saúde.

Bregman, J. I. (1999). Environmental impact statements. CRC Press.

Buheji, M., da Costa Cunha, K., Beka, G., Mavric, B., De Souza, Y. L., da Costa Silva, S. S., ... & Yein, T. C. (2020). The extent of covid-19 pandemic socio-economic impact on global poverty. a global integrative multidisciplinary review. American Journal of Economics, 10(4), 213-224. https://doi.org/10.5923/j.economics.20201004.02

Draper, N. R., & Smith, H. (1998). Applied regression analysis (Vol. 326). John Wiley & Sons.

Eysenbach, G. (2009). Infodemiology and infoveillance: framework for an emerging set of public health informatics methods to analyze search, communication and publication behavior on the Internet. Journal of medical Internet research, 11(1), e11. https://doi.org/10.2196/jmir.1157

Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., & Brilliant, L. (2009). Detecting influenza epidemics using search engine query data. Nature, 457(7232), 1012-1014. https://doi.org/10.1038/nature07634

Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2009). Análise multivariada de dados. Bookman editora.

Henson, R. K., Capraro, R. M., & Capraro, M. M. (2001). Reporting Practice and Use of Exploratory Factor Analysis in Educational Research Journals.

Instituto Brasileiro de Geografia, & Estatística. (2020). Censo demográfico 2020: características da população e dos domicílios: resultados do universo. Ministério de Planejamento, Orçamento e Gestão, Instituto Brasileiro de Geografia Estatística-IBGE.

Instituto Brasileiro de Geografia, & Estatística. Coordenação de Contas Nacionais. (2018). Produto interno bruto dos municípios. IBGE.

Junior, R. R. F., & Santa Rita, L. P. (2016). Impactos da Covid-19 na Economia: limites, desafios e políticas.Cadernos de Prospecção, vol. 13, n. 2, 2020. http://dx.doi.org/10.9771/rf.v1i7.37324

Kumar, A., Sinwar, D., & Saini, M. (2020). Study of several key parameters responsible for COVID-19 outbreak using multiple regression analysis and multi-layer feed forward neural network. Journal of Interdisciplinary Mathematics, 1-23. https://doi.org/10.1080/09720502.2020.1833443

Kurian, S. J., Alvi, M. A., Ting, H. H., Storlie, C., Wilson, P. M., Shah, N. D., ... & Bydon, M. (2020, November). Correlations Between COVID-19 Cases and Google Trends Data in the United States: A State-by-State Analysis. In Mayo Clinic Proceedings (Vol. 95, No. 11, pp. 2370-2381). Elsevier. https://doi.org/10.1016/j.mayocp.2020.08.022

Lakatos, E. M., & Marconi, M. D. A. (1996). Técnicas de pesquisa. São Paulo: Atlas, 205, 88.

Lin, S., Fu, Y., Jia, X., Ding, S., Wu, Y., & Huang, Z. (2020). Discovering Correlations between the COVID-19 Epidemic Spread and Climate. International Journal of Environmental Research and Public Health, 17(21), 7958. https://doi.org/10.3390/ijerph17217958

Liu, D., Clemente, L., Poirier, C., Ding, X., Chinazzi, M., Davis, J. T., ... & Santillana, M. (2020). A machine learning methodology for real-time forecasting of the 2019-2020 COVID-19 outbreak using Internet searches, news alerts, and estimates from mechanistic models. arXiv preprint arXiv:2004.04019.

Mavragani, A., & Gkillas, K. (2020). COVID-19 predictability in the United States using Google Trends time series. Scientific reports, 10(1), 1-12. https://doi.org/10.1038/s41598-020-77275-9

McKibbin, W., & Fernando, R. (2021). The global macroeconomic impacts of COVID-19: Seven scenarios. Asian Economic Papers, 20(2), 1-30. https://doi.org/10.1162/asep_a_00796

Rabajante, J. F. (2020). Insights from early mathematical models of 2019-nCoV acute respiratory disease (COVID-19) dynamics. arXiv preprint arXiv:2002.05296.

Razali, N. M., & Wah, Y. B. (2011). Power comparisons of shapiro-wilk, kolmogorov-smirnov, lilliefors and anderson-darling tests. Journal of statistical modeling and analytics, 2(1), 21-33.

Siettos, C. I., & Russo, L. (2013). Mathematical modeling of infectious disease dynamics. Virulence, 4(4), 295-306. https://doi.org/10.4161/viru.24041

Teng, Y., Bi, D., Xie, G., Jin, Y., Huang, Y., Lin, B., ... & Tong, Y. (2017). Dynamic forecasting of Zika epidemics using Google Trends. PloS one, 12(1), e0165085. https://doi.org/10.1371/journal.pone.0165085

Tizzoni, M., Bajardi, P., Poletto, C., Ramasco, J. J., Balcan, D., Gonçalves, B., ... & Vespignani, A. (2012). Real-time numerical forecast of global epidemic spreading: case study of 2009 A/H1N1pdm. BMC medicine, 10(1), 1-31. https://doi.org/10.1186/1741-7015-10-165

WHO. Statement on the second meeting of the international health regulations (2005) emergency committee regarding the outbreak of novel coronavirus (2019-ncov). URL https://www.who.int/news-room/detail/. [Online; accessed 9-March2021].

Downloads

Publicado

16.02.2022

Como Citar

Furletti, L. A., De Carvalho, Ítalo L., Da Silva, H. B., & Peixoto, L. de C. (2022). Aplicação de regressão linear múltipla para analisar a relação entre buscas por palavras-chave na internet e casos de COVID-19 no Brasil. Exacta, 21(4), 892–904. https://doi.org/10.5585/exactaep.2022.20401

Edição

Seção

Artigos