Modelos de machine learning para predição do sucesso de startups

Autores

DOI:

https://doi.org/10.5585/gep.v12i2.18942

Palavras-chave:

Predição do sucesso de startups, Machine learning, Investimento em startups, Plataforma crunchbase.

Resumo

Este estudo analisa resultados obtidos com modelos de machine learning para predição do sucesso de startups. Como proxy de sucesso considera-se a perspectiva do investidor, na qual a aquisição da startup ou realização de IPO (Initial Public Offering) são formas de recuperação do investimento. A revisão da literatura aborda startups e veículos de financiamento, estudos anteriores sobre predição do sucesso de startups via modelos de machine learning, e trade-offs entre técnicas de machine learning. Na parte empírica, foi realizada uma pesquisa quantitativa baseada em dados secundários oriundos da plataforma americana Crunchbase, com startups de 171 países. O design de pesquisa estabeleceu como filtro startups fundadas entre junho/2010 e junho/2015, e uma janela de predição entre junho/2015 e junho/2020 para prever o sucesso das startups. A amostra utilizada, após etapa de pré-processamento dos dados, foi de 18.571 startups. Foram utilizados seis modelos de classificação binária para a predição: Regressão Logística, Decision Tree, Random Forest, Extreme Gradiente Boosting, Support Vector Machine e Rede Neural. Ao final, os modelos Random Forest e Extreme Gradient Boosting apresentaram os melhores desempenhos na tarefa de classificação. Este artigo, envolvendo machine learning e startups, contribui para áreas de pesquisa híbridas ao mesclar os campos da Administração e Ciência de Dados. Além disso, contribui para investidores com uma ferramenta de mapeamento inicial de startups na busca de targets com maior probabilidade de sucesso.

 

 

 

Biografia do Autor

Fabiano Rodrigues, ESPM

Doutor em Administração de Empresas pela FEA-USP (2010), Mestre em Engenharia de Produção pela POLI-USP (2004) e Engenheiro de Produção pela POLI-USP (1996). Head do Centro de Gestão e Transformação de Negócios ESPM ADM: http://hubtransformacao.espm.br. Supervisor de Projetos Integrados do curso de Administração da ESPM. Durante 6 anos foi chefe de departamento na ESPM nas áreas de Gestão, Operações, Finanças e Métodos Quantitativos. Docente na graduação da ESPM, professor colaborador no Programa de Pós Graduação em Administração da ESPM (PPGA ESPM) e professor convidado na pós-graduação da FIA-USP. Pesquisador do Núcleo Decide da FEA-USP, grupo de pesquisa sobre Teoria e Análise de Decisão. Membro da Society for Decision Professionals e da Strategic Management Society. Formação complementar em Strategic Decisions and Risk Management, pelo programa de certificação profissional da Stanford University. 

Francisco Aparecido Rodrigues, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo

Francisco A. Rodrigues é professor associado de Sistemas Complexos e Ciência de Dados no Instituto de Matemática e Informática (ICMC) da Universidade de São Paulo. Ele também é editor da revista Chaos, Solitons & Fractals e editor associado do Journal of Physics: Complexity. De fevereiro de 2018 a fevereiro de 2019, Francisco foi professor visitante na Universidade de Warwick, Reino Unido, Instituto de Matemática, trabalhando no Centro de Ciências da Complexidade. Ele foi agraciado com uma cátedra de Professor Visitante da Fundação Leverhulme (Reino Unido). Francisco é formado em Física (2001, B.A.) e mestrado em Física Computacional (2004), ambos pela Universidade de São Paulo. Em 2007, obteve seu doutorado em Física pelo Instituto de Física de São Carlos (Universidade de São Paulo). Francisco é bolsista nível 1D do Conselho Nacional de Pesquisa do Brasil (CNPq) desde 2011. Ele coordenou vários projetos de pesquisa (incluindo alguns projetos internacionais). Durante os últimos anos, ele tem trabalhado em vários problemas relacionados à estrutura e dinâmica de sistemas complexos, tais como o desenvolvimento de conceitos e métodos para caracterização de redes complexas, o estudo da epidemia e a disseminação de rumores em redes sociais e tecnológicas, a modelagem de sincronização de osciladores acoplados e o desenvolvimento de novos métodos para reconhecimento de padrões e mineração de dados. Francisco é autor de mais de 100 artigos científicos em revistas internacionais que já receberam mais de 6.100 citações. Ele também é autor do livro "An Introduction to Multiplex Networks: Basic Formalism and Structural Properties", publicado pela Springer em 2018.

Thelma Valéria Rocha Rodrigues, ESPM

É Professora do Programa de Pós-Graduação em Administração - PPGA da ESPM, tendo completado em 2020, 19 anos de ESPM, com 18 orientações de Mestrado concluídas e 2 orientações de Doutorado nas áreas de Marketing e Comportamento do Consumidor. É doutora em Administração com ênfase em Marketing pela FEA-USP. Mestre em Administração Mercadológica pela EAESP/ FGV com especialização em International Business pela Stockholm School of Economics (SSE) Suécia. Graduada em Administração pela FEA/USP e Graduada em Engenharia de Produção pela FEI. Tem mais de 50 publicações em diversos Journals, com destaque para Advanced in International Marketing v. 25 e v. 26, The Review of Business Management - RBGN, RAUSP Management Journal, REMARK, Internext, entre outras. Foi Coordenadora do Programa da ESPM entre 2012 a 2015, quando o curso teve sua primeira avaliação trienal, com nota 4, e obteve seu pedido de Doutorado aprovado. Atualmente faz uma formação em Terapia Artística de base Antroposófica na Associação Aurora em São Paulo. Pesquisa o tema International Franchising, International Marketing Strategy e Relationship Marketing. Teve funções executivas na área de Marketing por 12 anos nas empresas Credicard SA, Mapfre, MyWeb e CPM onde foi Gerente de Marketing. Autora de livros como: Gestão dos Stakeholders com Andrea Goldschmidt; A Hora da Recompensa, com André Veloso; e a Coleção Marketing com 4 volumes, pela Editora Saraiva. Autora também da coleção Internacionalização das Franquias Brasileiras, publicada a cada dois anos, desde 2010, vol. 5 em 2018, disponíveis em https://pesquisa.espm.br/administracao/livros-e-e-books/ em parceria com a ABF

Referências

Arroyo, J., Corea, F., Jimenez-Diaz, G., & Recio-Garcia, J. A. (2019). Assessment of machine learning performance for decision support in venture capital investments. IEEE Access, 7, 124233–124243. https://doi.org/10.1109/ACCESS.2019.2938659

Basole, R. C., Park, H., & Chao, R. O. (2019). Visual Analysis of Venture Similarity in Entrepreneurial Ecosystems. IEEE Transactions on Engineering Management, 66(4), 568–582. https://doi.org/10.1109/TEM.2018.2855435

Bento, F. R. S. R. (2017). Predicting Start-up Success with Machine Learning. Master Program in Information Management. Instituto Superior de Estatística e Gestão da Informação. Universidade Nova de Lisboa. Recuperado de: https://run.unl.pt/bitstream/10362/33785/1/TGI0132.pdf. Acesso em 14/mai/2020.

Blank, S. (2013). The Four Steps to the Epiphany: successful strategies for products that win. Pescadero: K&S Ranch Press.

CB Insights. (2020). The Complete List of Unicorn Companies. Recuperado de: https://www.cbinsights.com/research-unicorn-companies. Acesso em 10/dez/2020.

Cremades, A. (2016). The Art of Startup Fundraising: pitching investors, negotiating the deal, and everything else entrepreneurs need to know. Hoboken: John Wiley & Sons.

Crunchbase. Crunchbase Platform. Disponível em: https://www.Crunchbase.com/. Acesso em: 12 mar. 2020.

Dalle, J.-M., Den Besten, M. & Menon, C. (2017). Using Crunchbase for economic and managerial research. OECD Science, Technology and Industry Working Papers. Recuperado de: https://pdfs.semanticscholar.org/aa83/4b1ddd1d6c96bde1c6e526be6bb2a99ad011.pdf. Acesso em 07/jun/2020.

Ertel, W. (2017). Introduction to Artificial Intelligence. 2nd ed. London: Springer.

Facelli, K., Lorena, A. C., Gama, J., & de Carvalho, A. C, P. L. F. (2019). Inteligência Artificial: uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC.

Gastaud, C., Carniel, T., & Dalle, J.-M. (2019). The varying importance of extrinsic factors in the success of startup fundraising: competition at early-stage and networks at growth-stage. arXiv preprint arXiv:1906.03210. Recuperado de: https://arxiv.org/abs/1906.03210. Acesso em 03/jun/2020.

Gereto, M. A. S. (2019). Caracterização dos ciclos de investimentos de venture capital em startups brasileiras em termos de rodadas de investimento e estratégias de desinvestimento a partir de dados da Crunchbase. Dissertação de mestrado em administração. FGV - Faculdade Getúlio Vargas, 2019. Recuperado de; http://bibliotecadigital.fgv.br/dspace;/handle/10438/27468. Acesso em 01/jun/2020.

Hsieh, K.-H., & Li, E. Y. (2017). Progress of Fintech industry from venture capital point of view. In: Proceedings of The 17th International Conference on Electronic Business. ICEB, Dubai, p. 297-301. Recuperado de: http://iceb.johogo.com/proceedings/2017/ICEB_2017_paper_36-WIP.pdf. Acesso em 3/jun/2020.

Kemeny, T., Nathan, M., & Almeer, B. (2017). Using Crunchbase to explore innovative ecosystems in the US and UK. Birmingham Business School Discussion Paper Series. Recuperado de: http://epapers.bham.ac.uk/3051/1/bbs-dp-2017-01-nathan.pdf. Acesso em 01/abr/2020.

Kosterich, A., & Weber, M. S. (2018). Starting up the News: The Impact of Venture Capital on the Digital News Media Ecosystem. International Journal on Media Management, 20(4), 239–262. https://doi.org/10.1080/14241277.2018.1563547

Kubat, M. (2017). An Introduction to Machine Learning. 2nd ed. Suiça: Springler.

Liang, E., & Daphne Yuan, S.-T. (2013). Investors Are Social Animals: Predicting Investor Behavior using Social Network Features via Supervised Learning Approach. In: Proceedings of the Workshop on Mining and Learning with Graphs (MLG-2013), Chicago. Recuperado de: http://chbrown.github.io/kdd-2013-usb/workshops/MLG/doc/liang-mlg13.pdf. Acesso em 03/jun/2020.

Losada, B. (2020). Finanças para Startups: o essencial para empreender, liderar e investir em startups. São Paulo: Editora Saint Paul.

National. Small Business Failure Rate. Recuperado de: https://www.national.biz/2019-small-business-failure-rate-startup-statistics-industry/. Acesso em 06/abr/2020.

Nylund, P. A., & Cohen, B. (2017). Collision density: driving growth in urban entrepreneurial ecosystems. International Entrepreneurship and Management Journal, 13(3), 757–776. https://doi.org/10.1007/s11365-016-0424-5

Pan, C., Gao, Y., & Luo, Y. (2018). Machine Learning Prediction of Companies ‘Business Success. CS229: Machine Learning, Stanford University. Recuperado de: http://cs229.stanford.edu/proj2018/report/88.pdf. Acesso em 25/mar/2020.

Porter, M. E. (2005). Estratégia Competitiva. Rio de Janeiro: Campus.

Profitfromtech (2020). The Ultimate List of Startup Statistics for 2020. Recuperado de: https://www.profitfromtech.com/startup-statistics/. Acesso em 01/out/2020.

Ries, E. (2012). A Startup Enxuta. 1ª ed. São Paulo: Leya.

Shan, Z., Cao, H., & Lin, Q. (2014). Capital Crunch: Predicting Investments in Tech Companies. CS221 Project: Crunchbase Investment Prediction. Training, 5831(32462), 32462. Recuperado de: http://www.zifeishan.org/files/capital-crunch.pdf. Acesso em 12/jun/2020.

Skiena, S. S. (2017). The Data Science Design Manual. Suiça: Springer.

Downloads

Publicado

2021-06-15

Como Citar

Rodrigues, F., Rodrigues, F. A., & Rocha Rodrigues, T. V. (2021). Modelos de machine learning para predição do sucesso de startups. Revista De Gestão E Projetos, 12(2), 28–55. https://doi.org/10.5585/gep.v12i2.18942

Edição

Seção

Artigos