PREDIÇÃO DE LINKS EM REDES SOCIAIS ACADÊMICAS: uma análise da influência das características da rede na precisão dos algoritmos baseados na topologia

THIAGO CHIERICI CUNHA

Resumo


A predição de links em redes sociais tem sido objeto de estudo de crescente número de artigos científicos e comerciais, devido à grande oferta de bases de dados com representações das relações entre pessoas e também devido à facilidade de acesso a recursos computacionais para análise dessas redes. Prever conexões em redes sociais acadêmicas contribui para o crescimento científico, facilitando a colaboração entre pesquisadores com potencial de contribuição mútua. Este trabalho buscou identificar as características das redes que impactam na eficácia da predição de links feita por algoritmos baseados na topologia. Grandes bases de coautoria foram segmentadas e mapeadas para permitir a escolha de conjuntos similares, que variassem apenas pela característica avaliada. De acordo com as análises, os melhores resultados foram obtidos com o uso de redes de coautoria grandes, com baixa densidade e grande diâmetro, formadas por autores das ciências humanas. O uso de diferentes tipos de coautorias como as de eventos, orientações, livros, jornais, revistas e produções técnicas também levou a maior eficácia. Em relação ao período de tempo utilizado, os melhores resultados foram obtidos com o período presente de dois anos e o período futuro de um trimestre. As análises efetuadas neste trabalho ajudarão a compreender melhor a dinâmica das redes sociais acadêmicas e também contribuirão para a escolha dos melhores algoritmos de predição de link para cada tipo de rede social. A definição de critérios para a escolha de conjuntos que favoreçam a comparação de resultados entre diferentes pesquisas e algoritmos é outra contribuição relevante.

Texto completo:

PDF

Referências


ADAMIC, Lada A.; ADAR, Eytan. Friends and neighbors on the web. Social networks, [S.l.], v. 25, n. 3, p. 211-230, July 2003. AGGARWAL, Charu C. Social Network Data Analytics. [S.l.]: Springer Science & Business Media, 2011.

ALVES, Alexandre D.; YANASSE, Horacio H.; SOMA, Nei Y. LattesMiner: a multilingual DSL for information extraction from lattes platform. In: SPLASH WORKSHOPS, 12., 2011, [S.l.]. Proceedings... New York: ACM, 2011. p. 85-92.

ARAÚJO, Eduardo Barbosa. Scientific Collaboration Networks from Lattes Database: Topology, Dynamics and Gender Statistics. 2016. 88 f. Tese (Doutorado em Física) – Departamento de Física, Centro de Ciências, Universidade Federal do Ceará, Fortaleza.

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 6023: informação e documentação: referências: elaboração. Rio de Janeiro, 2002.

BALANCIERI, Renato et al. A análise de redes de colaboração científica sob as novas tecnologias de informação e comunicação: um estudo na Plataforma Lattes. Ciência da Informação, [Brasília], v. 34, n. 1, p. 64-77, out. 2005. BARABÁSI, Albert-Laszlo et al. Evolution of the social network of scientific collaborations. Physica A: Statistical mechanics and its applications, [S.l.], v. 311, n. 3, p. 590-614, Aug. 2002. BOYD, Danah M. Friendster and publicly articulated social networking. In: CONFERENCE ON HUMAN FACTORS AND COMPUTING SYSTEMS (CHI), 2004, Vienna. Proceedings... Vienna: ACM, April 24-29, 2004. p. 1279-1282.

BRANDÃO, Michele A.; MORO, Mirella M. Recomendação de colaboração em redes sociais acadêmicas baseada na afiliação dos pesquisadores. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 27., 2012, São Paulo. Anais... Porto Alegre: SBC, 15 a 18 out. 2012. p. 73-80.

BRANDÃO, Wladmir Cardoso; PARREIRAS, Fernando Silva; SILVA, Antonio Braz de Oliveira. Redes em Ciência da Informação: evidências comportamentais dos pesquisadores e tendências evolutivas das redes de coautoria. Informação & Informação, [S.l.], v. 12, n. 1 esp., p. 110-124, dez. 2007.

CANNISTRACI, Carlo Vittorio; ALANIS-LOBATO, Gregorio; RAVASI, Timothy. From Link-Prediction in Brain Connectomes and Protein Interactomes to the Local-Community-Paradigm in Complex Networks, Scientif Reports, [S.l.], v. 3, p. 1613, 2013.

CGEE. Mestres e doutores 2015: estudos da demografia da base técnico-científica brasileira. Brasília: CGEE. 2016. Disponível em: . Acesso em: 9 maio 2017.

CLAUSET, Aaron; MOORE, Cristopher; NEWMAN, Mark EJ. Hierarchical structure and the prediction of missing links in networks. Nature, v. 453, n. 7191, p. 98-101, 2008.

CNPQ. Painel Lattes. Disponível em:. Acesso em: 22 mar. 2016.

CONTINUUM. Anaconda. Disponível em: . Acesso em: 23 mar. 2016.

DBLP. Computer Science Bibliography. Disponível em: . Acesso em: 23 mar. 2016.

DIEZ, David M.; BARR, Christopher D.; CETINKAYA-RUNDEL, Mine. OpenIntro statistics. 2nd ed. [S.l.]: CreateSpace, 2012. DIGIAMPIETRI, L. A.; LINDEN, R.; BARBOSA, L. F. Desambiguação de nomes em redes sociais acadêmicas: Um estudo de caso usando DBLP. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 4., 2015, Recife. Anais... Porto Alegre: SBC, 2015.

DIGIAMPIETRI, Luciano A. et al. Dinâmica das relações de coautoria nos programas de pós-graduação em computação no Brasil. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 1., 2012, Curitiba. Anais... Porto Alegre: SBC, 2012a. DIGIAMPIETRI, Luciano A. et al. Minerando e caracterizando dados de currículos lattes. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 1., 2012, Curitiba. Anais... Porto Alegre: SBC, 2012b. DIGIAMPIETRI, Luciano A.; SANTIAGO, Caio R. N.; ALVES, Caio M. Predição de Coautorias em Redes Sociais Acadêmicas: Um Estudo Exploratório em Ciência da Computação. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 2., 2013, Maceió. Anais... Porto Alegre: SBC, 2013. p. 146-157. DIGIAMPIETRI, Luciano Antonio; SILVA, Ernando Eduardo da. A framework for social network of researchers analysis. Iberoamerican Journal of Applied Computing, [Ponta Grossa], v. 1, n. 1, p. 1-24, 2011. DIGIAMPIETRI, Luciano et al. Um sistema de predição de relacionamentos em redes sociais. In: BRAZILIAN SYMPOSIUM ON INFORMATION SYSTEMS, 11., 2015, Goiânia. Anais... Porto Alegre: SBC, 2015. DRIVER, Mark. Introducing the Gartner Programming Language Index for 2014. Gartner Blog Network, October 2, 2014. Disponível em: . Acesso em: 23 mar. 2016.

FENG, Xu; ZHAO, J. C.; XU, Ke. Link prediction in complex networks: a clustering perspective. The European Physical Journal B, [S.l.], v. 85, n. 1, p. 1-9, 2012. FRANÇA, Júnia Lessa; VASCONCELLOS, Ana Cristina de. Manual para normalização de publicações técnico-científicas. 9. ed. Belo Horizonte: Editora UFMG, 2013.

FREEMAN, Linton C. Some antecedents of social network analysis. Connections, [S.l.], v. 19, n. 1, p. 39-42, 1996.

GEHRKE, Johannes; GINSPARG, Paul; KLEINBERG, Jon. Overview of the 2003 KDD Cup. ACM SIGKDD Explorations Newsletter, [New York], v. 5, n. 2, p. 149-151, Dec. 2003. GETOOR, Lise; DIEHL, Christopher P. Link mining: a survey. ACM SIGKDD Explorations Newsletter, [New York], v. 7, n. 2, p. 3-12, Dec. 2005.

GIL, Antonio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.

GUO, Philip. Python Is Now the Most Popular Introductory Teaching Language at Top U.S. Universities. Communications of ACM, July 7, 2014. Disponível em: . Acesso em: 23 mar. 2016. GUPTA, Naveen; SINGH, Anurag. A Novel Strategy for Link Prediction in Social Networks. In: CONEXT ON STUDENT WORKSHOP, 10., 2014, Sidney. Proceedings... New York: ACM, 2014. p. 12-14.

HERSKOWITZ, Nicole. Microsoft – the only vendor named a leader in Gartner Magic Quadrants for IaaS, Application PaaS, and Cloud Storage. Blog Microsoft Azure. Disponível em: . Acesso em: 23 mar. 2016. HUANG, Shiping et al. Link prediction based on time-varied weight in co-authorship network. In: COMPUTES SUPPORTED COOPERATIVE WORK IN DESIGN (CSCWD). 18., 2014, Hsinchu. Proceedings... [S.l.]: IEEE, 2014. p. 706-709. INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING, 9., 2016. San Francisco. Proceedings… New York: ACM, 2016. JEONG, Hawoong; NÉDA, Zoltan; BARABÁSI, Albert-László. Measuring preferential attachment in evolving networks. EPL, [S.l.], v. 61, n. 4, p. 567, Feb. 2003. KAISER, Marcus. Mean clustering coefficients: the role of isolated nodes and leafs on clustering measures for small-world networks. New Journal of Physics, [S.l.], v. 10, n. 8, Aug. 2008.

LANE, Julia. Let's make science metrics more scientific. Nature, [S.l.], v. 464, n. 7288, p. 488-489, Mar. 2010. LEE, Dave. Facebook has a billion users in a single day, says Mark Zuckerberg. BBC News, [S.l.], 28 Aug. 2015. Disponível em: . Acesso em: 23 mar. 2016.

LEY, Michael. DBLP: Some Lessons Learned. Proceedings of the VLDB Endowment, v. 2, i. 2, p. 1493-1500, Aug. 2009.

LIBEN-NOWELL, David; KLEINBERG, Jon. The link‐prediction problem for social networks. Journal of the American society for information science and technology, [S.l.], v. 58, n. 7, p. 1019-1031, 2007.

LICHTNWALTER, Ryan; CHAWLA, Nitesh V. Link prediction: fair and effective evaluation. In: ADVANCES IN SOCIAL NETWORKS ANALYSIS AND MINING (ASONAM). 4., 2012, Istanbul. Proceedings... [S.l.]: IEEE, 2012. p. 376-383.

LIU, Xiaoming; JOHAN BOLLEN, Michael L. Nelson; VAN DE SOMPEL, Herbert. Co-Authorship Networks in the Digital Library Research Community. Information Processing & Management, v. 41, n. 6, p. 1462-1480, 2005. LÜ, Linyuan; ZHOU, Tao. Link prediction in complex networks: A survey. Physica A: Statistical Mechanics and its Applications, [S.l.], v. 390, n. 6, p. 1150-1170, Mar. 2011.

MENA-CHALCO, Jesús P.; DIGIAMPIETRI, Luciano A.; CESAR-JR., Roberto M. Caracterizando as Redes de Coautoria de Currículos Lattes. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING (BraSNAM), 4., 2012, Recife. Anais… Recife: [s.n.], 21 a 22 jul. 2012. p. 1-12.

MENA-CHALCO, Jesús Pascual; CESAR JUNIOR, Roberto Marcondes. ScriptLattes: an open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, [Campinas], v. 15, n. 4, p. 31-39, Dec. 2009.

MICROSOFT. Microsoft Academic Graph. Disponível em: . Acesso em: 23 mar. 2016. MILOJEVIĆ, Staša. Accuracy of simple, initials-based methods for author name disambiguation. Journal of Informetrics, [S.l.], v. 7, n. 4, p. 767-773, Oct. 2013. NETWORKX. Overview. Disponível em: . Acesso em: 23 mar. 2016. NEWMAN, Mark EJ. Clustering and preferential attachment in growing networks. Physical Review E, [S.l.], v. 64, n. 2, p. 025102, Aug. 2001. NEWMAN, Mark EJ. Networks: an introduction. Oxford University Press, 2010. NEWMAN, Mark EJ; PARK, Juyong. Why social networks are different from other types of networks. Physical Review E, v. 68, n. 3, p. 036122, 2003. PEREZ-CERVANTES, Evelyn et al. Using link prediction to estimate the collaborative influence of researchers. In: INTERNATIONAL CONFERENCE ON ESCIENCE, 9., 2013, Beijing. Proceedings… [S.l.]: IEEE, 2013. p. 293-300.

RIBAS, Sabir et al. Simplified Relative Citation Ratio for Static Paper Ranking: UFMG/LATIN at WSDM Cup 2016. In: ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING, 9., 2016, San Francisco. Proceedings… [S.l.]: [s.n.], 2016.

SCOTT, John. Social network analysis. 2nd ed. [S.l.]: Sage, 2000.

SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 9., 2003, Washington DC. Proceedings… New York: ACM, 2003.

SILVA, Antonio Braz de Oliveira et al. Estudo da rede de co-autoria e da interdisciplinaridade na produção científica com base nos métodos de análise de redes sociais: avaliação do caso do programa de pós-graduação em ciência da informação-PPGCI/UFMG. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 6., 2005, Florianópolis. Anais... [S.l.]: [s.n.], 2005.

SILVA, Antonio Braz de Oliveira et al. Redes de co-autoria dos professores da ciência da informação: um retrato da colaboração científica dessa disciplina no Brasil. In: ENANCIB, 7., 2006, Marília. Anais… [S.l.]: [s.n.], 2006. p. 441-452.

SINHA, Arnab; SHEN, Zhihong; SONG, Yang; MA, Hao; EIDE, Darrin; HSU, Bo-June (Paul); WANG, Kuansan. An Overview of Microsoft Academic Service (MAS) and Applications. In: INTERNATIONAL CONFERENCE ON WORLD WIDE WEB (WWW ’15 Companion), 24., 2015, New York. Proceedings... New York: ACM, 2015. p. 243-246.

STANFORD. Snap.py – SNAP for Python. Disponível em: . Acesso em: 23 mar. 2016.

STATTNER, Erick; VIDOT, Nicolas. Social Network Analysis in Epidemiology: Current Trends and Perspectives. In: INTERNATIONAL CONFERENCE IN RESEARCH CHALLENGES IN INFORMATION SCIENCE (RCIS), 5., 2011, Gosier (France). Proceedings.... [S.l.]: IEEE, 19 to 21 May 2011. p. 1-11.

TANG, Jie; ZHANG, Duo; YAO, Limin. Social network extraction of academic researchers. In: IEEE INTERNATIONAL CONFERENCE ON DATA MINING, 7., 2007, Omaha. Proceedings… [S.l.]: [s.n.], 2007. p. 292-301.

WANG, Chao; SATULURI, Venu; PARTHASARATHY, Srinivasan. Local probabilistic models for link prediction. In: IEEE INTERNATIONAL CONFERENCE ON DATA MINING, 7., 2007, Omaha. Proceedings… [S.l.]: [s.n.], 2007. p. 322-331.

WANG, Peng et al. Link prediction in social networks: the state-of-the-art. Science China Information Sciences, [Beijing], v. 58, n. 1, p. 1-38, Jan. 2015. WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridge: Cambridge University Press, 1994. WAZLAWICK, Raul. Metodologia de Pesquisa para Ciência da Computação. 2. ed. Rio de Janeiro: Elsevier, 2014.

YANG, Jaewon; LESKOVEC, Jure. Defining and Evaluating Network Communities based on Ground-truth. Knowledge and Information Systems, [S.l.], v. 42, n. 1, p. 181-213, Jan. 2015.


Apontamentos

  • Não há apontamentos.




Projetos, Dissertações e Teses em Sistemas de Informação e Gestão do Conhecimento
ISSN 2358-5501 (Online)