Anotação Semântica Automática do Currículo Lattes Utilizando Linked Open Data

WALISON DIAS DA SILVA

Resumo


A Internet possui inúmeros tipos de documentos e é uma influente fonte de informação.
O conteúdo Web é projetado para os seres humanos interpretarem e não para as máquinas.
Os sistemas de busca tradicionais são imprecisos na recuperação de informações. O
governo utiliza e disponibiliza documentos na Web para que os cidadãos e seus próprios
setores organizacionais os utilizem, porém carece de ferramentas que apoiem na tarefa da
recuperação desses documentos. Como exemplo, podemos citar a Plataforma de Currículos
Lattes administrada pelo Cnpq.
A Web semântica possui a finalidade de otimizar a recuperação dos documentos, onde
esses recebem significados, permitindo que tanto as pessoas quanto as máquinas possam
compreender o significado de uma informação. A falta de semântica em nossos documentos,
resultam em pesquisas ineficazes, com informações divergentes e ambíguas. A
anotação semântica é o caminho para promover a semântica em documentos.
O objetivo da dissertação é montar um arcabouço com os conceitos da Web Semântica
que possibilite anotar automaticamente o Currículo Lattes por meio de bases de dados
abertas (Linked Open Data), as quais armazenam o significado de termos e expressões.
O problema da pesquisa está baseado em saber quais são os conceitos associados à Web
Semântica que podem contribuir para a Anotação Semântica Automática do Currículo
Lattes utilizando o Linked Open Data (LOD)?
Na Revisão Sistemática da Literatura foi apresentado conceitos (anotação manual, automática,
semi-automática, anotação intrusiva...), ferramentas (Extrator de Entidade...)
e tecnologias (RDF, RDFa, SPARQL..) relativas ao tema. A aplicação desses conceitos
oportunizou a criação do Sistema Lattes Web Semântico. O sistema possibilita a importação
do currículo XML da Plataforma Lattes, efetua a anotação automática dos dados
disponibilizados utilizando as bases de dados abertas e possibilita efetuar consultas semânticas.
A validação do sistema é realizada com a apresentação de currículos anotados e a realização
de consultas utilizando dados externos pertencentes ao LOD. Por fim é apresentado as
conclusões, dificuldades encontradas e proposta de trabalhos futuros.


Texto completo:

PDF

Referências


1, W. S. Sparql 1.1 overview. In: . [s.n.], 2013. Disponível em:

.

BELLOZE, K. T. et al. An evaluation of annotation tools for biomedical texts.

In: CITESEER. ONTOBRAS-MOST. 2012. p. 108–119. Disponível em:

//ceur-ws.org/Vol-938/ontobras-most2012_paper9.pdf>.

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web:a new form

of web content that is meaningful to computers will unleash a revolution of new

possibilities. Scientific American, v. 284, n. 5, p. 34–43, may 2001. Disponível em:

//www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21>.

BIZER TOM HEATH, T. B. C. Linked data - the story so far. Int. J. Semantic Web

Inf. Syst., v. 5, n. 3, p. 1–22, 2009. Disponível em:

>.

BONIFACIO, A. S. Ontologias e consulta semântica : uma aplicação ao caso

Lattes. Dissertação (Mestrado) — UFRGS, Porto Alegre, 2002. Disponível em:

.

BRASIL, W. Web semântica. In: . [s.n.], 2014. Disponível em:

Padroes/WebSemantica>.

BUTUC, M.-G. Semantically enriching content using opencalais. In: . [s.n.], 2009.

Disponível em:

publication_detail>.

CASARIN, H. d. C. S.; CASARIN, S. J. C. Pesquisa Científica: da teoria à prática. [S.l.:

s.n.], 2011.

CASTAñO, A. C. Populando ontologias através de informações em HTML - o caso do

currículo lattes. Dissertação (Mestrado) — Universidade de São Paulo, 2008. Disponível

em: .

CERVO, A.; BERVIAN, P.; SILVA, R. da. Metodologia científica. Pearson Prentice Hall,

ISBN 9788576050476. Disponível em:

SK2GQAACAAJ>.

CNPQ. Plataforma lattes cnpq. In: . [s.n.], 2014. Disponível em:

>.

DERCZYNSKI DIANA MAYNARD, G. R. M. v. E. G. G. R. T. J. P. K. B. L.

Analysis of named entity recognition and linking for tweets. Information Processing and

Management: www.elsevier.com/locate/infoproman, n. 17, p. 32–49, 2014. Disponível em:

.

ELLER, M. P. Anotações Semânticas de Fontes de Dados Heterogêneas Um Estudo

de Caso com a Ferramenta Smore. Dissertação (Mestrado) — Universidade Federal de Santa Catarian – Departamento de Informática e Estatística, 2008. Disponível em:

.

FAFALIOS, P.; PAPADAKOS, P. Theophrastus: On demand and real-time automatic

annotation and exploration of (web) documents using open linked data. Web

Semantics: Science, Services and Agents on the World Wide Web, n. 0, p. –, 2014.

ISSN 1570-8268. Disponível em:

S1570826814000572>.

FONTES, C. A.; CAVALCANTI, M.; MOURA, A. D. C. An ontology based

reasoning approach for document annotation. p. 160–167, Sept 2013. Disponível em:

.

FONTES, C. A.; MOURA, A. M. de C.; CAVALCANTI, M. C. Anotacao semantica em

documentos. In: . [s.n.], 2010. Disponível em:

wtdbd/2010/sbbd_wtd_14.pdf>.

FONTES, C. A. et al. Recuperação de informações em documentos anotados

semanticamente na Área de gestão ambiental. p. 43–52, 2010. Disponível em:

.

GALEGO, E. F. Extração e consulta de informações do currículo lattes baseada em

ontologias. 2013. Disponível em:

pdf>.

GIL, A. C. Como elaborar projetos de pesquisa. [S.l.: s.n.], 2002.

GOV, W. D. A. Dados abertos governamentais. In: . [s.n.], 2014. Disponível em:

.

GROUP, W. O. A. C. Open annotation data model. In: . [s.n.], 2013. Disponível em:

Annotation%20Data%20Model%20Primer.html,http://www.openannotation.org/

spec/core/20130208/index.html>.

MASCARENHAS, S. METODOLOGIA CIENTIFICA. PEARSON BRASIL.

ISBN 9788564574595. Disponível em:

kOZBLgEACAAJ>.

MENDES, P. N. et al. Dbpedia spotlight: Shedding light on the web of documents.

ACM, New York, NY, USA, p. 1–8, 2011. Disponível em:

2063519>.

MUNARO, B.; LIMA, M. L.; CAMPOS, M. Recomendação de dados abertos para

solucionar os problemas de comunicação textual : uma análise de métodos para extração

de entidades nomeadas. 2012. Disponível em:

anais_csbc/eventos/brasnam/artigos/BRASNAM%20-%20Recomendacao%20de%

dados%20abertos%20para%20solucionar%20os%20problemas%20de%20comunica%

C3%A7%C3%A3o%20textual%20uma%20analise%20de%20metodos%20para%

extracao%20de%20entidades%20nomeadas.pdf>.

NETO, G. M. d. S. Anotacao Semantica De Recursos Web Baseada em Ontologias.

Dissertação (Mestrado) — Dissertação de Mestrado–UFAM–INSTITUTO DE

CIÊNCIAS EXATAS–PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA,

Disponível em:

do?select_action=&co_obra=148061>.

ONTOTEXT. Graphdb ontotext. In: . [s.n.], 2015. Disponível em:

com/products/graphdb/>.

OREN, E. et al. What are semantic annotations. In: . [S.l.]: Citeseer, 2006.

OWL1, W. Owl web ontology language. In: . [s.n.], 2014. Disponível em:

//www.w3.org/TR/owl-features/>.

OWL2, W. Owl2 - web ontology language 2. In: . [s.n.], 2015. Disponível em:

.

PLANETDATA. Linked open data cloud diagram 2014. In: . [s.n.], 2014. Disponível em:

.

PRIMER, W. R. Rdfa 1.1 primer - second edition. In: . [s.n.], 2014. Disponível em:

.

REEVE, L.; HAN, H. Survey of semantic annotation platforms. In: Proceedings

of the 2005 ACM Symposium on Applied Computing. New York, NY, USA:

ACM, 2005. (SAC ’05), p. 1634–1638. ISBN 1-58113-964-0. Disponível em:

.

SALEH, L. M. B.; AL-KHALIFA, H. S. Aratation: An arabic semantic annotation

tool. ACM, New York, NY, USA, p. 447–451, 2009. Disponível em:

//doi.acm.org/10.1145/1806338.1806421>.

SCHEMA1.1, W. Rdf schema 1.1. In: . [s.n.], 2014. Disponível em:

//www.w3.org/TR/2014/REC-rdf-schema-20140225/>.

TAO, C. et al. Semantator: Semantic annotator for converting biomedical text to linked

data. Journal of Biomedical Informatics, v. 46, n. 5, p. 882–893, 2013. Disponível em:

.

TEXTRAZOR. Textrazor. In: . [s.n.], 2015. Disponível em:

com/>.

VIRGILIO, R. D. et al. A reverse engineering approach for automatic annotation of

web pages. Multimedia Tools and Applications, v. 64, n. 1, p. 119–140, may 2013. ISSN

-7501, 1573-7721. 00001. Disponível em:

s11042-011-0852-8>.

W3C-RDF1.1-PRIMER. Rdf 1.1 primer. In: . [s.n.], 2014. Disponível em:

//www.w3.org/TR/2014/NOTE-rdf11-primer-20140225/>.

WEB, C. de Estudos sobre T. Centro web brasil. In: . [s.n.], 2016. Disponível em:

.

ZHANG, Z.; CHEN, S.; FENG, Z. Semantic annotation for web services based

on DBpedia. p. 280–285, 2013. Disponível em:

articleDetails.jsp?reload=true&arnumber=6525532>.


Apontamentos

  • Não há apontamentos.




Projetos, Dissertações e Teses em Sistemas de Informação e Gestão do Conhecimento
ISSN 2358-5501 (Online)