Classificação Contínua de Documentos com Vocabulários Temáticos Dinâmicos para a Desambiguação de Termos
Resumo
Obter resultados precisos que reflitam o desejo dos usuários é um dos maiores desafios dos Sistemas de Recuperação de Informações. Uma prévia classificação temática dos documentos permite uma desambiguação prévia dos termos e garante maior precisão na recuperação de documentos. No entanto, as técnicas tradicionais de classificação de documentos utilizam bases de conhecimento estáticas e universais, que não representam a dinâmica da evolução do conhecimento linguístico e, muito menos, a dependência espaço-temporal do sentido das palavras. Com base nisso, a proposta deste trabalho é apresentar uma técnica que considera esta dinâmica por meio de um Thesaurus sensível ao contexto.
Palavras-chave:
Classificação Contínua, Documentos com Vocabulários Temáticos Dinâmicos, Desambiguação
Referências
Agirre, E., Edmonds, P. (2007) “Word Sense Disambiguation: Algorithms and Applications”, Springer, New York, NY.
Cohen, W. W., Singer, Y. (1999) “Contextsensitive learning methods for text categorization”. ACM Trans. Inf. Syst., 17(2).
Gliozzo, A.; B. Magnini; C. Strapparava. (2004) “Unsupervised domain relevance estimation for word sense disambiguation”. In: Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing. EMNLP. Barcelona, Spain.
Mallery, J. C. (1988) "Thinking about foreign policy: Finding an appropriate role for artificial intelligence computers”. Ph.D. dissertation. MIT Political Science Department, Cambridge, MA
Navigli, R. (2009) “Word Sense Disambiguation: A Survey”. ACM Computing Surveys.
Nunes, J. O. (2009) “Comunicação, sociedade e novas tecnologias: bases de transformação para novas práticas de produção e recepção do jornalismo on-line”. In: Fuser, B.; Pernisa, C. (Org.). Comunicação e Tecnologias. 1. E-papers, Rio de Janeiro, v. 1, p. 115-125.
Russel, S. , Norvig, P. (2003) “Artificial Intelligence: A Moderrn Approach”. Prentice Hall,2th edition.
Salles, T., Rocha, L., Mourão, F., Pappa, G. L., Cunha, L., Gonçalves, M. A., Meira Jr, W. (2010) "Automatic Document Classification Temporally Robust". Journal of Information and Data Management, Vol. 1, No. 2, Pages 199–211.
Siemiński, A. (2011) “WordNet Based Word Sense Disambiguation”. ICCCI'11 Proceedings of the Third International Conference on Computational Collective Intelligence: Technologies and Applications.
Silva, W. J. da., Baptista, C. S. Schiel, U., Silva, E. R. da, Menezes, L. C. de. Fernandes, R. M. (2006) “Freebie: Uma Biblioteca Digital Baseada em Software Livre com Suporte a Buscas Textual e Espacial”. In: WebMedia 2006, Natal.
Tristão, A. M. D., Fachin, G. R. B., Alarcon, O. E. (2004) “Sistema de classificação facetada e tesauros: instrumentos para organização do conhecimento”. Ci. Inf., Brasília, v. 33, n. 2, p. 161-171.
Tsymbal, A. (2004) “The problem of concept drift: Definitions and related work”. Technical Report TCD-CS-2004-15, Computer Science Department, Trinity College, Dublin
Cohen, W. W., Singer, Y. (1999) “Contextsensitive learning methods for text categorization”. ACM Trans. Inf. Syst., 17(2).
Gliozzo, A.; B. Magnini; C. Strapparava. (2004) “Unsupervised domain relevance estimation for word sense disambiguation”. In: Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing. EMNLP. Barcelona, Spain.
Mallery, J. C. (1988) "Thinking about foreign policy: Finding an appropriate role for artificial intelligence computers”. Ph.D. dissertation. MIT Political Science Department, Cambridge, MA
Navigli, R. (2009) “Word Sense Disambiguation: A Survey”. ACM Computing Surveys.
Nunes, J. O. (2009) “Comunicação, sociedade e novas tecnologias: bases de transformação para novas práticas de produção e recepção do jornalismo on-line”. In: Fuser, B.; Pernisa, C. (Org.). Comunicação e Tecnologias. 1. E-papers, Rio de Janeiro, v. 1, p. 115-125.
Russel, S. , Norvig, P. (2003) “Artificial Intelligence: A Moderrn Approach”. Prentice Hall,2th edition.
Salles, T., Rocha, L., Mourão, F., Pappa, G. L., Cunha, L., Gonçalves, M. A., Meira Jr, W. (2010) "Automatic Document Classification Temporally Robust". Journal of Information and Data Management, Vol. 1, No. 2, Pages 199–211.
Siemiński, A. (2011) “WordNet Based Word Sense Disambiguation”. ICCCI'11 Proceedings of the Third International Conference on Computational Collective Intelligence: Technologies and Applications.
Silva, W. J. da., Baptista, C. S. Schiel, U., Silva, E. R. da, Menezes, L. C. de. Fernandes, R. M. (2006) “Freebie: Uma Biblioteca Digital Baseada em Software Livre com Suporte a Buscas Textual e Espacial”. In: WebMedia 2006, Natal.
Tristão, A. M. D., Fachin, G. R. B., Alarcon, O. E. (2004) “Sistema de classificação facetada e tesauros: instrumentos para organização do conhecimento”. Ci. Inf., Brasília, v. 33, n. 2, p. 161-171.
Tsymbal, A. (2004) “The problem of concept drift: Definitions and related work”. Technical Report TCD-CS-2004-15, Computer Science Department, Trinity College, Dublin
Publicado
16/05/2012
Como Citar
SANTOS, Adriano A.; SCHIEL, Ulrich.
Classificação Contínua de Documentos com Vocabulários Temáticos Dinâmicos para a Desambiguação de Termos. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 8. , 2012, São Paulo.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2012
.
p. 785-790.
DOI: https://doi.org/10.5753/sbsi.2012.14465.