Redirigiendo al acceso original de articulo en 16 segundos...
ARTÍCULO
TITULO

CADWeb ? Categorização automática de documentos digitais

Georgia Regina Rodrigues Gomes    
Rubens de Oliveira Moraes Filho    

Resumen

Com a evolução da tecnologia da informação e a disseminação de documentos digitais na Web, faz-se necessário criar meios que forneçam um mecanismo de organização de tais documentos, facilitando sua busca e recuperação. Em bibliotecas digitais ou repositórios de obras eletrônicas, por exemplo, existe a necessidade de uma ferramenta que possa classificar automaticamente os documentos, visto que o processo de classificação (categorização) é feito de forma manual. Esta ferramenta será de grande importância no apoio à catalogação. Este artigo apresenta o desenvolvimento de uma ferramenta que tem como objetivo principal classificar automaticamente documentos digitais em categorias preestabelecidas, nas quais cada documento pertencerá a uma ou mais categorias de acordo com seu conteúdo, tornando assim mais eficaz e rápida a classificação. Na elaboração da ferramenta foram utilizadas técnicas e algoritmos de mineração de textos, sendo definidas no estudo de caso algumas categorias e termos relacionados, tais como informática, direito e física, para validar a ferramenta.Palavras-chaveTecnologia da informação. Categorização. Biblioteca digital. Mineração de texto. Documentos digitais.Automatic categorization of digital documentsAbstractThe evolution of information technology and dissemination of digital documents on the Web calls for a mechanism for the organization of such documents in order to facilitate the search and recall processes. In digital libraries or repositories of electronic works, for example, there is a need for tools that will automatically classify documents, since the classification process (categorizations) is done manually. Such a tool will represent an important resource and support for cataloging. This article presents the development of a tool whose chief objective is to categorize digital documents automatically, using preestablished categories, where each document will belong to one or more categories according to its content, thus making the classification of such documents more efficient and also quicker. Techniques and algorithms of text mining were used to develop and validate the tool; also, some categories were defined in the case study, as well as related terms such as: information technology, law and physics.KeywordsInformation technology. Categorization. Digital libraries. Text mining. Digital documents.

 Artículos similares

       
 
William Marinho Santos,Helga Cristina Hedler,Edilson Ferneda,Hercules Antonio do Prado,Breno Giovanni Adaid Castro     Pág. 01 - 15
A identificação de emoções, principalmente nos cursos da modalidade de Educação a Distância (EAD), pode ser relevante para a gestão do ambiente visando a melhoria do desempenho acadêmico do aluno. Este estudo tem como objetivo propor uma ferramenta compu... ver más

 
Fabiana Gama Chimes, Valéria da Silva Vieira    
A ciência pode ser considerada uma construção humana, histórica e que está sempre em transformação, e assim deve ser incorporada ao processo ensino-aprendizagem. Dessa forma, se faz necessário buscar diferentes métodos de ensino que aproximem os aprendiz... ver más

 
Monique Malafaia Guimarães, Rebecca Leal Caetano, Dra, César César Carriço, Dr, Júlio Vianna Barbosa, Dr, Deborah Paredes Soares da Silva, Prof, Zeneida Teixeira Pinto, Dra    
A toxicologia forense é uma ferramenta essencial que auxilia nas investigações, identificando os agentes tóxicos, com a finalidade de esclarecer as questões que ocorram em procedimento legal, ela é empregada com o objetivo de detectar, reconhecer, identi... ver más

 
Alana Corsi,Danilo Hisano Barbosa,Alec Murilo Kobner Moro     Pág. 01 - 20
A seleção de fornecedores é uma das atividades mais críticas para o gerenciamento da cadeia de suprimentos, podendo influenciar diretamente no desempenho das organizações. O problema de seleção de fornecedores é abordado como uma decisão estratégica capa... ver más

 
Pedro Vieira Souza Santos     Pág. 01 - 14
O termo eficiência, de forma geral, retrata à medida que um resultado é produzido com menor quantidade observada de desperdício e esforço, isto é, realizar uma operação com o mínimo de perdas. Diante disso, a verificação da eficiência dos equipamentos do... ver más