Utilize este identificador para referenciar este registo:
https://hdl.handle.net/10316/35585
Título: | Extracção de Informação Semântica de Conteúdo da Web 2.0 | Autor: | Carvalheira, Ana Rita Bento | Orientador: | Gomes, Paulo Jorge de Sousa | Palavras-chave: | Língua Portuguesa; Media Social; Pesquisa Semântica; Processamento de Linguagem Natural; Web 2 0; Web Semântica; Web Social | Data: | 8-Jul-2014 | Título da revista, periódico, livro ou evento: | Extracção de Informação Semântica de Conteúdo da Web 2.0 | Local de edição ou do evento: | Coimbra | Resumo: | A massiva proliferação de blogues e redes sociais fez com que o conteúdo gerado pelos utilizadores, presente em plataformas como o Twitter ou Facebook, se tornasse bastante valioso pela quantidade de informação passível de ser extraída e explorada. No entanto, a análise de informação proveniente destas fontes apresenta bastantes desafios, devido, não só, ao curto tamanho das mensagens, mas também ao tipo de linguagem usada, que contém inúmeras abreviaturas, erros ortográficos e conteúdo específico da media social, o que dificulta significativamente a tarefa de extração de informação a partir deste texto. A presente tese visa o desenvolvimento de um conjunto de ferramentas que permitem efetuar a análise e extração de conhecimento a partir de várias fontes da Web 2.0, recorrendo ao uso de diversas técnicas de Processamento de Linguagem Natural e representando esse conhecimento através de tecnologias da Web Semântica. De forma a realizar este objetivo foi desenvolvida uma biblioteca, constituída por vários módulos que possibilitam a extração de informação semântica a partir de notícias online, blogues e publicações provenientes de redes sociais. Foi também desenvolvido um sistema cujo principal objetivo é demonstrar as funcionalidades providenciadas pela biblioteca, permitindo a realização de pesquisa e navegação sobre a informação extraída e representando-a através de tecnologias da Web Semântica. Importa ainda salientar que a biblioteca suporta unicamente a língua portuguesa (português de Portugal) o que, por si só, representa um desafio, visto existirem relativamente poucos recursos disponíveis para o português. | Descrição: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra | URI: | https://hdl.handle.net/10316/35585 | Direitos: | openAccess |
Aparece nas coleções: | UC - Dissertações de Mestrado FCTUC Eng.Informática - Teses de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Extracao de Informacao Semantica de Conteudo da Web 2.0.pdf | 6.24 MB | Adobe PDF | Ver/Abrir |
Visualizações de página 20
781
Visto em 1/out/2024
Downloads 50
571
Visto em 1/out/2024
Google ScholarTM
Verificar
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.