logo-ri

Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)

Use este identificador para citar ou linkar para este item: https://hdl.handle.net/20.500.14867/848424
Título: IDEA-C2: Uma abordagem híbrida de modelagem conceitual apoiada por um modelo de linguagem e um metamodelo de dados no contexto de comando e controle.
Autor(es): Avelino, Jones de Oliveira
Orientador(es): Cordeiro, Kelli de Faria
Cavalcanti, Maria Cláudia Reis
Palavras-chave: Grafo de conhecimento
Modelo de linguagem
Modelo de domínio
Data-driven
Theory-driven
Áreas de conhecimento da DGPM: Ciência do dado
Setor(es) da Marinha: Diretoria-Geral do Desenvolvimento Nuclear e Tecnologia da Marinha (DGDNTM)
Data do documento: 2026
Editor: Instituto Militar de Engenharia (IME)
Descrição: A obtenção de conhecimento a partir de dados textuais foi impulsionada pelo avanço dos modelos de linguagem, cujo desempenho pode ser aprimorado por meio do ajuste fino em domínios específicos. Contudo, abordagens orientadas por dados (data-driven) geram modelos subsimbólicos que apresentam limitações, como falta de explicabilidade e vieses. Em contraste, abordagens orientadas por teoria (theory-driven) baseiam-se em conceituações formais para a construção de modelos de domínio simbólicos, embora enfrentem desafios na extração de classes e relações relevantes a partir de textos. Nesse contexto, esta tese propõe o IDEA-C2, uma abordagem supervisionada híbrida que combina textos doutrinários, recursos semânticos e um metamodelo de alto nível para anotar corpora e ajustar modelos de linguagem pré-treinados em língua portuguesa. A abordagem emprega técnicas de pré-anotação heurística e permite a geração de knowledge graphs (KG) flexíveis, viabilizando consultas exploratórias e inferências, a fim de apoiar o desenvolvimento de modelos de domínio (DM). Avaliada em seis experimentos distintos, a abordagem apresentou resultados promissores. Na pré-anotação do corpus, IDEA-C2 alcançou uma precisão de 95% nas entidades e 76% nas relações, culminando em um Modelo de Linguagem (ML) ajustado ao contexto com uma precisão e cobertura acima de 85%. Em outro experimento mais amplo, envolvendo 28 participantes, ao aplicar o ML ajustado combinado com o KG no apoio à construção de um DM, os resultados do IDEA-C2 mostraram que 40% das classes e relações do KG foram similares às dos DM construídos de maneira tradicional. Esses resultados demonstram a utilidade e viabilidade da abordagem IDEA-C2 tanto na geração de artefatos essenciais ao ajuste de um ML e geração de KG quanto na sua aplicação na construção de um DM.
Tipo de Acesso: Acesso aberto
URI: https://hdl.handle.net/20.500.14867/848424
Tipo: Tese
Aparece nas coleções:Ciência, Tecnologia e Inovação: Coleção de Teses

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Tese_IDEA-C2 - SC JONES.pdf6,34 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.