Use este identificador para citar ou linkar para este item:
https://hdl.handle.net/20.500.14867/848400| Título: | Poseidonslam: underwater slam inspired by a computational model of the human brain |
| Autor(es): | Melo, Plínio Bernardo dos Santos |
| Orientador(es): | Costa, Ramon Romankevicius |
| Palavras-chave: | Robótica Navegação autônoma Veículo submarino |
| Áreas de conhecimento da DGPM: | Controle e automação |
| Setor(es) da Marinha: | Diretoria-Geral do Desenvolvimento Nuclear e Tecnologia da Marinha (DGDNTM) |
| Data do documento: | 2026 |
| Editor: | Universidade Federal do Rio de Janeiro (UFRJ) |
| Descrição: | A operação autônoma em ambientes subaquáticos confinados e sem GPS impõe desafios críticos de robustez perceptual (perceptual aliasing) e associação de dados (data association), tornando o Simultaneous Localization and Mapping (SLAM) um subsistema central para navegação segura. Fatores como turbidez da água, iluminação variável, baixa textura e recorrência estrutural do ambiente submarino intensificam o perceptual aliasing, levando pipelines geométricos à perda de rastreamento e podendo degradar a consistência global do mapa, inclusive em abordagens bio-inspiradas canônicas quando submetidas a associações espúrias. Esta dissertação propõe o PoseidonSLAM, um framework neuro-inspirado para Visual-Inertial-Acoustic Underwater SLAM com ênfase em robustez perceptual e estabilidade topológica. O método combina reconhecimento de lugar — Visual Place Recognition (VPR) — por verificação temporal de sequências (sequence-aware VPR) com um mecanismo de VPR Guard que regula a emissão de eventos no Mapa de Experiências, reduzindo a probabilidade de atualizações motivadas por evidência perceptual instável e, consequentemente, mitigando corrupção estrutural do grafo sob condições degradadas. A arquitetura é composta por dois subsistemas acoplados: (i) um front-end neocortical, derivado do NeoSLAM, que codifica observações multimodais de câmera e sonar em Sparse Distributed Representations (SDR) e emprega Hierarchical Temporal Memory (HTM) para produzir identidades de lugar estáveis; e (ii) um back-end hipocampal, derivado do DolphinSLAM, que integra essas identidades ao dead-reckoning para construir e manter um grafo topológico tridimensional consistente do ambiente submarino explorado. A validação experimental em software-in-the-loop foi conduzida em dois eixos. Primeiro, a Underwater Cave Transformed Database foi construída como um teste controlado de robustez do VPR sob perturbações programáticas de aparência e ponto de vista, na qual a rede neural convolucional — Convolutional Neural Network (CNN) — ShuffleNetV2 x1.0 apresentou melhor desempenho na curva Precision– Recall do que a CNN AlexNet-conv3. Segundo, o PoseidonSLAM foi avaliado no benchmark Underwater Cave Sonar and Vision Data Set, evidenciando: (a) rastreabilidade determinística evento–evidência; (b) redução da densidade de eventos e do tamanho final do grafo com VPR Guard ON em relação ao OFF; e (c) indícios de fechamento de ciclo (loop closure) consistentes com o protocolo de ground truth adotado. Em síntese, os resultados indicam que, ao combinar verificação temporal de sequências e regulação da emissão de eventos, o PoseidonSLAM operacionaliza um mecanismo de robustez perceptual capaz de preservar a coerência topológica do mapa e, também, de reduzir o risco de colapso estrutural do grafo em missões subaquáticas sob condições ambientais severas.Autonomous operation in confined underwater environments without GPS poses critical challenges in perceptual aliasing and data association, making Simultaneous Localization and Mapping (SLAM) a central subsystem for reliable navigation. Factors such as water turbidity, variable illumination, low texture, and structural recurrence of the underwater environment intensify perceptual aliasing, causing geometric SLAM pipelines to lose tracking and potentially degrading global map consistency, including in canonical bio-inspired approaches under spurious associations. This dissertation proposes PoseidonSLAM, a neuro-inspired framework for Visual-Inertial-Acoustic Underwater SLAM with emphasis on perceptual robustness and topological stability. The method combines sequence-aware visual place recognition (VPR) by temporal verification of place hypotheses with a VPR Guard mechanism that regulates experience-event emission, reducing updates driven by unstable perceptual evidence and mitigating structural corruption of the experience graph under degraded sensing conditions. The architecture comprises two coupled subsystems: (i) a neocortical frontend, derived from NeoSLAM, which encodes multimodal camera and sonar observations into Sparse Distributed Representations (SDR) and employs Hierarchical Temporal Memory (HTM) to produce stable place identities; and (ii) a hippocampal back-end, derived from DolphinSLAM, which integrates these identities with deadreckoning to build and maintain a consistent three-dimensional topological graph of the explored underwater environment. The software-in-the-loop experimental validation followed two axes. First, the Underwater Cave Transformed Database was built as a controlled stress test for VPR robustness under programmatic appearance and viewpoint perturbations, in which the Convolutional Neural Network (CNN) ShuffleNetV2 x1.0 demonstrated better performance in the Precision-Recall curve than CNN AlexNet-conv3. Second, PoseidonSLAM was evaluated on the benchmark Underwater Cave Sonar and Vision Data Set, showing: (a) deterministic event–evidence traceability; (b) reduced event density and smaller final graph size with VPR Guard ON compared to OFF; and (c) loop closure indications consistent with the adopted ground truth protocol. Overall, the results suggest that PoseidonSLAM operationalizes perceptual robustness by combining temporal sequence verification with event-emission regulation, preserving topological map coherence and reducing the risk of structural graph collapse in severe underwater conditions. |
| Tipo de Acesso: | Acesso aberto |
| URI: | https://hdl.handle.net/20.500.14867/848400 |
| Tipo: | Dissertação |
| Aparece nas coleções: | Ciência, Tecnologia e Inovação: Coleção de Dissertações |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Dissertação M_Sc___Plinio_Bernardo_dos_Santos_Melo Versão Final.pdf | 23,51 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.