
Stream C9 — Smart Monitoring & Predictive Analytics — Water Loss 2026
Doutoranda da Universidade de Aveiro apresenta framework de pre-detection leak alarm via machine learning + simulador hidráulico — testado no benchmark Battledim L-Town. Digital shadow + RNN regressor.
Sobre a palestrante
Ana Luís Sousa é doutoranda na Universidade de Aveiro (Portugal) trabalhando na interseção entre simulação hidráulica, machine learning e detecção de vazamentos. Apresentou na Stream C9 o framework de seu PhD: "Smart Leak Management in Water Supply Systems — A Pre-Detection Leak Alarm and Localization Model Using Machine Learning." A apresentação foi rigorosa: introduziu o problema global, expôs o conceito de digital shadow, desenvolveu a arquitetura técnica do modelo combinando ML regressor + classificador anomaly, e aplicou no benchmark Battledim (L-Town network) — referência internacional para validação de algoritmos de leak detection.
Centro tradicional português em engenharia hidráulica e saneamento. Programa de doutorado de Sousa combina rigor estatístico de ML com aplicação direta em utilities de Portugal e referência internacional via benchmarks. "I'm here today to present my work — Smart Leak Management."
AveiroPhDDiferente de modelos que detectam vazamento depois que volume relevante é perdido, o framework de Sousa propõe alarme prévio via análise de séries temporais de pressão e vazão. "Time series analysis to check for small changes and to detect water leaks." Janela menor entre evento e ação.
Pre-alarmTime series"Vazamento é problema desafiador para sistemas de abastecimento de água. O volume perdido pode chegar a 50% do que é tratado — globalmente são 126,6 bilhões de metros cúbicos por ano, 39 bilhões de dólares."
Tese da palestra
"Digital shadow is a virtual reality representation of the physical system — exchanges information from the physical to the digital one." Diferença sutil mas importante: shadow é unidirecional (físico → digital); twin é bidirecional (digital ↔ físico). Sousa escolhe shadow para reduzir complexidade e custo de implementação.
Shadow1-way"This is a perfect predictor — that is just train with okay data. So it will be good to predict just okay." Regressor é treinado SOMENTE com dados normais — vira modelo do que deveria acontecer. Classificador detecta desvios. Output binário: leak / no leak. Arquitetura limpa, interpretable.
Perfect predictorBinary"The Battledim benchmark network — the L-Town network — has pressure sensors and predefined leaks with labels. Two years of data and record files given as the pipelines." Validação contra dataset público com leaks pré-rotulados. Aceite científico via comparação com state-of-the-art em literatura.
BattledimL-Town"Existe um digital shadow capaz de receber medições de pressão e vazão, analisar os dados, detectar pequenos desvios — e voltar ao sistema físico para ser analisado pela equipe de gestão. Assim podemos agir em tempo real."
Dados apresentados
O dataset Battledim oferece dados de 2 anos de simulação realista da L-Town network, com pressure sensors em pontos estratégicos e vazamentos pré-rotulados (label) em momentos específicos. Sousa usa parte do dataset para treino do regressor (apenas dados okay), parte para treino do classifier (incluindo leaks rotulados), e parte para teste cego — convenção padrão de ML supervisionado. Métricas reportadas: F1 score, MCC (Matthews Correlation Coefficient), true positive rate, false positive rate.
Abordagem técnica
"We connect with the time series for the system. It's also interesting to do the influence of the previous days on the actual data we want to predict. Daily sequences — actual day, previous day, weekday — were the most important." Janela de três dias capturando padrão semanal e contexto recente.
WindowWeekday"This is a perfect regressor. It is just trained with okay data — so it will be good to predict just okay." Treinamento intencionalmente unidirecional. Métricas RMSE e R². Output: predição do que pressão e vazão DEVERIAM estar fazendo na ausência de vazamento.
RegressorRMSE"With these predictions from the regressor, we need to fit the classifier. We choose the weight that produces the higher MCC." Classificador opera sobre a diferença entre predito e medido. F1 score e MCC otimizados conjuntamente. Threshold ótimo escolhido por validação cruzada.
ClassifierMCCCasos / Aplicações
Caso central da apresentação. Dataset público de 2 anos, com pressure sensors estratégicos e leaks rotulados. Permite comparação direta com state-of-the-art da literatura — Sousa reporta resultados competitivos com modelos publicados em journals internacionais.
L-TownPublicSousa pretende validar o framework em utilities reais portuguesas após defesa do PhD. Trabalho aplicado com transferência tecnológica direta para concessionárias do país — modelo replicável em outros países com infraestrutura comparável.
PortugalTransfer"Presentation today will be just for the leak alarm — the time series analysis. Localization model is the next part." Sousa entregou o módulo de detecção; a próxima etapa do PhD é localização — combinando ML com simulador hidráulico para indicar posição do vazamento na rede.
LocalizationNext step"Our models present a true positive rate with low number of false positives — being able to not misclassify okay data as anomaly." Métrica chave de viabilidade operacional: alarme com muitos falsos positivos é descartado pela equipe. Sousa otimiza explicitamente para esse trade-off.
False positiveOperationalPontos-chave
Mais simples e mais barato que digital twin, mantém comunicação física → digital. Para utilities sem maturidade para twin completo, shadow entrega 80% do valor com 30% do esforço.
Decisão arquitetural inteligente: regressor é "perfect predictor" do estado normal. Anomalia vira tudo que não está dentro da predição. Reduz necessidade de dataset com leaks rotulados.
Após comparar três modelos, Sousa reportou RNN como melhor para Battledim — peso ótimo 0.737 no critério MCC. Contraintuitivo: modelos mais novos não são sempre melhores em ML aplicado.
Padrão semanal é input crítico — consumo varia por dia da semana. Modelo simples que ignora isso falha em utilities reais.
Otimização single-objective mascara trade-offs. Sousa otimiza F1 e MCC conjuntamente — escolha técnica que reduz overfitting em datasets desbalanceados (leaks são raros).
Em ML aplicado a NRW, modelo sem benchmark público é difícil de avaliar. Sousa entrega rigor científico via comparação com state-of-the-art.
Sousa contextualiza com escala global: 39 bilhões de USD por ano. Justifica investimento em pesquisa aplicada e prioridade de tese.
Detecção entregue; localização em desenvolvimento. Sousa indica caminho: combinar ML com simulador hidráulico para posição. Tese segue 2026-2027.
Filosofia / Conclusão
Ana Luís Sousa entrega no Water Loss 2026 a melhor síntese do que pesquisa aplicada universitária deve ser: problema real (126 bilhões m³ de perda anual), método rigoroso (regressor + classificador + benchmark público), arquitetura interpretável (digital shadow + RNN escolhido após comparação) e roadmap claro (detecção entregue, localização em desenvolvimento). A escolha de digital shadow em vez de twin é prática — reduz complexidade sem perder capacidade analítica. O treinamento do regressor SÓ com dados okay é arquitetural — reduz dependência de leaks rotulados. A validação no Battledim L-Town é institucional — entrega aceite científico via comparação com state-of-the-art. Para utilities portuguesas e brasileiras com pressão e vazão medidas em DMAs, o framework é aplicável após calibração.
Sousa não escreve para journal e nunca implementa — escreve para utility implementar. Aveiro tem tradição de transferência direta entre PhD e concessionárias. Modelo replicável em USP, UFRJ, UNICAMP no Brasil.
TransferAppliedCada escolha do framework é deliberada para reduzir complexidade operacional: shadow > twin, regressor okay-only > supervisionado completo, RNN > LSTM em Battledim. Sousa entrega ML que utility consegue operar — não só publicar.
ArchitectureOperable"Combine machine learning techniques e simulador hidráulico — o framework recebe medidas de pressão e vazão, classifica anomalias e dá output binário para o sistema inteiro."
Resumo gerado a partir da transcrição ao vivo via Nobox Translate com inteligência artificial.