Ana Luís Sousa — Water Loss 2026

Sobre a palestrante

Quem é Ana Luís Sousa

Ana Luís Sousa é doutoranda na Universidade de Aveiro (Portugal) trabalhando na interseção entre simulação hidráulica, machine learning e detecção de vazamentos. Apresentou na Stream C9 o framework de seu PhD: "Smart Leak Management in Water Supply Systems — A Pre-Detection Leak Alarm and Localization Model Using Machine Learning." A apresentação foi rigorosa: introduziu o problema global, expôs o conceito de digital shadow, desenvolveu a arquitetura técnica do modelo combinando ML regressor + classificador anomaly, e aplicou no benchmark Battledim (L-Town network) — referência internacional para validação de algoritmos de leak detection.

Universidade de Aveiro — pesquisa aplicada

Centro tradicional português em engenharia hidráulica e saneamento. Programa de doutorado de Sousa combina rigor estatístico de ML com aplicação direta em utilities de Portugal e referência internacional via benchmarks. "I'm here today to present my work — Smart Leak Management."

AveiroPhD

Foco em pre-detection alarm

Diferente de modelos que detectam vazamento depois que volume relevante é perdido, o framework de Sousa propõe alarme prévio via análise de séries temporais de pressão e vazão. "Time series analysis to check for small changes and to detect water leaks." Janela menor entre evento e ação.

Pre-alarmTime series

"Vazamento é problema desafiador para sistemas de abastecimento de água. O volume perdido pode chegar a 50% do que é tratado — globalmente são 126,6 bilhões de metros cúbicos por ano, 39 bilhões de dólares."

— Ana Luís Sousa, sobre o problema global

Tese da palestra

Digital shadow + ML regressor capture small deviations antes da quebra

Digital shadow vs. digital twin

"Digital shadow is a virtual reality representation of the physical system — exchanges information from the physical to the digital one." Diferença sutil mas importante: shadow é unidirecional (físico → digital); twin é bidirecional (digital ↔ físico). Sousa escolhe shadow para reduzir complexidade e custo de implementação.

Shadow1-way

Regressor + anomaly classifier

"This is a perfect predictor — that is just train with okay data. So it will be good to predict just okay." Regressor é treinado SOMENTE com dados normais — vira modelo do que deveria acontecer. Classificador detecta desvios. Output binário: leak / no leak. Arquitetura limpa, interpretable.

Perfect predictorBinary

Benchmark Battledim como validação

"The Battledim benchmark network — the L-Town network — has pressure sensors and predefined leaks with labels. Two years of data and record files given as the pipelines." Validação contra dataset público com leaks pré-rotulados. Aceite científico via comparação com state-of-the-art em literatura.

BattledimL-Town

"Existe um digital shadow capaz de receber medições de pressão e vazão, analisar os dados, detectar pequenos desvios — e voltar ao sistema físico para ser analisado pela equipe de gestão. Assim podemos agir em tempo real."

— Ana Luís Sousa, sobre o framework do PhD

Dados apresentados

Battledim L-Town — números do benchmark

O dataset Battledim oferece dados de 2 anos de simulação realista da L-Town network, com pressure sensors em pontos estratégicos e vazamentos pré-rotulados (label) em momentos específicos. Sousa usa parte do dataset para treino do regressor (apenas dados okay), parte para treino do classifier (incluindo leaks rotulados), e parte para teste cego — convenção padrão de ML supervisionado. Métricas reportadas: F1 score, MCC (Matthews Correlation Coefficient), true positive rate, false positive rate.

126.6 bi m³

Volume anual perdido globalmente em vazamentos, citado por Sousa para contextualizar a relevância do trabalho. Equivalente a 39 bilhões de dólares perdidos por ano. "Up to 50% in some import limit — corresponds to 126 6 billion cubic meters per year."

5.6 bi m³/dia

Volume médio diário por km na rede de Portugal em 2024. Sousa contextualiza com dados nacionais: "In 2024, on the bulk side, this value was 5.6 billion m³ per kilometer per day, and on the distribution..." Pesquisa aplicada com referência ao contexto de utilities portuguesas.

RNN > LSTM > GRU

Comparação entre 3 modelos de ML aplicados. Sousa testou Recurrent Neural Network, LSTM (Long Short-Term Memory) e GRU (Gated Recurrent Unit). Reportou que RNN apresentou melhor balanço entre confusion matrix e MCC para o dataset Battledim — peso ótimo de 0.737 no critério.

Abordagem técnica

Offline training + online inference

Data preparation com janela temporal

"We connect with the time series for the system. It's also interesting to do the influence of the previous days on the actual data we want to predict. Daily sequences — actual day, previous day, weekday — were the most important." Janela de três dias capturando padrão semanal e contexto recente.

WindowWeekday

Regressor treinado em dados normais

"This is a perfect regressor. It is just trained with okay data — so it will be good to predict just okay." Treinamento intencionalmente unidirecional. Métricas RMSE e R². Output: predição do que pressão e vazão DEVERIAM estar fazendo na ausência de vazamento.

RegressorRMSE

Classifier sobre o resíduo

"With these predictions from the regressor, we need to fit the classifier. We choose the weight that produces the higher MCC." Classificador opera sobre a diferença entre predito e medido. F1 score e MCC otimizados conjuntamente. Threshold ótimo escolhido por validação cruzada.

ClassifierMCC

Casos / Aplicações

Onde o framework de Sousa se aplica

Battledim L-Town como benchmark

Caso central da apresentação. Dataset público de 2 anos, com pressure sensors estratégicos e leaks rotulados. Permite comparação direta com state-of-the-art da literatura — Sousa reporta resultados competitivos com modelos publicados em journals internacionais.

L-TownPublic

Utilities portuguesas como cenário aplicado

Sousa pretende validar o framework em utilities reais portuguesas após defesa do PhD. Trabalho aplicado com transferência tecnológica direta para concessionárias do país — modelo replicável em outros países com infraestrutura comparável.

PortugalTransfer

Localização leak — próximo passo

"Presentation today will be just for the leak alarm — the time series analysis. Localization model is the next part." Sousa entregou o módulo de detecção; a próxima etapa do PhD é localização — combinando ML com simulador hidráulico para indicar posição do vazamento na rede.

LocalizationNext step

Low false positive rate é crítico

"Our models present a true positive rate with low number of false positives — being able to not misclassify okay data as anomaly." Métrica chave de viabilidade operacional: alarme com muitos falsos positivos é descartado pela equipe. Sousa otimiza explicitamente para esse trade-off.

False positiveOperational

Pontos-chave

Insights da palestra

Digital shadow é caminho intermediário

Mais simples e mais barato que digital twin, mantém comunicação física → digital. Para utilities sem maturidade para twin completo, shadow entrega 80% do valor com 30% do esforço.

Regressor treinado SÓ com dados okay

Decisão arquitetural inteligente: regressor é "perfect predictor" do estado normal. Anomalia vira tudo que não está dentro da predição. Reduz necessidade de dataset com leaks rotulados.

RNN escolhido vs LSTM/GRU

Após comparar três modelos, Sousa reportou RNN como melhor para Battledim — peso ótimo 0.737 no critério MCC. Contraintuitivo: modelos mais novos não são sempre melhores em ML aplicado.

Janela de 3 dias com weekday feature

Padrão semanal é input crítico — consumo varia por dia da semana. Modelo simples que ignora isso falha em utilities reais.

F1 score + MCC como métrica conjunta

Otimização single-objective mascara trade-offs. Sousa otimiza F1 e MCC conjuntamente — escolha técnica que reduz overfitting em datasets desbalanceados (leaks são raros).

Battledim L-Town como pré-requisito de credibilidade

Em ML aplicado a NRW, modelo sem benchmark público é difícil de avaliar. Sousa entrega rigor científico via comparação com state-of-the-art.

126,6 bilhões m³/ano de perda — escala do problema

Sousa contextualiza com escala global: 39 bilhões de USD por ano. Justifica investimento em pesquisa aplicada e prioridade de tese.

Localização é próximo passo do PhD

Detecção entregue; localização em desenvolvimento. Sousa indica caminho: combinar ML com simulador hidráulico para posição. Tese segue 2026-2027.

Filosofia / Conclusão

Rigor científico aplicado a problema operacional

Ana Luís Sousa entrega no Water Loss 2026 a melhor síntese do que pesquisa aplicada universitária deve ser: problema real (126 bilhões m³ de perda anual), método rigoroso (regressor + classificador + benchmark público), arquitetura interpretável (digital shadow + RNN escolhido após comparação) e roadmap claro (detecção entregue, localização em desenvolvimento). A escolha de digital shadow em vez de twin é prática — reduz complexidade sem perder capacidade analítica. O treinamento do regressor SÓ com dados okay é arquitetural — reduz dependência de leaks rotulados. A validação no Battledim L-Town é institucional — entrega aceite científico via comparação com state-of-the-art. Para utilities portuguesas e brasileiras com pressão e vazão medidas em DMAs, o framework é aplicável após calibração.

Pesquisa aplicada com transferência direta

Sousa não escreve para journal e nunca implementa — escreve para utility implementar. Aveiro tem tradição de transferência direta entre PhD e concessionárias. Modelo replicável em USP, UFRJ, UNICAMP no Brasil.

TransferApplied

Architecture decisions reduzem complexity

Cada escolha do framework é deliberada para reduzir complexidade operacional: shadow > twin, regressor okay-only > supervisionado completo, RNN > LSTM em Battledim. Sousa entrega ML que utility consegue operar — não só publicar.

ArchitectureOperable

"Combine machine learning techniques e simulador hidráulico — o framework recebe medidas de pressão e vazão, classifica anomalias e dá output binário para o sistema inteiro."

— Ana Luís Sousa, sobre a arquitetura do PhD framework

Resumo gerado a partir da transcrição ao vivo via Nobox Translate com inteligência artificial.