HTW 2018: deteção de falhas em turbinas eólicas
Concurso terminado
- Data-limite: 27 de setembro de 2018, 10:00 (CET)
- Primeiro prémio: 5000 € para a equipa vencedora do desafio da EDP
- Melhor Solução Técnica: 2000 € para a equipa com os melhores resultados do algoritmo
Descrição
Tempo é dinheiro e a antecipação de falhas nas turbinas eólicas pode reduzir o tempo de manutenção e o decréscimo da produção devido à indisponibilidade, abrindo caminho a custos mais baixos e nivelados de energia limpa. Quantas falhas conseguirá prever? Desafiamo-lo a desenvolver uma solução global para este problema, atribuindo especial atenção às capacidades de antecipação, de forma a detetar falhas na fase inicial e, consequentemente, reduzir os custos de manutenção. As componentes a ser monitorizadas serão as seguintes:
- Caixa de velocidades
- Gerador
- Rolamento do gerador
- Transformador
- Grupo hidráulico
Disponibilizamos 2 anos de registos SCADA referentes a 5 turbinas eólicas e dados meteorológicos para que possa criar, treinar e testar os seus modelos. Incluímos, também, 1 ano de falhas anteriormente detetadas.
Regras
Aqui, pedimos que cada equipa ponha à prova as suas capacidades de previsão! O objetivo deste desafio de dados é fomentar novas estratégias de manutenção preventiva inovadoras e fiáveis que evitem a ocorrência de medidas corretivas de grande dimensão, de forma a prever e minimizar o tempo de inatividade dos recursos e diminuir os custos associados.
Regras mais relevantes:
Data-limite de envio: 27 de setembro de 2018, 10:00;
Prémio:
5000 € para a equipa com a melhor solução global;
2000 € para a equipa com a melhor solução técnica;
A equipa vencedora do Primeiro prémio não é elegível para ganhar o prémio de Melhor Solução Técnica.
- Elegibilidade:
- Aqueles que estiverem inscritos no concurso;
- Aqueles cuja idade seja superior à idade exigida por lei no seu país de residência para participar neste concurso;
- Aqueles que forem titulares de uma conta bancária no seu país de residência fiscal;
- Aqueles que possuírem competências de TI, técnicas, de design, ou de marketing; e
- Aqueles que possuírem o seu próprio equipamento informático em condições de funcionamento durante a totalidade do período de duração do concurso.
Para serem elegíveis para vencer o desafio, os participantes devem, também, estar presentes durante a apresentação do protótipo da sua equipa ou, se necessário, ser dispensados pelos restantes membros da sua equipa.
- Conjuntos de dados externos: apenas os conjuntos de dados fornecidos devem ser exigidos para a solução.
Para mais informações sobre as regras, consulte os Termos e Condições da organização do Hack the Wind 2018 (disponível em inglês).
Avaliação do desafio
Este desafio integra o Hack The Wind 2018 e, como tal, queremos desafiar cada equipa a desenvolver mais do que apenas um simples algoritmo preditivo. Procuramos uma solução global, não apenas centrada nas capacidades preditivas da equipa, mas também no modelo de negócio como um todo e na forma como apresentam a vossa solução.
A avaliação será dividida em dois momentos:
- A primeira fase consiste num processo de avaliação científico justo, no qual uma equipa de um mentor encarregue da avaliação irá reunir com as equipas individualmente, ouvir as suas apresentações e selecionar os finalistas. Nesta fase, a sua pontuação será gerada de acordo com os seguintes critérios: 35% proveniente da opinião dos juízes; 65% proveniente dos resultados dos algoritmos.
- Na segunda fase, cada equipa finalista irá apresentar o seu protótipo ao júri. Nesta fase, a pontuação será de acordo com os seguintes critérios: 40% proveniente dos resultados dos algoritmos; 25% proveniente da apresentação; 20% proveniente do design de UI/UX; 15% proveniente do modelo de negócio.
Prémios:
Em conformidade com os critérios acima mencionados, 2 equipas receberão os seguintes prémios:
- Primeiro prémio de 5000 € para a equipa com a melhor solução global, isto é, a equipa com a pontuação mais alta em todas as componentes dos critérios de avaliação da fase 2.
- Prémio de melhor solução técnica, no valor de 2000 €, para a equipa com a pontuação mais alta na componente "Resultados do algoritmo" dos critérios de avaliação da fase 2
A equipa vencedora do Primeiro prémio não é elegível para ganhar o prémio de Melhor Solução Técnica.
Para perceber de que forma o algoritmo é avaliado, consulte o separador "Avaliação do algoritmo".
Avaliação do algoritmo
Relativamente ao algoritmo preditivo, as apresentações serão classificadas com base na poupança total relacionada com a previsão, isto é, a capacidade de reduzir os custos de manutenção (incluindo preventivos e corretivos).
As previsões podem ser classificadas como:
- Os verdadeiros positivos (TP) são falhas na turbina e no subsistema eólicos corretos, detetadas entre 2 a 60 dias antes da data do intervalo. Se for detetada uma falha no período certo mas na turbina ou subsistema eólico errados, esta contará como falso positivo. Os verdadeiros positivos traduzem-se em poupanças, que representam a diferença entre os custos de substituição e os custos de reparação.
- Os falsos negativos (FN) são falhas reais numa turbina e num subsistema eólicos que não foram detetadas nos 2 a 60 dias anteriores. Os falsos negativos traduzem-se em custos de substituição.
- Os falsos positivos (FP) são detetados numa turbina e num subsistema eólicos onde não existam falhas nos 2 a 60 dias seguintes. Os falsos positivos traduzem-se em custos de inspeção.
De acordo com a classificação anterior, as suas previsões implicarão Custos de Substituição (RP), Custos de Reparação (RC) ou Custos de Inspeção (IC). Os RP, RC e IC para cada componente encontram-se descritos na tabela abaixo:
Com base nas previsões e custos associados, a poupança total com base na previsão é calculada contabilizando as 5 componentes e as 5 turbinas eólicas, de acordo com a seguinte métrica:
Sistema de classificação:
Com base na poupança de custos decorrente do algoritmo de manutenção preditiva, os resultados serão classificados entre 0 e 20, recorrendo a uma função de ativação sigmoide não revelada, conforme descrito a seguir:
- Poupança com base na previsão positiva (parte verde da curva) significa que o seu modelo permitiu poupanças e que obteve uma nota positiva (>10).
- Poupança com base na previsão negativa (parte azul da curva) significa que o seu modelo resultou em despesas adicionais e que obteve uma nota negativa (<10).
- Poupança com base na previsão nula significa que a despesa adicional causada por previsões erradas é compensada pela poupança adicional causada por previsões precisas e que obteve a nota 10.
Vencedores do primeiro prémio
Testemunho e abordagem da equipa Alpha-I
"Para a Alpha-I, o HTW 2018 foi uma fantástica experiência de aprendizagem, tanto em termos tecnológicos, como de conhecimentos de domínio. Além disso, consistiu em 48 horas passadas a analisar dados de forma ininterrupta, bem como numa oportunidade para interagir com novas pessoas no setor. A equipa da EDP Renováveis foi muito prestável, para além de ter ajudado na compreensão dos dados. Durante o hackathon, a Alpha-I avaliou uma abordagem dupla. Em primeiro lugar, as propriedades estatísticas dos dados SCADA foram analisadas para formalizar regras de deteção de anomalias. No entanto, a escassez de dados relativos a falhas dificultou o treino dos nossos modelos de aprendizagem automática. Em segundo lugar, utilizando a nossa plataforma de visualização, procurámos sinais visuais aparentes anteriores à ocorrência de uma falha (de acordo com a lista de falhas de 2016). Recorrendo a conhecimentos de domínio, foi possível detetar facilmente algumas das falhas com bastante antecedência, utilizando apenas sinais visuais característicos dessas falhas. Em suma, concluímos que a visualização de dados e os conhecimentos de domínio podem ajudar a classificar os dados da turbina de modo a tornar a aprendizagem automática mais eficaz."
Vencedores do prémio melhor solução técnica
Testemunho e abordagem da equipa ODS-AI
"Durante a hackathon, a equipa ODS AI teve uma excelente oportunidade para analisar as especificidades inerentes ao trabalho com dados no domínio da energia eólica. Foi uma fantástica experiência, aliada à interessante tarefa na área da aprendizagem automática. O primeiro passo consistiu no pré-processamento do conjunto de dados. Os valores em falta foram preenchidos através de interpolação pelos vizinhos e cada característica foi normalizada numa determinada turbina. Durante a investigação inicial, tornou-se claro que as soluções de ponta têm, geralmente, como base redes de Memória a Curto Prazo Longa. Não obstante, para as condições existentes, esta abordagem foi ineficaz, devido ao tempo de treino limitado e à dimensão do conjunto de dados. Como alternativa, foi utilizada a rede neuronal convolucional unidimensional com janela móvel de 10 dias. Para fazer face ao facto de o conjunto de dados ser limitado, foi utilizada a técnica de aumento de dados. Esta abordagem demonstrou ser eficaz. No entanto, também gerou diversos resultados falso-positivos e foi incapaz de prever falhas no rolamento do gerador."