KR101941854B1 - 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법 - Google Patents
미취득 데이터 보정을 통한 부하 예측 시스템 및 방법 Download PDFInfo
- Publication number
- KR101941854B1 KR101941854B1 KR1020180136852A KR20180136852A KR101941854B1 KR 101941854 B1 KR101941854 B1 KR 101941854B1 KR 1020180136852 A KR1020180136852 A KR 1020180136852A KR 20180136852 A KR20180136852 A KR 20180136852A KR 101941854 B1 KR101941854 B1 KR 101941854B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- load
- prediction
- power
- value
- Prior art date
Links
- 238000012937 correction Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 title claims description 118
- 230000002159 abnormal effect Effects 0.000 claims abstract description 62
- 230000008859 change Effects 0.000 claims abstract description 56
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 47
- 230000007774 longterm Effects 0.000 claims description 16
- 230000006403 short-term memory Effects 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 10
- 230000007787 long-term memory Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000012800 visualization Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for AC mains or AC distribution networks
-
- H02J2003/003—
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
본 발명에 따른 미취득 데이터 보정을 통한 부하 예측 시스템이 제공된다. 상기 부하 예측 시스템은, 전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별하는 데이터 획득부; 상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성하는 전처리부; 및 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행하는 부하 예측부를 포함하여, 전력 부하 데이터의 비정상 데이터를 제거하고 패턴이 변화하는 시점을 탐지한 후 이상 데이터를 제거함으로써 부하 예측 알고리즘의 정확도를 높일 수 있도록 부하 데이터를 전처리 할 수 있다.
Description
본 발명은 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법에 관한 것이다. 보다 상세하게는, 미취득 데이터 보정을 통한 데이터 생성 및 기간 별 부하 예측 방법 및 이를 이용하는 시스템에 관한 것이다.
최근 데이터 분석 기술의 발달로 인하여 전력 또는 수자원 기기에 붙어있는 센서에서 취득된 데이터를 이용한 미래 상황 예측이 중요시되고 있다. 예를 들면, 배전선로에서 취득된 전력을 통해 미래 사용될 전력값을 예측하거나 수자원 약품 투여량 변화시에 수자원 품질을 예측한다.
이와 같이 미래 상황 예측에 대한 가용성(availability) 및 성능을 확보하기 위하여는 데이터에 결측치 또는 이상치 문제가 해결되어야 한다. 이러한 시계열 데이터의 결측치 (미측치) 및 이상치는 일반적으로 센서들의 전송에러나 끊김으로 인해 발생한다. 시계열 전력 또는 수 데이터에 이러한 결측치 또는 이상치가 존재하는 경우, 데이터의 왜곡 및 편향을 야기하거나, 심지어 분석을 위해 적용되는 알고리즘의 성능을 저하시키는 문제를 야기하기도 한다. 하지만 대부분의 전력 패턴 분석을 위한 종래의 방법들은 결측치 또는 이상치가 포함되지 않은 완전한 자료만을 분석데이터로 사용하였거나 결측치 또는 이상치가 미치는 영향을 고려하지 않고 사용되었으나, 보다 정확한 데이터 분석을 위해서 결측치 또는 이상치에 대한 정확하고 신뢰성 있는 대체 접근법이 요구되었다.
이와 관련하여, 전력 계통 등에서 부하 예측과 관련하여, ARIMA (Autogressive Integrated Moving Average) 또는 AR (Autogressive Regression)을 사용하여 미래 부하를 예측하는 방법이 있다. 하지만, 이러한 방법은 공간적 연결(위치, 소속) 관계 데이터를 활용하지 못하고, 중장기 예측을 위한 복잡한 주기성을 추정하지 못하는 모델이라는 문제점이 있다. 또한, 이러한 방법은 미취득 데이터(null data)를 고려하지 못하고, 시계열 데이터의 패턴 변화와 데이터의 이상치를 고려하지 못한다는 문제점이 있다.
본 발명이 해결하고자 하는 기술적 과제는 미취득 데이터 보정을 통한 데이터 생성 및 기간 별 부하 예측 방법 및 이를 이용하는 시스템을 제공하는 것이다.
또한, 본 발명은 데이터 수집 장치에서 측정된 부하 데이터를 이용해 미래 부하를 예측하는데 필요한 전 과정에 대한 알고리즘을 제공하기 위한 것이다.
또한, 본 발명을 통해 미래 부하를 높은 정확도로 예측할 수 있도록 함으로써 전력 설비의 투자 및 운영 시 경제적이고 효율적인 투자 및 운영을 가능하도록 한다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 미취득 데이터 보정을 통한 부하 예측 시스템이 제공된다. 상기 부하 예측 시스템은, 전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별하는 데이터 획득부; 상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성하는 전처리부; 및 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행하는 부하 예측부를 포함하여, 전력 부하 데이터의 비정상 데이터를 제거하고 패턴이 변화하는 시점을 탐지한 후 이상 데이터를 제거함으로써 부하 예측 알고리즘의 정확도를 높일 수 있도록 부하 데이터를 전처리 할 수 있다.
일 실시 예에서, 상기 부하 예측부는, 상기 제1 예측 알고리즘을 사용하여 전력 계통의 장기 부하 예측을 수행하고, 상기 제2 예측 알고리즘을 사용하여 상기 전력 계통의 단기/중기 부하 예측을 수행할 수 있다.
일 실시 예에서, 상기 장기 부하 예측은 LSTM(long short term memory) 알고리즘을 변경한 HOLSTM (High Order LST) 알고리즘을 사용하여 수행되고, 상기 단기/중기 부하 예측은 상기 HOLSTM 알고리즘 또는 상기 LSTM 알고리즘을 사용하여 수행될 수 있다.
일 실시 예에서, 상기 부하 예측부는, 상기 단기/중기 부하 예측을 위한 학습 시 학습 레이트(learning rate)를 동적으로 변경할 수 있다. 또한, 상기 학습 시 도출된 MMSE (Minimum Mean Squared Error) 가 d회 동안 갱신되지 않을 경우, 상기 학습 레이트에 gamma 를 곱하여 학습 레이트 감쇠(learning rate decay)를 동적으로 변경시킬 수 있다.
일 실시 예에서, 상기 전처리부는, 상기 전력 데이터에서 비정상 데이터 제거 과정, 패턴 변화 데이터 제거 과정 및 이상 데이터 제거 과정을 통해 상기 제2 전력 데이터를 획득할 수 있다.
일 실시 예에서, 상기 패턴 변화 데이터 제거 과정에서, 부하 데이터의 범위를 예측한 예측 값과 실제 측정 값의 차이가 임계 값을 초과하는 절체 시점을 기준으로 패턴 군집화가 수행될 수 있다. 또한, 상기 절체 시점 이전 및 이후 데이터에 대해 패턴 재군집화가 수행될 수 있다.
일 실시 예에서, 상기 전처리부는, 상기 미취득 데이터를 생성하기 위하여 이전 시점에서 예측한 값을 다시 입력으로 사용하는 방법으로 LSTM 알고리즘을 학습할 수 있다. 이때, 상기 부하 예측부는, 상기 부하 예측 시, 학습 시와 동일한 방법으로 이전 시점에서 예측한 값을 다시 입력으로 사용할 수 있다.
일 실시 예에서, 상기 부하 예측부는, 상기 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 상기 시계열 데이터의 시계열 추세 값을 추출하는 시계열 추세 추출부; 및 상기 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산하는 시계열 추세 제거부를 포함할 수 있다.
일 실시 예에서, 특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득하는 통계치 획득부; 및 상기 통계치 획득부에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정하는 임계치 결정부를 더 포함할 수 있다. 이에 따라 상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성할 수 있다.
본 발명의 다른 양상에 따른 미취득 데이터 보정을 통한 부하 예측 방법이 제공된다. 상기 부하 예측 방법은, 전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별하는 데이터 획득 과정; 상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성하는 전처리 과정; 및 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행하는 부하 예측 과정을 포함한다.
일 실시 예에서, 상기 부하 예측 과정은, 상기 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 상기 시계열 데이터의 시계열 추세 값을 추출하는 시계열 추세 추출 과정; 상기 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산하는 시계열 추세 제거 과정; 특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득하는 통계치 획득 과정; 및 상기 통계치 획득부에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정하는 임계치 결정 과정을 포함할 수 있다. 이에 따라, 일 실시 예에서, 상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성할 수 있다.
본 발명에 따르면, 전력 부하 데이터의 비정상 데이터를 제거하고 패턴이 변화하는 시점을 탐지한 후 이상 데이터를 제거함으로써 부하 예측 알고리즘의 정확도를 높일 수 있도록 부하 데이터를 전처리할 수 있다는 장점이 있다.
또한, 본 발명에 따르면, 측정된 데이터에서 비정상 데이터와 이상 데이터를 제거하는 것은 부하 예측 알고리즘이 정상 데이터를 이용해 학습을 진행할 수 있도록 함으로써 예측하고자 하는 미래 부하의 정확도를 높일 수 있다.
또한, 본 발명에 따르면, 측정된 데이터에서 패턴이 변화하는 시점을 탐지하는 것은 해당 데이터에서 절체로 인해 데이터의 패턴이 변화한 시점과 일반적인 패턴에서 벗어나는 패턴을 탐지함으로써 일반적인 패턴만으로 구성된 학습 데이터를 이용해 부하 예측을 진행하여 예측하고자 하는 미래 부하의 정확도를 높일 수 있다.
또한, 본 발명에 따르면, 이와 같이 측정된 부하 데이터에서 비정상 데이터를 제거하고 패턴 변화를 탐지하여 복원한 후 이상 데이터를 제거하는 것은 부하 데이터에 기계학습을 적용하여 정확한 미래 부하를 예측할 수 있도록 한다.
또한, 본 발명에 따르면, 미래 전력 수요로 볼 수 있는 미래 부하를 높은 정확도로 예측할 수 있게 되면 전력 설비를 운영하는데 많은 도움을 줄 수 있다는 장점이 있다.
도 1은 본 발명에 따른 부하 예측 시스템의 상세한 구성을 나타낸다.
도 2a는 본 발명의 일 실시 예 따른 가용 데이터 비율의 시각화를 나타낸다. 또한, 도 2b는 본 발명의 다른 실시 예 따른 가용 데이터 비율의 시각화를 나타낸다.
도 3은 본 발명에 따른 전처리부에서 수행하는 일련의 과정의 개념도를 나타낸다.
도 4는 본 발명에 따른 비정상 데이터 제거 과정에서 비정상 데이터 제거 후와 제거 이전의 시계열 데이터를 나타낸다.
도 5a는 본 발명에 따른 절체 패턴 탐지 관련 기본 데이터를 나타낸다. 한편, 도 5b는 본 발명에 따른 절체 시점 탐지에 관한 예시를 나타낸다.
도 5c는 본 발명에 따른 패턴 군집화에 관한 예시를 나타낸다. 또한, 도 5d는 본 발명에 따른 패턴 재군집화에 관한 예시를 나타낸다.
도 6은 본 발명의 비정상 패턴 탐지에 따른 패턴 변화 데이터 제거 후, 제거 이전의 시계열 데이터를 나타낸다.
도 7a는 본 발명에 따른 이상 데이터 제거 과정의 개념도를 나타낸다. 또한, 도 7b는 본 발명에 따른 이상 데이터 제거 이후, 비정상 데이터 판정을 위한 RNOF 알고리즘을 적용한 예시이다.
도 7c는 본 발명과 관련하여 RNOF 알고리즘 적용 시, 비정상 데이터 판정이 이루어질 수 없는 일 예시를 나타낸다.
도 7d는 본 발명과 관련하여, 시계열 데이터에서 주변 값들과 평균 값과의 차이가 발생 시 절사 주변 평균법의 원리를 나타낸 개념도이다.
도 8은 본 발명에 따른 미취득 데이터 학습 및 예측 과정의 개념도를 나타낸다.
도 9는 본 발명에 따른 추세 변화 데이터 제거 과정의 개념도를 나타낸다.
도 10은 본 발명에 따른 HOLSTM 알고리즘의 원리를 나타낸 개념도이다.
도 11은 본 발명의 LSTM 및 HOLSTM 알고리즘에 따른 학습 횟수에 따른 오류 결과를 나타낸 것이다.
도 12는 본 발명의 LSTM 및 HOLSTM 알고리즘에 따른 기간 별 전력 부하 예측 결과를 나타낸 것이다.
도 13은 본 발명의 HOLSTM 알고리즘에 날짜 정보를 사용한 경우의 부하 예측 결과를 나타낸 것이다.
도 14는 본 발명과 관련하여 부하 패턴 변화 지점을 탐지하지 못한 경우와 본 발명에 따라 패턴 변화 탐지에 따른 예측 결과를 비교한 것이다.
도 15는 본 발명에 따른 미취득 데이터 보정을 통한 부하 예측 방법의 흐름도를 나타낸다.
도 2a는 본 발명의 일 실시 예 따른 가용 데이터 비율의 시각화를 나타낸다. 또한, 도 2b는 본 발명의 다른 실시 예 따른 가용 데이터 비율의 시각화를 나타낸다.
도 3은 본 발명에 따른 전처리부에서 수행하는 일련의 과정의 개념도를 나타낸다.
도 4는 본 발명에 따른 비정상 데이터 제거 과정에서 비정상 데이터 제거 후와 제거 이전의 시계열 데이터를 나타낸다.
도 5a는 본 발명에 따른 절체 패턴 탐지 관련 기본 데이터를 나타낸다. 한편, 도 5b는 본 발명에 따른 절체 시점 탐지에 관한 예시를 나타낸다.
도 5c는 본 발명에 따른 패턴 군집화에 관한 예시를 나타낸다. 또한, 도 5d는 본 발명에 따른 패턴 재군집화에 관한 예시를 나타낸다.
도 6은 본 발명의 비정상 패턴 탐지에 따른 패턴 변화 데이터 제거 후, 제거 이전의 시계열 데이터를 나타낸다.
도 7a는 본 발명에 따른 이상 데이터 제거 과정의 개념도를 나타낸다. 또한, 도 7b는 본 발명에 따른 이상 데이터 제거 이후, 비정상 데이터 판정을 위한 RNOF 알고리즘을 적용한 예시이다.
도 7c는 본 발명과 관련하여 RNOF 알고리즘 적용 시, 비정상 데이터 판정이 이루어질 수 없는 일 예시를 나타낸다.
도 7d는 본 발명과 관련하여, 시계열 데이터에서 주변 값들과 평균 값과의 차이가 발생 시 절사 주변 평균법의 원리를 나타낸 개념도이다.
도 8은 본 발명에 따른 미취득 데이터 학습 및 예측 과정의 개념도를 나타낸다.
도 9는 본 발명에 따른 추세 변화 데이터 제거 과정의 개념도를 나타낸다.
도 10은 본 발명에 따른 HOLSTM 알고리즘의 원리를 나타낸 개념도이다.
도 11은 본 발명의 LSTM 및 HOLSTM 알고리즘에 따른 학습 횟수에 따른 오류 결과를 나타낸 것이다.
도 12는 본 발명의 LSTM 및 HOLSTM 알고리즘에 따른 기간 별 전력 부하 예측 결과를 나타낸 것이다.
도 13은 본 발명의 HOLSTM 알고리즘에 날짜 정보를 사용한 경우의 부하 예측 결과를 나타낸 것이다.
도 14는 본 발명과 관련하여 부하 패턴 변화 지점을 탐지하지 못한 경우와 본 발명에 따라 패턴 변화 탐지에 따른 예측 결과를 비교한 것이다.
도 15는 본 발명에 따른 미취득 데이터 보정을 통한 부하 예측 방법의 흐름도를 나타낸다.
상술한 본 발명의 특징 및 효과는 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명은 다양한 변경을 가할 수 있고 여러가지 형태를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 개시형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 명세서에서 사용한 용어는 단지 특정한 실시 예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다.
본 발명은 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법을 제안한다. 본 발명에 따른 부하 예측 시스템 및 방법은 다음과 같은 점에서 종래 기술에 비해 기술적 차별점이 있다.
1) 공간적 연결(위치, 소속) 관계 데이터 미 활용 → 다 변량 데이터를 사용할 수 있는 회귀신경망 모델을 사용할 수 있다.
2) 중장기 예측을 위한 복잡한 주기성을 추정하지 못하는 모델 → 회귀신경망 모델 중 중장기 예측을 위한 복잡한 주기성을 추정할 수 있는 고 차수 회귀신경망 알고리즘 (High Order Recurrent Neural Networks; HORNN)을 변경하여 발명한 고 차수 LSTM 회귀신경망 알고리즘 (High Order Long Short-Term Memory; HOLSTM)을 사용할 수 있다.
3) 미취득 데이터 미 고려 → 미취득 데이터를 학습하여 미취득 데이터 값을 생성하는 고 차수 LSTM 회귀신경망 알고리즘 발명을 제공할 수 있다.
4) 패턴 변화 미 고려 → 부하 데이터의 패턴 변화 지점을 단순 지수 평활법(Simple Exponential Smoothing)을 이용하여 탐지할 수 있다.
5) 이상치 미 고려 → 근접 시점(예: t-3, t-2, t-1, t+1, t+2, t+3)의 데이터를 이용하여 이상치를 탐지하기 위하여 발명한 '주변 시점 기반 강건한 이상치 점수 (Robust Neighbor Outlier Factor; RNOF)' 알고리즘을 사용할 수 있다.
이하, 본 발명에 따른 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법을 도면을 참조하여 보다 상세하게 설명한다.
도 1은 본 발명에 따른 부하 예측 시스템의 상세한 구성을 나타낸다. 도 1에 도시된 바와 같이, 부하 예측 시스템은 데이터 획득부(100), 전처리부(200) 및 부하 예측부(300)를 포함한다.
데이터 획득부(100)는 전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별한다. 또한, 전처리부(200)는 상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성한다. 또한, 부하 예측부(300)는 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행한다. 이때, 부하 예측부(300)는 상기 제1 예측 알고리즘을 사용하여 전력 계통의 장기 부하 예측을 수행할 수 있다. 또한, 부하 예측부(300)는 상기 제2 예측 알고리즘을 사용하여 상기 전력 계통의 단기/중기 부하 예측을 수행할 수 있다.
여기서, 장기 부하 예측은 LSTM(long short term memory) 알고리즘을 변경한 HOLSTM (High Order LST) 알고리즘을 사용하여 수행될 수 있다. 반면에, 상기 단기/중기 부하 예측은 상기 HOLSTM 알고리즘 또는 상기 LSTM 알고리즘을 사용하여 수행될 수 있다. 이러한 알고리즘에 대해서는 아래에서 상세히 살펴보기로 한다.
한편, 전술한 부하 예측은 장기 부하 예측 및 단기/중기 부하 예측에 한정되는 것이 아니라, 응용에 따라 다양하게 변경 가능하다. 이와 관련하여, 표 1은 본 발명의 일 실시 예에 따른 부하 예측 방법과 관련한 기간과 활용 방안을 제시한 것이다.
초 단기 예측 | 기간: 1시간 이내 활용: 1시간 이내의 단기 급전 계획 |
단기 예측 | 기간: 일주일 이내활용: 전력 계통 안정성 확보, 효율적 전력계통 운용 (발전 비용 감소) |
중·장기 예측 | 기간: 월·년 단위 활용: [발전기] 유지보수 계획, 건설 계획 [전력 수급] 수급 비상 상황 (최대 수요) 대비 |
한편, 데이터 획득부(100)에서의 동작에 대해 상세하게 살펴보면 다음과 같다. 데이터 획득부에서는 데이터를 획득한 후, 분석에 사용할 만큼 데이터가 있는지를 판별한다.
판별을 위하여 가용 데이터 비율을 계산하는데, 가용 데이터 비율이 α % 이상일 경우 데이터가 사용 가능하다고 판단된다.
- α는 사용자 지정 파라미터로 디폴트(default) 값은 80% 이다.
- 가용 데이터 비율: (전처리 이전) 전체 데이터 개수/취득되어야 할 데이터 개수
- 취득되어야 할 데이터 개수: 취득 간격 * 기간
한편, 가용 데이터 비율이 시각화 될 수 있다. 이와 관련하여, 도 2a는 본 발명의 일 실시 예 따른 가용 데이터 비율의 시각화를 나타낸다. 또한, 도 2b는 본 발명의 다른 실시 예 따른 가용 데이터 비율의 시각화를 나타낸다.
한편, 전처리부(200)에서의 동작에 대해 상세하게 살펴보면 다음과 같다. 전처리부(200)는 상기 전력 데이터에서 비정상 데이터 제거 과정, 패턴 변화 데이터 제거 과정 및 이상 데이터 제거 과정을 통해 상기 제2 전력 데이터를 획득할 수 있다. 한편, 상기 패턴 변화 데이터 제거 과정에서, 부하 데이터의 범위를 예측한 예측 값과 실제 측정 값의 차이가 임계 값을 초과하는 절체 시점을 기준으로 패턴 군집화가 수행될 수 있다. 또한, 상기 절체 시점 이전 및 이후 데이터에 대해 패턴 재군집화가 수행될 수 있다.
한편, 전처리부(200)는 다음과 같은 과정을 수행할 수 있다. 이와 관련하여, 도 3은 본 발명에 따른 전처리부에서 수행하는 일련의 과정의 개념도를 나타낸다.
1) 비정상 데이터 제거
2) 패턴 변화 데이터 제거
3) 이상 데이터 제거
4) 가용 데이터 판별
5) 미취득 데이터 생성
먼저, 비정상 데이터 제거 과정과 관련하여, 도 4는 본 발명에 따른 비정상 데이터 제거 과정에서 비정상 데이터 제거 후와 제거 이전의 시계열 데이터를 나타낸다. 한편, 비정상 데이터란 0 이하 또는 고정 값이 반복되어 나오는 경우를 의미하며, 이는 기록 오류로 발생한 데이터이므로, 이러한 데이터를 제거한다.
다음으로, 패턴 변화 데이터 제거 과정과 관련하여, 도 5a는 본 발명에 따른 절체 패턴 탐지 관련 기본 데이터를 나타낸다. 한편, 도 5b는 본 발명에 따른 절체 시점 탐지에 관한 예시를 나타낸다. 이때, 절체 시점 탐지와 관련하여, 다음 부하 데이터의 범위를 Simple Exponential Smoothing을 이용하여 예측하고 예측 값과 실제 측정된 값이 설정한 임계 값을 초과할 경우 절체 시점으로 탐지할 수 있다.
한편, 도 5c는 본 발명에 따른 패턴 군집화에 관한 예시를 나타낸다. 또한, 도 5d는 본 발명에 따른 패턴 재군집화에 관한 예시를 나타낸다. 한편, 패턴 군집화 과정에서, 절체 시점을 기준으로 클래스를 분류할 수 있다. 이때, 절체 시점 이전은 A 클래스로, 절체 구간에서는 B 클래스로, 절체 시점 이후는 C 클래스로 분류될 수 있다. 또한, 패턴 재군집화 과정에서, 일차 분류된 클래스를 군집에 따라 클래스를 재분류할 수 있다. 이때, A 클래스와 패턴이 비슷한 C클래스를 A 클래스로 재분류할 수 있다.
다음으로, 도 6은 본 발명의 비정상 패턴 탐지에 따른 패턴 변화 데이터 제거 후, 제거 이전의 시계열 데이터를 나타낸다. 이때, 전술한 바와 같이, 부하 데이터의 범위를 예측한 예측 값과 실제 측정 값의 차이가 임계 값을 초과하는 절체 시점을 기준으로 패턴 군집화가 수행될 수 있다. 또한, 상기 절체 시점 이전 및 이후 데이터에 대해 패턴 재군집화가 수행될 수 있다.
다음으로, 도 7a는 본 발명에 따른 이상 데이터 제거 과정의 개념도를 나타낸다. 또한, 도 7b는 본 발명에 따른 이상 데이터 제거 이후, 비정상 데이터 판정을 위한 RNOF 알고리즘을 적용한 예시이다. 여기서, RNOF 알고리즘은 Robust Neighbor Outlier Factor 알고리즘이다.
한편, 도 7b의 하단 그림에서는 RNOF 가 적용된 그림이 나타난다. 파란색 선은 측정된 데이터를 의미하며, 주황색 선은 추세선을 의미한다. RNOF는 측정된 데이터 값에서 추세 값을 차감한 값에 절대값을 취하여 계산한다. 한편, 임계치는 잔차 탐지율을 보고 자동적으로 결정되며, 잔차가 임계치가 넘는 데이터를 이상 데이터로 판정하고 제거할 수 있다.
한편, 이상 데이터 제거 이후, 비정상 데이터 판정을 위한 RNOF 알고리즘에 대해 살펴보면 다음과 같다. RNOF 알고리즘은 특정 기간에 취득된 데이터의 경계값 즉, 최대값과 최소값에 일정 상수 c1, c2를 곱하여 정상 범위를 정하는 방법 예를 들어, 특정 기간에 취득된 데이터의 최대값의 150%, 최소값의 50% 값 이내에 해당하는 데이터를 정상으로 판정하는 기법이다. 한편, 이러한 방법은 시간에 따라 변화하는 데이터의 특성을 고려하지 않았기 때문에, 정상 데이터의 범위가 필요 이상으로 넓을 수 있다. 이럴 경우, 비정상 데이터를 정상으로 탐지하는 오류가 발생할 수 있다는 문제점이 있다.
한편, 도 7c는 본 발명과 관련하여 RNOF 알고리즘 적용 시, 비정상 데이터 판정이 이루어질 수 없는 일 예시를 나타낸다. 예를 들어, 위 그림과 같이 특정 기간에서 취득된 데이터의 최대값이 100, 최소값이 10이라고 가정하자. 그러면 150, 10 은 각각 최대값의 150%에 해당하는 값과 최소값의 50%에 해당하는 값이다. 이러한 값들 안에 데이터가 들어올 경우 정상으로 판정, 이 범위를 넘어가는 값이 발생할 경우 비정상으로 판정한다.
이와 같은 방법은 도 7c의 A 데이터를 정상으로 판정하지만, 이는 비정상적인 데이터이다. 왜냐하면 시간에 따라 변화하는 데이터의 특성을 고려하였을 때, 발생할 확률이 적은 데이터이기 때문이다.
종래 비정상 데이터 판별 방법은 시간에 따라 변화하는 데이터의 특성을 고려하지 않는다. 따라서 비정상 데이터를 정상 데이터라고 잘못 판정하는 오류가 발생할 가능성이 크다.
따라서, 본 발명에서는 시간에 따라 변화하는 데이터의 특성을 고려하기 위하여, 이동 평균법을 사용하여 추출한 추세 값을 기준으로 정상 범위를 벗어나는 데이터를 비정상 데이터로 판정한다.
이를 위해, 전술한 바와 같이, 부하 예측부(300)의 시계열 추세 추출부는 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 시계열 데이터의 시계열 추세 값을 추출할 수 있다.
이와 관련하여, 시계열 데이터 추세는 이동 평균법을 사용하여 추출하였다. 이동 평균법은 t시점의 데이터와 주변 시점의 데이터의 평균값을 의미한다. 이동 평균법은 주변 시점의 데이터가 이상 데이터이더라도 이를 포함하여 평균값을 계산한다. 따라서 이상 데이터가 존재할 경우, 정상 시계열 추세를 추출해내지 못하는 단점이 있다. 따라서 본 발명에서는 이동 평균법을 수정하여 사용하였으며, 이를 절사 주변 평균법(Trimmed vicinity Mean Method)이라 칭하였다. 한편, 도 7d는 본 발명과 관련하여, 시계열 데이터에서 주변 값들과 평균 값과의 차이가 발생 시 절사 주변 평균법의 원리를 나타낸 개념도이다.
도 7d는 본 발명에 따른 절사 주변 평균법 계산 즉, 시계열 추세 추출부에 대한 그림이다. t시점의 주변 평균값을 계산할 경우, t 시점의 데이터 외에 주변 시점의 데이터를 같이 고려하여 계산한다.
발명된 절사 주변 평균값의 목적은 주변 평균값 계산시, 이상 데이터 또는 이상 데이터에 영향을 받지 않도록 하는 것이다. 이를 위하여 t시점의 이동 평균값을 구할 경우, t시점의 데이터는 고려 대상에서 제외하였다. 왜냐하면 해당 값이 이상 값일 경우, 주변 평균값에 영향을 미치기 때문이다. 이와 더불어 주변 평균값 계산시 절사 평균값을 사용함으로써 이상 값에 영향을 덜 받도록 하였다.
예를 들어, t시점 주변 평균값 계산시 고려되는 대상이 [-100, 1, 2, 500, 2, 3, 100] 이며, t 시점의 값이 500 이라고 가정하자. 그러면 t 시점의 값과 절사되는 값들을 제외하면 [1, 2, 2, 3]이 되며, 평균값은 2가 된다.
한편, 부하 예측부(300)의 시계열 추세 제거부는 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산한다.
한편, 부하 예측부(300)의 통계치 획득부는 특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득한다. 이와 관련하여, 통계치 획득부에서는 여러 방법으로 계산한 잔차의 합을 계산한다. 방법이 1개 이상이 되는 이유는 주변 시점을 어떻게 정의하는지에 따라 여러 방법이 발생하기 때문이다.
예를 들어 오후 2시의 이동 평균값을 계산할 경우 고려되는 주변 값은 다음 시점의 값들이다. 이 경우에는 주변 2시점까지 고려하는 것으로 가정한다.
1시간 간격: [오후 12시, 오후 1시, 오후 2시, 오후 3시, 오후 4시]
24시간 간격: [전 전날 오후 2시, 전날 오후 2시, 당일 오후 2시, 다음날 오후 2시, 다다음날 오후 2시]
24시간 간격: [전 전주 오후 2시, 전주 오후 2시, 당일 오후 2시, 다음주 오후 2시, 다다음주 오후 2시]
변압기 IoT 센서에서 취득한 유중 온도의 경우 사람들이 사용한 전력량에 영향을 받는다. 사용된 전력량 즉 부하는 시간에 따라 변화하는 성질이 있기 때문에, 주변 값을 1시간 간격, 24시간 간격 그리고 1주일 간격으로 정의하여 획득할 수 있다 (변압기 외부 온도는 날씨에 영향을 받기 때문에 시간에 따라 변화하는 성질을 갖으며, 유중 온도와 동일한 간격을 적용할 수 있다).
한편, 부하 예측부(300)의 임계치 결정부는 상기 통계치 획득부에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정한다. 이에 따라, 상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성할 수 있다.
이와 관련하여, 임계치 획득부에서는 부트스트랩(Bootstrap) 방법을 이용하여 통계치 획득부에서 계산된 잔차의 q% 분위수를 계산한다. 부트스트랩 방법은 데이터의 개수만큼 복원추출을 한 다음 통계량을 계산하는 작업을 n번 반복하고 평균을 내서, 통계량을 추정하는 방법이다.
예를 들어 잔차의 q% 분위수를 구할 경우를 가정하자. 그러면 잔차 데이터 개수만큼 복원 추출을 수행하여 q% 분위수를 계산한다. 이를 q1 이라고 한다. 그 다음에는 이와 같은 작업을 반복하고 이렇게 계산된 분위수들을 q1, q2, ..., q1000 라고 한다. qi에서 i는 번호, 즉 지수를 의미한다. 위의 과정에서 얻어진 1000개의 분위수를 다시 평균을 내면 잔차의 부트스트랩 q% 분위수가 계산된다.
부트스트랩 방법을 사용하여 통계치를 획득할 경우 표본 통계치를 사용하는 것보다 모집단의 통계량을 잘 추정하는 것으로 알려져 있다. 임계치 획득부에서는 q를 100, 99.9, 99.8, ..., 99.0 으로 설정하여 11가지 경우의 분위수를 계산한다.
한편, 임계치 결정부에서는 11가지 분위수 중 어느 분위수를 사용할지 결정한다.
임계치 결정 방법 1) 이전 분위수와의 값 차이가 c 이상인 분위수, c: 사용자 지정 파라미터 (default: 1)
임계치 결정 방법 2) 이전 분위수와의 값 차이가 최대가 되는 분위수 + 잔차 데이터의 표준편차 * α, α: 사용자 지정 파라미터 (default: 1.5)
이와 같은 시계열 추세를 고려한 일련의 부하 예측 방법은 시계열 값의 변화가 이상 범위에 해당하는 데이터를 제거할 수 있다는 장점이 있다. 이와 관련하여, 시계열 값이 급격하게 변화된 경우는 시계열 데이터의 추세에서 극단적으로 벗어난 경우를 의미한다. 시계열 추세에서 벗어난 데이터는 이전 값에 비해 값이 급격하게 변화되는 특징을 보이며, 이는 비정상적인 값의 변화이므로 이상 데이터라고 볼 수 있다.
한편, 가용 데이터 판별은 데이터 획득부(100) 뿐만 아니라, 전처리부(200)에서도 수행될 수 있다.
이와 관련하여, 가용 데이터 판별부에서는 전처리 후에도 분석에 사용할 만큼 데이터가 남아있는지를 판별한다.
이러한 판별을 위하여 가용 데이터 비율을 계산하는데, 가용 데이터 비율이 α % 이상일 경우 데이터가 사용 가능하다고 판단된다.
- α는 사용자 지정 파라미터로 디폴트(default) 값은 80% 이다.
한편, 미취득 데이터 생성과 관련하여, 전처리부(200)는 상기 미취득 데이터를 생성하기 위하여 이전 시점에서 예측한 값을 다시 입력으로 사용하는 방법으로 LSTM 알고리즘을 학습할 수 있다. 또한, 부하 예측부(300)는 부하 예측 시, 학습 시와 동일한 방법으로 이전 시점에서 예측한 값을 다시 입력으로 사용할 수 있다.
구체적으로, 미취득 데이터 생성 과정과 관련하여, 데이터 개수가 사용 가능할 만큼 존재한다면, 미취득 또는 전처리 과정에서 제거된 데이터를 생성한다. 한편, 미취득 데이터 학습 알고리즘에 대해 상세하게 살펴보면 다음과 같다.
미취득 데이터가 포함된 데이터에서 예측 알고리즘을 학습하기 위하여 회귀신경망 (Recurrent Neural Networks) 모델 중 LSTM (Long Short-Term Memory) 알고리즘의 구조를 변경하여 사용할 수 있다. 이와 관련하여, 본 발명의 목적은 2가지 부분으로 각각 미취득 데이터 학습 및 예측과 중장기 예측을 목적으로 한다.
먼저, 미취득 데이터 학습 및 예측은 다음과 같다. 이와 관련하여, 도 8은 본 발명에 따른 미취득 데이터 학습 및 예측 과정의 개념도를 나타낸다. 한편, 예측 알고리즘 학습 시 사용되는 데이터는 Null (미취득)이 없다고 가정되어 있다. 따라서, 미취득 데이터를 생성하기 위하여 이전 시점에서 예측한 값을 다시 입력으로 사용하는 방법으로 LSTM 알고리즘을 학습한다.
예측 시에도 입력되는 데이터가 Null (미취득)을 포함할 경우, 학습시와 동일한 방법으로 이전 시점에서 예측한 데이터를 입력 데이터로 사용한다.
한편, 부하 예측부(300)는 다음과 같은 방식으로 부하 예측을 수행할 수 있다. 이와 관련하여, 부하 예측부(300)는 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 상기 시계열 데이터의 시계열 추세 값을 추출하는 시계열 추세 추출부를 포함할 수 있다. 또한, 상기 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산하는 시계열 추세 제거부를 포함할 수 있다
한편, 부하 예측부(300)는 특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득하는 통계치 획득부를 더 포함할 수 있다. 또한, 상기 통계치 획득부에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정하는 임계치 결정부를 더 포함할 수 있다. 이때, 상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성할 수 있다.
따라서, 전술한 바와 같이, 부하 예측부(300)는 추세 변화 데이터를 제거한 후, 단기 및 중기 또는 장기 예측을 진행한다. 먼저, 추세 변화 데이터 제거 과정에 대해 살펴보면 다음과 같다. 이와 관련하여, 도 9는 본 발명에 따른 추세 변화 데이터 제거 과정의 개념도를 나타낸다. 이때, 추세 변화 데이터 제거부에서는 추세의 변화가 있는지를 탐지한 후, 추세 변화가 존재할 경우 추세 변화 이후의 데이터를 빼내어 새로운 데이터셋을 만든다. 즉, 전체 데이터셋과 더불어 추세 변화 이후 데이터 셋이 생성된다.
추세 변화를 고려하는 이유는 시계열 패턴이 변화된 경우, 변화 이전의 데이터를 같이 사용하면 예측 모델의 성능을 저하될 가능성이 있기 때문이다. 따라서 이후 예측 모델 학습 시, 전체 데이터셋과 추세 변화 이후 데이터셋에 대해 각각 예측 모델을 학습한 후 평가 오류(Validation Loss)가 적은 모델을 최종 모델로 선택한다.
다음으로, 부하 예측과 관련하여 장기 예측 알고리즘에 대해 살펴보면 아래와 같다. 한편, 도 10은 본 발명에 따른 HOLSTM 알고리즘의 원리를 나타낸 개념도이다. 이와 관련하여, 장기 부하 예측은 LSTM(long short term memory) 알고리즘을 변경한 HOLSTM (High Order LST) 알고리즘을 사용하여 수행될 수 있다. 반면에, 단기/중기 부하 예측은 상기 HOLSTM 알고리즘 또는 상기 LSTM 알고리즘을 사용하여 수행될 수 있다.
장기 예측을 위하여 LSTM 알고리즘을 변경한 HOLSTM (High Order LSTM) 알고리즘을 사용할 수 있다. HOLSTM은 HORNN (High Order Recurrent Neural Networks)의 High Order 개념을 LSTM의 long-term memory에 적용한 제안(발명) 방법이다.
본 방법은 Long-term Memory (또는 Cell) 값 계산시, 2시점 이상의 이전 Long-term Memory (또는 Cell)의 값에 remember gate를 곱한 값을 같이 사용하는 방법 (그림의 빨간색 선)으로, 장기 정보를 효과적으로 전달한다.
- remember gate: 0 내지 1의 사이의 값을 가지며, Long-term Memory의 값을 얼마나 반영하여 전달할지를 결정한다.
이때, LSTM과 HOLSTM 알고리즘에 따른 시간 t에서의 부하 예측 알고리즘은 다음과 같다.
따라서, HOLSTM 알고리즘이 Long-term Memory (또는 Cell) 값 계산시, t-2시점 이상의 이전 ()Long-term Memory (또는 Cell)의 값에 remember gate를 곱한 값을 같이 사용하는 방법 (그림의 빨간색 선)으로, 장기 정보를 효과적으로 전달할 수 있다는 장점이 있다.
한편, 단기, 중기 예측 알고리즘에 대해 살펴보면 다음과 같다. 단기 및 중기 예측 알고리즘에서는 장기 예측에서 사용한 HOLSTM 또는 LSTM 알고리즘을 사용하여 예측 모델을 학습할 수 있다. 이와 관련하여, 학습시에는 학습 레이트(learning rate)에 매 5 또는 10회 반복(iteration)마다 0.8을 곱하여 사용하는 학습시에는 학습 레이트 감쇠(learning rate decay)를 적용할 수 있다.
이와 관련하여, 부하 예측부(300)에서는 단기/중기 부하 예측을 위한 학습 시 학습 레이트(learning rate)를 동적으로 변경할 수 있다. 이때, 상기 학습 시 도출된 MMSE (Minimum Mean Squared Error) 가 d회 동안 갱신되지 않을 경우, 상기 학습 레이트에 gamma 를 곱하여 학습 레이트 감쇠(learning rate decay)를 동적으로 변경시킬 수 있다.
한편, 도 11은 본 발명의 LSTM 및 HOLSTM 알고리즘에 따른 학습 횟수에 따른 오류 결과를 나타낸 것이다. 도 11을 참조하면, HOLSTM 알고리즘을 적용한 경우, 비교적 적은 학습 횟수로 오류 가능성을 감소시킬 수 있다는 장점이 있다.
한편, 도 12는 본 발명의 LSTM 및 HOLSTM 알고리즘에 따른 기간 별 전력 부하 예측 결과를 나타낸 것이다. 이때, LSTM 은 1주간의 예측 패턴이 반복되는 반면, HOLSTM 은 조금 더 다양한 주기성을 반영하여 예측할 수 있음을 알 수 있다.
한편, 도 13은 본 발명의 HOLSTM 알고리즘에 날짜 정보를 사용한 경우의 부하 예측 결과를 나타낸 것이다. 도 13에 도시된 바와 같이, 공휴일, 주말 정보 등 날짜 정보를 사용할 경우 예측 성능이 더욱 향상됨을 알 수 있다. 따라서, 공휴일, 주말 정보 등 날짜 정보와 기온 정보 등 부가 데이터(meta data)를 반영하면 더 정확한 부하 예측 결과를 얻을 수 있다는 장점이 있다.
이상에서는 본 발명에 따른 발명은 미취득 데이터 보정을 통한 부하 예측 시스템에 대해 살펴보았다. 이와 관련하여, 도 14는 본 발명과 관련하여 부하 패턴 변화 지점을 탐지하지 못한 경우와 본 발명에 따라 패턴 변화 탐지에 따른 예측 결과를 비교한 것이다. 도 14의 (a)와 같이, 부하 패턴 변화 지점을 탐지하지 못할 경우 부정확하게 부하를 예측하게 된다. 반면에, 도 14의 (b)와 같이, 부하 패턴 변화 지점을 탐지할 경우, 부하를 높은 정확도로 올바르게 예측할 수 있다는 장점이 있다.
이상에서는 본 발명에 따른 발명은 미취득 데이터 보정을 통한 부하 예측 시스템에 대해 살펴보았다. 한편, 상기 부하 예측 시스템을 이용하여 미취득 데이터 보정을 통한 부하 예측이 수행될 수 있다. 이와 관련하여, 부하 예측 시스템에서 설명된 내용이 부하 예측 방법에 이용될 수 있다.
도 15는 본 발명에 따른 미취득 데이터 보정을 통한 부하 예측 방법의 흐름도를 나타낸다. 도 16을 참조하면, 상기 부하 예측 방법은 데이터 획득 과정(S100), 전처리 과정(S200) 및 부하 예측 과정(S300)을 포함한다.
데이터 획득 과정(S100)에서, 전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별한다. 또한, 전처리 과정(S200)에서, 상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성한다. 또한, 부하 예측 과정(S300)에서, 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행할 수 있다.
한편, 상기 부하 예측 과정은 전술한 바와 같이, 시계열 추세 추출 과정, 시계열 추세 제거 과정, 통계치 획득 과정 및 임계치 결정 과정을 포함할 수 있다.
이때, 시계열 추세 추출 과정에서, 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 상기 시계열 데이터의 시계열 추세 값을 추출할 수 있다. 또한, 시계열 추세 제거 과정에서, 상기 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산할 수 있다. 또한, 통계치 획득 과정에서, 특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득할 수 있다. 또한, 임계치 결정 과정에서, 상기 통계치 획득부에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정할 수 있다. 이에 따라, 상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행할 수 있다.
이상에서는 본 발명에 따른 발명은 미취득 데이터 보정을 통한 부하 예측 시스템과 부하 예측 방법에 대해 살펴보았다. 본 발명의 적어도 일 실시 예에 따른 기술적 효과는 다음과 같다.
본 발명에 따르면, 전력 부하 데이터의 비정상 데이터를 제거하고 패턴이 변화하는 시점을 탐지한 후 이상 데이터를 제거함으로써 부하 예측 알고리즘의 정확도를 높일 수 있도록 부하 데이터를 전처리 할 수 있다는 장점이 있다.
또한, 본 발명에 따르면, 측정된 데이터에서 비정상 데이터와 이상 데이터를 제거하는 것은 부하 예측 알고리즘이 정상 데이터를 이용해 학습을 진행할 수 있도록 함으로써 예측하고자 하는 미래 부하의 정확도를 높일 수 있다.
또한, 본 발명에 따르면, 측정된 데이터에서 패턴이 변화하는 시점을 탐지하는 것은 해당 데이터에서 절체로 인해 데이터의 패턴이 변화한 시점과 일반적인 패턴에서 벗어나는 패턴을 탐지함으로써 일반적인 패턴만으로 구성된 학습 데이터를 이용해 부하 예측을 진행하여 예측하고자 하는 미래 부하의 정확도를 높일 수 있다.
또한, 본 발명에 따르면, 이와 같이 측정된 부하 데이터에서 비정상 데이터를 제거하고 패턴 변화를 탐지하여 복원한 후 이상 데이터를 제거하는 것은 부하 데이터에 기계학습을 적용하여 정확한 미래 부하를 예측할 수 있도록 한다.
또한, 본 발명에 따르면, 미래 전력 수요로 볼 수 있는 미래 부하를 높은 정확도로 예측할 수 있게 되면 전력 설비를 운영하는데 많은 도움을 줄 수 있다는 장점이 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능뿐만 아니라 각각의 구성 요소들은 별도의 소프트웨어 모듈로도 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리에 저장되고, 제어부(controller) 또는 프로세서(processor)에 의해 실행될 수 있다.
Claims (11)
- 미취득 데이터 보정을 통한 부하 예측 시스템에 있어서,
전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별하는 데이터 획득부;
상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성하는 전처리부; 및
상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행하는 부하 예측부를 포함하는, 부하 예측 시스템. - 제1항에 있어서,
상기 부하 예측부는,
상기 제1 예측 알고리즘을 사용하여 전력 계통의 장기 부하 예측을 수행하고,
상기 제2 예측 알고리즘을 사용하여 상기 전력 계통의 단기/중기 부하 예측을 수행하는 것을 특징으로 하는, 부하 예측 시스템. - 제2항에 있어서,
상기 장기 부하 예측은 LSTM(long short term memory) 알고리즘을 변경한 HOLSTM (High Order LST) 알고리즘을 사용하여 수행되고,
상기 단기/중기 부하 예측은 상기 HOLSTM 알고리즘 또는 상기 LSTM 알고리즘을 사용하여 수행되는 것을 특징으로 하는, 부하 예측 시스템. - 제3항에 있어서,
상기 부하 예측부는,
상기 단기/중기 부하 예측을 위한 학습 시 학습 레이트(learning rate)를 동적으로 변경하고,
상기 학습 시 도출된 MMSE (Minimum Mean Squared Error) 가 d회 동안 갱신되지 않을 경우, 상기 학습 레이트에 gamma 를 곱하여 학습 레이트 감쇠(learning rate decay)를 동적으로 변경시키는 것으로 특징으로 하는, 부하 예측 시스템. - 제3항에 있어서,
상기 전처리부는,
상기 전력 데이터에서 비정상 데이터 제거 과정, 패턴 변화 데이터 제거 과정 및 이상 데이터 제거 과정을 통해 상기 제2 전력 데이터를 획득하는 것을 특징으로 하는, 부하 예측 시스템. - 제5항에 있어서,
상기 패턴 변화 데이터 제거 과정에서,
부하 데이터의 범위를 예측한 예측 값과 실제 측정 값의 차이가 임계 값을 초과하는 절체 시점을 기준으로 패턴 군집화가 수행되고,
상기 절체 시점 이전 및 이후 데이터에 대해 패턴 재군집화가 수행되는 것을 특징으로 하는, 부하 예측 시스템. - 제1항에 있어서,
상기 전처리부는,
상기 미취득 데이터를 생성하기 위하여 이전 시점에서 예측한 값을 다시 입력으로 사용하는 방법으로 LSTM 알고리즘을 학습하고,
상기 부하 예측부는,
상기 부하 예측 시, 학습 시와 동일한 방법으로 이전 시점에서 예측한 값을 다시 입력으로 사용하는 것을 특징으로 하는, 부하 예측 시스템. - 제1항에 있어서,
상기 부하 예측부는,
상기 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 상기 시계열 데이터의 시계열 추세 값을 추출하는 시계열 추세 추출부; 및
상기 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산하는 시계열 추세 제거부를 포함하는, 부하 예측 시스템. - 제8항에 있어서,
특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득하는 통계치 획득부; 및
상기 통계치 획득부에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정하는 임계치 결정부를 더 포함하고,
상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하는, 부하 예측 시스템. - 미취득 데이터 보정을 통한 부하 예측 방법에 있어서,
전력 데이터를 획득한 후, 상기 전력 데이터가 분석을 위해 필요한 최소 데이터 개수 이상인지 여부를 판별하는 데이터 획득 과정;
상기 전력 데이터에서 일부 데이터를 제거한 제2 전력 데이터가 가용 데이터 비율 이상인지 여부를 판별하고, 미취득 데이터(null data)를 생성하는 전처리 과정; 및
상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하고, 상기 데이터 셋을 이용하여 제1 예측 알고리즘 또는 제2 예측 알고리즘에 따라 부하 예측을 수행하는 부하 예측 과정을 포함하는, 부하 예측 방법. - 제10항에 있어서,
상기 부하 예측 과정은,
상기 제2 전력 데이터의 시계열 데이터에서 이상 데이터를 보정한 이동 평균법인 절사 주변 평균법에 따라 상기 시계열 데이터의 시계열 추세 값을 추출하는 시계열 추세 추출 과정;
상기 제2 전력 데이터의 원시 데이터(raw data)와 상기 시계열 추세 값의 차이에 해당하는 잔차(remainder)를 계산하는 시계열 추세 제거 과정;
특정 시간 간격으로 상기 잔차의 합을 계산하여, 상기 잔차에 대한 통계치를 획득하는 통계치 획득 과정; 및
상기 통계치 획득 과정에서 계산한 잔차의 복수의 q% 분위수 중 어느 하나의 분위수를 사용하여 임계치를 결정하는 임계치 결정 과정을 포함하고,
상기 결정된 임계치에 기반하여 상기 제2 전력 데이터의 추세 변화에 따라 데이터 셋을 생성하는 것을 특징으로 하는, 부하 예측 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180136852A KR101941854B1 (ko) | 2018-11-08 | 2018-11-08 | 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180136852A KR101941854B1 (ko) | 2018-11-08 | 2018-11-08 | 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101941854B1 true KR101941854B1 (ko) | 2019-01-24 |
Family
ID=65277399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180136852A KR101941854B1 (ko) | 2018-11-08 | 2018-11-08 | 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101941854B1 (ko) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210026447A (ko) * | 2019-08-30 | 2021-03-10 | 한국전력공사 | 심층 신경망 기반 전력 수요 예측 장치 및 방법 |
KR102268104B1 (ko) * | 2020-02-18 | 2021-06-22 | 국민대학교산학협력단 | 부하 예측 방법 및 장치 |
CN113434496A (zh) * | 2021-07-15 | 2021-09-24 | 广东电网有限责任公司 | 配变重过载实时监测系统方法、系统及计算机介质 |
KR20220096568A (ko) * | 2020-12-31 | 2022-07-07 | 현대일렉트릭앤에너지시스템(주) | 전력 사용량 예측 장치 및 방법 |
CN115019078A (zh) * | 2022-08-09 | 2022-09-06 | 阿里巴巴(中国)有限公司 | 数据聚类方法以及装置 |
KR20220157129A (ko) * | 2021-05-20 | 2022-11-29 | 한국전력공사 | 공동주택 수전설비의 기중차단기 동작 예측 장치 및 방법 |
CN116930595A (zh) * | 2023-09-18 | 2023-10-24 | 法拉迪电气有限公司 | 一种用于新能源并网调压的精准数据计量方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101848923B1 (ko) * | 2011-09-28 | 2018-04-17 | 한국전력공사 | 검침데이터 검증 장치 및 방법 |
KR20180046174A (ko) * | 2016-10-27 | 2018-05-08 | 한국전기연구원 | 신재생기반 독립형 마이크로그리드의 최적 운전을 위한 운영 시스템 및 방법 |
KR20180057780A (ko) * | 2016-11-22 | 2018-05-31 | 한국에너지기술연구원 | 기계학습을 활용한 에너지관리시스템 및 에너지관리방법 |
KR20180103632A (ko) * | 2017-03-10 | 2018-09-19 | 광주과학기술원 | 비정상 정보 검출 기술을 적용한 스마트 미터 시스템 및 검출 방법 |
-
2018
- 2018-11-08 KR KR1020180136852A patent/KR101941854B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101848923B1 (ko) * | 2011-09-28 | 2018-04-17 | 한국전력공사 | 검침데이터 검증 장치 및 방법 |
KR20180046174A (ko) * | 2016-10-27 | 2018-05-08 | 한국전기연구원 | 신재생기반 독립형 마이크로그리드의 최적 운전을 위한 운영 시스템 및 방법 |
KR20180057780A (ko) * | 2016-11-22 | 2018-05-31 | 한국에너지기술연구원 | 기계학습을 활용한 에너지관리시스템 및 에너지관리방법 |
KR20180103632A (ko) * | 2017-03-10 | 2018-09-19 | 광주과학기술원 | 비정상 정보 검출 기술을 적용한 스마트 미터 시스템 및 검출 방법 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210026447A (ko) * | 2019-08-30 | 2021-03-10 | 한국전력공사 | 심층 신경망 기반 전력 수요 예측 장치 및 방법 |
KR102324783B1 (ko) * | 2019-08-30 | 2021-11-11 | 한국전력공사 | 심층 신경망 기반 전력 수요 예측 장치 및 방법 |
KR102268104B1 (ko) * | 2020-02-18 | 2021-06-22 | 국민대학교산학협력단 | 부하 예측 방법 및 장치 |
KR20220096568A (ko) * | 2020-12-31 | 2022-07-07 | 현대일렉트릭앤에너지시스템(주) | 전력 사용량 예측 장치 및 방법 |
KR102501857B1 (ko) * | 2020-12-31 | 2023-02-21 | 현대일렉트릭앤에너지시스템(주) | 전력 사용량 예측 장치 및 방법 |
KR20220157129A (ko) * | 2021-05-20 | 2022-11-29 | 한국전력공사 | 공동주택 수전설비의 기중차단기 동작 예측 장치 및 방법 |
KR102675326B1 (ko) * | 2021-05-20 | 2024-06-14 | 한국전력공사 | 공동주택 수전설비의 기중차단기 동작 예측 장치 및 방법 |
CN113434496A (zh) * | 2021-07-15 | 2021-09-24 | 广东电网有限责任公司 | 配变重过载实时监测系统方法、系统及计算机介质 |
CN115019078A (zh) * | 2022-08-09 | 2022-09-06 | 阿里巴巴(中国)有限公司 | 数据聚类方法以及装置 |
CN115019078B (zh) * | 2022-08-09 | 2023-01-24 | 阿里巴巴(中国)有限公司 | 车辆图像处理方法、计算设备及存储介质 |
CN116930595A (zh) * | 2023-09-18 | 2023-10-24 | 法拉迪电气有限公司 | 一种用于新能源并网调压的精准数据计量方法 |
CN116930595B (zh) * | 2023-09-18 | 2023-11-24 | 法拉迪电气有限公司 | 一种用于新能源并网调压的精准数据计量方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101941854B1 (ko) | 미취득 데이터 보정을 통한 부하 예측 시스템 및 방법 | |
JP2023017888A (ja) | 根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 | |
JP5996384B2 (ja) | プロセス監視診断装置、プロセス監視診断プログラム | |
US20200356087A1 (en) | Model predictive maintenance system with event or condition based performance | |
EP2514068B1 (en) | Method for non-intrusive load monitoring using a hybrid systems state estimation approach | |
CN108700851B (zh) | 用于预测能量消耗的系统、方法和基于云的平台 | |
CN117114454B (zh) | 一种基于Apriori算法的直流套管状态评估方法及系统 | |
KR101948604B1 (ko) | 센서 군집화 기반의 설비 건강 모니터링 방법 및 장치 | |
EP3364157A1 (en) | Method and system of outlier detection in energy metering data | |
CN113837427B (zh) | 用于对资产执行预测性健康分析的方法和计算系统 | |
AU2018251134B2 (en) | Method and apparatus for monitoring the condition of subsystems within a renewable generation plant or microgrid | |
WO2018112352A1 (en) | Techniques of automated fault detection and related systems and methods | |
CN113868953B (zh) | 工业系统中多机组运行优化方法、装置、系统及存储介质 | |
CN116529740A (zh) | 使用机器学习对电气设备的负载预报 | |
CN116187552A (zh) | 异常检测方法、计算设备及计算机存储介质 | |
WO2020252666A1 (zh) | 工业物联网的边缘计算设备、方法和计算机可读存储介质 | |
Al-Mohamad et al. | Zonotopic extended Kalman filter for RUL forecasting with unknown degradation behaviors | |
KR101960755B1 (ko) | 미취득 전력 데이터 생성 방법 및 장치 | |
CN108459991B (zh) | 一种获得设备可靠性数据的方法 | |
US20230297095A1 (en) | Monitoring device and method for detecting anomalies | |
CN109324591A (zh) | 基于鲁棒估计器的随机混杂系统的故障诊断装置及方法 | |
KR20210097613A (ko) | 수요관리 자원 최적화를 위한 전력사용량 예측 시스템 | |
US20200166205A1 (en) | Apparatus for managing combustion optimization and method therefor | |
CN112581727B (zh) | 桥梁的位移漂移预警方法、装置、设备及存储介质 | |
KR20010036423A (ko) | 일반 회귀 신경망을 이용한 고장 검출 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |