[D-4 대선 전망]ESM 빅데이터 선거예측시스템 "이재명 47% vs 윤석열 39% 득표 예상"여론조사 공표 금지로 빅데이터만이 선거 예측하는 유일한 바로미터20대 대선 사전투표율 36.93%로 19대 대선보다 10.87% 높은 투표율이재명에 대한 관심도와 사전투표율과의 상관 관계 매우 높아ESM "8%의 격차로 오차범위 밖에서 이재명 후보의 당선 예측"3일부터 여론조사 공표가 금지됨에 따라 사전선거가 시작되는 이제 빅데이터만이 대중이 알수있는 민심을 측정하는 유일한 바로미터가 되었다. 최근 선거 결과를 미리 예측하기 위해 수많은 여론조사가 쏟아지고 있다. 그러나 조사기관의 유무선 비율, 질문지 구성, 응답률에서 그 신뢰성에서 크게 의심받고 있다. 여론조사에서 낮은 응답률, 신뢰성없는 표본의 추출, 유도성 질문지, 특정 지지층의 과표집 등 많은 문제를 내포하고 있다. 또한 난립한 여론조사 업체에서는 향후에도 응답을 할 것인가라고 질문하여 기 응답자의 성향을 미리 수집 파악하여 의뢰자가 원하면 응답자 표본을 임의로 설계하여 의뢰자가 원하는 대로 돈만 지불하면 원하는 결과치를 얻어내는 것이 아닌가 의심된다. 즉 사실상 여론 조사가 아니라 여론조작 수준이다. 열린뉴스는 본지 편집인이며 빅데이터 전문가인 동양미래대 로봇자동화공학부 김상민 겸임교수가 블로그에서 발표하고 있는 ESM 선거 예측 시스템의 분석을 통해 20대 대선을 전망한다. -편집자주- 3일 안철수 후보가 단일화를 이유로 사퇴하고, 언론들은 이재명 후보와 윤석열 후보의 박빙의 선거 결과를 예측하고 있는 가운데 역대 선거에서 선거 결과에 근접한 예측을 해온 ESM 빅데이터 선거예측 시스템의 분석에 따르면 이재명 후보의 승리가 예상되고 있다. 3일 안철수 후보가 윤석열 후보와의 단일화로 20대 대선에서는 이재명, 윤석열, 심상정 3자 대결로 굳어졌다. 다수의 여론조사가 의뢰자에 따라 그 결과가 설계된 상황에서 그 신뢰도가 크게 훼손된 상황으로 역대 선거에서 보았듯이 여론조사 결과는 신뢰성이 크게 떨어져 있으며 대선판도는 여론조사기관의 데이터 보다는 빅데이터만이 유일한 판세를 읽는 수단이 된 상황이다. 4일과 5일 실시된 20대 대선 사전투표에서 사전 투표율은 19대 사전투표율과 비교해 보았을 때 전국적으로 26.06%에서 36.93%로 10.87% 높은 투표율을 보였으며 전통적으로 민주당 지지가 높은 호남 지역에서는 전국 평균보다 훨씬 높은 50%대의 사전투표율을 보였다. ESM 선거예측시스템은 이같은 투표열기는 감안하여 19대 대선보다 2%정도 높은 79% 가까운 투표율을 보일 것으로 예상된다. 5일 선관위가 발표한 16개 광역 시도별 사전 투표율을 살표보면, 구글트렌드에서의 이재명에 대한 관심도 순위 점수와 사전투표율과의 상관관계를 살펴보면 상관계수(1에 가까울 수록 상관도가 정비례하여 높고 -1에 가까울 수록 반비례하여 낮음)가 0.88로 매우 높은 상관관계가 있음을 알수 있다. 즉 다시말해 이재명 후보에 대한 결집이 윤석열 후보의 결집보다 훨씬 높다고 볼수 있다. 그러나 선거 막판이 다가오자 지역별로 볼때 19대에서는 보수세가 강한 영남지역과 민주당 세가 강한 호남과의 격차를 12%에서 3.4%로 사전 투표율간의 격차가 좁혀 졌다. 즉 경북의 결집도를 보았을 때 보수의 결집도 상당 이루어져 사전투표가 끝나면서 부동층이 거의 사라지고 19대 대선에서 3자 구도로 인해 무효표와 기권표가 거의 사라지고 보수진영의 결집도 뚜렷해져 진영간 치열한 대결 양상이 관측된다. 호남에서는 그간 경선에서 이낙연 후보를 밀던 표가 이재명으로 주저하는 모습이었으나 투표일이 다가오자 호남에서 역대급의 결집이 일어나는 모습이다. 하이퍼 인공지능 예측시스템 ESM은 빅데이터에서 트렌드을 이용하여 선거결과를 예측할때 최종의 관심도가 아니라 기간중 시간을 X축으로 놓고 트렌드 관심도를 Y축으로 놓고 적분하고 최근 데이터에 가중치를 주는 방식으로 득표율을 예상하였다. 또 단순 트렌드가 아니라 연관 키워드 분석을 통해 키워드에 따른 지지율의 가감을 하고 인공지능 예측모델을 이용한 계산으로 정확한 예측을 기하였다. 네이버의 빅데이터는 검색어 트렌드만을 제공하기 때문에 빅데이터라고 볼수 없어 실제 웹페이지 전체에서 트렌드를 볼수 있는 구글의 보완 자료로 사용하였다. 연관 검색어에서도 윤석열 후보는 가족의 일본의 극우 사이비 무속 종교 관련, 윤후보 측근의 남묘호렌게쿄 관련 의혹 등 연관 검색어가 급등하고, 이는 안철수와의 단일화 검색어 보다 관심이 높다. 또 본부장 리스크 관련, 선데이저널이 공개한 윤석열 후보의 박근혜 전 대통령에 대한 육성 녹취록, 일본 자위대의 한반도 진입도 가능하다는 윤석열 발언 등 부정적인 키워드 검색이 압도적으로 많다. 또 눈에 띄이는 것중에는 사전투표시 윤석열이 줄을 서지 않고 새치기한 것으로 알려져 이에 대한 검색량이 급등하는 모습이다. 이재명 후보는 야당에서 시흥시 거북섬에 대한 특혜의혹을 제기함에 따라 검색어가 급등하였으나 여권에서는 근거없는 모략이라고 반박하고 있으며, 역대 대선에서 당선자만을 인터뷰했다는 타임지와의 인터뷰와 관련한 검색, 박근혜 전 대통령 박근령씨의 이재명 지지 등 상대적으로 윤석열 후보보다 긍정적인 키워드 검색이 많다. 2022.3.2. [평화방송의 Pick 인터뷰] ESM 빅데이터 선거예측 시스템 개발자 김상민 겸임교수와 배종찬 여론조사 전문가와의 20대 대선 전망 대담이에 따라 ESM을 이용한 20대 대선의 최종 결과 사전투표가 역대 가장 높은 투표율을 보여주면서 부동층이 대체로 사라지고 양진영의 결집이 이루어 지면서 하이퍼 인공지능 예측시스템 ESM에 의하면 만약 D-4인 5일 투표가 이루어 진다면 후보별 득표율은 이재명 47%, 윤석열 39%, 심상정 2.1% 의 득표율이 예측되고 있다. ESM에 의하면 2월 26일(D-11)에 비해서 이재명 후보가 윤석열 후보에 비해 3.5% -> 7.0 -> 9%->10% -> 11%로 득표율 격차를 벌이다 D-4일인 5일에는 경북, 경남, 울산에서 뚜렷한 윤석열 표의 결집이 보여주고, 부동층이 점차 사라지면서 양 후보간에 8% 정도의 격차로 좁혀졌다. 결론적으로 오늘 당장 투표를 한다면 8%의 격차로 오차범위 밖에서 이재명 후보의 당선이 확실시 되고 있다.
이 기사 좋아요
<저작권자 ⓒ 열린시민뉴스 무단전재 및 재배포 금지>
댓글
ESM, 구들빅데이터, 윤석열, 이재명, 심상정, 사전투표율, 지역별관심도, 구글트렌드, 네이버트렌드, 배종찬, 김상민동양미래대로봇자동화공학부겸임교수 관련기사목록
|
|