Data@KU 구독자 여러분, 안녕하세요. 디지털정보처 데이터Hub팀 김진원입니다.
그동안 잘지내셨나요? 기존 워드프레스 기반 디지털정보처 홈페이지(data.korea.ac.kr)에서 현 디지털정보처 홈페이지(ic.korea.ac.kr)로 이관작업이 진행되어서 잠시 Data@KU 뉴스레터가 쉬는 시간을 가졌습니다. 앞으로 다시 Data@KU 뉴스레터가 연재되오니 많은 관심부탁드립니다.
오늘은 영국 프리미어리그에서의 데이터 활용에 대해 다루고자 합니다. 매주 응원하는 팀이 하는 축구 경기를 시청하면서 스트레스를 해소하고는 하는데, 작년부터 흥미로운 정보들이 눈길을 사로잡았습니다. 중계화면 상단에 “Powered by Oracle Cloud”라는 문구와 함께 경기결과에 대한 예측, 10초 내 골을 넣을 확률, 공격 및 수비시 선수들의 평균 위치에 대한 정보가 제시되었습니다. 실제로 축구에서의 통계는 우리에게 아주 익숙합니다. 경기 중 / 전반 종료 / 경기 종료에 볼 점유율 평균값이 제시되기도 하고, (유효) 슈팅 수, 파울 수 등 각종 경기관련 수치들이 제시되기도 합니다. 하지만 이는 합산, 평균 등의 단순 통계이기 때문에 축구 경기를 시청하는데 흥미를 이끌기보다는 평범한 느낌을 자아내기만 했던 것 같습니다.
Oracle은 고급 성능 데이터와 머신러닝 기술을 활용하여 실시간 통계 및 예측 결과를 제공하고 경기장에서의 선수들의 실시간 액션에 대한 더 깊은 이해를 제공하는 것을 목표로 합니다. Oracle의 머신러닝 모델은 라이브 스트림 데이터, 실시간 추적 데이터, 프리미어리그 축구 선수와 무수히 많은 과거 경기에서 수집된 데이터를 기반으로 즉각적인 예측 결과를 생성하기 위해 개발되었습니다.
첫 번째로, Oracle Cloud에 의해서 제시되는 평균 포메이션(Average Formation)이 있습니다. 이는 팀이 볼 소유권 안팎에 있을 때 모든 선수들의 위치를 추적합니다. 이와 관련된 모델은 공격과 수비를 할 때의 조직 스타일의 방법 차이에 중점을 둡니다. 이 수치를 통해서 Oracle은 축구 팬들이 팀마다 다른 스타일의 경기 뒤에 숨겨진 전략들을 이해하고, 팀들이 상대팀의 전술에 어떻게 반응하는 지를 즉각적으로 확인하는 것을 기대합니다.
<Average Formation>

<Source: https://www.premierleague.com/news/2210969>
두 번째로, 실시간 승리 확률(Live Win Probability)은 4년 동안의 경기 데이터를 바탕으로 남은 경기 시간을 100,000번 시뮬레이션하여 팀이 승리하거나 무승부를 거둘 확률을 보여줍니다. 또한, 실시간 승리 확률 모델은 팀이 홈 또는 원정경기일 경우, 현재 득점, 페널티킥, 경기장 위의 선수 수, 레드카드 여부, 남은 경기 시간 등 다양한 요인을 함께 고려합니다.
<Live Win Probability>

<Source: https://www.premierleague.com/news/2210969>
세 번째로, 위협적인 공격(Attacking Threat)은 경기의 흐름에 따라 수많은 과거 경기 데이터를 바탕으로 공을 소유한 팀이 10초 내에 득점할 수 있는 확률을 보여줍니다. 이 모델은 패스의 결과, 볼 소유시 드리블, 태클, 그리고 그것들이 일어나는 경기장 위치를 통합적으로 고려합니다.
<Attacking Threat>

<Source: https://www.premierleague.com/news/2210969>
각 수치들을 계산하는 모델이 정확히 어떤 알고리즘을 기반으로 하고 있는지를 알기는 어렵지만, 과거에 축적되어 있는 데이터를 통해 축구 경기의 생동감을 전달해줄 수 있는 결과를 도출하고자 하는 노력이 돋보인다고 볼 수 있습니다. 이처럼 인공지능, 머신러닝, 빅데이터 분석은 우리와 멀리 떨어져있는 것이 아니라 실생활에서 흔하게 발견할 수 있으며 심지어 스포츠 분야에서도 널리 활용되고 있는 것을 확인할 수 있습니다. 과거와는 다르게 축구 경기 중계뿐만 아니라, 축구 스카우터들이 영입할 선수들의 리스트를 축구 클럽 지도자 및 이사회에 전달할 때에도 선수들의 CC(chance created: 어시스트와 키 패스를 합쳐 슈팅으로 연결된 패스), CCC(clear-cut chances: 명백한 찬스), xG(expected goals: 기대 득점) 등의 지표들을 산출하기 위해 수많은 데이터를 활용한다고 합니다. 축구 경기를 즐겨보시는 분들이 있다면, 앞으로 데이터 관점에서도 경기를 보시면 더 재밌으실 것 같습니다! 다음 뉴스레터에서 또 뵙겠습니다. 감사합니다.
