본문 바로가기
도서

(도서) 수학을 품은 야구공 (서평)

by 안그럴것같은 2023. 3. 5.
반응형
SMALL

WBC 시즌이 곧 시작된다. 

3/9 12:00에 호주전으로 시작한다.

겸사겸사 야구 책을 한 권 집어들었다.

 

원래는 다른 책을 보고 싶었는데 마음에 쏙 들지 않아서 눈을 야구로 돌렸고 그러던 중 몇 권을 확인하다가 이 책이 2019년에 출간되어 골랐다. (그래서 2018년 야구 데이터가 많다.)

 

요즘에는 야구에 대한 모든 데이터를 수치화해서 한 경기에 나오는 데이터의 용량이 7테라바이트가 넘는다고 한다. 한 게임 하나하나가 빅데이터다. 1테라는 1024기가바이트다. 아주 고화질이 아닌, 보통 영화가 2~3기가 정도이니 비교가 될 듯 하다.

 

공동 저자 중 한 명은 수학교사다. 그러다보니 공분산, 확률, 피타고라스의 정리, 순열과 조합 같은 수학 개념에 관한 설명도 등장한다. 복잡하게 생긴 수학 기호와 수식들이 나오는 부분은 ...... 그냥 건너뛰었다. n,.n

 

 

한 이닝에 4개의 삼진도 발생 가능하다고 한다. (49쪽) 스트라이크 아웃되는 공을 포수가 놓치고 타자가 낫이웃 상태로 1루로 진루한 경우 투수는 삼진 기록을 얻지만 폭투나 포일로 기록한다고 한다.

 

이건 정말 나의 기존 상식을 깨는 내용이다. 나는 투수의 마운드가 내야의 중심이라고 생각하고 있었다. 투수판과 홈베이스 사이 거리는 18.44m이고 홈과 2루 사이의 거리는 38.795m이다. (55~6쪽) 즉 투수판은 1루와 3루를 이은 가상의 선 보다 1미터 정도 조금 더 홈에 가까운 것이다.

 

팀간 이동 거리에 관한 이야기는 흥미로웠다. 언젠가 롯데의 이동 거리가 가장 길어서 불리하다는 기사를 본 적이 있다. 당연히 서울에 세 팀이 있고 수도권에 두 팀이 있으니 지방팀의 이동 거리가 길어진다. 이 책에서 자료로 제시한 2018년 이동거리를 보면 삼성의 이동 거리가 10,215km로 가장 길고, 이동거리가 가장 짧은 LG는 그보다 3,000km 정도 짧다.

어느 대학교수가 통계물리학의 최적화 방법을 활용한 몬테카를로 시뮬레이션(이게 뭔지 자세한 설명은 없지만 개념은 이해가 간다)을 통해 최적화된 방법을 통해 재조정한 결과 이동 거리가 가장 긴 팀과 짧은 팀과의 차이를 380km 정도로 줄있 수 있었다. 이 교수는 2012년의 자료를 사용했는데 그 해 이동 거리의 차이는 3,600km이 넘었다.(이 해에 롯데의 이동거리가 1등) 이 교수님을 KBO로!!!

 

야구에서 사용하는 데이터 중 WAR이라는 것이 있다. WAR을 산출하는 방법은 복잡하여 설명은 생략했다. 선수의 종합적인 능력을 평가하는 지표이다. WAR 기준으로 만 27세에 가장 좋은 성적을 기록한다고 한다.(93쪽) 당연히 나이가 들수록 WAR지표는 떨어진다. 은퇴 시즌에 골든글러브를 받은 이대호가 정말 대단해 보인다.

 

우리는 거액의 계약을 맺는 스타급 야구 선수만 눈에 들어온다. 운동으로 성공하는 것이 얼마나 힘든지 데이터를 통해 보여준다. 2018년 신인 드래프트 신청자는 1,072명이고 그 중 100명만이 구단의 부름을 받았다고 한다.(126~7쪽) 프로야구 선수가 되겠다는 고졸, 대졸, 기타 선수들 중 10% 이하가 프로가 된다. 그것도 끝이 아니고, 구단의 선택을 받아도 1군 오르기가 쉽지 않고 1군 선수가 되도 스타가 되기는 더 어렵다.

명심하자.

공부하는 것 만큼 쉬운 일이 없다.

반응형
LIST

댓글