by 코코넛 팀
이번 포스팅에서는 빅데이터 팀이 지난 3개월 간 해왔던 활동들을 정리, 보고해보려 한다. 프로젝트에 대한 후기는 첫 번째 포스팅에서 많이 이야기했으니 이번에는 활동 내용 위주로 언급하겠다. 빅데이터 팀의 활동은 크게 두 파트로 나뉜다. 하나는 데이터 분석 공모전에 참가한 것이고, 다른 하나는 구글 데이터 스튜디오를 활용해 본 것이다.
다들 데이터 분석 공모전에 참가한 것도, 구글 데이터 스튜디오를 사용하는 것도 처음이라 시행착오가 많았지만 그만큼 좋은 경험이 되었다고 생각한다.
9월부터 11월 초까지는 데이콘의 '교통•문화•통신 빅데이터 플랫폼 융합 분석 경진대회'에 참가했다. 발표 심사 당시 사용했던 ppt 중 일부를 발췌하여 어떤 데이터 분석을 진행했는지 간단히 설명하고자 한다. 결론부터 말하자면 본 프로젝트에서는 전주시의 관광 활성화 차원에서 공영자전거 대여소를 추가 설치할 입지를 선정해보는 분석을 진행했다.
이 프로젝트는 대표적인 관광도시인 전주의 유동 인구와 관광 인구가 코로나 이후 감소했고, 코로나로 인해 우리 삶에서 여행이 사라졌지만 사람들은 여전히 여행을 원한다는 문제의식에서 출발했다.
여러 조건을 고려했을 때 전주시를 분석 대상으로 정했고, 뚜벅이 여행객을 유치할 수 있는 관광 활성화 아이디어를 도출하는 방향으로 진행되었다. 이와 관련하여, 전주시 내 공영자전거 대여소의 수가 부족하고, 분포가 고르지 않아 자전거로 전주 전역을 여행하기는 어렵다는 사실을 발견했다.
입지 선정의 기준은 수요와 접근성, 두 가지였다.
수요 측면에서는 기존 대여소의 위치가 관광 수요와 맞지 않다는 점,
그리고 현지인과 외지인이 방문하는 지역이 다르다는 점에 주목했다.
접근성 측면에서는 숙박시설과 자전거 대여소와의 접근성이 중요하기 때문에 대여소가 부족한 숙박시설 비밀집지역에도 대여소를 설치하자는 결과가 나왔다.
이 두 가지 측면에서 도출된 후보지들을 종합하여 총 4군데의 대여소 추가 설치 입지를 선정했다.
여기까지가 공모전을 위해 준비한 부분이다.
대회에서 수상은 하지 못했지만 발표 심사 당시 피드백을 받았고, 팀원들 나름대로 아쉬운 점들이 있었기에 프로젝트 결과물을 더 발전시키기로 했다.
특히 시각화 부분에서, 더 효과적인 방법을 생각해낼 수 있을 것 같았다. 그래서 11월 중순부터는 구글 데이터 스튜디오를 활용해 대시보드를 만들었다. 기존 결과물에서 데이터 분석을 통해 도출된 것들만 모아 대시보드에 담아보았다. 아래 그림이 그 대시보드인데, 원래 결과물에서 약간 컨셉을 바꾸어 전주시를 찾는 자전거 여행객에게 전주와 전주 여행에 대해 소개하는 식으로 만들어보았다.
대시보드는 크게 '코로나와 전주 관광' 페이지와 '자전거 여행객을 위한 정보' 페이지로 구성했다. '코로나와 전주 관광'에서는 코로나로 인해 변화한 전주시의 유동 인구와 동별 관광 인구, 그리고 전주시의 주요 관광 지점이 어느 곳인지 알 수 있다.
한편 '자전거 여행객을 위한 정보' 페이지에는 실제로 전주에 자전거 여행을 간 관광객들에게 도움이 될만한 정보를 실었다. 공공자전거 대여소의 위치, 운영시간과 자전거 코스, 전주의 날씨 정보가 포함되어 있다. (대시보드는 여기에서도 확인할 수 있다.)
이렇게 대시보드로 프로젝트의 분석결과물을 정리해보니, ipynb 파일로 볼 때보다 더 깔끔하고 정보가 한 눈에 들어온다는 장점이 있었다. 하지만 행정동별 관광객 수와 같은 몇몇 그래프는 더 나은 시각화 방법을 찾지 못해 기존의 것에서 바뀐 것이 없는데, 이 점이 아쉬움으로 남는다. 또 구글 데이터 스튜디오에서도 지도 시각화가 가능하지만, 기능 상 한계가 있었다. 본 프로젝트는 지도 시각화를 활용한 분석이 많았던 만큼 QGIS를 활용해봐도 좋았을 것 같다.
하지만 구글 데이터 스튜디오 자체로도 구현할 수 있는 것들이 많고 배우기 어렵지 않기 때문에 관심이 있다면 시도해봐도 좋을 것 같다.