by 코코넛팀
저희 빅데이터팀은 DACON에서 주관하는 ''교통·문화·통신 빅데이터 플랫폼 융합 분석 경진대회''에 참여했습니다.
대회의 목적은 다음과 같습니다.
저희 팀은 전주시를 타켓 지역으로 잡고, 전주시의 경제 활성화를 위해 전주시 공영자전거인 꽃싱이를 활용하는 것을 주제로 잡았습니다. 11월 2일 구글 미트를 통해 ppt 발표를 하였고, 11월 8일 최종결과가 나왔는데 아쉽게 수상하지 못했습니다.
대회는 끝났지만 저희 팀은 여기서 끝내지 않고 저희가 했던 프로젝트를 구글 애널리틱스의 대시보드를 이용하여 시각화 해보려고 합니다. 구글 애널리틱스의 대시보드를 이용하는 활동은 11월 15일부터 계획 중에 있습니다.
우선 공모전 준비 기간이 짧아 원하는 만큼의 퀄리티를 내지 못한게 아쉬웠다. 3월부터 데이터 분석 공부를 시작하고나서 첫 공모전이었는데 준비하면서 부족한 점과 깨달은 점이 많았다.
준비 기간이 짧아서인지 정책 제시에만 급급했고 사전에 철저한 조사를 하지 못했다. 그 결과, 정책 제안했던 것들이 기존에 있는 정책들이었고 이 때문에 여러 번의 수정을 거듭하였다. 충분한 사전분석이 왜 필요한지 다시 한번 느꼈다.
개인적으로 다양한 EDA분석을 했다. 대표적인 예로 전주시 동별로 현지인 관광객과 외지인 관광객의 수를 시각화 했는데, 둘의 많이 방문하는 지역이 차이가 있었다. 외지인 관광객은 현지인 관광객에 비해 풍남동을 많이 찾았는데 차이가 나는 이유를 생각해보니까 풍남동에 전주한옥마을이 위치하기 때문이라는 것을 알 수 있었다. 실제로 자전거 대여소는 외지인 관광객이 많이 찾는 풍남동 일대에 몰려 있었다. 이를 기반으로 우리 팀은 관광수요가 있지만 외지인에게 잘 알려지지 않은 지역에 자전거 대여소 추가 설치를 제안했다.
EDA분석 할 당시에는 이러한 정책이 나올 줄 몰랐다. 이처럼 여러 각도에서 데이터들을 관찰하면서 insight을 얻는 것이 중요하다는 생각을 했다. 분석한 결과가 어떻게 사용될지 몰라도 좋은 결과가 나올 수 있기 때문이다.
시각화 종류는 엄청나게 다양한데 자꾸 익숙한 시각화 분석만 사용하는 경향이 있었다. 다양한 시각화 기법을 공부하고 사용법을 알아두면 좋을 것 같다는 생각을 했다.
다음 공모전에 나간다면 지금보다 더 발전되고 퀄리티 높은 결과물을 낼 수 있을 것 같다. 첫 공모전인만큼 기억에 오래 남을 것 같고 좋은 팀원들을 만나 감사했다. 길다면 길고 짧다면 짧은 두 달간 열심히 달려온 우리 팀원들에게 감사의 의미로 박수를 보낸다.
이번 대회를 통해서 자전거 정책의 현 방향성과 한계점에 대해서 배울 수 있었다, 특히 자전거 정책이 대량의 자전거를 설치하면서 이를 이용할 장소를 마련하지 않은 아쉬운 점이 많다는 점이 느꼈다, 그리고 이러한 정부와 공공기관의 빈틈을 이용하여 대기업들이 시민들의 대중교통 이용권을 유료 대용을 통하여 공공의 영역을 사익화 시킨다는 위험성을 느꼈다.
첫 대회라서 너무나도 부족한 점이 많았다, 주최 측이 요구한 점이 과한 면이 없지는 않았지만 날씨나 계절처럼 자전거 이용에 영향을 주는 면을 고려하지 못한 디테일의 부족성이 부끄러웠다. 하지만 우리가 왜 탈락했는지는 이해하고 받아들이기가 어렵다. 어려웠던 점은 앞에서 이어서 말했듯이 결론은 정책 공모전이기에 정책을 정하는 사람들이 보는 시선과 우리의 시선이 많이 달랐고 그들의 요구점이 우리의 기준보다 높았다는 점이다, 특히 학부생들에게 지형 분석과 같은 고차원적인 요구에 있어서 상당한 어려움을 느꼈다.
첫 공모전이라 처음부터 걱정이 참 많았다. 나의 부족한 경험과 얕은 지식이 행여나 우리 팀에 폐가 될까 우려하기도 하였다. 하지만 결론적으로는 좋은 사람들을 만나 이들과 계속해서 이야기를 나누며 하나의 목표를 향해 달려갔던 그 모든 시간들이 뜻 깊고 즐거웠다.
하지만 공모전 준비 과정이 순탄하기만 했던 것은 아니었다. 무엇보다도 우리 팀이 공모전에 참여하기로 마음먹은 시점이 이미 대회가 개최된 후로 시간이 좀 지난 뒤라 우리에게 주어진 시간이 충분하지 않았다. 그런 탓에 사전 조사에 투자할 수 있는 시간이 부족했고, 방향성을 정하고 난 뒤에도 사전 조사 때 차마 알지 못 하였던 새로운 사실들이 끊임없이 튀어나왔다. 그 덕에 우리는 우리가 정한 프로젝트의 방향성을 완전히 뒤엎어야 할지 말지를 결정해야 할 순간들과 계속해서 마주하였다.
또한 우리가 간과한 한 가지가 있다면 ‘내가 생각해낸 것은 남도 생각할 수 있다.’ 는 점이다. 우리가 좋은 아이디어라고 생각하여 추진한 것들이 이미 세상에 존재하여 잘 운영되고 있다는 것을 확인하기를 여러 번. 세상에는 똑똑한 사람들이 참 많고, 그 사람들이 우리 사회 곳곳에서 자신이 맡은 바를 묵묵히 해내고 있음을 뼈저리게 느낀 순간들이었다.
이러한 어려움에도 불구하고 끝까지 이끌어 준 예은님과 묵묵히 뒤에서 받쳐준 정민님 그리고 적극적으로 의견을 피력해 준 후정님이 있었기에 중간에 포기하지 않고 우리가 가고자 한 길을 끝까지 갈 수 있었음을 알기에 감사한 마음을 전하고 싶다.
공모전이 끝나고 느낀 점이 있다면, ‘조금만 더 과감해도 되지 않았을까?’하는 것이다. 현실성에 갇혀 우리가 낸 아이디어의 일부만으로 공모전의 제출물의 뼈대를 이룬 점이 아쉬움이 남는다. 또한 충분한 시간과 충분한 사전 조사의 필요성 간절히 느낄 수 있었다. 만약 우리에게, 나에게 또 다른 공모전의 기회가 온다면 그때는 지금보다 한 층 발전된 결과물을 제출할 수 있을 것이라 믿는다.
심사 기준 중에 ‘주어진 데이터를 서로 독립되지 않게 활용했는가’라는 항목이 있었다. 다양한 데이터들을 잘 결합해서 말이 되도록 사용했느냐는 뜻인데, 우리 팀은 구글 맵스를 활용하여 여러 위치 데이터셋들을 한 지도 안에 넣거나 같은 내용의 데이터를 시간흐름에 따라 정렬하는 등의 방법으로 해결했다. 우리가 참가한 대회의 심사 기준에 있었기 때문에 고려하기도 했지만, 이 부분은 앞으로 데이터 분석을 할 때 꼭 유념해야 할 부분인 것 같다. 데이터셋들을 논리적으로 결합하여 새로운 인사이트를 도출하는 것이 데이터 분석의 목적 중 하나라고 생각한다.
또한 적절한 시각화 방식에 대한 깊은 고려가 필요하다는 생각이 들었다. 그리고 그러기 위해서는 다양한 시각화 방식을 시도해보는 것이 좋을 것 같다. 평소 익숙한 방식으로 분석과 시각화 자료를 만드는 경향이 있기 때문이다. 이 부분은 프로젝트 기간이 아직 남았기 때문에 좀 더 고민하고 수정할 계획이다.
우리 프로젝트에 대해 조금 언급해보자면, 분석 대상은 전주시였다. 대회가 끝난 후 돌아보니 아쉬웠던 점은 사전조사가 조금 부족한채로 분석과 정책 수립 부분을 만들어나간 점이었다. 프로젝트 과정에서 우리가 전주시에 대해 몰랐던 사실들이 계속 튀어나와 분석과 정책 방향을 여러번 수정했기 때문이다. 수정과정이 없는 프로젝트는 없겠지만 분석에 급급하기보다는 전주시에 대해 충분한 조사를 거친 후 데이터 분석 단계로 넘어갔다면 더 좋았을 것 같다. 더불어 프로젝트에서 정책으로 제시했던 공영자전거와 지역경제활성화, 회의 과정에서 언급되었던 지역화폐 등에 대해서도 좀 더 공부했다면 더 나은 도메인 지식을 갖고 결과물을 만들어낼 수 있었을 것 같다.
대회 발표심사 때 전주시의 날씨, 지형, 사고율 등을 고려했으면 더 좋았을 것 같다는 피드백을 받았다. 본 프로젝트에서는 관광수요와 숙박시설과의 접근성을 중점적인 기준으로 삼았다. 그런데 심사평을 들어보니 내가 직접 자전거 여행을 갔다고 상상해보며 어떤 요소들이 자전거 여행에 필요하거나 위협이 될지 떠올리는 것도 좋은 방법이었을 것 같다.
종합하자면 개인적으로는 데이터 분석 공모전에 처음으로 참가했다는 데 의의를 두고 싶고, 프로젝트의 내용적인 측면에서는 데이터 분석에서 그치지 않고 정책 제안까지 나아갔다는 점이 긍정적이라고 생각한다. 수상은 하지 못했지만 좋은 경험이었다고 생각하고, 팀원들의 데이터 분석 실력 향상에 도움이 되었길 바란다.