이 글은 2015년 10월 1일부터 2016년 12월 31일까지 (주)포인트웰이라는 스타트업에 근무하면서 느낀 것을 개인 페이스북에 노트 형식으로 기록했던 것인데 호스팅 서버 이전 기념으로 블로그로 옮긴 것입니다.
- 10월 16일 정식 서비스 시작
- 10월 19일 Google Play 라이프스타일 인기앱 4위
- 10월 19일 가입자 10만 돌파
- 10월 19일 Google Play 라이프스타일 인기앱 2위
- 10월 21일 Google Play 라이프스타일 인기앱 1위, 전체 랭킹 25위
비슷한 내용을 연거푸 올려서 페친 분들께서 스팸성 글로 인식하실 것이 뻔함에도 불구하고 입(손?)이 근질근질해서 못참고 개인 페북에 여러번 포스팅했던 내용입니다.
지금까지는 성공한 회사에 입사해서 성공 이후의 모습만 경험하거나, 한번 성공하고 후속 성공을 만들어내지 못해서 회사가 고전하는 경험만 했었지, 서비스 초기부터 폭발적으로 성공하는 것을 가까이서 지켜보는 것은 이번이 처음이다 보니 개인 페북을 빌어서 신기한 경험을 자랑하고 싶었었습니다.
회원이 폭발적으로 증가하다보니 이제는 찾아다니지 않아도 찾아오는 사업 기회들이 생기고, 기술과 솔루션만 가지고 있어서 회원 기반 플랫폼이 필요한 회사를 만나게 되면 금맥을 찾은 것 처럼 들뜨게 되고, 어쩌다가 사업의 전환점이 될만한 아이템을 찾게 되면 뒷골이 짜릿해지는 경험도 자주 하게 됩니다.
이렇게 매일 매일이 새로운 경험으로 가득차다 보니 구름위에 있는 듯 붕떠서 멍한 느낌이 들기도 하면서도 한편으로는 ‘이렇게 좋아도 되나?’라는 반문을 종종 했었습니다.
제가 딱히 뭔가를 하지 않아도.. 당장 할 수 있는 일이 없기도 해서 가까운 미래를 위한 준비부터 차근차근 하자고 마음먹고 이것저것 한뼘씩 앞으로 나가자는 목표를 세우고 구성원들이 Confluence에 익숙해질 수 있도록 이런 저런 사소한 노력을 해왔습니다.
또한, 지금까지 경험해 왔던 회사와 달리 갓 설립된 조직이다보니 미비한 점이 많고 특히 회사 돌아가는 것이 불투명한 점은 너무 어색하고 못참겠어서, 우선적으로 할 수 있는 운영 서버에 와탭(http://whatap.io)을 연결해서 서버 Instance 상태를 실시간 모니터링할 수 있도록 설정하고, DB 서버는 직관적으로 AWS 모니터링 화면을 누구나 볼 수 있도록 회사에 방치되어 있던 장비를 조합해서 설정을 했습니다.
다행(?)인지 불행인지 모니터링 장비 셋업하고 불과 몇십분이 지나지 않아서 DB 서버의 connection과 CPU load가 급격하게 증가하면서 서비스에 장애가 생겼고 회사 전화는 문의/항의 전화로 폭주했고 처음 겪는 비상 상황에 조직은 당황했습니다.
자연스럽게 모니터링 장비 앞이 상황실이 되었고 잘 모르지만 어설프게나마 그럭저럭 장애 조치를 했습니다. 지금은 장애 과정에서 발생한 오류에 대한 후속조치와 재발 방지를 위한 원인 파악을 하느라 모두들 상당히 분주합니다. (분주한 와중에 저는 또 이 글을 쓰고 있네요… ㅡ.ㅡa)
‘호사다마’이면서 ‘전화위복’이 된 이번 장애는 놀라운 성과에 취해서 붕붕 떠 다니던 직원들의 마음을 다잡는 계기가 되었고 서비스 초기에 발생했기 때문에 그나마 크지 않은 비용으로 복구가 가능할 것으로 보이고 사업적으로도 치명적이지 않을 수 있었다고 생각합니다.