해당 글은 아래 데이터리안의 'RFM 고객 세분화 분석에서 합리적으로 기준을 잡는 방법'을 읽고 작성했습니다.
https://datarian.io/blog/how-to-make-your-rfm-customer-segmentation-reasonable
RFM 고객 세분화 분석에서 합리적으로 기준을 잡는 방법
RFM 고객 세분화 분석은 ‘인사이트’를 내기 위한 분석이 아닙니다
datarian.io
우선 글 처음에 나오는 'RFM 고객 세분화 분석은 인사이트를 내기 위한 분석이 아니다'라는 내용과 '데이터 분석가가 성과를 내는 일들은 분석의 목적이 명확한 일들이다' 이 개인적으로 충격적으로 다가왔습니다.
이 말들이 충격적으로 다가온 이유는 정곡을 찔린 느낌을 받았기 때문입니다.
이전에 국비지원 과정에서 프로젝트를 했을 때 그런 느낌을 많이 받았습니다.
분석의 목적을 정확하게 정하지 못하고 남들이 하던 코드, 머신러닝 모델 등을 적용할 때 회의감을 느꼈었습니다.
지금 생각해보니 그때 분석의 목적이 명확하지 않고 다른 사람들이 했던 분석을 따라가려고 해서 그랬던 것 같습니다.
이번에 시작할 프로젝트에서는 EDA를 통해서 데이터의 특성들을 잘 파악해서 분석의 목적을 명확하게 설정한 뒤에 그것을 위한 분석을 진행하겠습니다.
그 뒤에 나온 내용들에서 중요하다고 생각한 것은 RFM 분석이라고 꼭 R, F, M을 다 포함하지 않아도 된다는 것이었습니다.
산업의 특성상 R, F, M 중에서 그렇게 중요하지 않은 요인이 있을 수 있습니다.
이럴땐 해당 요소를 제외하고 분류하거나 별도의 다른 중요한 요소를 추가하여 분류를 해볼 수 있습니다.
예를 들면, 특정 회사의 서비스에서는 Rencecy 즉 얼마나 최근의 구매했는지 보다는 구매 간격이 더 중요할 수 있습니다.
그렇다면 Recency를 제외하고 고객별로 평균 구매간격을 구해서 분류의 조건으로 사용해 볼 수 있습니다.
정리
1. 데이터 분석을 할 땐 분석의 목적을 가지고 하는 것이 제일 중요하다.
2. RFM 분석에서 R F M 3가지 요소를 전부 사용할 필요는 없다.
이상으로 글을 마치겠습니다.
다음에는 데이콘의 이커머스 데이터를 EDA해보는 글로 돌아오겠습니다.