노다지 캐는‘데이터 마이닝’
페이지 정보
작성자 princeton 댓글 0건 조회 1,648회 작성일 10-08-10 11:31
본문
도난 및 분실 카드가 불법으로 이용되는 데 따른 카드사의 손실액이 해마다 100억원을 넘고 있다. 신용카드사는 데이터 마이닝(data mining)이라는 기술을 활용해 분실 신고가 안된 카드라도 본인 이외의 사람이 불법 사용하는 것을 적발할 수 있다. 평소와 다른 구매 양태와 평소 거래한 금액보다 훨씬 많거나 구매하지 않던 늦은 시각에 카드를 쓰거나 하면 불법 사용일 가능성이 높다고 시스템이 판단한 다. 이런 경우는 카드사가 본인임을 확인하는 것이 중요하므로 ‘거래 정지’보다는 ‘전화를 하라’는 메시지를 카드 판독기에 보낸 다. 국내외 신용카드사의 카드 범죄 평균 건수는 전체 사용 건수의 0.1%에 달한다. 데이터 마이닝 기술을 활용해 이를 방지할 수 있는 확률은 40% 정도이다. 돈으로 환산하면 40억원 가량의 손실을 방지할 수 있다.
데이터 마이닝이란 문자 그대로 광산에서 금맥을 캐는 것과 마찬가지로 산더미 같은 데이터에서 유용한 정보를 캐는 것이다.
전산 시스템이 발달해 어느 기업이나 엄청나게 많은 데이터가 있는데, 이 데이터들의 상관 관계를 다양한 통계적 알고리듬을 통해서 분석하는 것이다. 신용카드사는 기존 카드 사용 데이터 중에서 부정 사용으로 판명이 난 데이터를 모아서 부정 사용의 유형을 분석하고 이를 다양한 통계적 알고리듬으로 데이터 마이닝 모형을 만든다. 이 모형에 기존 데이터를 넣으면 부정 사용 결과가 점수로 환산되어 나온다. 그래서 매번 사용할 때마다 거래 금액, 장소, 시간, 구매 상품, 가맹점 종류 등에 대한 데이터를 카드사의 메인 컴퓨터에 넣으면 데이터 마이닝 모델은 ‘이 구매의 부정 사용 점수는 ○○점’이라고 계산해 준다. 그리고 이 점수가 카드사가 정해놓은 부정 사용 점수보다 높으면 앞서의 김씨 경우처럼 본인 확인 절차를 거치게 된다.
백화점에서 고객의 구매 유형 분석이라고 하는 것은 일명 장바구니 분석(association)이라고 하는 데이터 마이닝의 한 분야이다. 고객이 ㄱ이라는 제품을 샀을 경우 ㄴ이라는 제품을 살 확률이 얼마인가를 밝히는 분석이다. 만일 고객이 유모차를 샀을 경우 젖병·기저귀·이유식 등 유아용품을 살 확률이 높은 것이 밝혀지면 유모차와 유아용품을 동시에 세일한다든지, 유모차를 샀지만 유아용품을 사지 않은 고객에게는 유아용품을 할인해 구매할 수 있도록 쿠폰을 우송한다든지 하는 방식으로 활용한다. 영국의 테스코 슈퍼마켓은 이러한 방법을 포함한 고객관리(CRM) 기법을 활용해 영국 내 마켓 점유율을 2위에서 1위로 끌어올렸으며 2위와의 격차를 해마다 벌리고 있다. 물론 데이터 마이닝이라는 기술 하나만으로 된 것은 아니지만 도약의 지렛대가 된 것만은 분명하다.
데이터 마이닝이 활용되는 분야는 생각보다 매우 넓다. 앞의 사례 이외에도 통신회사의 해지자 분석, 은행의 개인 및 기업 신용 점수 계산, 리스크 관리, 제약회사의 신약 개발을 위한 데이터 분석, 병원에서 환자 치료를 위한 임상 데이터 분석, 생명공학에서의 DNA 염기서열 분석 등 무궁무진하다. 데이터 마이닝이 요즘 각광받는 까닭은, 과거 기업에서 발생하는 데이터는 분석이 원천적으로 불가능한 테이프에 보관했지만, 지금은 모두 컴퓨터 시스템 내에 있는 하드 디스크에 보관하고 있기 때문이다. 이 데이터는 즉시 분석이 가능하도록 다양한 시스템 처리를 해 데이터 마이닝 시스템에 넘겨진다. 이처럼 기업 운영에 매우 필요하고 투자 대비 효과가 뛰어나기 때문에 많은 기업이 데이터 마이닝을 도입하고 있다.
데이터 마이닝이란 문자 그대로 광산에서 금맥을 캐는 것과 마찬가지로 산더미 같은 데이터에서 유용한 정보를 캐는 것이다.
전산 시스템이 발달해 어느 기업이나 엄청나게 많은 데이터가 있는데, 이 데이터들의 상관 관계를 다양한 통계적 알고리듬을 통해서 분석하는 것이다. 신용카드사는 기존 카드 사용 데이터 중에서 부정 사용으로 판명이 난 데이터를 모아서 부정 사용의 유형을 분석하고 이를 다양한 통계적 알고리듬으로 데이터 마이닝 모형을 만든다. 이 모형에 기존 데이터를 넣으면 부정 사용 결과가 점수로 환산되어 나온다. 그래서 매번 사용할 때마다 거래 금액, 장소, 시간, 구매 상품, 가맹점 종류 등에 대한 데이터를 카드사의 메인 컴퓨터에 넣으면 데이터 마이닝 모델은 ‘이 구매의 부정 사용 점수는 ○○점’이라고 계산해 준다. 그리고 이 점수가 카드사가 정해놓은 부정 사용 점수보다 높으면 앞서의 김씨 경우처럼 본인 확인 절차를 거치게 된다.
백화점에서 고객의 구매 유형 분석이라고 하는 것은 일명 장바구니 분석(association)이라고 하는 데이터 마이닝의 한 분야이다. 고객이 ㄱ이라는 제품을 샀을 경우 ㄴ이라는 제품을 살 확률이 얼마인가를 밝히는 분석이다. 만일 고객이 유모차를 샀을 경우 젖병·기저귀·이유식 등 유아용품을 살 확률이 높은 것이 밝혀지면 유모차와 유아용품을 동시에 세일한다든지, 유모차를 샀지만 유아용품을 사지 않은 고객에게는 유아용품을 할인해 구매할 수 있도록 쿠폰을 우송한다든지 하는 방식으로 활용한다. 영국의 테스코 슈퍼마켓은 이러한 방법을 포함한 고객관리(CRM) 기법을 활용해 영국 내 마켓 점유율을 2위에서 1위로 끌어올렸으며 2위와의 격차를 해마다 벌리고 있다. 물론 데이터 마이닝이라는 기술 하나만으로 된 것은 아니지만 도약의 지렛대가 된 것만은 분명하다.
데이터 마이닝이 활용되는 분야는 생각보다 매우 넓다. 앞의 사례 이외에도 통신회사의 해지자 분석, 은행의 개인 및 기업 신용 점수 계산, 리스크 관리, 제약회사의 신약 개발을 위한 데이터 분석, 병원에서 환자 치료를 위한 임상 데이터 분석, 생명공학에서의 DNA 염기서열 분석 등 무궁무진하다. 데이터 마이닝이 요즘 각광받는 까닭은, 과거 기업에서 발생하는 데이터는 분석이 원천적으로 불가능한 테이프에 보관했지만, 지금은 모두 컴퓨터 시스템 내에 있는 하드 디스크에 보관하고 있기 때문이다. 이 데이터는 즉시 분석이 가능하도록 다양한 시스템 처리를 해 데이터 마이닝 시스템에 넘겨진다. 이처럼 기업 운영에 매우 필요하고 투자 대비 효과가 뛰어나기 때문에 많은 기업이 데이터 마이닝을 도입하고 있다.
댓글목록
등록된 댓글이 없습니다.