아우슈리네 서버의 광광 우럭따님께서 올려주신 7랭 유저 목록을 가지고
데이터마이닝을 해보고 있습니다만 전공은 아닌지라 쉽지 않네요데이터마이닝 수업은 들었는데...

  • 데이터 출처 : 실시간 유저 뉴스 게시판 - 아우슈리네 7랭 유저 목록
http://www.inven.co.kr/board/powerbbs.php?come_idx=4621&l=910

  • 데이터마이닝 기법 : Association Rule Mining
(간단하게 설명하자면 소하하바바 등의 트리가 여러개 있을때 하하를 찍으면 바바를 찍을 확률을 계산합니다. 실무에선 유용한 정보인지 검증하기 위해 하하를 찍은 사람이 몇이나 되는지, 사람들이 원래 바바를 많이 찍는건지 등을 조목조목 따지게 됩니다.)

  • 도구: SPMF
http://www.philippe-fournier-viger.com/spmf/


  • 도출된 결과

하이랜더 2써클을 찍은 유저는 바바리안 2써클을 찍은 경향이 있음(71%)
==> 하이랜더 2써클 유저 99명
==> 바바리안 2써클 유저 105명
==> 하2바2 유저 70명

머스킷티어를 찍은 유저는 아처 2써클을 찍은 경향이 있음 (61%)
==> 아처2써클 유저 50명
==> 머스킷티어 유저 36명
==> 아2-->머스킷 유저 22명

프리스트를 2써클 이상 찍은 유저는 크리비를 1써클 찍는 경향이 있음(57%)
==> 프리스트2써클 유저 53명
==> 프리스트3써클 유저 73명
==> 크리비1써클 유저 85명
==> 프2크1 유저 34명
==> 프3크1 유저 38명

프리스트를 3써클 찍은 유저는 플레이그닥터를 찍은 경향이 있음(59%)
==> 프리스트3써클 유저 73명
==> 플레이그닥터 유저 88명
==> 프3-->플닥 유저 43명

클레릭 2써클, 크리비 1써클을 찍은 유저는 플레이그닥터를 찍은 경향이 있음(71%)
==> 클레릭2써클유저 88명
==> 크리비1써클유저 85명,
==> 플레이그닥터 유저 88명
==> 클2크1 유저 58명
==> 클2크1-->플닥 유저 41명


--------------------------------------------------------------------------------------
  • 보너스로 보는 각 클래스 써클당  유저 수
클래스 1써클 2써클 3써클
소드맨 250 12 6
하이랜더 2 99 42
펠타스타 100 2 30
하플라이트 13 17 15
바바리안 10 105 18
캐터프랙트 7 1 16
로델레로 1 5 3
커세어 28 61 4
스콰이어 1 16 11
도펠죌트너 50 69 0
펜서 10 30 0
드라군 35 0 0
템플러 65 0 0
시노비 35 0 0

클래스 1써클 2써클 3써클
위자드 213 1 46
파이로맨서 42 91 51
크리오맨서 17 0 16
사이코키노 4 1 2
링커 39 120 8
쏘마터지 13 12 4
엘리멘탈리스트 3 2 76
소서러 6 15 9
크로노맨서 2 3 28
알케미스트 2 58 0
네크로맨서 1 10 0
워록 89 0 0
페더풋 32 0 0
룬캐스터 11 0 0

클래스 1써클 2써클 3써클
아처 22 50 33
쿼렐슈터 2 0 26
레인저 16 1 18
헌터 1 0 1
새퍼 3 15 8
무고사 2 16 2
스카우트 19 0 16
로그 15 2 5
플래처 6 2 6
슈바르츠라이더 15 12 0
응사 19 2 0
캐노니어 34 0 0
머스킷티어 36 0 0

클래스 1써클 2써클 3써클
클레릭 55 88 25
프리스트 5 53 73
크리비 85 20 13
보코르 2 1 0
딥디르비 2 0 3
사두 1 15 2
팔라딘 15 0 3
몽크 0 5 24
파드너 9 5 0
드루이드 10 21 0
오라클 13 3 0
플레이그닥터 88 0 0
카발리스트 16 0 0
채플린 24 0 0


위 데이터는 광광 우럭따님께서 말씀하신 것처럼 
모든 유저의 정보가 아닌 아우슈리네 서버 "표본 집단"의 정보입니다.

그렇기 때문에 100명이나 된다, 한명도 없다 라는 식의 해석보다는

표본 집단의 분포가 이정도이니 모집단의 분포도 유사할 것이다.

고로 로델레로 사이코키노 헌터 보코르 딥디르비는 비주류안습클래스이다. 라고 해석하심이 좋습니다.

--------------------------------------------------------------------------------------

원래라면 Sequential Rule Mining 이라는 기법을 사용해야 하는데
데이터 자체가 살펴보기로 얻은 데이터다보니 최종 직업만 알 수 있고 정확히 어떤 트리인지 알수가 없네요
게다가 입력값으로 바꿀 때 대충 바꿔서 그런지 재밌는 결과가 안나오네요위자드는 결과도 안나오고...

위에서는 "클래스를 찍지 않는" 경우를 제외했습니다만 시간이 난다면 추후에 더 재미난 결과를 들고 오겠습니다.