본문 바로가기

프로그래밍/데이터사이언스

(3)
마케팅에 도움 되는 빅데이터 사이트 소개 1. 구글트렌드 trends.google.co.kr/trends/?geo=KR Google 트렌드 trends.google.co.kr 구글 트렌드는 전 세계적으로 검색량의 변화 정도, 지역별 관심을 볼 수 있다. 또한 관련 키워드의 순위도 보여주고 있어서 검색량을 분석할 때 유용하게 쓰일 수 있다. 대한민국 내의 티스토리 검색량을 보면 검색량의 추이, 인천 지역에서 많이 검색이 되고 있고 관련 검색어는 어떠한 것이 많은지 볼 수 있다. 2. 구글 애드워즈의 키워드 플래너 ads.google.com/intl/ko_KR/home/ Google Ads - 손쉬운 온라인 광고로 더 많은 고객을 유치하세요 나에게 중요한 결과를 달성하세요 ads.google.com 구글 애드워즈에 들어가서 로그인을 한 다음 도구-..
차원축소알고리즘 (PCA) 어떠한 데이터가 있다고 가정하자 1차원 2차원 3차원 4차원 5차원 1차원에 있던 데이터는 2차원으로 차원이 늘면서 거리가 늘어나고 2차원은 3차원이 되면서 거리가 늘어나고 차원이 커질 수록 늘어난다. 또한 데이터가 희소화 된다. 만약 수백개의 피처을 작은 피처으로 축소할 수 있다면 어떻게 될까? 그러면 당연히 데이터의 크기가 줄어들어 학습 시간을 절약 할 수 있고 인간이 다룰 수 있는 거대한 피처를 줄여서 좀 더 핸들링 하기 쉽게 만들 수 있다. 피처를 줄이려면 불필요한 피처를 제거하고 데이터의 특성에 부합하는 중요한 피처만 선택하여 추출하면 피처 추출 전의 정보를 최대한 훼손하지 않고 추출 할 수 있다. 여기서 피처 추출에 대해 이해가 가지 않을 수 있다. 예시를 들면 어떠한 사람이 건강보험공단의 공..
A/B 테스트를 하는 두가지 방법(p-value를 이용한 빈도론, 베이지안론) 설명과 파이썬으로 계산하기 A/B 테스트를 하는 대표적인 방법은 2가지가 있다. 첫 번째는 빈도론, 두 번째는 베이지안론이다. 일단 두 가지 이론을 알기 전에 A/B테스트가 무엇인지 알아보자. A/B 테스트는 두 개의 그룹으로 나눈 다음 특정한 상황을 제시하고 각각의 반응을 비교하는 분석방법이다. 만약 새롭게 온라인 쇼핑몰을 열었다고 가정해보자. A라는 디자인의 웹 페이지가 있고 B라는 디자인의 웹 페이지가 있다. 그럼 당신은 이 둘 중에 하나를 선택해야 한다. 어떻게 선택할 것인가? 당연히 구매전환율이 높은 웹 페이지로 선택해야 된다. 그러면 A디자인의 웹 페이지를 들어온 사람 람들의 구매전환율과 B디자인의 웹 페이지로 접속한 사람들의 구매전환율을 파악한 다음 결정하면 된다. 이것이 바로 A/B 테스트이다. 빈도론 빈도론을 설명..