전체 글 35

[DATA의 이해 ②] 데이터 베이스의 정의와 특징

[DATA의 이해 ②] 데이터 베이스의 정의와 특징 1. 데이터 베이스 ▪ 1950년대 - 미군에 군대 내부 물자들을 집중적/효율적 관리를 위해 컴퓨터를 활용한 도서관 개념 개발 ▪ 1960년대 - 1963년의 미국에 SDC라는 회사에서 심포지엄을 통해 데이터베이스라는 용어를 공식적으로 사용 - 미국뿐만 아니라 전 세계적으로 데이터베이스를 공식화해서 사용 ▪ 1970년대 - 국내에 데이터베이스를 처음으로 받아드려서 활용하기 시작 ▪ 1980년대 - 데이터 베이스가 국내에 연구 또는 기술분야에 활용되기 시작 2. 데이터 베이스의 정의 ① 국내 저작권법 - 소재를 체계적으로 배열 또는 구성한 편집물로 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것 ② 국내 컴퓨터 용어 사전 - 동시의 복..

Machine Learning 2022.11.10

[DATA의 이해 ①] Data와 정보

[DATA의 이해 ①] Data와 정보 1. DATA와 정보 ▪ 라틴어 ‘Dare’ 주다의 과거분사형 ‘주어진 것’ ▪ 1940년대 컴퓨터 등장 후 많은 양의 정보를 수치로 연산 ▪ 자연과학, 경영학, 통계학 등 다양한 사회과학에서 컴퓨터 활용 ※ 컴퓨터를 활용한 기술의 발달 2. DATA의 정의 ▪ 추론, 추정의 근거를 이루는 사실 ▪ 단순한 객체로서의 가치와 다른 객체와의 상호관계 속에서 가치를 갖는 것 ▪ 데이터의 유형 ① 정성적 데이터 ② 정량적 데이터 3. 정성적 데이터 ▪ 특징 : 형태와 형식이 정해져 있지 않아서 저장, 검색, 분석하는데 많은 기술과 기술적 투자 수반 ▪ 언어 : 언어, 문자 등 ▪ 예시 : 회사의 매출이 증가함, 주관식 응답, SNS 게시물 4. 정량적 데이터 ▪ 특징 : ..

Machine Learning 2022.11.02

[Tableau] UDT(U우리는 D데이터 T특공대) 2기 9일차. 집합은 분석 앞으로 집합

1. 전체 매출 순위 vs 특정 지역 매출 순위 총 5가지 시각화 차트 작성 예정 지역 매출 : 맵에 시도 별 매출 표현 전체 매출 : 제품 중분류 별 매출과 순위 표현 지역별 매출 : 선택된 지역을 기준으로 제품 중분류 별 매출과 순위 표시 순위 비교 : 전체 매출 순위와 지역별 매출 순위 차이 표현 전체 대비 매출 비율 : 선택된 지역이 매출의 얼만큼의 비중을 차지하는지 표현 1. 지역 매출 마크 > 세부 정보 > 시도 마크 > 색상 > 합계 매출 결과 2. 전체 매출 1. 전체 매출 RANK 계산된 필드 만들기 RANK ( SUM ([매출]), 'desc' 2. 전체 매출 RANK > 행으로 이동 > 불연속형으로 변경 3. 전체 테두리를 라인 없이 변경 결과 3. 지역별 매출 2번과 같은 방법으로 ..

[Tableau] UDT(U우리는 D데이터 T특공대) 2기 8일차. 공간의 지배자

1. 맵 이중축 + 맵 배경 커스텀 + AREA 함수 실습 1) 전통시장 위치 전통시장 면적에 따라 색상의 진하기가 달라지게 표현 2. 생성된 필드를 색상에 추가 색상은 회색 리본으로 바꿔주시고, 투명도는 50%로 바꿔주세요 3. 이중축으로 합친후 동대문구로 필터 제작 4. 상단의 메뉴에서 맵 > 배경 맵 을 클릭하여 아웃도어로 변경해주고, 바뀐 배경을 확인 2) AREA 계산 vs 실제 면적값 위에서 계산한 AREA값이 맞는지 검증 상권코드별로 AREA함수로 계산한 측정값과 실제 면접값 비교 2. 차트를 막대로 표시 2. 맵 다중 레이어 실습 각 조건별로 계층 추가 따릉이, 화장실, 공원, 시군구명, 읍명동명 지도위 맵계층 아이콘을 이용해 of/off 이용 시군구 필터를 이용하여 각 공원, 따릉이, 화..

[Tableau] UDT(U우리는 D데이터 T특공대) 2기 6-7일차. 차원의 지배자2

부주제 : 테이블 계산식 1. 테이블 계산식을 이용한 성장률 계산 (2) 테이블 계산 편집에서 방향과 범위, 차이 계산의 기준 조정하기 테이블 계산 편집 창에서 방향, 범위, 기준 확인 다음을 사용하여 계산 > 테이블(옆으로) 기준 > ‘이전' (3) 성장률- 계산된 필드 작성 결과 2. 제품 대분류별 매출 기준 상위 10개 제품 나열하기 (1) [제품 대분류],[제품명] 별 [매출]의 합계를 나타낸 막대차트 시각화하기 행 > [제품 대분류], [제품명] 열 > [매출] [매출]의 합계 내림차순으로 정렬 (2) 테이블 계산을 이용해 ‘매출의 내림차순 순위’ 계산하기 RANK(SUM([매출])) ※ 순위 계산의 기본은 ‘desc’, 즉 내림차순으로 계산됩니다. ‘desc’는 생략 가능하며, 만약 오름차순으..

[Tableau] UDT(U우리는 D데이터 T특공대) 2기 3-5일차. 세부수준 계산식

1. FIXED 로 빈 행 채우기 과제 내역보면 어떤식으로 FIXED를 사용하고 어떤식으로 만드는지에 대한 설명이 다 적혀있다. 설명에 따라 2개의 변수와 YoY 계산식을 만들자 그 후, 아래처럼 그림 배치하면 구체적인 결과 표를 알 수 있다. 2. 시트 제목에 선택된 기간 표시하기 마찬가지로 친절한 과제에 어떤식으로 넣는지 적혀있다 결과는 아래 차트를 보자 3. 키워드 분석 3-1. 카테고리의 키워드 별 주간 평균 순위 Top 10 (1) 평균순위를 구하는데 기준이 되는 기준날짜를 선택할 수 있도록 매개변수 생성 (2) 선택한 매개변수 날짜 값을 이용해 평균 순위 구하기 3-2. 최근 3주 평균 순위 연속 상승 키워드 4. 고객 별 평균 주문 단가 증감율 구하기 이번에도 마찬가지로 UDT 3~5일차 파..

[Tableau] UDT(U우리는 D데이터 T특공대) 2기 1-2일차. 시간의 지배자

[1] 특정 날짜 기준으로 기준 월 vs 전 월 매출 비교 1-1. DATEPART 함수 사용하기 (1) 날짜 유형의 매개 변수 생성 (2) 기준월 매출과 전월 매출에 대한 계산된 필드 만들기 DATEPART (date_part, 날짜) : date_part에 해당되는 날짜 부분의 값을 정수로 반환 1-2. DATETRUNC, DATEADD 함수 사용하기 DATEADD (date_part, 지정한 숫자, 날짜): date_part에 지정한 숫자만큼 더해 새로운 날짜를 반환 ex) DATEADD (‘month’, -1, #2020. 10. 23#) → 2020. 09. 23 결과 [2] 특정 날짜 기준 MTD, 전년도 MTD (1) 기준 기간과 전년 동기간을 구분하는 계산된 필드 생성 DATETURNC, ..

[Tableau] UDT(U우리는 D데이터 T특공대) 2기 - intro

신병훈련소 이수 후, 태블로 중급 프로그램인 UDT를 지난 날 학습 했던 내용을 포스팅을 하고자 한다. 기간은 4월 22일부터 5월 6일까지 진행하였고 1주차 월~금과 2주차 월~금 총 10일간의 학습을 진행하였다. 특이하게도 지난 신병훈련소와 다르게 숙제가 1~2일주차 , 3~5주차 이런식으로 묶어서 나왔다 커리쿨렴은 다음과 같다. 지난번처럼 깔끔하게 수료완료하였고, 어느정도 태블로에대한 감을 완벽하게 잡은 느낌이다. 신병훈련소들은분들은 이후 교육도 참석하면 좋은 것을 얻어갈 수 있을거라본다

[Tableau] 신병훈련소 13기 DAY 10 - Prep 데이터 정리와 조인

Prep을 진행하기 앞서 Union과 Join에 대한 개념을 설명하고자 한다. 왜냐면 Prep라는 것이 Data에 대한 전처리 및 결합에 유용한 도구이기 때문에 이것을 잘쓰려면 해당 지식을 알아가는 것이 좋다. 1. Union Union은 같은 구조를 가진 집합(테이블) 여러 개를 하나의 집합(테이블)으로 합치는 것 위 테이블과 아래테이블을 하나로 합치는 것을 Union이라고 한다. 단 여기서는 Column 구조가 동일해야한 것을 잊지말자 2. Join Join 은 기준 필드를 가지고 조인 형태에 따라, 두 개 이상의 집합을 연결 또는 결합하여 데이터를 출력 1) Inner 조인 두 집합이 모두 존재하는 값들에 대해서만 합친다. 즉 왼쪽값과 오른쪽값이 모두 일치한 값을 합친다 2) Left Outer 조..

[Tableau] 신병훈련소 13기 DAY 9 - 모범 사례 적용

과제 1 : 시각적 분석 베스트 프랙티스 적용해 보기 - 구글 시트내 데이터 추출하기부터 진행 1) 확진자 수 사망자수 시트 개선 2) 지역별 분포 시트 개선 3) 대시보드 수정 9일차 진행한 파일은 해당 git에서 확인하면 된다 -> 거울세계 git GitHub - chomihee/data_visualization Contribute to chomihee/data_visualization development by creating an account on GitHub. github.com