BALL

Business Analytics for ALL

데이터 분석 공부 11

SQLD를 아시나요?

안녕하세요, 숙명여자 대학교 비즈니스 애널리틱스 동아리 BALL입니다 😊 오늘은 여러분의 데이터 분석 지식과 스펙을 UP 시킬 수 있는 두 번째 자격증을 소개해드리겠습니다! 더보기 목차 1. SQLD란? 2. 시험 주요 내용 3. 시험 일정 4. 합격 기준 1. SQLD란? SQLD(SQL 개발자)는 전 게시물을 통해 소개 해드렸던 ADP, ADSP와 동일한 'DATA 데이터자격검정' 사이트에서 확인하실 수 있습니다! SQL은 데이터베이스 관련 업무에 종사하고자 하는 분들께 매우 중요한 언어 중 하나입니다. 데이터베이스를 유일하게 엑세스 할 수 있는 언어인데요, SQLD(SQL 개발자)는 데이터베이스와 데이터 모델링에 대한 지식을 활용해 응용 소프트웨어를 개발하면서 데이터를 조작 및 추출에 최적의 성능을..

태블로를 활용한 차트 만들기 튜토리얼! (캘린더 차트 & 폭포형 차트)

안녕하세요, BALL입니다! 태블로를 알게 되었는데 어떻게 사용할지 막막하신가요? 혹은 본격적으로 태블로를 다뤄보기 전 직접 사용하면 어떤 느낌일지 궁금해하고 계신가요? 오늘은 직접 차트를 만들어보는 단계를 설명해보며 태블로를 이용한 데이터 시각화 과정을 살펴보겠습니다. 1. 캘린더 차트 만들기! STEP1 - 기준 연월 필터링하기 우선 데이터는 굳이 구하지 않아도 태블로 내에서 사용할 수 있는 슈퍼스토어 샘플을 사용하겠습니다. 첫 번째로 해야할 일은 [배송 날짜] 필드를 마우스 오른쪽 (또는 Option+마우스왼쪽) 버튼을 누른 채 열 선반으로 끌어올립니다. 그럼 [그림2]와 같이 나타난 '필드 놓기' 상자에서 파란색 불연속형 [년월(배송 날짜)]를 선택하면 아래 [그림2]와 같이 최근 4년의 머리글이..

추천 시스템 알고리즘에 대해 알아보자 !

안녕하세요 ! 숙명여자대학교 비즈니스 애널리틱스 동아리 Ball 입니다. 오늘은 우리 삶에 녹아있는 ‘추천 시스템’ 에 대해 자세히 소개해드리고자 하는데요. 추천 시스템 알고리즘 소개를 서두로, 직접 데이터 실습까지 진행해보겠습니다 ! 1. 추천 시스템이란 ? 추천 시스템을 한 문장으로 정의한다면 '사용자의 취향을 이해하고 맞춤 상품과 콘텐츠를 제공'하는 것입니다. 우리가 사용하는 콘텐츠 포털(유튜브/애플 뮤직), 전자상거래 업체(아마존/이베이) 들은 고객을 사이트에 조금이라도 오래 머무르게 해야 수익을 증가시킬 수 있는데요. 따라서 사용자가 선택한 콘텐츠와 연관된 콘텐츠를 적절하게 추천하는 시스템을 구축해, 사용자로부터 해당 사이트의 신뢰도를 높이고 더 많은 추천 콘텐츠를 선택하도록 합니다. 이렇게 되..

Git과 Github, VS Code로 편하게 관리하자!

안녕하세요, BALL입니다! 데이터 분석 공부를 주제로 다시 돌아왔습니다 :) 이번 포스팅에서는 코드 소스 관리의 1티어인 Git과 Github에 대해 소개하고, 이를 편리하게 관리할 수 있는 방법에 대해 알려드리고자 합니다! 먼저, Git과 Github에 대해 간단히 소개해드리겠습니다. Git이란 무엇일까요? 깃은 프로그램을 개발할때 발생하는 변경사항을 추적하는 분산 버전관리 시스템입니다. 깃을 통해 소스 코드를 거듭 수정할 필요 없이 효율적으로 소스를 관리할 수 있죠! 깃이 더욱 편리한 이유는, 개발자가 아니더라도 본인의 소스 관리에 큰 도움을 받을 수 있다는 점입니다. Git의 핵심 기능은 다음 3가지입니다. 첫번째로, 소스에 대한 버전을 관리할 수 있습니다. 코드를 수정할때마다 언제, 어느 부분을..

태블로의 기초 용어, 아직도 헷갈리시나요?

안녕하세요, BALL 입니다! 이번 포스팅에서는 태블로의 기본적인 용어들에 대해 알아보겠습니다. 태블로를 처음 시작하고 배우다보면, 마크 카드가 뭐였는지, 불연속형과 연속형은 어떻게 다른 건지 등등 헷갈릴 때가 많은데요, 태블로를 오랫동안 사용하여도 드래그 앤 드롭은 익숙하지만 기초 용어가 정확히 무엇을 의미했는지 잊을 때도 있으실 겁니다. 그래서 언제든지 다시 용어의 개념을 찾아볼 수 있도록 오늘은 기본 개념과 요소들을 총집합하여 정리해드리도록 하겠습니다! 1. 데이터 원본 페이지 먼저, 데이터 원본 페이지입니다.태블로에서 파일을 연결하면 가장 먼저 보게 되는 탭입니다. 데이터 원본 페이지에서는 시트로 넘어가기 전에 데이터 그리드 영역에서 데이터를 미리 보고 사용하지 않을 필드를 숨겨놓을 수도 있고, ..

SQL 입문 , 데이터베이스에 대해 알아보자.

안녕하세요 ! 숙명여자대학교 비즈니스 애널리틱스 동아리 Ball 입니다. 오늘은 SQL을 입문하는 분들을 위해 ‘데이터베이스’ 개념을 소개해드리고자 하는데요. SQL에 대해 제대로 이해하기 위해서는 데이터베이스에 대한 지식이 선행적으로 요구됩니다. 특히나 데이터베이스는 IT 분야뿐만 아니라 다른 분야에서도 보편적으로 사용하는 용어입니다. 우리의 삶이 데이터베이스와 직/간접적으로 연관되어 있다고 생각해도 무방할 정도인데요 ! 이번 포스팅을 통해 데이터베이스 개념과 SQL의 관계에 대해 알아보겠습니다. 1. 데이터베이스란 ? (Database, DB) 데이터베이스를 한 마디로 정의한다면 ‘데이터의 집합’ 입니다. 우리 일상생활 대부분의 정보가 저장되고 관리되는데요. 예시로, 오늘 인스타그램에 업로드한 사진,..

맵박스(Mapbox)를 활용해 나만의 태블로 커스텀 맵 만드는 법

안녕하세요, BALL 입니다 ! 오늘은 태블로를 더욱 다양하게 활용할 수 있는 방법을 소개하려고 합니다 ~ 태블로를 통해 데이터 시각화를 하다보면 "지도"를 많이 사용하게 되는데요, 태블로의 강점이 바로 위도와 경도 데이터만 있으면 손쉽게 맵 차트를 생성할 수 있다는 것이기도 합니다! 위치정보를 한눈에 파악할 수 있고 인근 건물, 지역, 국가 등과의 관계를 시각화해서 설명하기에 아주 편하기 때문이죠! 그런데 태블로에 있는 지도만을 사용하다보면, - 어떤 특정 지역을 다르게 표현해서 더 강조하고 싶은데 방법이 없을까? - 내 대시보드의 테마에 맞게 지도를 커스터마이징 할 수는 없을까? - 내가 임의로 어떤 장소들을 수정할 수는 없을까? - 지도에 표시할 마커를 다양하게 바꿀 수는 없을까? 이러한 고민들에 ..

머신러닝 알고리즘 회귀분석 , 예시로 쉽게 알아보기

안녕하세요, BALL 입니다! 오늘은 머신러닝 알고리즘 ‘회귀분석'에 대한 이야기를 가지고 왔습니다. 들어가기 전 ! '회귀'는 주로 머신러닝을 배우기 시작할 때, 가장 먼저 배우는 첫 부분에 위치하곤 하는데요. 회귀 모델 안에서도 다양한 개념들이 존재합니다. 그렇다면 '회귀분석' 이란 무엇일까요 ? 회귀 분석이란, 데이터 값이 평균과 같은 특정한 값으로 돌아가려는 경향을 이용한 통계학 기법입니다. 이때, 회귀는 통계적으로 여러 개의 독립변수(x)와 한 개의 종속변수(y) 간의 상관관계를 모델링하는 기법을 의미합니다. 즉, 회귀 분석은 데이터를 가장 잘 설명하는 최적의 회귀식을 찾는 과정입니다. 위 그림의 w0, w1, … 를 회귀계수 (coef)라고 하며, 회귀 분석을 통한 예측은 주어진 피처와 결정 ..

태블로 프렙(Tableau Prep), 간단히 마스터하기

안녕하세요, BALL 입니다! 오늘은 데이터를 시각화하는 ‘태블로’의 두 번째 이야기로 찾아왔습니다. 여러분, 혹시 Tableau Prep Builder에 대해 들어보셨나요? 'Tableau Desktop만 있으면 데이터 시각화에 문제 없다!'라고 생각하실 수 있지만, 우리가 사용하는 데이터는 늘 사용하기 쉽게 잘 정리되어 있는 건 아니라는 것, 많이 경험하셨죠? 공공데이터 포털이나 기타 다른 사이트에서 다운받는 데이터는 분석에 적합한 형태가 아닐 수 있습니다. 예) 셀이 병합되어 있는 경우, 데이터 정렬이 열 방향인 경우 등 태블로가 데이터를 정상적으로 인식하지 못할 수 있기 때문에 사전작업이 필요합니다. 분석 전 데이터를 전처리하기 위해서 엑셀에서 직접 편집하거나 R, 파이썬 등의 프로그래밍 언어를 ..

사이킷런에 대해 소개합니다!

안녕하세요, BALL입니다! 이번 포스팅은 데이터 분석에서 빼놓을 수 없는, 머신러닝의 대표적인 패키지 사이킷런에 대해 간략히 소개해드리고자 합니다🙂 사이킷런은 매우 많은 머신러닝 알고리즘을 제공할 뿐만 아니라, 쉽고 직관적인 API 프레임워크, 편리하고 다양한 모듈 등을 지원합니다. 파이썬 기반의 머신러닝 패키지에서 사이킷런만큼 다양한 머신러닝 기능을 제공하는 패키지는 단연코 없는데요 ! 이와 더불어 사이킷런의 직관적인 API가 머신러닝 애플리케이션을 쉽게 구현시켜주므로, 사이킷런의 기본적인 개념부터 활용 방법까지 익히는 것이 중요합니다. 최근에는 텐서플로, 케라스 등 딥러닝 전문 라이브러리의 강세로 인해 대중적인 관심이 줄어들고 있지만, 여전히 많은 데이터 분석가가 의존하는 대표적인 파이썬 ML 라이..