데이터분석 8

[분석 기초] SQL 쿼리 조건절, 그룹화로 특정 데이터 추출하기 (조건절 having vs where 차이!)

지난 포스팅에서 SQL 집계함수 [group by] 까지 진행되었습니다 전체 데이터의 합계(sum), 최소값(min), 최대값(max), 평균값(avg) 등의 집계 정보를 추출할 수 있는 아주 유용한 쿼리입니다. 실무를 하다보면 정말 없어서는 안 될 유용한 쿼리라고 볼 수 있어요. 오늘 포스팅 할 쿼리들은 실무에서 정말 유용하게 쓰이는 조건절(+집계함수)입니다 전체 데이터를 조건화, 그룹화하여 원하는 데이터를 추출할 수 있습니다 실무 데이터 분석을 하신다면 꼼꼼히 봐주세요 having vs where (having, where 이론부분은 스크롤을 아래로 쭉 내려주세요) 지난 포스팅에 이어서 진행하겠습니다 (지난 포스팅) https://s-s-o-story.tistory.com/19 [분석 기초] SQL ..

IT_SQL 2021.10.20

[분석 기초] SQL 쿼리로 특정 데이터 탐색, 총합, 평균, 최소/최대값 구하기 (집계함수 group by!)

지난 포스팅에서 SQL 쿼리로 데이터 탐색하기까지 진행되었습니다 전체 데이터에서 내가 필요한 부분들만 쏙쏙 골라볼 수 있는 쿼리들이고 어찌보면 가장 기초이자, 가장 많이 쓰는 SQL 쿼리들이라고 볼 수 있어요. 오늘 포스팅 할 쿼리들은 실무에서 정말 유용하게 쓰이는 집계함수입니다 DB데이터를 효율적으로 훑어보고 분석의 기반을 다질 수 있죠 실무 데이터 분석을 하신다면 꼼꼼히 봐주세요 지난 포스팅에 이어서 진행하겠습니다 지금 다루고 있는 데이터는 'KOSIS 주요 업종별 가맹점 여부별 현황 데이터'를 사용했는데요, 데이터는 아래 포스팅을 보시고 다운로드 해주세요. https://s-s-o-story.tistory.com/16 [분석 기초] SQL 프로그램 데이터 업로드. 내 파일로 SQL 업로드 하기 이전..

IT_SQL 2021.10.17

[분석 기초] SQL 기본 쿼리로 데이터 탐색하기 (where 조건절!)

지난 포스팅에서 SQL 프로그램에 데이터를 업로드하기까지 진행되었습니다 파일 업로드가 완료되었으니 이번 포스팅부터는 전체 데이터에서 내가 필요한 부분들만 쏙쏙 골라볼 수 있는 쿼리를 볼게요 어찌보면 가장 기초이자, 가장 많이 쓰는 SQL 쿼리들이 되겠네요 오늘 포스팅할 쿼리들을 통해 SQL에서 필요한 부분들을 파이썬으로 읽어와서 본격적이 분석이 시작됩니다 실무 데이터 분석을 하신다면 꼼꼼히 봐주세요 1. 주석 달기 가장 먼저 주석을 달아볼게요 예를들어, '쿼리~~~'를 입력하고, 실행되지 않는 문구를 써야할 때(당연히 이런경우가 많습니다) SQL실행창에 문자를 그대로 입력하면, 앞에 써놓은 쿼리도 오류가 납니다..ㅠ 그래서 '이 부분은 실행할 쿼리가 아니라 주석이다!'라는 주석 표시를 하고 그 안에 내가..

IT_SQL 2021.10.16

[분석 기초] SQL 프로그램 데이터 업로드. 내 파일로 SQL 업로드 하기

이전 포스팅까지 SQL, SQL 실행프로그램 설치가 모두 완료되었습니다 이제 본격적으로 SQL 분석 기초 씐나게 달려보겠습니다! 먼저 요리조리 분석해볼 데이터를 하나 가져와 보겠습니다 저는 아래 엑셀파일을 사용해 볼게요 이 엑셀파일은 아래와같이, 주요 업종별 가맹점 여부별 현황 통계를 나타내고 있는 데이터인데요 각 업종별 가맹점 여부와, 사업체수, 직원수, 매출액, 비용 정보를 담고 있습니다 어떤 업종의 프랜차이즈가 잘나가나~ 어떤업종은 프랜차이즈가 더 잘나가더라~ 간단히 요런 정보들이 포함되어 있네요 * 팁으로 KOSIS 국가통계포털에는 다양한 통계자료들과 공공데이터들이 있으니 다양한 데이터들로 연습해보기 좋습니다 https://kosis.kr/index/index.do KOSIS 국가통계포털 내가 본..

IT_SQL 2021.10.16

[분석 준비] SQL 시작하기. SQL설치, SQL 실행 프로그램 설치하기

이걸 못하면 데이터분석의 시작조차 못하죠? SQL!!! 사내 Data를 불러오지도 못하니까요~ 지난 시간에 이어 DBeaver 설치에 대해 간략히 가이드를 하려합니다 관련 내용은 앞 포스팅 설명을 참조! https://s-s-o-story.tistory.com/14 [분석 준비] SQL 시작하기. 실무에서 가장 많이 쓰는 데이터 분석 툴은? 실무에서 가장 많이 쓰는 데이터분석 툴은? 파이썬? R??... 사실상 SQL이 가장 중요하다고 할 수 있습니다. 전문 데이터분석가, 또는 데이터분석 관련 실무 분야가 아니라 할지라도, 데이터를 다루 s-s-o-story.tistory.com 먼저 PostgreSQL을 설치하고 설치한 SQL을 실행할 실행프로그램(쿼리쓰기, 실행결과 확인하기 등등을 위하여) Dbeav..

IT_SQL 2021.10.16

[분석 준비] SQL 시작하기. 실무에서 가장 많이 쓰는 데이터 분석 툴은?

실무에서 가장 많이 쓰는 데이터분석 툴은? 파이썬? R??... 사실상 SQL이 가장 중요하다고 할 수 있습니다. 전문 데이터분석가, 또는 데이터분석 관련 실무 분야가 아니라 할지라도, 데이터를 다루는, 관련해서 업무에 반영을 시킬 수 있으려면 SQL은 기본입니다. 파이썬으로 데이터분석 코딩을 먼저 생각하기도하지만, 실무를 해본 사람이라면, SQL을 활용해 사내 DB에서 데이터를 불러오는 것이 먼저입니다 (이게 안되면 데이터 분석 시작조차 불가능합니다!ㅠㅠ) SQL코드가 조금 익숙하다면, 사내/해당 업무 데이터를 활용해, 실무에서 무궁무진한 활용이 가능한 경우가 많습니다 SQL 설치 : https://www.postgresql.org/download/ PostgreSQL: Downloads Downloa..

IT_SQL 2021.10.15

[분석 준비] 2. 파일 업로드하기(구글 Colab 파일 직접 업로드, 드라이브 업로드)

구글 Colaboratory(약칭:Colab)을 사용하기! 1. 직접 업로드하기 (코드) from google.colab import files files.upload() (출력) - 위 '파일선택'을 누르면 파일선택 창이 뜨고, 원하는 파일을 선택하면 됩니다 - 핸들링하기 위해서는 왼쪽 파일탭을 클릭하면 아랫쪽에 해당 데이터 파일이 뜹니다 - but!!! 이렇게 업로드하면 좀 번거로워요. - 더 쉽게하려면? (코드) from google.colab import files myfile = files.upload() (출력) -여기서 동일하게 파일을 선택해주면, 'myfile'에 업로드하려는 데이터 파일을 담아줍니다 2. 드라이브에서 업로드하기(추천!) (코드) from google.colab import..

IT_Python 2021.10.10

[분석 준비] 1. 구글 Colab 으로 파이썬 설치없이 분석하기(Colab, 셀 기본)

구글 Colaboratory(약칭:Colab)을 사용하기! 앞으로 데이터 분석에 대한 기초부터 포스팅을 시작하려합니다 먼저, 편리한 분석환경 준비를 위해 구글 Colab을 사용할텐데요 파이썬 설치없이, PC메모리 걱정없이 상대적으로 방대한 양의 데이터를 다룰 수 있고 외부 다른 PC를 사용할 때에도 구글드라이브 사용하듯이, 편리하게 사용할 수 있으니 꼭 설치하시기 바래요 [ Colab 설치하기 ] a. 구글드라이브 왼쪽상단 '새로만들기' 클릭! b. 더보기-연결할 앱 더보기 클릭 c. Colab 검색 d. 추가 버튼 클릭 위 절차대로하면 이제 구글 Colab을 사용할 수 있습니다 간단하게 Colab을 사용해볼까요? 1. 파이썬 버전 알아보기 !python --version (출력) 2. Colab의 GP..

IT_Python 2021.10.09