분류 전체보기115 데이터분석 > 4주차 > 파트 03 > 0904 SQL과 데이터 베이스 소개1. SQL을 이용한 데이터 분석데이터 관련 3개의 직군데이터 엔지니어파이썬, 자바/스칼라SQL, 데이터베이스ETL/ELT(Airflow, DBT)Spark, Hadoop데이터 분석가SQL, 비즈니스 도메인에 대한 지식통계(AB 테스트 분석)데이터 과학자머신러닝SQL, 파이썬통계2. 관계형 데이터베이스란?구조화된 데이터를 저장하고 질의할 수 있도록 해주는 스토리지엑셀 스프레드시트 형태의 테이블로 데이터를 정의하고 저장테이블에는 컬럼(열)과 레코드(행)가 존재관계형 데이터베이스를 조작하는 프로그래밍 언어가 SQL테이블 정의를 위한 DDL(Data Definition Language)테이블 데이터 조작/질의를 위한 DML(Data Manipulation Language)대표적 관계.. 2024. 9. 3. 데이터분석 > 3주차 > 파트 04 > 0829 실전 데이터 분석 사례 1 - Indian Restaurant Dataset점포 수가 1개인 식당을 단일 점포, 2개 이상인 식당을 프렌차이즈라고 정의별점 기준 상위 20개 식당은 모두 단일 점포다.평균적으로 프렌차이즈의 평점이 단일 점포보다 높다.별점 분포 히스토그램단일 점포는 분포가 양끝으로 더 넓게 퍼져 있다. -> 양 극단의 값이 더 많다./*SELECT COUNT(1) AS cnt, COUNT(DISTINCT restaurant_name) AS cnt_distinctFROM restaurant*/-- SELECT restaurant_name, COUNT(1) AS cnt-- FROM restaurant-- GROUP BY 1-- HAVING cnt > 1-- SELECT *-- FROM rest.. 2024. 9. 1. 데이터분석 > 3주차 > 파트 02 > 0827~0828 숫자5. 다양한 데이터 타입 다루기숫자문자이진ArrayKey-Value숫자Bit(M) : Bit 뒤에 오는 괄호 안에 있는 개수만큼의 비트를 저장할 수 있음. !TinyInt : Signed 범위 : -127~127, Unsigned 범위 : 0~255Bool, Boolean : True, FalseFloat : 4 바이트Dounle : 8 바이트SELECT IF(1, 'true', 'fasle')true 반환0만 fasle 반환하고 나머지 수는 다 true 반환, 음수도 마찬가지임SELECT IF(2=True, 'true', 'fasle')2=1 로 쓴 것과 동일함True를 False로 써도, 2=0으로 쓴 것과 동일하기 때문에 FALSE 반환1=True 혹은 0=False로 쓰면 둘 다 True 반환.. 2024. 8. 30. 데이터분석 > 3주차 > 파트 01 > 0826 다양한 JOINSJOIN : 두 개 이상의 테이블을 특정 key를 기준으로 결합하는 것테이블을 쪼개는 이유 : 각 테이블을 관리하기 쉽게 하고 보기 쉽게 하려고테이블에 저장된 데이터에 변경사항이 생길 수 있기 때문이다. INNER JOIN : 두 개의 테이블에서 일치하는 행만 결합연결된 열에서 값이 일치하는 행만 포함됨두 테이블 간 교집합 반환SELECT products.*, managers.name as manager_nameFROM products INNER JOIN managers on products.category = managers.managingINNER 앞에는 기준할 테이블임그 뒤에는 교집합 구할 대상이 되는 테이블, ON 뒤에는 어떤 컬럼을 기준으로 작성할지를 나타냄products 테이블.. 2024. 8. 26. 이전 1 2 3 4 ··· 29 다음