728x90

분류 전체보기 224

[SQL] 조인 - Inner, Outer, Full, Cross, Natural, Self

조인(Join)이란? 2개 이상의 테이블을 사용자가 필요한 집합에 맞게 가상 테이블처럼 만들어 보여주는 것 조인의 종류 Inner 조인: 교집합으로, 정확히 중복되는 요소만 출력 Outer 조인 Left Outer: Left는 전부 가져오고, Right에서는 Left에 있는 것만 가져옴 Right Outer: Right는 전부 가져오고, Left에서는 Right에 있는 것만 가져옴 Full(Outer) 조인: 합집합으로, Inner + Left + Right Outer 조인 모두 출력 Cross 조인: 조인되는 두 테이블의 곱집합을 출력 Natural 조인: 각 테이블에 동일한 이름의 컬럼을 기준으로 알아서 조인이 이뤄짐 Self 조인: 동일한 테이블 출력 Self 조인 - 자체 조인 같은 테이블을 마치..

Data/Sql 2023.06.19

[SQL] 데이터 보유 여부 확인 - In, Like, Isnull

와 같음)\nSELECT\n CUSTOMER_ID\n , RENTAL_ID\n , RETURN_DATE\n FROM RENTAL\n WHERE\n CUSTOMER_ID 1 \n AND CUSTOMER_ID 2\nORDER BY RETURN_DATE DESC\n;\n\n---------- # cast 데이터 형식 변환: cast (변환하고자 하는 데이터 AS 데이터 형식)\n---------- returndate를 date 타입 변환 후 ">In - 보유여부특정 집합에서 특정 요소가 존재하는지 확인옵티마이저 특성상 IN조건이 유리할때가 많다 (DBMS/SQL 최적화 문법)---------- # IN: 있는 경우SELECT CUSTOMER_ID ,..

Data/Sql 2023.06.19

[SQL] 데이터 수행/선택/정렬 - Commit, Select, Orderby, Distinct

Begin/Commit/RollbackDML(Data Manipulation Language) 작업을 하고 DBMS에 반영할건지 아닌지를 결정하는 명령어들---------- # BEGIN 시작 - 생략 가능BEGIN; ---------- # COMMIT - 수행COMMIT; ---------- # ROLLBACK - 취소ROLLBACK;Select테이블에 저장된 데이터를 가져오는데 쓰는 구문---------- # 전체 선택 '*'SELECT * FROM CUSTOMER;---------- # 특정 칼럼만 선택SELECT FIRST_NAME , LAST_NAME , EMAIL FROM ..

Data/Sql 2023.06.19

[Python] 파이썬 정규 표현식 - re

정규표현식(regular expression) 특정한 패턴과 일치하는 문자열를 '검색/치환/제거'하는 기능을 지원 정규표현식의 도움없이 패턴을 찾는 작업은 불완전하거나, 작업 비용이 높음 예를 들어, 이메일 형식 판별, 전화번호 형식 판별, 숫자로만 이루어진 문자열 등 # re 패키지 사용법 import re re.함수(찾아줄것, 찾아야할 데이터) - 직접 찾아줄 것을 대입 기본 패턴 a, X, 9 등등 문자 하나하나의 character들은 정확히 해당 문자와 동일. 대소문자의 경우 기본적으로 구별하나, 구별하지 않도록 설정 가능. 몇몇 문자들에 대해서는 예외가 존재하는데, '. ^ $ * + ? { } [ ] \ | ( )'들은 틀별한 의미로 사용 됨 https://docs.python.org/3/li..

Data/Python 2023.06.18

[Python] 파이썬 Pandas의 연산 - 피봇테이블, 통계값, 함수들

기초 통계 연산 보통 누락된 값을 제외하고 연산 # 중앙값 >>> df.mean() A -0.004474 B -0.383981 C -0.687758 D 5.000000 F 3.000000 dtype: float64 # 특정 축의 중앙값 >>> df.mean(1) 2013-01-01 0.872735 2013-01-02 1.431621 2013-01-03 0.707731 2013-01-04 1.395042 2013-01-05 1.883656 2013-01-06 1.592306 Freq: D, dtype: float64 # 다른 차원의 객체더라도 판다스는 자동으로 정렬해 연산함 >>> s = pd.Series([1, 3, 5, np.nan, 6, 8], index=dates).shift(2) >>> s 201..

Data/Python 2023.06.18

[Python] 파이썬 Pandas의 사용법 - 보기, 선택, 설정, 누락된 데이터

Pandas란? 데이터 분석, 처리를 위해 만들어진 파이썬 패키지로, 보다 안정적으로 대용량 데이터들을 쉽게 처리할 수 있다 0. 패키지 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt 1. 객체 생성 # 1. 시리즈 >>> s = pd.Series([1, 3, 5, np.nan, 6, 8]) >>> s 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 # 2. 데이터프레임 >>> df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD')) >>> df A B C D 2013-01-01 0.469112 ..

Data/Python 2023.06.18

[Python] 파이썬 Pandas 자료구조 - Dataframe

1. 데이터 프레임 인덱싱, 셀렉션 # 데이터 프레임 선택, 추가, 삭제, 삽입 >>> df['three'] = df['one'] * df['two'] # 새로운 컬럼 추가 >>> df['flag'] = df['one'] > 2 >>> df one two three flag a 1.0 1.0 1.0 False b 2.0 2.0 4.0 False c 3.0 3.0 9.0 True d NaN 4.0 NaN False >>> df['one'] # 변수명[' ']은 해당값 선택 a 1.0 b 2.0 c 3.0 d NaN Name: one, dtype: float64 >>> df.one # 컬럼 선택 flag a 1.0 b 2.0 c 3.0 d NaN Name: one, dtype: float64 >>> del ..

Data/Python 2023.06.18

[Python] 파이썬 Pandas 자료구조 - Series, Dataframe

Pandas란? 데이터 분석, 처리를 위해 만들어진 파이썬 패키지로, 보다 안정적으로 대용량 데이터들을 쉽게 처리할 수 있다고 한다 0. 패키지 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt 1. 자료구조 ① 시리즈(Series) value와 index의 형태를 지니는 Pandas의 자료 구조. 값이 있는 리스트를 통해 Series를 만들고, 정수로 만들어진 인덱스를 기본값으로 불러옴. # 시리즈 생성 방법 변수명 = pd.Series(data, index=['','']) # 인덱스 지정 생략가능, 생략시 0부터 자동 지정 # 리스트로 Series 만들기 >>> s = pd.Series([1,3,5,7], index..

Data/Python 2023.06.18

[Python] 파이썬 웹페이지 자동화 - Selenium

Selenium란? BeautifulSoup 라이브러리만으로도 다양한 사이트의 정보를 추출 가능하나, 자바스크립트로 동적으로 생성된 정보는 가져올 수 없는 한계 Request와 Beautifulsoup으로 크롤링 실패시 Selenium 사용하면 끝 Selenium은 웹페이지 테스트 자동화용 모듈로, 개발/테스트용 드라이버(웹브라우저)를 사용하여 실제 사용자가 사용하는 것처럼 동작하게 만듬. 인스타그램 좋아요 등 보통 반복적으로 하고 있는 웹상의 행동들을 자동화하기에 좋음. Selenium 모듈 설치 Anaconda Navigator > Environments > All 선택 > selenium 검색 및 선택 > Apply 크롬 드라이버 다운로드 ChromeDriver 88.0.4324.27 부분 클릭 >..

Data/Python 2023.06.18
728x90