일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Python
- 분산분석
- DBSCAN
- 교차검증
- SPLIT
- distribution
- 가설검정
- hive
- p-value
- T-검정
- 다중공선성
- SQL on 하둡
- 병렬 쿼리 시스템
- 데이터프레임
- 딕셔너리
- 유사도
- join
- Sawzall
- 밀도기반
- 분포
- merge
- list
- 결정계수
- DataFrame
- pca
- cross validation
- dict
- pig
- k-means
- 하둡
- Today
- Total
목록Python/내장모듈 및 자료구조 (5)
one of a kind scene
튜플(tuple), 리스트(list), 셋(set), 딕셔너리(dict) 비교 (궁금증을 갖게된 계기) : 면접에서 튜플과 리스트의 차이점을 명확하게 기억나지 않아서 제대로 설명하지 못 하였다. 따라서, 이번 기회에 여러 자료 구조간의 유사한 점과 차이점을 명확히 알아보고자 함 1. 튜플(tuple) • 리스트와 비교가 많이되며, 리스트와의 가장 큰 차이점은 요소를 삭제하거나 변경할 수 없다는 것. • 이를 immutable(불변성) 이라고 표현함, iterable 함 • 리스트는 append, remove 메소드로 요소들을 추가하거나 삭제할 수 있지만 튜플은 이러한 메소드가 없음 • 튜플 + 튜플 형식으로 요소를 추가할 수는 있으며, 삭제도 indexing을 통해서 삭제하고자 하는 요소의 index를 ..
import itertools print(list(itertools.product(["-", "+"], repeat = 2))) print(list(itertools.permutations(["-", "+"], 2))) print(list(itertools.combinations(["-", "+"], 2))) print(list(itertools.product(["A", "B", "C"], repeat = 2))) print(list(itertools.permutations(["A", "B", "C"], 2))) print(list(itertools.combinations(["A", "B", "C"], 2)))
1. 언제사용? split은 구분자로 구분된 하나의 문자열(str)을 구분자 기준으로 나누어 list 형태로 만들어 줄때 사용 즉, 자료형이 string → list로 바뀌어서 return됨 (코드 모양) 문자열.split("구분자") ※구분자 없는 경우(default로 공백을 기준으로 split함) = 문자열.split("") # split 사례 a = "hello-world" a = a.split("-") # 아래와 같은 결과값을 지님 ['hello', 'world'] join은 list내의 여러 문자열들을 하나의 문자열로 만들어 줄 때 사용 즉, 자료형이 list → string로 바뀌어서 return됨 (코드 모양) "구분자".join(list or tuple) ※구분자 없이 이어붙이고 싶을때 =..
1) list 정렬하기 : list.sort(), sorted(list) - list.sort()는 return값이 없이 list자체를 변환 시켜줌, 별도로 alias안해줘도됨 - sorted(list)는 sort된 값을 return해줌. 만약, alias를 안해주면 정렬해준 값을 이후에 사용 못함 # 1) list.sort() 자체변환 : alias 불필요 # 오름차순 list.sort() # 내림차순 list.sort(reverse=True) # 2) sorted(list) : alias 필요 # 오름차순 sorted(list) # 내림차순 sorted(list, reverse=True) 2) list 역순으로 만들어주기 : list.reverse() 3) for문에서 list 역순으로 가져오기 : ..
Heap의 특징 a = [3, 8, 5, 2] heapq.heapify(a) print(a) - 원소들이 항상 정렬된 상태로 추가되고 삭제됨(binary tree 기반) - 최소 힙(min heap)이라고 칭함 - 최소 힙은 root 즉 idx 0에 위치한 값이 가장 작고 자식들은 root보다 같거나 작음 - 즉, 최소 힙의 root는 최소값이니 이 성질을 잘 기억하자 - 따라서, 노드들도 자식들보다 같거나 작음 1. 내장모듈 heapq 불러오기 import heapq 2. heap 생성하기 - heapq 모듈을 사용하면 python의 일반 리스트를 heap 구조로 사용할 수 있게해줌 heap = [] 3. 힙에 element 넣어주기 : heappush( ) heapq.heappush(heap, 6)..