일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- distribution
- p-value
- pig
- T-검정
- 결정계수
- SQL on 하둡
- pca
- 가설검정
- dict
- DBSCAN
- 딕셔너리
- 분산분석
- cross validation
- hive
- DataFrame
- join
- 데이터프레임
- k-means
- 다중공선성
- Python
- list
- 분포
- Sawzall
- 병렬 쿼리 시스템
- 하둡
- SPLIT
- 교차검증
- merge
- 밀도기반
- 유사도
- Today
- Total
목록Python (11)
one of a kind scene
튜플(tuple), 리스트(list), 셋(set), 딕셔너리(dict) 비교 (궁금증을 갖게된 계기) : 면접에서 튜플과 리스트의 차이점을 명확하게 기억나지 않아서 제대로 설명하지 못 하였다. 따라서, 이번 기회에 여러 자료 구조간의 유사한 점과 차이점을 명확히 알아보고자 함 1. 튜플(tuple) • 리스트와 비교가 많이되며, 리스트와의 가장 큰 차이점은 요소를 삭제하거나 변경할 수 없다는 것. • 이를 immutable(불변성) 이라고 표현함, iterable 함 • 리스트는 append, remove 메소드로 요소들을 추가하거나 삭제할 수 있지만 튜플은 이러한 메소드가 없음 • 튜플 + 튜플 형식으로 요소를 추가할 수는 있으며, 삭제도 indexing을 통해서 삭제하고자 하는 요소의 index를 ..
Survival Analysis¶참고 url : https://hyperconnect.github.io/2019/07/16/survival-analysis-part1.html¶ In [8]: # !pip install pandas # !pip install lifelines In [36]: import pandas as pd # Survival Function 추정 부분 from lifelines import KaplanMeierFitter # Culmulative hazard function 추정 부분 from lifelines import NelsonAalenFitter # 유의성 검증에 활용되는 부분 from lifelines.statistics import logrank_test 데이터 입력¶ t..
import itertools print(list(itertools.product(["-", "+"], repeat = 2))) print(list(itertools.permutations(["-", "+"], 2))) print(list(itertools.combinations(["-", "+"], 2))) print(list(itertools.product(["A", "B", "C"], repeat = 2))) print(list(itertools.permutations(["A", "B", "C"], 2))) print(list(itertools.combinations(["A", "B", "C"], 2)))
1. 언제사용? split은 구분자로 구분된 하나의 문자열(str)을 구분자 기준으로 나누어 list 형태로 만들어 줄때 사용 즉, 자료형이 string → list로 바뀌어서 return됨 (코드 모양) 문자열.split("구분자") ※구분자 없는 경우(default로 공백을 기준으로 split함) = 문자열.split("") # split 사례 a = "hello-world" a = a.split("-") # 아래와 같은 결과값을 지님 ['hello', 'world'] join은 list내의 여러 문자열들을 하나의 문자열로 만들어 줄 때 사용 즉, 자료형이 list → string로 바뀌어서 return됨 (코드 모양) "구분자".join(list or tuple) ※구분자 없이 이어붙이고 싶을때 =..
1) list 정렬하기 : list.sort(), sorted(list) - list.sort()는 return값이 없이 list자체를 변환 시켜줌, 별도로 alias안해줘도됨 - sorted(list)는 sort된 값을 return해줌. 만약, alias를 안해주면 정렬해준 값을 이후에 사용 못함 # 1) list.sort() 자체변환 : alias 불필요 # 오름차순 list.sort() # 내림차순 list.sort(reverse=True) # 2) sorted(list) : alias 필요 # 오름차순 sorted(list) # 내림차순 sorted(list, reverse=True) 2) list 역순으로 만들어주기 : list.reverse() 3) for문에서 list 역순으로 가져오기 : ..
(상황) 어떤 데이터 프레임 df에서 onehot인코딩하여 1값을 지닐 index를 담고있는 column1이 있을때, 이를 가지고 onehot 인코딩한 vector형태의 list를 column2에 만들어 주고자 한다. (예제) vector의 index를 담고있는 [1,4] 라는 list를 보고 [0,1,0,0,1]이라는 onehot 인코딩한 vector형태의 list 만들어주기 [1,4] → [0,1,0,0,1] 변환 (코드) # 비어있는 column2를 만들어 준다 df['column2'] = np.NaN for i in range(len(df)): # maxrange = len(벡터) maxrange = 벡터길이 설정해주면 됨 # onehot만들어줄 0으로만 이루어진 list만들어주기 onehot =..