업무 스킬/Python(파이썬)(23)
-
[Python] BeautifulSoup 사용하여 주식 종목 가져오기.
Python의 BeautifulSoup를 사용하여 기본 웹크롤링 작성한 내용. 1. 웹크롤링에 필요한 BeautifulSoup, requests import 하기. anaconda를 사용한다면 BeautifulSoup는 기본으로 깔려있을 것이다. 아니면 깔려있는지 안 깔려 있는지 확인부터 해보자. (requests lib은 python의 기본 lib이니 다 있을 거다.) 난 아직 초보라 이 방법이 가장 쉽더라구.. ↓복사↓ import bs4 print(bs4.__version__) 만약 해당 Library가 있다면 아래와 같이 Version 명이 뜨고 없다면 그런 거 없는데? 하고 error가 뜰 거다. 없으면 pip install BeaurifulSoup 를 통해 설치해주자. 2. 웹 크롤링하고자 하..
2021.04.12 -
[Pandas] Apply를 활용한 Object → float 변환.
1. Data 확인. 아래 예시 data를 보면 item_price Column의 Data에 $가 붙어 object type으로 되어있는 것을 알 수 있다. 금액 Data의 경우 Object Type을 Float Type으로 변환해줘야 활용을 자유롭게 할 수있는데 위 예시 Data에서는 $표기를 빼야 한다. 그 방법을 확인해 보자. 2. Apply와 lambda의 활용. 우선 Pandas에서는 apply를 활용해 함수를 적용할 수 있는데, 물론 함수는 def로 정의할 수 있지만 간단한 함수의 경우에는 lambda를 활용하면 편리하다. 어려운 부분이 없으니 그냥 예시만 적는다.
2021.04.09 -
[Pandas] loc, iloc 차이 확인[Pandas] loc, iloc 차이 확인
1. Pandas에서 많이 활용하는 loc, iloc이란? - iloc은 i가 붙은 만큼 index를 활용한 location 지정 방법. → 사용 예시 : DataFrame.iloc[index_index, column_index] - loc은 index를 활용하지 않고 직접 index 및 column명을 통해 지정하는 방법. → 사용 예시 : DataFrame.loc[index_name, column_name] 오늘은 예시로 미국 치폴레 매장의 매출표를 예시로 활용하고자 한다. 2. 한눈에 보는 loc, iloc 실행의 차이. 그냥 아래의 차이를 보면 두 방식의 차이가 확인이 된다. 우선 위에서 활용한 DataFrame은 'data'를 객체명으로 지정하였다. 예시에서 주의할 점은 index가 문자가 아닌..
2021.04.08 -
[Jupyter Notebook] 글씨체 변경 방법.
1. 실행 (윈도우 + R) 키를 눌러 실행창을 켠후 cmd를 실행. 2. Users(사용자) 폴더에 .jupyter config 생성. 복사하세요 : jupyter notebook --generate-config 3. .jupyter 폴더에 들어가서 custom 폴더 생성. 4. Visual Studio에 들어가서 해당 폴더에 custom.css 파일 생성 후 코드 작성. ↓복사하세요↓ div.CodeMirror, dic.output_area pre, div.ouput_wrapper pre{ font-family: Consolas; font-size: 13pt; line-height: 110% } div#notebook, div.prompt{ font-family: Consolas; font-size:..
2021.04.07 -
[Numpy] Pooling, Average_Pooling 방법 및 설명
1. Pooling 이란? 이해하기 쉽게 아래 그림을 보면 예를 들어 10 x 10의 Array를 두꺼운 테두리를 기준으로 5 x 5로 바꾸는 것을 말한다. 즉, 기존의 Array를 그 반의 크기로 변환하는데 거기에 계산 값이 들어가는 것이다. 종류는 평균 값을 내는 Average Pooling이 있고 하고 싶으면 Variance(분산)이나 다른 값을 내도 된다. 2. 예시 코드 보기. 예시 코드를 보자 코드는 VS Code에서 작성했다. 아래는 전체 코드다. 순서대로 보면 1. average_pooling의 함수를 정의해주고 값은 Array값을 받아온다. 나는 arr로 표기하였다. 2. Array의 Shape를 Tuple 형태로 받아준다. 그 후에 Array의 크기를 2로 나눠준 값을 정의하여, 새로운..
2021.03.27 -
[Numpy] 다중 차원(Dimension) 연산 쉽게 익히기 (꿀팁)
포스팅을 보기에 앞서, 이 글을 읽는 사람이 4차원쯤은 머릿속에서 그릴 수 있다. 하면 뒤로 가기를 누르길 바란다. 그럼 시작한다. 1. Axis = Numbering 부터 확인 np.sum([array], axis = # )가 기본 차원 연산자인데, 저 식의 맨뒤 axis = # 즉, 차원의 Numbering이 패턴이 있다. 아래 표를 보자 표처럼 차원이 하나씩 늘어날수록 기존의 차원 Numbering이 하나씩 뒤로 밀리는 것을 볼 수 있다. 예를 들면 1차원에서는 axis = 0이 x 축이였다면, 3차원 배열의 경우 axis = 0의 축은 z 축이 된다. 이 점이 Numpy를 처음 시작할 때 나에게 큰 혼동을 주었고 이제는 뭐 외우게 되었다. 2. 한 차원 연산 익히기 그럼 한 차원만 연산해보도록 하..
2021.03.19