반응형

Python 30

[Markdown] Jupyter notebook tab like r markdown(widgets)

주피터 노트북에서 tab 만들기 R 마크다운에서는 tabset으로 내용을 나누어 깔끔하게 만드는 것이 가능했다. 주피터 노트북에서도 widget으로 해당 기능을 구현할 수 있는데, 그 방법을 알아보고자 한다. 최종 Output은 다음과 같다. First, Second 두 개의 Tab을 만들고, 각각에 histogram 이미지를 넣어주었다. 먼저 필요한 Library를 import 한다. ipywidgets의 widgets 가 핵심이다. import matplotlib.pyplot as plt import pandas as pd import ipywidgets as widgets import numpy as np 다음으로, 그래프를 그려 줄 예시 데이터를 만든다. data1 = pd.DataFrame(np..

Python/MarkDown 2021.09.14

[Python pandas] Fill time interval by group :: 비어있는 시간 채우고, group별 직전값으로 NA 채우기

공정 TAG 데이터를 처리하다보면, 데이터가 수집되지 않아, 비어있는 시간을 채워야 하는 경우가 있다. 특히, Group 별로 사이사이 비어있는 시간을 채우는 방법을 설명하고자 한다. 최종 결과는 다음과 같다. DATE에 분 단위로 비어있는 row를 채우고, 그 값은 Group별 직전 시점의 값으로 채운다. 1. Library pandas와 numpy를 불러온다. import pandas as pd import numpy as np 2. Create Data 실습에 사용할 데이터를 만들어준다. 나중에 Group별로 직전값으로 채워주기 위해 A와 B로 이루어진 Group 컬럼과, 값을 나타내는 value, 시간을 나타내는 DATE로 만들었다. data = pd.DataFrame({'Group':['A','..

[Pandas] Line, Scatter, Box, Histogram, Density, Bar, Pie Plot :: add Hline, Vline, Plot Customizing, by Group

판다스 데이터 프레임으로 여러가지 그래프를 그리고, Customizing 하는 방법에 대해 알아보겠다. 1. Import Library matplotlib 와 seaborn을 활용한다. import matplotlib.pyplot as plt import seaborn as sns import numpy as np import pandas as pd import random 2. Create Sample Data Set 50개의 random 한 데이터를 만들어 준다. group별로 그래프를 customizing 하기 위해 A, B, C로 이루어진 'group' 컬럼도 생성한다. data = pd.DataFrame({"x":np.random.rand(50), "y":np.random.rand(50), "z..

Python/Plot 2021.06.21

[Markdown] Jupyter Notebook :: 주피터 노트북 마크다운 정리

주피터 노트북에서 마크다운을 활용하는 여러가지 기능들을 소개하고자 한다. 마크다운이란? 먼저, 마크다운이란 일반 텍스트 문서의 양식을 편집하는 문법으로, HTML의 형태로 변환이 가능하다. 마크다운은 HTML과 아주 깊게 연관되어 있어, 웹 프로그래밍 중 HTML 문법을 알고 있다면 더욱 다양한 활용이 가능하다. 1. 마크다운 사용하기 주피터 노트북에서 마크다운을 사용하려면 먼저, Code Cell 에서 Markdown Cell 로 변경해 주어야 한다. 변경하는 방법은 다음과 같다. 1. esc + m 2. Cell -> Cell Type -> Markdown 첫 번째 방법은 단축키를 활용하는 방법으로, 마크다운 셀로 변경하고자 하는 셀을 클릭 후, esc로 커서를 없애주고, m을 눌러 마크다운 셀로 변..

Python/MarkDown 2021.06.15 (1)

[Python] matplotlib 으로 pandas data 그래프 그리기 :: multiple plots, Customizing Figure Layouts, scatter, boxplot

최종적으로 다음과 같이 group별로 Scatter 혹은 boxplot의 색상도 다르고, layout이 자유분방한 그래프를 그릴 것이다. 데이터는 numpy와 pandas를 활용하고, scatter와 boxplot은 matplotlib을 활용하며, Layout은 matplotlib의 gridspec를 활용한다. 1. Import Library 위에서 언급했듯, numpy, pandas, matplotlib 등 필요한 라이브러리를 불러온다. import numpy as np import pandas as pd import matplotlib.pyplot as plt from matplotlib import gridspec 2. Create Data Set x와 y, group으로 이루어진 50개의 data..

Python/Plot 2021.06.10

[Python Pandas] pandas table sorting by other table's column

2개의 Pandas DataFrame A, B가 있을 때, B 테이블의 하나의 컬럼을 기준으로 A 테이블을 sorting 하는 방법을 알아보겠다. 예로 다음 두 DataFrame이 있다고 하자. import padnas as pd ## create A table A = pd.DataFrame({'col1' : ['d','b','a','e','c'], 'col2' : [1,6,9,3,6]}) ## create B table B = pd.DataFrame({'standard_col' : ['a','b','c','d','e'], 'col3' : [1,2,3,4,5]}) A table의 'col1' 컬럼과 B table의 'standard_col' 의 요소가 동일하다. 이 때, A table을 B table의 ..

[numpy tutorial] numpy에서 대각선 값 채우기 in python

Python :: fill diagonal in numpy numpy에서 대각선 값을 채우기 위해서는 numpy.fill_diagonal() 를 활용하면 된다. numpy를 np 로 import 하고, 0부터 15로 이루어진 4 by 4 테이블을 생성해 주었다. import numpy as np metrix = np.arange(16).reshape(4,4) 생성된 metrix 결과는 다음과 같다. np.diagonal(metrix) 로 대각선 값이 무엇인지 확인할 수 있다. 대각선 값을 모두 0으로 지정하는 방법은 다음과 같다. np.fill_diagonal(metrix, 0) 모두 한 가지 값이 아니라 각각 다른 값으로도 채워줄 수 있다. 대각선 값을 100, 101, 102, 103 으로 채워보았다..

Python 2021.01.19

[Python] pandas tutorial :: replace nan/na/null

2020/09/18 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란? 2020/09/19 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: read csv, txt file with pandas 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Create Data Frame with Dictionary, List 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Save Pandas Data Frame to CSV ..

[Python] pandas tutorial :: drop duplicates in pandas

2020/09/18 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란? 2020/09/19 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: read csv, txt file with pandas 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Create Data Frame with Dictionary, List 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Save Pandas Data Frame to CSV ..

[Python] Pandas Tutorial :: groupby transform (groupby 결과 컬럼에 추가하기)

2020/09/18 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란? 2020/09/19 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: read csv, txt file with pandas 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Create Data Frame with Dictionary, List 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Save Pandas Data Frame to CSV ..

반응형