공공 데이터 포털에서 기상 데이터를 fetch 하는 방법에 대해 알아보겠습니다. 공공 데이터 포털은 기상 데이터 외에도 교육, 국토 관리, 공공 행정, 재정 금융, 산업 고용 등 우리나라의 많은 데이터들을 api 외에도 파일 데이터로 제공해주는 사이트입니다.
https://www.data.go.kr/index.do
제가 필요한 데이터는 기상청_지상(종관, ASOS) 일자료 조회서비스입니다.
https://www.data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15059093
이 데이터는 전국 각지에 흩어져 있는 기상청 및 기상대에서 측정한 온도, 습도, 풍속 등 전반적인 기상 데이터들을 가지고 있습니다.
공공 데이터 포털에서 api를 신청하고 이용하는 방법은 굉장히 간단합니다.
1. 로그인을 해주고 원하는 API에 들어가, 활용 신청을 클릭합니다.
2. 활용 목적을 선택하고 필수 입력 칸을 입력합니다.
3. 자동승인인 api의 경우, 신청 후 바로 사용이 가능합니다. 현재 활용하고 있는 데이터를 보기 위해서는 마이 페이지 -> 데이터 활용 -> Open API -> 활용 신청 현황에 들어간 뒤, 승인된 api를 클릭합니다.
4. 미리보기 클릭 후 부여받은 인증키를 입력하고, 데이터를 미리 확인해볼 수도 있습니다.
5. 또한 맨처음 활용 신청을 했던 API 페이지의 맨 하단에 각 프로그래밍 언어로 어떻게 API를 신청해야 하는지 샘플코드를 보여주고 있습니다. 이를 참고하여, data를 fetch할 수 있습니다.
Python으로 기상 데이터를 fetch한 후(Extract), pandas를 활용하여 필요한 column을 담은 Dataframe 형식으로 변환한 후(Transform), 그것을 PostgreSQL 데이터 베이스에 적재하는(Load) ETL 플로우를 작업하고 있습니다. 이에 대한 설명은 다음 포스팅에 올리도록 하겠습니다.
'Projects > ClimaML' 카테고리의 다른 글
[ClimaML] 커스텀 센서로 안정성 높은 데이터 파이프라인 구축 (1) | 2024.11.25 |
---|---|
[Airflow] 기상 데이터 적재 자동화: 2014년부터 2024년까지 (1) | 2024.11.18 |
[Postgresql] Open API 데이터 ETL 플로우 (0) | 2024.11.04 |
[Postgresql] Linux(Ubuntu)에서 설치 (0) | 2024.11.03 |