분류 전체보기 79

[Airflow] Sensor에 대해 알아보자

Sensor Operator란?Sensor Operator는 특정 조건이 충족될 때까지 대기하는 Task로, 조건이 만족되면 True를 반환하여 다음 Task로 넘어갑니다. 모든 Sensor는 BaseSensorOperator를 상속하여 구현되며, 반드시 두 가지 메서드를 오버라이딩해야 합니다:__init__(): 초기화 메서드로, Sensor의 기본 설정을 정의합니다.poke(context): 센싱 로직을 정의하는 메서드로, 특정 조건을 만족하는지 확인합니다.BaseSensorOperator는 Airflow의 BaseOperator를 상속하며, Sensor의 동작과 모드를 결정하는 다양한 매개변수를 제공합니다.Airflow docs: https://airflow.apache.org/docs/apache..

MLOps/Airflow 2024.11.19

[Airflow] 기상 데이터 적재 자동화: 2014년부터 2024년까지

들어가며Airflow를 활용하여 2014년부터 2024년까지의 기상 데이터를 공공 API를 통해 요청하고, PostgreSQL 데이터베이스에 저장하는 과정을 설명합니다.디렉토리 구조 및 common 폴더: 프로젝트 디렉토리 구조와 공통으로 사용될 파일 정의Airflow DAG 설계: 데이터 적재 작업을 정의.Custom Operator 작성: API 요청과 데이터 적재 로직 구현.PostgreSQL 데이터베이스와 스키마 자동 생성.프로젝트 디렉토리 구조아래는 현재까지의 프로젝트 디렉토리 구조입니다: ├── dags/│ ├── climaml_historical_weather_data_dag.py # DAG 정의 파일├── plugins/│ ├── operators/│ │ ├── climam..

Projects/ClimaML 2024.11.18

[Airflow] Provider 패키지 설치

Airflow에서 사용 가능한 Providers는 UI의 "Connections" 섹션에서 확인할 수 있습니다. 만약 필요한 Provider가 없다면 설치해야 합니다.설치 방법1. 도커 파일 생성Base Image로 사용중이던 airflow version의 이미지를 입력합니다.원하는 provider 패키지를 입력해줍니다. 2. 도커 이미지 빌드sudo docker build -t airflow_custom . 3. docker-compose.yaml 수정 airflow 서비스의 이미지를 airflow_custom으로 변경합니다. 4. 컨테이너 재실행docker-compose downdocker-compose up 5. Provider 확인Airflow UI의 Admin > Providers에서 설치된 P..

MLOps/Airflow 2024.11.17

[Airflow] PostgreSQL 연동 - Docker Compose를 활용한 설정과 Custom Hook 사용

이번 포스팅에서는 Docker Compose로 PostgreSQL 컨테이너를 설정하고, Airflow의 Hook을 활용해 데이터베이스 작업을 간소화하는 방법을 살펴보겠습니다.PostgreSQL 컨테이너 설정Docker Compose를 활용해 PostgreSQL 컨테이너를 설정합니다. 아래는 docker-compose.yaml 파일에서 PostgreSQL 설정의 주요 부분입니다.services: postgres_custom: image: postgres:13 environment: POSTGRES_USER: kim POSTGRES_PASSWORD: kim POSTGRES_DB: kim TZ: Asia/Seoul volumes: - postgre..

MLOps/Airflow 2024.11.16

2024 AWS Innovate 발표

2024 AWS Innovate - AI/ML & Data EditionAWS Innovate - AI/ML & Data Edition AWS Innovate - AI/ML & Data Edition본 온라인 컨퍼런스는 한국어를 비롯해 영어, 인도네시아어, 일본어 강연이 제공되며, 다른 언어 강연은 한글 자막이 제공되지 않으므로 한국 청중께서는 컨퍼런스 당일 한국어 강연을 선택하aws.amazon.comContentsAWS Innovate의 발표 주제로, SageMaker를 이용한 자동화 파이프라인을 구축을 선정하였습니다. 배경 및 필요성Trouble지금까지는 Data 전처리부터 Deploy까지 각 단계를 담당자가 순차적으로 처리하며, 잘못된 의사소통과 지연 시간으로 인해 결과물 확인에 많은 시간이 소요..

ETC 2024.11.16

[Angular] Renderer2를 사용한 동적 사이드바 및 팝업 전환 Directive 구현

Angular에서 Renderer2와 ApplicationRef를 활용해 화면에 동적으로 생성되는 사이드바와 팝업 모드를 전환할 수 있는 기능을 구현해 보겠습니다. 이번 글에서는 사용자가 사이드바를 열고 닫을 수 있으며, 사이드바를 드래그하여 팝업 모드로 전환하거나 다시 사이드바로 돌아가는 방법을 다룹니다. 이를 통해 Angular의 커스텀 디렉티브와 DOM 조작을 효과적으로 사용하는 방법을 알아보겠습니다.구현 목표사이드바 열기와 닫기: 클릭 시 사이드바가 화면 오른쪽에서 열리고, 다시 클릭하면 닫히도록 합니다.팝업 전환: 드래그하여 화면 중간으로 이동하면 사이드바가 팝업 모드로 전환되도록 합니다.사이드바 복귀: 팝업을 오른쪽으로 드래그해 특정 위치에 오면 다시 사이드바 모드로 돌아갑니다.주요 기술 요소..

FE/Angular 2024.11.15

[Airflow] Docker Compose 파일 해석

Docker Compose의 역할과 사용 방법Docker Compose의 목적Docker Compose는 다중 컨테이너를 생성하고 관리할 때 효율성을 제공합니다. 예를 들어, 데이터베이스, 웹서버, 백엔드 등 여러 구성 요소를 하나의 애플리케이션으로 묶어야 할 때 유용합니다. Compose 파일 하나에 모든 컨테이너의 설정을 정의하고, 한 번의 명령어로 일괄적으로 컨테이너를 관리할 수 있습니다.Docker Compose 작성 방법Docker Compose 설정 파일은 docker-compose.yaml이라는 이름으로 작성합니다. 이 파일에 각 컨테이너의 이미지, 환경 변수, 볼륨, 네트워크, 의존성 등을 YAML 형식으로 정의할 수 있습니다.Docker Compose 서비스 시작 및 중지설정 파일이 있는..

MLOps/Airflow 2024.11.14

[Airflow] DAG 실행과 스케줄링

1. DAG 파일 로드 및 파싱Airflow에서 모든 워크플로는 DAG(Directed Acyclic Graph) 형태로 정의됩니다. 이 DAG은 Python 코드로 작성되며, 작업의 순서와 의존성을 설정하는 방향성 비순환 그래프입니다. Airflow의 스케줄러(Scheduler)는 설정된 디렉토리를 주기적으로 확인하여 새로 생성되거나 수정된 DAG 파일이 있는지 감지합니다.(이로 인해 코드를 작성할 때 메모리 효율적으로 작성을 해야 함)스케줄러는 DAG 파일을 로드하고 파싱하여 DAG 객체를 생성하며, 이를 메타데이터 데이터베이스에 저장합니다. 이때 DAG에 정의된 모든 작업(Task)과 그 의존 관계도 함께 등록됩니다. 덕분에 Airflow는 DAG의 실행 시점을 정확히 파악하고 DAG이 완료될 때까..

MLOps/Airflow 2024.11.13

[Angular] GraphQL과 gql을 사용한 서버 요청

GraphQL의 개념부터 gql 태그를 사용해 클라이언트에서 서버로 데이터를 요청하는 방식까지 단계별로 한번 알아보겠습니다.1. GraphQL이란?GraphQL은 페이스북에서 개발한 데이터 질의 언어로, 클라이언트가 필요한 데이터의 형태를 지정하여 서버로 요청하고 원하는 응답을 받을 수 있게 합니다. GraphQL은 주로 REST API의 단점을 해결하기 위해 만들어졌습니다. 기존 REST API와 달리, 클라이언트는 한 번의 요청으로 필요한 데이터만 선택해서 가져올 수 있어 데이터 효율성을 크게 높일 수 있습니다.GraphQL의 주요 개념Query: 클라이언트가 서버에 데이터를 요청하는 방식입니다. 필요한 데이터의 필드만 선택해서 요청할 수 있습니다.Mutation: 서버의 데이터를 변경하기 위한 요청..

FE/Angular 2024.11.12

[Airflow] Custom Operator 만들기

Custom Operator가 필요한 이유기본적으로 Airflow에는 PythonOperator, BashOperator, EmailOperator 등 자주 사용하는 작업에 대한 Operator가 준비되어 있지만, 모든 상황을 커버하지는 않습니다. 예를 들어, 외부 API 호출 후 데이터를 처리하는 작업이나 복잡한 데이터 파이프라인을 위한 연산이 필요할 때는 Custom Operator가 더욱 적합합니다.Custom Operator를 통해 우리는 다음과 같은 이점을 얻을 수 있습니다.코드 재사용성: 특정 비즈니스 로직을 담은 Operator를 재사용하여 일관성 있게 워크플로우를 구축할 수 있습니다.코드 간소화: DAG에서 반복적인 코드를 줄이고, 명확한 역할을 가진 Operator를 만들어 가독성을 높일..

MLOps/Airflow 2024.11.11