크크루쿠쿠

[ML4T]트레이딩용 머신러닝: 아이디어에서 주문 집행까지 본문

Quant

[ML4T]트레이딩용 머신러닝: 아이디어에서 주문 집행까지

JH_KIM 2023. 1. 12. 22:36

이 글은 "퀀트 투자를 위한 머신러닝 딥러닝 알고리즘 트레이딩 2/e" 책을 바탕으로 작성되었습니다.

0. Why?

 평소에 관심을 갖고 있던 분야기도 했고 예전 부스트캠프 특강중 퀀트 트레이딩에 대한 특강을 듣고 재밌어 보여서 관심을 더 크게 갖게 되었지만, 어쩌다 취업이 되고나서 정신없이 살다보니 잊혀진 분야였다. 그러던 어느날 회사에 있는 책들 중에서 이 책이 눈에 들어오게 되었고 읽어봐야겠다 라는 생각이 들었다. 하지만 생각만 하고 거대한 책의 위엄에 짓눌려 생각의 저편에 치워놨었다. 그러고 이번에 긴 휴가를 갔다온 후에 신년계획겸 열심히 살자는 느낌으로 내가 관심을 갖는 분야를 한번 제대로 공부를 해보고 싶어 이렇게 시작하게 되었다. 금융 공부도 하면서 ML도 같이 할 수 있다니 이게바로 일석이조가 아닌가 싶다. 목표는 책을 다 읽거나 중간부터 실제로 내가 국내 투자API를 이용해서 나만의 트레이딩용 end to end ML (ML4T)를 구성하는것이다

1. 아이디어에서 주문 집행까지

(1) 투자업계에서 ML의 부상

왜 algorithm trading과 ml이 부상했는가?

1. 전자 거래의 확산과 market microstructure의 변화

2. 자산군과 반대되는 risk-factor exposure 측면에서 투자 전략의 개발

3. 기술의 발전(컴퓨터, data, statistic method...)

4. 실제 나오는 성과들

(2) 머신러닝 기반 전략의 설계와 실행

아래 그림은 이 책에서 하고자 하는 workflow의 main steps다.

책의 1부에서 하는 내용

1. 데이터 소실과 관리

- 알파 신호를 포함한 시장, fundamental, 대체 데이터의 소스를 식별하고 평가한다.

- 클라우드 기반의 확장 가능한 데이터 인프라와 Hadoop, Spark 와 같은 분석 도구를 배포하거나 액세스해 빠르고 유연한 데이터 액세스를 용이하게 함

- Point-In-Time 기준으로 원하는 빈도로 조정해 look-ahead bias를 피해야 한다. 데이터는 알려진 정보만 반영해야 한다. 이 부분이 명확하지 않을 시에는 무조건 손실이다.

 

2. 알파 팩터 리서치에서 포트폴리오 관리까지

알파 팩터는 데이터에서 signal을 추출해서 수익을 예측하게 설계되었다. 보통 이 팩터는 자산에 대해 단일 값을 취하지만 여러 변수와 기간을 결합할 수 있다.(결국은 하나가 된다)

아래 사진은 리서치부터 포트폴리오 관리까지의 workflow

- Research

Alpha factors의 설계와 평가가 포함된다.

이는 매우 중요하며 bias 나 PIT(원금,이자,세금) 정보같은 것들을 놓치게 된다면 데이터가 오염된다. 

- Execution

매수와 매도 주문으로 이어진다. 이는 포트폴리오 리스크에 상호작용하고 리스크 프로파일을 갖게 된다.

 

3. 전략 백테스팅

ML에서 Test set으로 결과를 보는 느낌인것 같다.

backtrader와 zipline을 사용하는 방법을 알려준다 하니 열심히 읽어보자

 

2. 앞으로...

앞으로는 다양한 수식과 코드가 넘쳐나 블로그에는 정리하기 힘들고 아마 따로 할 것 같다 ㅎ

Comments