웹3 인사이트, 하루 한잔 DeFi Juice

스타트업 이야기

2024 금융산업전문인력 AI역량강화 - 2회차 강연 (금융권 AI 적용방안) 후기

레오(Leo) 2024. 5. 10. 13:09

 

강연자: 이재훈 도비캔버스 대표(AI 스타트업)

내용:

 

통계 기본 개념
- 데이터 사이언스는 통계학과 밀접한 관계가 있습니다.

- 미국에서 COMPASS라는 ML 알고리즘을 사용하여 범죄자를 분류할 때 인종 편향이 발생했습니다. 인종 데이터를 제거하였음에도 불구하고, ML은 다른 데이터를 통해 인종을 유추했습니다. 이로 인해 흑인에 대한 위험도 평가를 낮추는 보정 작업이 이루어졌습니다. 이는 결국 정치적이고 인간적인 문제로 귀결됩니다.

- 투자 AI는 주로 Look-ahead bias와 Survivorship bias에서 실수를 범합니다.
 - Look-ahead bias는 투자 모델이 실제로는 알 수 없는 미래 정보를 사용하는 오류를 말합니다. 예를 들어, 과거 데이터를 분석할 때 아직 발생하지 않은 이벤트의 정보가 포함되어 있으면, 모델이 현실보다 더 좋은 성능을 보이는 것처럼 착각할 수 있습니다.
 - Survivorship bias는 성공한 사례만을 고려하여 전체적인 분석을 왜곡하는 오류입니다. 예를 들어, 현재 시장에서 존재하는 회사만을 대상으로 연구를 진행하면, 실패하여 시장에서 사라진 회사들을 고려하지 않게 되어, 투자 전략이나 모델이 실제보다 더 긍정적으로 평가될 수 있습니다.


- 로보어드바이저를 개발하는 기업들은 AI가 '블랙박스'라는 이유로 타입1 오류를 경험하기도 합니다.
 - 타입1 오류는 실제로는 효과가 없음에도 불구하고, 통계적 검증 과정에서 효과가 있다고 잘못 결론 내리는 오류를 말합니다. 예를 들어, 로보어드바이저가 투자 결정에서 성공적인 투자 기회를 발견했다고 판단하지만, 실제로는 그렇지 않은 경우에 이 오류가 발생합니다. 이는 AI 모델이 내부적으로 어떻게 결정을 내리는지 명확하게 설명하기 어려운 '블랙박스' 문제와 연관이 있습니다.
- 전후 관계를 인과 관계로 잘못 이해하면 안 됩니다.

AI로 인한 오류:
1. Overfitting으로 인해 설명률이 100%에 이르는 오류가 발생합니다.
2. 경제나 금융 데이터는 가상의 데이터를 생성할 수 없기 때문에, Multicollinearity 문제가 발생합니다.
 - **Multicollinearity(다중공선성)**는 회귀 분석에서 두 개 이상의 설명 변수가 서로 강하게 연관되어 있어, 각 변수의 독립적인 효과를 분리해내기 어렵게 만드는 상황을 말합니다. 경제나 금융 데이터에서는 이러한 문제가 자주 발생하는데, 예를 들어 주가와 이익률이 서로 밀접하게 연결되어 있어 어느 하나의 영향을 분리해서 설명하기 어려울 수 있습니다. 이는 분석 결과의 정확성을 저하시키고, 실제 영향력을 오해하게 만들 수 있습니다.
- 변수 사이에 관계가 없을 때는 머신러닝을 사용합니다. 기존에 통계로 분석하던 것은 통계가 잘 처리하고, 비정형 데이터는 AI로 분석해야 합니다.

데이터 관리:
1. 문제 정의
2. 데이터 소싱: 데이터와 인과 관계가 없을 경우, 데이터 모델이 개선되어도 예측력이 향상되지 않습니다.
3. 방법 찾기: AI, 통계 등

- 데이터를 가진 사람은 지주가 되고, AI를 만드는 사람은 소작농과 같습니다.

좋은 사례:
1. 한국투자증권의 AIR(AI Research)는 전체 리서치 트래픽의 두 배를 달성했습니다. 프로젝트에는 총 5명이 참여했습니다.
2. 삼성증권은 2차전지 ETF를 개발하면서 기존에 없던 카테고리를 만들었습니다. AI를 사용하여 IR, 리포트, 뉴스 등의 텍스트 데이터에서 2차전지와 관련된 기업을 선별했습니다.

- 미래에셋과 삼성증권에서 개발한 ETF 중 많은 수가 겹쳤지만, 가장 큰 차이점은 개발 비용입니다.

- 미국에서는 ETF가 주식보다 많이 존재하며, 이는 'ETF의 춘추전국 시대'와 같습니다.

- 보험 업계에서는 레모네이드 사례가 있습니다. AI 봇은 정보 비대칭성 문제를 해결하려고 하지만, 인터랙션 문제에 집중합니다. 이는 장기적으로 지속 가능하지 않습니다.

- 핑안보험은 AI를 지속적으로 도입하고 있으며, 동시에 사람의 역할도 계속 증가하고

 있습니다.

- 고빈도 거래(HFT)의 경우, 미국은 여러 거래소가 가능하므로 HFT가 유리하지만, 한국은 그렇지 않습니다.

 

 

 


 

아이디어: 가격이 아닌 변동성 예측을 할 수 있다면 ****상품들의 수익율 예측할 수 있지 않을까?

대표적인 기업만 찾아서 전체 시장 예측 가능

HFT를 ****분야에 충분히 적용가능하지 않을까?