서비스를 올리기 전, 성능테스트를 하고 있었다.
모델을 사용하기 때문에 inference 시간이 가장 짧은 인스턴스 사양을 찾고있었다.
이어서 n2-highcpu-4, 4cpu 4gb메모리 + Intel Cascade Lake 사양으로 테스트를 해보려 하니
GCP ssh 접속에서 에러가 발생했다.
Connection via Cloud Identity-Aware Proxy Failed 에러
4gb의 메모리가 너무 적어서 발생한 문제였다.
인스턴스의 메모리를 늘려서 해결했다.
'mlops, devops' 카테고리의 다른 글
gunicorn worker & thread 설정(2) - 성능 테스트 (0) | 2021.12.01 |
---|---|
gunicorn의 gevent란? (0) | 2021.12.01 |
python warning (0) | 2021.11.30 |
gunicorn thread worker 설정 (0) | 2021.11.30 |
docker 내 conda 환경이 안맞는 이슈 (0) | 2021.11.19 |