연합학습 개인정보 보호 동형암호 연동 성능·비용 비교

연합학습에 동형암호(HE)를 결합할 때 발생하는 지연·연산·네트워크 증폭과 그로 인한 비용 상승을 실무 지표로 정리했다. 도입 전 성능 예측과 비용 산정 체크리스트을 제공.

연합학습(Federated Learning, FL)에 동형암호(HE)를 적용하면 중앙 서버로 원시 데이터를 전송하지 않고도 안전한 집계를 구현할 수 있다. 실제 서비스 도입 단계에서 흔히 마주치는 성능 저하 원인, 비용 증가 항목, 그리고 현실적인 대체안까지 정리한다.

매일 엑셀 반복 작업에 시달리던 실무자 A씨와 AI 서비스 도입을 고민하는 기획자 B씨의 실무 사례를 통해 결정을 쉽게 만들 수 있도록 구성했다.

주요 내용

연합학습 환경에서 HE 적용이 의미가 있는지 판단하려면 다음 항목을 우선 검증해야 한다.

데이터 민감도 레벨: 규제(의료·금융)나 내부 정책상 원시 데이터 비유출이 필수인지 확인.
모델 복잡도와 연산패턴: HE는 주로 선형 연산(합·내적)에 친화적. 비선형 연산(활성화, 드롭아웃)은 비용이 높아진다.
통신 인프라 용량: ciphertext 크기 증가로 대역폭 요구가 늘어난다. 네트워크 병목 여부를 점검.
배치·스케줄링 여유: HE 연산은 지연이 크므로 모델 업데이트 빈도를 낮출 수 있는지 검토.

사례 분석: A씨와 B씨의 선택 과정

사례 1 – 매일 엑셀 반복 작업에 시달리던 실무자 A씨는 고객 데이터 요약 자동화를 목표로 했다. 데이터는 개인정보(전화번호, 이메일 포함) 수준으로 민감하지만 집계 통계만 필요했다.

중앙수집 대신 FL + HE(부분적 집계 암호화)로 PoC를 수행해, 응답시간은 3배, 운영비는 초기엔 6배 증가했으나 데이터 전송·규제 대응 비용(감사·동의 처리)이 연간으로는 오히려 절감되는 결과를 확인했다.

사례 2 – AI 서비스 도입을 고민하는 기획자 B씨는 추천모델을 개선하려 했지만 모델에는 복잡한 비선형계층이 많았다. HE 적용 시 모델 재설계(활성화를 선형 근사) 비용이 컸고, 정확도 손실도 발생했다.

결국 B씨 팀은 TEE(Trusted Execution Environment) 기반의 안전 실행 환경과 전송계층 보안(TLS+DLP)을 결합하는 방안을 채택했다. 결과: 초기 투자비는 HE보다 낮고 지연은 상대적으로 작음.

민감 데이터가 ‘로우(raw)’ 그대로 필요하지 않다면, 먼저 데이터 최소화(특성선택·차원축소)와 로컬 프리프로세싱으로 HE 적용 범위를 줄여 비용-성능을 빠르게 개선할 수 있다.

데이터 비교 표: 접근 방식별 성능·비용 개요

방식	암호화/보호 모델	연산 오버헤드(학습 시간)	네트워크 증가(암호문 크기)	예상 비용 증가(초기/운영)	정확도 영향
기본 FL (FedAvg)	전송 TLS, 로컬 보호	1x (baseline)	1x	1x	0% (baseline)
FL + 동형암호(HE, CKKS/BFV)	암호문 직접 연산	5-40x	4-25x	5-30x	0-8% 악화(근사 연산 시)
FL + Secure Aggregation (MPC)	다자간 암호화 합계	2-10x	2-8x	2-12x	0% (정확도 유지)
FL + TEE (SGX 등)	신뢰 실행 환경 내부 처리	1.2-3x	1-2x	1.5-6x	0% (정확도 유지)

표의 배수는 인사이트 편집팀의 합성 벤치마크(중형 모델, 배치 512, CPU/서버 GPU 혼재 환경)를 기반으로 한 추정치다. 실제 증폭률은 HE 종류(CKKS vs BFV), 파라미터(배치 크기, 폴리노미얼 차수), 그리고 라이브러리 최적화 수준에 따라 크게 달라진다.