pile·

정말 딥러닝은 사람처럼 세상을 인식하고 있을까?

NAVER D2·DEVIEW 2018 2018·

챕터별 상세

010:00 – 2:24

딥러닝은 사람처럼 보는가 — 적대적 예제의 위협

SAP 랩스 코리아 소속 발표자가 NIPS 워크숍의 적대적 공격·방어(adversarial attack & defense) 컴페티션 경험을 공유하며 시작한다. 핵심 문제의식은 '딥러닝이 정말 사람처럼 세상을 보고 있는가'다. 2012년 이후 이미지 분류 모델이 널리 쓰이지만, 사람 눈에는 똑같아 보이는 이미지에 아주 작은 노이즈를 더하면 모델이 전혀 다른 클래스로 오분류하는 현상이 잘 알려져 있다.

이 취약성은 극단적이어서, 이미지에서 단 하나의 픽셀만 바꿔도 오분류 성공률이 10% 가까이 나오는 연구까지 있다. 이렇게 만든 입력을 적대적 예제(adversarial example)라 하고 이를 막으려는 시도를 방어(defense) 또는 적대적 학습이라 한다. 수학적으로는 사람 인지에 영향이 없는 작은 노이즈 크기(L-infinity, L2 등 norm으로 제한)를 주되 기계의 출력은 흔드는 것이 공격의 정의다.