Aug 06, 2023
튜브 아래로: 일반적인 PVC 파이프는 음성 인식 시스템을 해킹할 수 있습니다.
Kassem Fawaz 교수 연구실의 박사과정 학생인 Shimaa Ahmed는 모든 하드웨어에서 발견되는 일종의 PVC 파이프를 사용하여 자동 화자 식별 시스템을 무력화하는 방법을 결정했습니다.
Kassem Fawaz 교수 연구실의 박사과정 학생인 Shimaa Ahmed는 모든 철물점에서 찾을 수 있는 일종의 PVC 파이프를 사용하여 자동 화자 식별 시스템을 무력화하는 방법을 결정했습니다. 토드 브라운
연구원들은 데이터 도난을 막기 위해 해커들과 경쟁을 벌이고 있습니다. 표준 도구에는 다단계 인증 시스템, 지문 기술 및 망막 스캔과 같은 전략이 포함됩니다. 인기를 얻고 있는 보안 시스템 중 하나는 사람의 음성을 비밀번호로 사용하는 자동 화자 식별입니다.
이미 폰 뱅킹 및 기타 애플리케이션에 사용되고 있는 이러한 시스템은 디지털 조작을 통해 사용자의 음성을 위조하려는 공격을 제거하는 데 능숙합니다. 그러나 University of Wisconsin–Madison의 디지털 보안 엔지니어는 이러한 시스템이 새로운 아날로그 공격에 대해 완벽하지 않다는 사실을 발견했습니다. 그들은 대부분의 철물점에서 판매되는 맞춤형 PVC 파이프를 통해 말하는 것이 자동 화자 식별 시스템을 지원하는 기계 학습 알고리즘을 속일 수 있다는 사실을 발견했습니다.
Kassam Fawaz는 전기 및 컴퓨터 공학과의 조교수입니다. 사진: Althea Dotzour
박사 과정 학생인 Shimaa Ahmed와 전기 및 컴퓨터 공학 교수인 Kassem Fawaz가 이끄는 팀은 8월 9일 캘리포니아 애너하임에서 열린 Usenix 보안 심포지엄에서 연구 결과를 발표했습니다.
아날로그 보안 허점으로 인한 위험은 광범위할 수 있습니다. Ahmed는 많은 영리 기업이 이미 이 기술을 판매하고 있으며 금융 기관도 초기 고객으로 포함하고 있다고 지적합니다. 이 기술은 Apple의 Siri와 같은 AI 지원 개인 비서에도 사용됩니다.
Ahmed는 “이제 시스템은 지문만큼 안전하다고 광고하지만 그다지 정확하지는 않습니다.”라고 말합니다. “이들 모두 화자 식별 공격에 취약합니다. 우리가 개발한 공격은 매우 저렴합니다. 철물점에서 튜브를 사서 목소리를 바꾸세요.”
이 프로젝트는 팀이 자동 화자 식별 시스템의 약점을 조사하기 시작하면서 시작되었습니다. 명확하게 말하면 모델은 광고된 대로 행동했습니다. 그러나 명확하게 말하는 대신 손으로 말하거나 상자에 말을 걸면 모델이 예상대로 행동하지 않았습니다.
Ahmed는 보안 시스템을 무력화하기 위해 음성의 공명 또는 특정 주파수 진동을 변경하는 것이 가능한지 조사했습니다. 코로나19로 인해 집에 갇혀 있는 동안 작업이 시작되었기 때문에 아흐메드는 아이디어를 테스트하기 위해 종이 타월 튜브를 통해 말하기 시작했습니다. 나중에 연구실로 돌아온 후 그룹은 UW Makerspace에서 PVC 파이프를 개조하는 데 도움을 주기 위해 당시 학부생이자 현재 박사 과정 학생이었던 Yash Wani를 고용했습니다. 지역 철물점에서 구입한 다양한 직경의 파이프를 사용하여 Ahmed, Yani 및 그들의 팀은 그들이 모방하려는 목소리와 동일한 공명을 생성할 수 있을 때까지 파이프의 길이와 직경을 변경했습니다.
결국 팀은 거의 모든 음성의 공명을 변환하여 다른 음성을 모방하는 데 필요한 PVC 파이프 치수를 계산할 수 있는 알고리즘을 개발했습니다. 실제로 연구원들은 91개의 음성으로 구성된 테스트 세트에서 PVC 튜브 공격으로 보안 시스템을 60% 속이는 데 성공한 반면, 변경되지 않은 인간 흉내를 낸 사람은 시스템을 속일 수 있는 비율이 6%에 불과했습니다.
스푸핑 공격은 몇 가지 이유로 작동합니다. 첫째, 소리가 아날로그이기 때문에 음성인증 시스템의 디지털 공격 필터를 우회한다. 둘째, 튜브는 한 목소리를 다른 목소리의 정확한 복사본으로 변환하지 않고 대신 대상 목소리의 공명을 스푸핑하는데, 이는 기계 학습 알고리즘이 공격하는 목소리를 잘못 분류하게 만드는 데 충분합니다.
Fawaz는 이 프로젝트의 동기 중 하나는 단순히 보안 커뮤니티에 음성 인식이 많은 사람들이 생각하는 것만큼 안전하지 않다는 사실을 알리는 것이라고 말했습니다. 하지만 그는 많은 연구자들이 이미 이 기술의 결함을 알고 있다고 말합니다.
이 프로젝트에는 더 큰 목표도 있습니다.