“받침 많고 문장 길어지니 힘빠진다? 딥보이스 의심”

입력 2023-06-12 09:47 수정 2023-06-12 11:23

인공지능(AI)을 이용해 가족이나 지인 목소리 일부를 훔쳐 진짜인 것처럼 만들어 보이스피싱 등에 악용되는 음성합성물 ‘딥보이스(deepvocie)’를 구분할 방법이 있을까.

12일 음성분석 전문가인 충북도립대 생체신호분석연구실 조동욱(63) 교수가 진행한 진짜 음성과 딥보이스 가짜 음성 비교실험 결과를 보면 두 음성에 에너지(㏈·데시벨) 차이는 있었다.

조 교수는 피실험자의 음성 샘플 2개(단음절 문장, 길고 받침 많은 문장)를 전문업체에 보내 딥보이스를 만든 뒤 이를 음성 분석기(프라트)로 진단해 두 음성을 비교했다.

그 결과 두 음성의 음높이(㎐)는 거의 일치했다. 목소리 톤 자체는 거의 비슷해 구분이 쉬운 게 사실이라는 얘기다. 다만 음성에 실리는 에너지에서는 차이가 나타났다. 특히 받침이 많은 단어, 긴 문장에서 이 차이는 커졌다.

실험 대상자의 실제 음성은 단음절 문장일 때 에너지가 65.51㏈이었던 반면 딥보이스는 60.02㏈로 약했다. 장음절 문장에서 둘의 차이는 71.50㏈과 53.14㏈로 차이가 더 컸다.

딥보이스 목소리가 실제 음성보다 더 힘이 약했고, 이는 문장이 복잡해질수록 더 명확히 드러난다는 것으로 볼 수 있다.

조 교수는 “복잡하고 긴 문장에서는 발음의 정확도가 떨어져 음성 강도가 낮아지는 특성을 보였다”고 말했다. 그러면서 “전화기 너머로 들리는 진짜 같은 가짜 음성을 쉽게 구분하기는 힘들지만, 평소보다 힘없이 느껴지거나 일부 단어의 발음이 부정확하다고 판단되면 보이스피싱을 의심해볼 수 있다”고 덧붙였다.

조민영 기자 mymin@kmib.co.kr