애플 '스피치애널라이저', 오픈AI 위스퍼보다 음성 텍스트 변환 속도 빨라

 

스피치 애널라이저 (출처 : Apple developer)

 애플이 WWDC25에서 공개한 새로운 음성 텍스트 변환 API '스피치애널라이저(SpeechAnalyzer)'가 음성 텍스트 변환 속도에서 오픈AI의 음성인식모델인 '위스퍼(Whisper)'를 압도하는 것으로 나타났다.

지난 19일(현지시간) 온라인 매체 기가진에 따르면, 애플 전문 매체 맥스토리즈 편집자인 피엔 보히어스는 스피치애널라이저를 테스트한 결과, 위스퍼보다 55% 빠른 처리 속도를 기록했다고 밝혔다.

보히어스에 따르면 34분 분량의 4K 영상 파일을 변환한 결과, 스피치애널라이저는 45초 만에 작업을 완료했다. 같은 파일을 위스퍼 Large-v3 모델로 변환했을 때 1분 41초가 걸렸고, 맥위스퍼 Large-v2 모델은 3분 55초가 소요됐다. 이는 스피치애널라이즈가 위스퍼보다 55% 빠른 속도를 기록한 것으로, 변환된 텍스트의 품질에서도 큰 차이가 없는 것으로 나타났다.

보히어스는 "스피치애널라이저가 단순히 빠른 것뿐 아니라, 대용량 파일을 처리할 때 성능 차이가 더욱 극명해진다"며, "자막 제작이나 강의 기록 작업에서 시간 절감 효과가 클 것"이라고 평가했다.

스피치애널라이저는 현재 개발자 베타 버전으로 제공되며, 정식 출시 시점에 더욱 정교한 성능을 발휘할 것으로 기대된다.

다음 이전

POST ADS1

POST ADS 2