제품소개
디지털 정보통신 문화를 선도하는

DIGITAL COMMUNICATION

STT(Speech-to-Text)

STT 구축솔루션(Speech-to-Text)

음성인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자데이터로 전환하는 처리를 말하며 STT(Speech-to-Text)라고도 합니다. 음성인식 엔진은 음성 인터페이스를 기반으로 하는 다양한 서비스에 활용하기 위해 음성인식 서비스를 제공하는 시스템입니다. 특히 AI Suite의 음성인식 엔진은 방대한 데이터를 사전 학습하였으며, 특정 도메인에 빠르게 적용하기 위한 전이학습 방식을 활용하여 적은 양의 데이터 학습만으로도 양질의 음성인식 서비스 제공이 가능합니다.
시스템 특징

– 챗봇의 시스넴 연계를 통해 무인콜센터 운영

– 대쉬 보드 지원

– 로그통계 모니터링 지원

– 모니터링 지원

– 인식결과 검색 지원

– 호분리로 송수화자간의 분리 기능 제공

– 음성 플레이어 지원

– 환경 설정 기능

– 사용자 계정 관리 지원

화자분리 주요기능(VITO)
주요내용

음성인식 엔진은 딥러닝(Deep Learning)에 의해 고도화된 음향모델 적응 학습을 기반으로 합니다. 일반적으로 사용되는 음성인식 알고리즘인 HMM(Hidden Markov Model) 또는, 기존 Fully connected DNN(Deep Neural Network) 기반 음향모델보다 개선된 음성인식 성능을 보이는 LSTM(Long Short-Term Memory)기술을 적용한 baseline 음향모델을 기반으로 적응 학습 환경을 제공합니다.