[네트워크 및 알고리즘] 음성패킷 VoIP 기반 STT 성능 향상 시스템

 

최근 콜센터나 기업 내에서 VoIP를 활용하여 고객응대 혹은 마케팅을 실시하고 있다.

 

이에 모든 전화 통화 수신 및 발신 내역을 효율적으로 녹취하고 관리하는 중요성 또한 커지고 있다.

 

금융IT
[ 현재는 별도의 녹취 장비 설치가 필요하다 ]

다만 현재는 콜 담당자가 각 콜에 대한 내용을 수기로 작성하거나 태깅하여 데이터베이스의 저장 및 탐색이 효율적이지 못하다.

 

금융IT
[ ISP 서비스 센터에서 제공하는 CRM은 그 기능 등 한계가 존재한다.]

 

이에 따라 다양한 인터넷 전화 및 VoIP기반 환경에서도 효율적으로 설치하여

 

모든 전화에 대한 정보를 효율적으로 녹취, 관리하고 각 고객들과의 전화응대에 대한 내용을 직접 들어보지 않고도 

 

미리 짐작가능한 수준의 시스템을 개발하였다.

 

 

개발 환경  - Windows 7, Ubuntu 12.04, Visual Studio 2010, VoIP, Eclipse

사용 기술  - Packet Capture (libpcap,winpcap), SIP &RTP packet analysis, 형태소분석

                - VoIP Call Record, Audio Mixing, Speech To Text, Audio Signal Analysis

 

다른 녹취 시스템과는 다르게 해당 사업장의 자원을 이용하여 소프트웨어적인 녹취를 진행한다.

또한 기존의 CRM에서는 제공하지 않는 녹취 파일의 키워드화는 콜센터와 다양한 사업장에서 효율적인 솔루션으로 활용될 수 있다.

 

시스템 아키텍쳐는 다음과 같다.,

 

금융IT

중앙 PC 한 곳에서 각 네트워크에 연결된 VoIP들의 수발신 내역을 모두 저장하며,

 

각통화에 대한 내용을 녹취하고 이를 TTS(Text To Speak) 를 활용하여 키워드화 시켜 데이터베이스에 저장한다.

 

이에 따라 각 통화를 모두 들어보지 않고도, 통화중 이야기 했던 키워드를 통해 과거에 통화했던 사람과의 통화 내용을 검색할 수 있다.

 

금융IT
[통화를 들어보지 않고 위와 같은 키워드로 내용을 추정가능]

 

금융IT
[패킷을 분석하고 음성 녹취, 키워드화에 이용되는 스크립트 설명]

 

통화 녹취에 활용한 기능은 다음과 같다.

 

금융IT
금융IT

 

각 음성에 대한 대화 내용을 텍스트로 변경하기 위해 구간을 나누어 서버에 저장하였다.

 

 

금융IT

 

음성 데이터에서 텍스트를 변환하여 키워드를 뽑느 그 과정에 대한 시스템 흐름은 다음과 같다.

 

금융IT

 

이외에도 정리한 자료가 너무 많지만 너무 길어질 것 같아서 여기서 마무리 하도록 하겠다.

+ Recent posts