Hầu hết các hệ thống Contact Center hiện nay đều lưu tệp ghi âm cuộc gọi ở định dạng đơn âm (mono). Các bản ghi âm đơn kênh này khó phân biệt được ai đang nói gì, đặc biệt khi khách hàng và tư vấn viên đang nói chuyện đồng thời. Điều này gây ra thách thức cho các giải pháp về phân tích giọng nói hay nhận diện người nói.
Theo đó, công nghệ tách kênh giọng nói (Speaker Diarization) ra đời đã giải quyết được vấn đề khó khăn này. Đây cũng là một trong những công nghệ cốt lõi của giải pháp đánh giá chất lượng tổng đài tự động – EM&AI Virtual QC.
Contents
Vai trò tách kênh giọng nói trong kiểm soát chất lượng tổng đài tự động
Khi đánh giá chất lượng tổng đài, hầu hết doanh nghiệp thường quan tâm đến các yếu tố như tốc độ nói, thái độ cảm xúc hay từ ngữ phù hợp,… của tư vấn viên. Để đánh giá tự động các tiêu chí này, cần đảm bảo việc tách biệt giọng nói của nhân viên và khách hàng để kết quả đánh giá không bị nhầm lẫn. Trong khi giải pháp ghi âm đơn kênh (mono) không đáp ứng được điều này, thì công nghệ tách kênh giọng nói (Speaker Diarization) trở thành điều kiện tiên quyết của các hệ thống đánh giá tổng đài tự động.
Tách kênh giọng nói là gì?
Tách kênh giọng nói là quá trình phân chia một đoạn âm thanh đầu vào thành các phân đoạn đồng nhất dựa trên việc định danh giọng nói của ai. Theo nhận định của các chuyên gia về Machine Learning, tách kênh giọng nói là một trong những bài toán khó. Giải pháp này sử dụng cả kỹ thuật học máy có giám sát và không giám sát. Ngoài ra, nó dựa trên sự kết hợp của cả mô hình học sâu và mô hình phân cụm Agglomerative thông thường.
Công nghệ tách kênh giọng nói đột phá của EM&AI Virtual QC
EM&AI là đơn vị tiên phong công nghệ Voice AI mới như tách kênh giọng nói (Speaker Diarization). Và hệ thống tự động đánh giá chất lượng tổng đài EM&AI Virtual QC là một trong những giải pháp ứng dụng công nghệ này. Khi được triển khai, EM&AI Virtual QC đã giúp tiết kiệm được hơn 80% thời gian kiểm soát chất lượng dịch vụ đồng thời gia tăng giá trị cho doanh nghiệp.
Công nghệ tách kênh giọng nói mạnh mẽ của EM&AI có thể phân tách và định danh giọng nói kể cả với tệp âm thanh kém chất lượng.Thời gian xử lý nhanh chóng, đoạn âm thanh dài 5 phút có thể được xử lý chỉ trong 2 giây. Nó giúp thúc đẩy tính hiệu quả của hệ thống tự động đánh giá chất lượng tổng đài EM&AI Virtual QC. Dựa trên khả năng định danh giọng nói của tư vấn viên, doanh nghiệp có thể xác định rõ ràng liệu nhân viên đó có thái độ thô lỗ với khách hàng, sử dụng từ ngữ không phù hợp hay tốc độ nói quá nhanh hay không. Đồng thời, cuộc gọi sau khi được xử lý tách kênh sẽ lưu trữ trên hệ thống, doanh nghiệp có thể tùy chọn tải về tệp âm thanh chỉ có giọng nói của khách hàng hoặc nhân viên mà không cần đầu tư vào cơ sở hạ tầng chuyên biệt để chuyển đổi hoặc phân tích tệp.
Bên cạnh đó, thông qua việc ứng dụng kết hợp công nghệ tách kênh giọng nói và chuyển đổi giọng nói thành văn bản (speech to text), hệ thống tự động đánh giá chất lượng tổng đài EM&AI Virtual QC còn mang đến tính năng diễn dịch nội dung cuộc gọi giữa khách hàng và tổng đài viên cho thấy ai nói nội dung gì, trong thời điểm nào và chỉ số cảm xúc tương ứng. Điều này hỗ trợ tốt hơn cho việc đánh giá các tiêu chí như mức độ hài lòng của khách hàng, kịch bản chăm sóc có được thực hiện đúng hay không,…
Có thể nói, tách kênh giọng nói là một trong những công nghệ cốt lõi không chỉ giúp đánh giá năng lực nhân viên mà còn đánh giá được mức độ hài lòng khách hàng. Theo đó, kết quả chất lượng tổng đài sẽ chính xác hơn và có tính khách quan khi kết hợp cả hai yếu tố chất lượng phục vụ của nhân viên và mức độ hài lòng của khách hàng.
Để có những trải nghiệm thực tế về công nghệ đánh giá tổng đài mới và cách thức triển khai phù hợp, vui lòng để lại liên hệ tại link này để được hỗ trợ trực tiếp.
Xem thêm cách giải pháp đánh giá tổng đài tự động giúp doanh nghiệp giảm tỉ lệ nghỉ việc & tiết kiệm chi phí