Hội nghị thường niên của Hiệp hội ISCA lần thứ 22 (Interspeech 2021) chuẩn bị được tổ chức tại Brno, Czechia. Đây là một trong những hội nghị có quy mô lớn nhất thế giới về nghiên cứu và phát triển các giải pháp xử lý ngôn ngữ nói, thu hút tới hàng nghìn chuyên gia trong các lĩnh vực có liên quan tới trình bày, phát biểu và hợp tác. Sự kiện cũng sẽ được phát sóng trên nhiều quốc gia trên toàn cầu từ ngày 30/08/2021 đến 03/09/2021.

Vbee tự hào được lựa chọn tham gia trình bày tại INTERSPEECH – Hội nghị lớn nhất thế giới về khoa học và công nghệ xử lí ngôn ngữ nói. 

Với chủ đề: Prosodic boundary Prediction Model for Vietnamese Text To Speech (Mô hình ngắt nghỉ trong tổng hợp tiếng nói Tiếng Việt).

Vbee tham dự INTERSPEECH 2021
  • Yếu tố ngắt nghỉ ảnh hưởng rất lớn tới chất lượng và độ tự nhiên của giọng nói tổng hợp, tuy nhiên có rất ít các nghiên cứu về vấn đề tương tự cho ngôn ngữ tiếng Việt. Tập trung nghiên cứu và xây dựng mô hình dự đoán ngắt nghỉ cho các hệ thống tổng hợp tiếng nói tiếng Việt dựa trên DNN và End-to-end. Hệ thống này có thể dự đoán được thời gian ngắt nghỉ dựa trên ngữ cảnh của văn bản đầu vào, nhiệm vụ của mô hình dự đoán ngắt nghỉ là chỉ ra các vị trí ngắt nghỉ phù hợp trong văn bản. 
  • Bài nghiên cứu đã tích hợp và triển khai mô hình ngắt nghỉ vào cả ba loại hệ thống tổng hợp tiếng nói: HMM, DNN, và End-To-End. Kết quả thí nghiệm cảm thụ cho thấy độ tự nhiên của giọng nói có sử dụng mô hình ngắt nghỉ tăng từ 6 tới 10% so với giọng nói không sử dụng mô hình ngắt nghỉ. 
    • Trong tương lai, nghiên cứu này có thể được phân tích mở rộng sang nhiều các giọng tiếng Việt khác, đa dạng về giới tính lẫn vùng miền.Với mục tiêu mở rộng nghiên cứu này sang các ngôn ngữ khác để phân tích sự tương đồng, định nghĩa ra những định dạng chung cho nhiều ngôn ngữ, hướng tới xây dựng một mô hình phân đoạn tiếng nói đa ngôn ngữ.

Tác giả: Nguyễn Thị Thu Trang, Nguyễn Hoàng Kỳ, Albert Rilliard and Christophe D’Alesandro.

Nguynthithutrang 1 1
Theo https://soict.hust.edu.vn/can-bo/ts-nguyen-thi-thu-trang.html

 

GIỚI THIỆU ĐẠI DIỆN NHÓM TÁC GIẢ.

TS. NGUYỄN THỊ THU TRANG Giảng viên ngành Khoa học Máy tính tại Viện Công nghệ thông tin và truyền thông, trường Đại học Bách khoa Hà Nội.

Bà là tác giả và trưởng nhóm nghiên cứu Vbee (https://vbee.vn) với nhiều ứng dụng trong thực tiễn như ra lệnh bằng giọng nói trong nhà thông minh (loa Milo của Lumi), tổng đài thông minh (NTT Network, các ngân hàng như Vietcombank…), số hoá bài giảng (trường Đại học Công nghệ, Đại học Quốc gia Hà Nội). Vbee được vinh dự giải cao nhất Nhân tài đất Việt 2018 lĩnh vực Công nghệ thông tin và truyền thông với giải pháp chuyển văn bản thành giọng nói tự nhiên tiếng Việt.

 

Các sản phẩm dịch vụ của VBee được xây dựng và phát triển trên nền tảng công nghệ chuyển văn bản thành tiếng nói tự nhiên tiếng Việt ứng dụng trí tuệ nhân tạo AI. Với sứ mệnh trở thành công ty cung cấp giải pháp, dịch vụ số hoáxử lý dữ liệu tiếng Việt tiên phong tại Việt Nam. Chúng tôi luôn chú trọng vào việc tập trung phát triển & sáng tạo công nghệ lõi số hoá dữ liệu và text to speech (TTS). Cung cấp các giải pháp tốt nhất cho doanh nghiệp và cộng đồng trong lĩnh vực xử lý dữ liệu số hoá tại Việt Nam.

Truy cập Vbee.vn để trải nghiệm ngay !!

0 0 đánh giá
Đánh giá bài viết
Theo dõi
Thông báo của
guest

0 Góp ý
Phản hồi nội tuyến
Xem tất cả bình luận
Try for Free