Nghiên cứu và ứng dụng công nghệ chuyển văn bản tiếng Việt thành giọng nói (Text To Speech) là mục tiêu của TS. Nguyễn Thị Thu Trang, Sáng lập Công ty cổ phần Dịch vụ và Giải pháp dữ liệu VBee cùng đội ngũ cộng sự.

Công nghệ Text To Speech “bao phủ” nhiều lĩnh vực trong đời sống

Công nghệ Text To Speech (chuyển văn bản thành giọng nói) đang phát triển với tốc độ nhanh chóng và tương lai của công nghệ này rất hứa hẹn. Với những tiến bộ mới của công nghệ Neural TTS, nhân bản giọng nói (voice cloning) và các xu hướng mới nổi khác, Text To Speech ngày càng trở nên tự nhiên và dễ tiếp cận hơn bao giờ hết.

Công nghệ Text To Speech "bao phủ" nhiều lĩnh vực trong đời sống
Công nghệ Text To Speech “bao phủ” nhiều lĩnh vực trong đời sống

Khi công nghệ Text To Speech tiếp tục phát triển có thể sẽ có tác động lớn hơn đến cuộc sống của chúng ta. Công nghệ này có khả năng cách mạng hóa cách chúng ta tiêu thụ và tạo ra nội dung, đồng thời biến thế giới trở thành một nơi dễ tiếp cận và hòa nhập hơn

Hứa hẹn nhiều ứng dụng tiềm năng từ công nghệ Text To Speech của Vbee 

Nguyễn Thị Thu Trang đã có một sự nghiệp nghiên cứu, giảng dạy với Text To Speech – giải pháp chuyển văn bản tiếng Việt thành giọng nói, với mong muốn hỗ trợ người khiếm thị có thể tiếp cận thông tin tốt hơn. Nhưng, mọi việc đã không dừng lại.

“Tôi là giảng viên của Trường đại học Bách Khoa Hà Nội. Năm 2015, tôi bảo vệ luận án tiến sỹ với giải pháp chuyển văn bản tiếng Việt thành giọng nói. Dựa trên nền tảng đó, tôi phát triển một số ứng dụng cộng đồng cho người khiếm thị. Nhưng, khi triển khai các ứng dụng, chúng tôi phát hiện rằng, công nghệ này còn có thể ứng dụng rộng rãi hơn, ở nhiều lĩnh vực trong tương lai. Tôi và các đồng nghiệp đã thử nghiệm cùng ứng dụng Vadi – “trợ lý ảo” lái xe với hai tính năng được tích hợp là bản đồ giao thông và báo nói. Ứng dụng này được cập nhật trên hệ điều hành Android hoặc iOS”, TS. Trang chia sẻ.

TS. Nguyễn Thị Thu Trang, Sáng lập Công ty cổ phần Dịch vụ và Giải pháp dữ liệu VBee
TS. Nguyễn Thị Thu Trang, Sáng lập Công ty cổ phần Dịch vụ và Giải pháp dữ liệu VBee

Text To Speech là công nghệ xử lý văn bản thành giọng nói đã được nghiên cứu khoảng vài chục năm trước, đặc biệt phát triển mạnh trong 10-15 năm gần đây. Công nghệ này đã phát triển gần như hoàn thiện ở nước ngoài, đặc biệt tại các nước sử dụng tiếng Anh. Khi ứng dụng vào cuộc sống, công nghệ này mang lại lợi ích lớn cho cộng đồng người khuyết tật, như người khiếm thị, những người mất khả năng đọc, mất khả năng nói hoặc diễn đạt.

Ngoài ra, Text To Speech còn mang lại nhiều giá trị thực tiễn, ứng dụng trong hệ thống tổng đài chăm sóc khách hàng, tổng đài nhắc nợ, hay các hệ thống phát thanh trong các lĩnh vực công cộng như giao thông, y tế….

Giải pháp Vbee Text To Speech mang lại nhiều giá trị thực tiễn cho doanh nghiệp
Giải pháp Vbee Text To Speech mang lại nhiều giá trị thực tiễn cho doanh nghiệp

Nhưng tại Việt Nam, Text To Speech đang đi những bước đi đầu tiên. “VBee đã ra đời nhằm đưa công nghệ này vào đời sống của người Việt. Vadi một ứng dụng trong lĩnh vực giao thông cũng ra đời dựa trên nền tảng này”, TS. Nguyễn Thị Thu Trang nói

Cùng với Trang, Hồ Minh Đức – người có hơn chục năm kinh nghiệm kinh doanh trong lĩnh vực công nghệ và TS. Nguyễn Thanh Hùng, Trưởng Bộ môn Công nghệ phần mềm (Trường đại học Bách Khoa Hà Nội) cũng ghi tên trong danh sách sáng lập của VBee.

Ra đời từ đầu năm 2018, hiện tại đội ngũ của VBee có gần 20 người. Ngoài ra, Công ty có nhiều cộng tác viên, đa số là sinh viên ưu tú của Trường đại học Bách khoa Hà Nội cùng nghiên cứu và làm việc.

Ứng dụng thực tiễn của giọng nói nhân tạo

Chia sẻ về Vadi, TS. Nguyễn Thị Thu Trang cho biết, người dùng sẽ nhận được thông báo về tai nạn, tắc đường hoặc lũ lụt tại thời gian thực, từ đó đưa ra các gợi ý để lái xe chuyển cung đường khác.

Ngoài ra, Vadi còn phục vụ nhu cầu giải trí do được tích hợp công nghệ đọc báo. Đơn cử, người dùng có thể yêu cầu Vadi đọc một bài báo về trận bóng World Cup đêm qua, hoặc yêu cầu tìm đường tới một địa điểm nào đó bằng giọng nói, không cần thao tác bằng tay.

“Chúng tôi là nhóm đầu tiên ở Việt Nam tích hợp tính năng bản đồ giao thông và báo đọc trong một ứng dụng”, TS. Trang nói.

Sự khác biệt là điều mà đội ngũ VBee để tâm. Ví dụ, về giọng đọc, nhóm mất khá nhiều thời gian để tạo ra giọng có ngữ điệu thu hút và gần gũi nhất với người dùng, khác với ngôn ngữ máy đọc thông thường là đều đều, không tự nhiên mà Google hay Microsoft đang hỗ trợ cho tiếng Việt.

Ứng dụng hiện có gần 5.000 người dùng. Nhóm nghiên cứu đã hoàn thiện tính năng điều khiển bằng giọng nói cho Vadi, giúp thuận tiện trong sử dụng, đặc biệt khi đang lái xe. Tương lai, ngoài cung cấp bản đồ và báo nói, nhóm sẽ cung cấp thêm các dịch vụ như sách nói, truyện nói hoặc các hình thức giải trí khác cho lái xe.

Người đồng sáng lập VBee, TS. Nguyễn Thanh Hùng cũng cho hay, dư địa phát triển ứng dụng của công nghệ Text To Speech còn rất lớn, Vadi là một phần trong đó.

Ngoài ra, công nghệ này còn có thể ứng dụng trên nhiều lĩnh vực như, bộ phận chăm sóc khách hàng, tổng đài, đọc chuyện cho trẻ bằng giọng của bố mẹ hướng dẫn, bất động sản ứng dụng smart home (nhà thông minh)…

“Công ty đang hợp tác với một số đối tác để phát triển ứng dụng về tổng đài chăm sóc khách hàng và nhà thông minh. Khi bước vào nhà có thể bật tắt điện, nước bằng giọng nói, đưa ra thông báo, điều chỉnh thiết bị tivi… Tuy nhiên, chúng tôi xác định không phát triển theo số lượng mà sẽ hợp tác với những đối tượng ở các lĩnh vực khác nhau”, TS. Hùng chia sẻ.

Nói về dự dịnh phát triển trong thời gian tới, người đồng sáng lập VBee cho biết, Công ty sẽ đáp ứng nhiều cho các bên có như cầu sử dụng dịch vụ ứng dụng công nghệ chuyển văn bản bằng giọng nói. Đồng thời, VBee vẫn tiếp tục và hoàn thiện ứng dụng Vadi.

Liên hệ:

CÔNG TY CP DỊCH VỤ VÀ GIẢI PHÁP XỬ LÝ DỮ LIỆU VBEE

  • Địa chỉ: tầng 15, tòa Ngọc Khánh Plaza – Số 1 Phạm Huy Thông, Ba Đình, Hà Nội.
  • Hotline: 024.9999.3399
  • Email: Contact@vbee.vn
5 1 đánh giá
Đánh giá bài viết
Theo dõi
Thông báo của
guest

0 Góp ý
Phản hồi nội tuyến
Xem tất cả bình luận
Try for Free