SSML là ngôn ngữ đánh dấu cho phép người dùng chỉ định cách chuyển văn bản đầu vào thành giọng nói tổng hợp bằng cách sử dụng công nghệ Text-To-Speech (TTS). SSML cho phép người dùng tinh chỉnh khoảng ngắt nghỉ giữa các câu nói, cách phát âm, tốc độ nói và hơn thế nữa.
EM&AI Text-To-Speech cung cấp đa dạng tùy chọn SSML như: thời gian (ngày, giờ, tháng), đơn vị đo, số la mã, từ tiếng Anh,...
Những phần sau sẽ trình bày chi tiết cách sử dụng các loại thẻ SSML và khi nào các loại thẻ là bắt buộc hoặc tùy chọn.
Mẫu | Example
Tab Example cho thấy cách các thẻ SSML được sử dụng để chỉ định cách chuyển văn bản đầu vào thành giọng nói tổng hợp.
Dưới đây là ví dụ về 1 đoạn SSML
<audio>https://www2.cs.uic.edu/~i101/SoundFiles/CantinaBand3.wav</audio> tôi sẽ gặp <english>messi</english> vào ngày <date>15/2/2020</date> . <break>3</break> chào mừng bạn đến với tổng đài tự động.
Ngắt nghỉ | <break>
Sử dụng thẻ <break> để thêm khoảng nghỉ, tạm dừng giữa các từ hoặc giữa các câu. Ví dụ thêm khoảng ngừng giữa các câu ngăn cách bởi dấu chấm hoặc dấu phẩy.
Cấu trúc
<break> số giây </break>
Ví dụ dưới đây cho thấy cách sử dụng thẻ <break> để thêm khoảng nghỉ giữa các câu, từ.
Đây là tài liệu hướng dẫn. <break>1</break> Hãy đọc kỹ trước khi sử dụng
Văn bản được nói dưới dạng một chuỗi các chữ số riêng lẻ. Ví dụ như cách đọc của số điện thoại 0905112113 (không chín không năm một một hai một một ba)
Cấu trúc
Ví dụ:
Hệ thống trả về kết quả giọng nói là "một hai ba bốn năm"