Tải lên câu mẫu huấn luyện
Last updated
Last updated
Bước 1: Chọn tab Câu mẫu (1).
Bước 2: Nhấn chọn Tải lên câu mẫu (2), sau đó chọn click để tải xuống file ví dụ (3) để tải xuống file mẫu nhập liệu để tải lên hệ thống.
Bước 3: Nhập vào file dữ liệu câu mẫu, ý định và thực thể tương ứng.
Lưu ý
1) Tên ý định: ask_working_hour (Phân cách các từ bằng dấu gạch ngang dưới).
2) Thực thể: thứ 7|sys.date (phân cách giữa thực thể và loại thực thể bằng dấu gạch đứng). Nếu câu có nhiều thực thể, ngăn cách nhau bằng dấu chấm phẩy.
3) Không sử dụng các ký tự đặc biệt để đặt tên ý định, thực thể (Ví dụ: (!@#$%^&*.)
4) Có thể sử dụng tiếng Anh hoặc tiếng Việt không dấu để đặt tên ý định, thực thể.
Bước 4: Sau khi nhập liệu, chọn Tải lên câu mẫu (5) sau đó nhấn Chọn file(6) tải lên câu mẫu cần huấn luyện.
Bước 5: Chọn Xử lý(7) để tải file dữ liệu huấn luyện lên hệ thống.
Trong trường hợp hệ thống đã có sẵn dữ liệu, người huấn luyện chọn Thay thế để xóa toàn bộ dữ liệu cũ và thay bằng dữ liệu được tải lên
Bước 6: Sau khi xác nhận hệ thống tiến hành xử lý file huấn luyện. Kết quả trả về gồm chi tiết câu lỗi (nếu có) và dòng dữ liệu lỗi (8) . Người huấn luyện thực hiện chỉnh sửa dữ liệu cần thiết.
Bước 1: Chọn tab Câu mẫu(1) sau đó nhấn chọn nút Tạo mới(2).
Bước 2: Tại giao diện, chọn Ý định(3) tại danh sách đã được tạo trước. (Xem thêm mục Ý định)
Bước 3: Nhập câu mẫu tương ứng với ý định đã chọn tại ô Nội dung.
Bước 4: Bôi đen từ muốn nhập loại thực thể trong câu mẫu. Lựa chọn loại thực thể tương ứng từ danh sách có sẵn trong hệ thống hoặc nhập loại thực thể mới (4). (Xem thêm mục Thực thể)
Bước 5: Chọn Lưu (5) để hoàn tất nhập câu mẫu, ý định và thực thể.
Người huấn luyện có thể thêm ý định mới tại tab Ý định như sau:
Bước 1: Chọn tab Bối cảnh (1) sau đó nhấn chọn nút Tạo mới.
Bước 2: Nhập tên ý định tại tab Ý định và thêm những mô tả cần thiết cho tên ý định (2).
Bước 3: Nhấn chọn Lưu(3) ý định mới
Tại giao diện này, người huấn luyện có thể thêm câu mẫu tương ứng với ý định như sau:
Bước 1: Tại tab Samples, nhấn chọn nút Tạo mới(1). Tại hộp thoại hiển thị, nhập nội dung câu mẫu tương ứng với ý định (2) và thực thể có trong câu mẫu (3)
Bước 2: Chọn nút Tạo mới(4) để hoàn thành bước tạo câu mẫu.
Người huấn luyện có thể thêm dữ liệu loại thực thể tại tab Thực thể như sau:
Bước 1: Tại tab Loại thực thể (1), nhấn chọn Tạo mới (2). Tại giao diện hiển thị, nhập nội dung loại thực thể, mô tả (ô Nội dung) và lựa chọn Loại thực thể tương ứng (3).
Tại ô loại thực thể, có các tùy chọn tương
Ví dụ: Xét câu mẫu “7h ngày mai chi nhánh điện biên phủ có mở cửa không”. Câu mẫu naỳ có ý định là hỏi giờ làm việc (ask_working_hour: date) với hai thông tin thực thể cùng xuất hiện trong câu cần được trích xuất gồm: thứ 7 (loại thực thể: date) và chi nhánh điện biên phủ (loại thực thể: branch_name).
Bước 2: Nhấn chọn Lưu (4) loại thực thể vừa tạo.
Bước 3: Sau khi tạo mới thực thể, người huấn luyện chọn nút “Huấn luyện” tại thanh công cụ để đào tạo kiến thức mới cho Bot.
Thực thể hệ thống là loại thực thể được xây dựng sẵn trên nền tảng EM&AI.
Thực thể hệ thống có thể giúp nhận diện được những thông tin cơ bản như: ngày (sys.date), thành phố (sys.city), số lượng (sys.amount), khoảng thời gian (sys.duration), email (sys.email)...
Khi người huấn luyện gán thông tin có trong câu nói của khách hàng với loại thực thể hệ thống tương ứng, Bot có thể nhận diện và trích xuất được những thông tin đó mà không cần huấn luyện qua nhiều câu mẫu.
Bước 1: Chọn Danh sách thực thể -> Chọn Tạo mới
Bước 2: Tại giao diện hiển thị, nhập nội dung từ khóa chính vào ô Danh sách thực thể, nhập từ viết tắt, từ đồng nghĩa,… tương ứng của từ khóa chính vào ô Từ đồng nghĩa. Chọn loại thực thể cần được nhận diện cho từ khóa từ danh sách Loại thực thể sẵn có.
Bước 3: Nhấn chọn Lưu(5) để lưu danh sách thực thể mới
Bước 1: Chọn Danh sách thực thể -> chọn Tải lên -> Chọn Nhấn để tải xuống từ khóa mẫu
Bước 2: Người huấn luyện nhập từ khóa vào file dữ liệu mẫu theo định dạng như sau.
Trong đó:
Keyword: Từ khóa chính cần hệ thống nhận diện
Synonym: Từ đồng nghĩa/Từ viết tắt/Từ mượn/… có nghĩa tương đương với từ khóa chính.
Entity Type: Loại thực thể của từ khóa đó
Bước 3: Nhấn Chọn File(4) sau đó chọn file từ khóa đã nhập liệu. Nhấn chọn Xử lý (5) để hệ thống bắt đầu tải từ khóa lên hệ thống. Kết quả trả về báo số câu lỗi/không lỗi sau khi tải lên.
Stopwords là những từ có trong từ điển tiếng Việt nhưng không ảnh hưởng đến nghĩa. Huấn luyện Stopwords giúp hệ thống nhận diện được những từ này để xử lý loại bỏ nếu xuất hiện trong câu. Chọn tab Stopwords(1), tại giao diện hiển thị sau đó nhập danh sách từ stopwords(2) cần xử lý vào ô Nội dung.
Huấn luyện Teencodes giúp hệ thống nhận diện được nghĩa của những từ viết tắt này. Để huấn luyện nhận diện Teencodes, thực hiện theo những bước sau:
Bước 1: Chọn tab Teencodes.
Bước 2: Nhập nghĩa cần nhận diện cho teencodes tại ô “Nhập giá trị” (2) và teencodes tại ô “Codes” (3). Người huấn luyện có thể thêm nhiều giá trị teencodes tương ứng, sau đó nhấn Enter.
Bước 3: Nhấn Thêm(4) để lưu Teencodes.
Normal
Composite:
Loại thực thể thông thường.
Trích xuất nhiều thông tin cùng xuất hiện trong câu.