Khởi tạo Knowledge base

Cơ sở tri thức (Knowledge base) là nơi tập hợp tất cả dữ liệu được phân loại dưới dạng chủ đề và các bài viết (dạng văn bản). Hệ thống sẽ sử dụng các dữ liệu được nhập vào tại đây để huấn luyện cho Bot.

Chọn Bot muốn thiết lập -> Tại thanh menu trái -> bấm vào trang Xây dựng kịch bản -> chọn Cơ sở tri thức.

Sau khi chọn -> hệ thống sẽ chuyển tiếp đến trang Cơ sở tri thức. Tại đây, người dùng tiến hành tạo chủ đề cho dữ liệu và nhập vào các nội dung chi tiết hoặc tải lên các tệp dữ liệu (pdf, doc, txt) để huấn luyện.

Tại cơ sở tri thức, bấm vào nút TẢI LÊN → sẽ hiển thị cửa sổ Tải lên dữ liệu huấn luyện.

  • Tên chủ đề: nhập tên chủ đề (thư mục) chứa các dữ liệu huấn luyện liên quan. Việc tổ chức dữ liệu theo từng chủ đề sẽ giúp việc quản lý và truy xuất dữ liệu được thuận tiện và hiệu quả hơn. VD: chủ đề FAQ sẽ chứa các dữ liệu liên quan tới FAQ

  • Tải lên: bấm CHỌN FILE và chọn tệp dữ liệu muốn tải lên. Lưu ý: tệp phải có định dạng pdf, docx, txt (dưới 5MB).

Sau khi bấm nút TẢI LÊN, hệ thống sẽ tiến hành tạo chủ đề và tải lên dữ liệu từ tệp đã chọn. Nếu tệp tải lên có chứa nhiều hơn 1400 tokens (khoảng 1000 chữ), hệ thống sẽ tự động cắt tệp thành nhiều dữ liệu chi tiết, mỗi dữ liệu chứa tối đa 1400 tokens (khoảng 1000 chữ). Sau khi xử lý xong hệ thống sẽ hiển thị danh sách các dữ liệu đã tải lên như ảnh bên dưới.

Để đảm bảo dữ liệu tải lên hoàn toàn chính xác với mong muốn, người dùng có thể bấm vào từng dữ liệu chi tiết để kiểm tra và chỉnh sửa lại nội dung, sau đó bấm vào nút Lưu để tiến hành huấn luyện lại dữ liệu. Lưu ý: Dữ liệu tải lên sau khi bị cắt có thể sẽ không còn đúng về mặt ngữ nghĩa, vì vậy người dùng nên kiểm tra và điều chỉnh lại để đảm bảo nội dung có đủ thông tin & rõ nghĩa.

Dữ liệu sau khi được huấn luyện sẽ được thêm vào hệ thống Cơ sở tri thức và được sử dụng như bộ tài liệu tham chiếu. Dựa vào đó, Bot truy xuất thông tin để đưa ra các câu phản hồi, tùy thuộc vào kịch bản đã được thiết lập.

Tìm hiểu thêm:

Last updated