Hướng dẫn cấu hình lệnh điều khiển bằng giọng nói cho mạch Offline Voice Recognition VC-02 Kit Ai-Thinker

GIỚI THIỆU VỀ BOARD

Mạch nhận dạng giọng nói Offline Voice Recognition VC-02 Kit Ai-thinker sử dụng IC chính là US516P6 từ hãng Unisound tích hợp các thuật toán nhận dạng giọng nói cải tiến và kiến trúc chip 32-bit RISC mới nhất hiện nay giúp cung cấp giải pháp nhận dạng giọng nói offline (không cần kết nối mạng) với chi phí cực thấp, VC-02 hỗ trợ nhận dạng 150 lệnh điều khiển bằng Tiếng Anh (English) hoặc Tiếng Trung (Chinese) với phần mềm Tranning tại trang chủ của Ai-Thinker, thích hợp với các ứng dụng: nhà thông minh, điều khiển thiết bị qua âm thanh,…

Trong bài viết này mình sẽ hướng dẫn các bạn cấu hình các lệnh điều khiển bằng giọng nói cho mạch VC-02 bằng Tiếng Anh (English) và nạp chương trình (firmware) vào mạch.

CÁC BƯỚC TIẾN HÀNH

Chuẩn bị phần cứng:

Cài đặt phần mềm để nạp chương trình (firmware) vào mạch

Các bạn vào Website của Ai-Thinker tại đây và tải về file UART burning tool:

Sau khi tải về và giải nén các bạn sẽ thấy tập tin chạy chương trình tên là UniOneUpdateTool.exe, các bạn chạy tập tin này để kích hoạt chương trình nạp firmware cho mạch VC-02:

Chương trình nạp firmware cho mạch VC-02 có giao diện và các chức năng như dưới đây:

Tạo tài khoản tại Ai-Thinker và khởi tạo dự án

Truy cập vào trang: http://voice.ai-thinker.com/#/login, nhấn register now để tạo tài khoản theo hướng dẫn, bạn cũng có thể sử dụng tài khoản có sẵn của MakerLab để đăng nhập (lưu ý không thay đổi Password):

  • contact@makerlab.vn
  • MakerLab123

Sau khi đã tạo tài khoản bạn vào trang chủ: http://voice.ai-thinker.com/#/ chọn ngôn ngữ là Tiếng Anh (English), sau đó chọn product management > Create Product:

Các bạn chọn một Product Category bất kỳ:

Ở mục Scene các bạn chọn Offline:

Ở mục Module các bạn chọn VC-02:

Sau đó các bạn đặt tên cho dự án của mình và trong phần Select Language chọn English (Tiếng Anh), sau đó nhấn Save:

Cấu hình các lệnh điều khiển Voice SDK cho VC-02

front-end signal processing

Mục này bao gồm các cấu hình thiết lập việc xử lý âm thanh đầu vào:

  • Microphone configuration: Mặc định là single MIC vì module VC-02 chỉ tích hợp 1 Microphone.
  • distance recognition: Chọn khoảng cách nhận dạng âm thanh ở xa (Far field) hoặc gần (Near field).
  • AEC echo cancellation: Sau khi được bật, có thể lọc nhiễu âm thanh do chính module VC-02 phát ra.
  • Steady-state noise reduction: Sau khi được bật, có thể giảm nhiễu của tiếng ồn môi trường.

***Lưu ý: Không thể bật đồng thời hai chức năng AEC echo cancellation Steady-state noise reduction.

Pin configuration

Mục này cấu hình các chân điều khiển trên mạch VC-02 có thể tương tác với các lệnh điều khiển, lưu ý các chân có lưu ý màu đỏ không nên sử dụng và để ở mặc định vì có thể sẽ làm mất chức năng nạp firmware hoặc lỗi mạch:

Xin lưu ý thêm các chân có chức năng dưới đây cần được thiết lập đúng hoặc đã được sử dụng cho các chức năng tích hợp sẵn trên mạch, lưu ý đặc biệt chân GPIO_A28 cần được để ở mức thấp (low level):

Wake-up word customization

Update quan trọng!!!: Sau khi test thêm về mạch thì mình thấy các lệnh nhận dạng không nên đi kèm các ký tự dấu như: “,”/ “.” / “;” sẽ làm lệnh nhận dạng kém chính xác.

Tùy chỉnh các từ đánh thức và phản hồi:

Customize offline command words and response words

Update quan trọng!!!: Sau khi test thêm về mạch thì mình thấy các lệnh nhận dạng không nên đi kèm các ký tự dấu như: “,”/ “.” / “;” sẽ làm lệnh nhận dạng kém chính xác.

Mục basic information tuỳ chỉnh các lệnh điều khiển và phản hồi như mình tạo 2 lệnh là Turn the light onTurn the light off như hình:

Mục control details tuỳ chỉnh tương tác giữa các lệnh điều khiển và các chân điều khiển GPIO có trên mạch VC-02, ví dụ mình có thể cấu hình cho chân GPIO_A26 bật (high level) với lệnh Turn the light on và tắt (low level) với lệnh Turn the light off như hình:

Phần phía dưới giúp bạn cấu hình các lệnh được gọi mà không cần phải gọi các lệnh đánh thức, hỗ trợ tối đa 10 lệnh:

Speaker configuration

Mục này giúp bạn tuỳ chỉnh giọng nói phản hồi từ mạch VC-02 ra loa (speaker):

other configuration

Mục này giúp bạn tuỳ chỉnh giọng nói phát ra lúc khởi động (boot broadcast), thời gian chờ lệnh mới (timeout time) và giọng nói kết thúc khi hết thời gian chờ lệnh mới (quit).

Finish – Build the Voice SDK

Sau khi các cấu hình phía trên hoàn tất bạn nhần vào nút make a new version để tiến hành xử lý Voice SDK để tạo ra firmware dùng để nạp chương trình như sau:

Nhấn vào nút build SDK để bắt đầu quá trình xử lý tạo ra firmware:

Sẽ mất một chút thời gian chờ để xử lý SDK:

Sau khi đã tạo xong Voice SDK bạn nhấn vào nút download firmware để tải firmware nạp vào mạch VC-02:

Nạp chương trình (firmware) vào mạch VC-02

Giải nén firmware vừa tải về theo các bước sau để có được tập tin uni_app_release_update.bin:

 

Mở chương trình nạp firmware UniOneUpdateTool.exe, chọn firmware cần nạp là uni_app_release_update.bin như hình:

Kết nối mạch VC-02 với máy tính và nhấn nút như hình để phần mềm sẽ quét và tự động nhận cổng COM của mạch, các cổng COM đã sẵn sàng sẽ hiển thị màu vàng:

Sau khi nhận COM thành công thì nhấn reset trên mạch VC-02 để nạp chương trình:

Sau khi nạp chương trình thành công khi hiển thị màu xanh như trong hình:

***Lưu ý: Trong quá trình đang nạp chương trình không được tác động vào mạch cho đến khi quá trình nạp hoàn tất, nếu quá trình nạp bị ngắt quãng có thể làm lỗi và hư mạch.

Video Demo

Tìm kiếm

Các kênh truyền thông

Dịch vụ

Các chuyên mục

Bài viết liên quan

1 Comment

0 0 votes
Article Rating
Subscribe
Notify of
guest

1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Athokorala
Athokorala
1 year ago

How can I light on and off LED bulb with using those commands. How I can connect the LED bulbs to which pins. Please explain me. It’s a grate help