Hôm bữa, trong lúc tắm tôi chợt nghĩ, có cách nào ra lệnh cho máy mở tự động chỉ bằng giọng nói mà thuần Việt không? Chuyện này có thể không mới mẻ gì, ngược lại đã và đang là chủ đề vô số người làm rồi. Nhưng ý tưởng của tôi không thiên về hướng Deep Learning hay Machine Learning hay gì cao siêu cả. Chỉ đơn giản là ứng dụng lắng nghe giọng nói và làm theo yêu cầu của người sử dụng.

Cụ thể, thử hình dung một chuyện đơn giản thôi: so sánh mức tần số của một luồng âm thanh đầu vào với tất cả database âm thanh mà ta có. Nếu mức độ trùng khớp của tần số rõ và trong nhất lên tới 90% thì confirm là trùng nhau. Và trước đó, ta đã lập trình sẵn, với luồng voice mẫu này thì làm gì, voice mẫu kia thì làm gì,…

Nếu ghi nhận được từ micro là yêu cầu mở chrome thì khi so sánh thành công và thấy khớp, thì ứng dụng sẽ dùng các hàm hệ thống để gọi tới “chrome.exe”.

Chỉ vậy thôi.

Câu hỏi đặt ra, làm sao so sánh mà biết là hai luồng âm thanh đó giống nhau? Câu trả lời: vốn dĩ tôi đâu có ý định phát triển sản phẩm rộng rãi public, mà chỉ sử dụng cá nhân thôi. Vậy thì, voice trong database của chương trình cũng là tự tôi thu trước đó rồi!

Một ý tưởng cực kỳ ích kỷ nhỉ 🙂