智能语音设备|ESP32-S3-BOX智能语音设备开发应用,支持打断唤醒和连续识别功能

依托离线语音助手SDK ESP-Skainet,ESP32-S3-BOX现已支持打断唤醒和连续识别功能,让语音交互更自然流畅,带来更人性化的对话体验。

本文将详细为您演示ESP32-S3-BOX的强大功能。打断唤醒:用户可以在设备播放音乐或播报语音的同时,随时再次唤醒设备;连续识别:用户可以在唤醒一次设备后,与其连续对话。
智能语音设备|ESP32-S3-BOX智能语音设备开发应用,支持打断唤醒和连续识别功能
文章插图

ESP32-S3-BOX AI语音开发套件是一个智能语音设备开发平台,依托于声学前端 (AFE) 算法、ESP-Skainet 离线语音助手 SDK 和 Alexa for IoT SDK,为用户提供了出色的离线和在线语音功能。

ESP32-S3-BOX既可以用于构建智能音箱,也可以赋能更多物联网设备实现人机语音交互。

同时,它还集触摸屏控制、传感器、红外控制器和智能网关等多功能于一体,能够作为全屋设备的控制中枢,支持用户通过语音命令或触屏控制,轻松实现全屋智能联动。
智能语音设备|ESP32-S3-BOX智能语音设备开发应用,支持打断唤醒和连续识别功能
文章插图

我们将ESP32-S3-BOX与AI图像处理、Wi-Fi智能网关、Wi-Fi 人体检测、Wi-Fi 无线图传等技术方案相结合,对办公室进行了升级改造,构建了一个以前台和会议室为主体的智能场景。

ESP32-S3-BOX搭载ESP32-S3 AI SoC,在芯片内置的512 KB SRAM之外,还集成了16MB QSPI flash和8MB Octal PSRAM。

它板载一块配备电容触摸面板的2.4寸显示屏(分辨率 320 x 240),双麦克风,一个扬声器和两个用于硬件拓展的 Pmod 兼容接口;采用Type-C USB连接器,提供5V电源输入和串口/JTAG调试接口。
智能语音设备|ESP32-S3-BOX智能语音设备开发应用,支持打断唤醒和连续识别功能
文章插图

ESP32-S3-BOX能够运行通过Software Audio Front-End Solution认证的声学前端算法、ESP-Skainet 离线语音助手SDK、Alexa for IoT SDK。

基于LVGL的HMI解决方案,以及ESP-DL深度学习开发库和ESP-ADF等多种SDK;也能够通过一站式AIoT云平台ESP RainMaker?,实现APP控制设备状态、自由配置GPIO管脚、自定义离线语音命令和OTA升级等功能。

值得一提的是,经过更新的离线语音助手SDK ESP-Skainet实现了打断唤醒和连续识别功能,支持在设备播放音乐或播报语音的同时,随时再次唤醒设备;也支持在唤醒一次设备后,与其连续对话。

此外,ESP-Skainet还在保证优异唤醒率的同时,降低了误唤醒率,提升了语音识别性能。
智能语音设备|ESP32-S3-BOX智能语音设备开发应用,支持打断唤醒和连续识别功能
文章插图

为满足客户多样的功能和成本需求,ESP32-S3-BOX-Lite轻量级开发套件,简化了部分设计。它与ESP32-S3-BOX拥有类似的离、在线语音功能,取消了电容触摸面板和Mute按键,增加了3个由客户自定义的功能按键。

如果您只需要评估AI语音功能,也可以直接使用ESP32-S3-BOX-Lite裸板构建方案。

【 智能语音设备|ESP32-S3-BOX智能语音设备开发应用,支持打断唤醒和连续识别功能】通过ESP32-S3-BOX丰富的软硬件功能,有效简化客户的产品开发流程。我们提供了完善的 SDK和丰富的例程,不仅支持用户在已有示例的基础上进行开发,快速实现项原型;也方便用户基于 SDK 构建的AIoT语音产品。