ESP32-LyraTD-MSC 开发板能访问自建的ASR/TTS服务吗?
Posted: Thu Apr 21, 2022 6:08 am
ESP32-LyraTD-MSC 支持的SDK有三种(ESP-ADF、ESP-VA-SDK、ESP-Skainet),能不能基于其中一种来实现唤醒、拾音,再将 wav 文件通过websocket 或者 grpc 上传至自建的服务器,实现云端的语音识别,然后将语音合成下发到开发板进行音频播放?
这些都是可以的,应该没有问题, 可以参考 dueros 例程。 https://github.com/espressif/esp-adf/tr ... les/dueros
square123 wrote: ↑Wed Jun 01, 2022 1:10 am根据你说的,参考 dueros 例子,我需要修改哪些 .c 和 .h 文件才能实现访问自建的 ASR 和 TTS 服务呢?另外,READMR_CN 中的日志,比如 "I (5709,tid:3ffddebc) lightduer_engine.c( 242):duer_engine_start, g_handler:3F82005C, length:1469, profile:3F823170" 中的 " lightduer_engine.c " 文件就没有找到,搜索了整个 ADF 和 IDF 目录也没有发现,请问这类文件在哪里?
这些接口是 百度的那边的, 如果你要访问你的 自建 的语音识别服务, 需要打通这两者.I (5709,tid:3ffddebc) lightduer_engine.c
( 242):duer_engine_start, g_handler:3F82005C, length:1469, profile:3F823170" 中的 " lightduer_engine.c "