希望添加命令词模型或例子教程 #39

fettliu · 2021-12-29T08:14:33Z

现在几乎所有语音库感觉都是语音训练库，不好直接使用，名不副实。
希望分个库专门提供特定语音识别功能（功能，而不是学术倾向的训练器）。提供VAD函数及分析函数，参数是音频，返回是否含有语音，及音频识别结果。
库的功能可以是：语音转命令/词组、语音转音素、语音转句子。

我现在最需要的是语音转音素，用在单片机，训练出来的库越小越好，不能超过1M尺寸。识别库需要支持c/c++。
作为参考，上海乐鑫ESP32这MCU只有4M存储500KB不到的内存，但是官方的语音识别可以做到语音转音素，但不开源。

Z-yq · 2022-01-05T07:14:40Z

你这更倾向于微片的定制开发了

微片的东西需要定制的点比较多，不同的微片可能整个代码结构都不同了，还需配合硬件（如果有硬件部门的话）进行C model验证工程，所以少有基于微片的开源项目：）

fettliu · 2022-01-05T08:45:50Z

其实只需要提供一个尽可能小的TF Lite预训练模型，现在几乎所有单片机都支持C/C++语言，移植一个TFLite是小事。
我这种应用开发者，对训练不是很感兴趣，几乎对库的理解应该是立刻使用，不搞学术。
若库主有时间，请向这个方向走一步，方便一下我们使用。有小型模型，不至于单片机，我还想用到HTML5的Web上，做到WASM里，为Web提供强力语音命令识别能力。
请做语音库的强力推动者。

Z-yq · 2022-01-09T13:51:06Z

后续慢慢完善吧

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

希望添加命令词模型或例子教程 #39

希望添加命令词模型或例子教程 #39

fettliu commented Dec 29, 2021

Z-yq commented Jan 5, 2022

fettliu commented Jan 5, 2022

Z-yq commented Jan 9, 2022

希望添加命令词模型或例子教程 #39

希望添加命令词模型或例子教程 #39

Comments

fettliu commented Dec 29, 2021

Z-yq commented Jan 5, 2022

fettliu commented Jan 5, 2022

Z-yq commented Jan 9, 2022