We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
现在几乎所有语音库感觉都是语音训练库,不好直接使用,名不副实。 希望分个库专门提供特定语音识别功能(功能,而不是学术倾向的训练器)。提供VAD函数及分析函数,参数是音频,返回是否含有语音,及音频识别结果。 库的功能可以是:语音转命令/词组、语音转音素、语音转句子。
我现在最需要的是语音转音素,用在单片机,训练出来的库越小越好,不能超过1M尺寸。识别库需要支持c/c++。 作为参考,上海乐鑫ESP32这MCU只有4M存储500KB不到的内存,但是官方的语音识别可以做到语音转音素,但不开源。
The text was updated successfully, but these errors were encountered:
你这更倾向于微片的定制开发了
微片的东西需要定制的点比较多,不同的微片可能整个代码结构都不同了,还需配合硬件(如果有硬件部门的话)进行C model验证工程,所以少有基于微片的开源项目 :)
Sorry, something went wrong.
其实只需要提供一个尽可能小的TF Lite预训练模型,现在几乎所有单片机都支持C/C++语言,移植一个TFLite是小事。 我这种应用开发者,对训练不是很感兴趣,几乎对库的理解应该是立刻使用,不搞学术。 若库主有时间,请向这个方向走一步,方便一下我们使用。有小型模型,不至于单片机,我还想用到HTML5的Web上,做到WASM里,为Web提供强力语音命令识别能力。 请做语音库的强力推动者。
后续慢慢完善吧
No branches or pull requests
现在几乎所有语音库感觉都是语音训练库,不好直接使用,名不副实。
希望分个库专门提供特定语音识别功能(功能,而不是学术倾向的训练器)。提供VAD函数及分析函数,参数是音频,返回是否含有语音,及音频识别结果。
库的功能可以是:语音转命令/词组、语音转音素、语音转句子。
我现在最需要的是语音转音素,用在单片机,训练出来的库越小越好,不能超过1M尺寸。识别库需要支持c/c++。
作为参考,上海乐鑫ESP32这MCU只有4M存储500KB不到的内存,但是官方的语音识别可以做到语音转音素,但不开源。
The text was updated successfully, but these errors were encountered: