voice2text/README.md
2024-11-20 11:24:17 +08:00

16 lines
910 B
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# voice2text
利用星火API将一个文件夹内所有的音频文件转换成文本后存储成json文件
## main.py
- 使用讯飞 `语音转写` 接口将文件夹内所有内容转为文本
- 使用轮询apikey防止达到qps出现错误
- 每次使用调用两次api第一次调用会返回文件大小第二次调用第一次返回的文件大小作为参数进行请求
- 将内容先存在列表变量中,最后写入文件
## iat.py
- 使用讯飞 `语音听写(流式版)` 将文件夹内音频文件转换为文本
- 使用轮询apikey防止达到qps出现错误
- 调用api之前判断是否之前调用过该文件如果以前调用过则跳过该文件
- 每次完成一条语音的转换就会存入json文件中
- 出现websocket错误的时候会将内容重写为 `*#本次转写失败#*` + 错误信息即在json中搜索该字段就能判断出那里出现错误