From 82dd38d507f2272dadcbf9cdbd3d8b6796b4fff5 Mon Sep 17 00:00:00 2001 From: Haujet Zhao <1292756898@qq.com> Date: Sat, 11 Jul 2020 11:33:41 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E4=BA=86readme=E5=B8=A6?= =?UTF-8?q?=E8=A7=86=E9=A2=91=E7=9A=84=E5=B8=96=E5=AD=90=E9=93=BE=E6=8E=A5?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .gitignore | 3 ++- README.md | 47 +++++++++++++++++++++++++++-------------------- 2 files changed, 29 insertions(+), 21 deletions(-) diff --git a/.gitignore b/.gitignore index 4a6b471..f1d6420 100644 --- a/.gitignore +++ b/.gitignore @@ -2,4 +2,5 @@ build* dist* __pycache__* run.spec -alispeech.log \ No newline at end of file +alispeech.log +*.wav \ No newline at end of file diff --git a/README.md b/README.md index 70ea5a7..8bd6c98 100644 --- a/README.md +++ b/README.md @@ -1,13 +1,19 @@ # Caps Writer -### 简介 +### 💡 简介 -一款语音输入工具,后台运行脚本后,按下大写锁定键超过 0.3 秒后,开始语音识别,松开按键之后,自动输入识别结果。 +一款电脑端语音输入工具,后台运行脚本后,按下按下 `Caps Lock`(也就是大写锁定键)超过 0.3 秒后,开始语音识别,松开按键之后,自动输入识别结果。 -### 开发动机 +目前使用了阿里云的一句话识别 api。(有兴趣的可以自行改成百度、腾讯、讯飞、谷歌的 api ) + +因为使用了阿里云的 api,所以需要用户自己到阿里云申请,再填到 `token.ini` 中才能正常使用。 + +对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。 + +### 📝 背景 -我就气抖冷,为什么直到现在,仍然没有开发者做过一个好用的语音输入工具? +我真是气抖冷,为什么直到 0202 年,仍然没有开发者做过一个好用的语音输入工具? 有人建议用搜狗输入法、讯飞输入法的语音输入,但这几个方面是真让人受不了: @@ -23,28 +29,20 @@ 为了在电脑上语音输入,我之前是用的 Quicker 的手机端进行语音识别,输入到电脑上,需要两个设备,非常麻烦。今天终于做好我心目中最好用的电脑端语音输入工具了! -### 描述 -本工具(Caps Writer)是一个电脑端的语音输入工具,使用了阿里云的一句话识别 api +### 📽️ 视频演示 -(有兴趣的可以改成百度、腾讯、讯飞的 api 试试)。 - -使用方法很简单:运行程序后,按下 `Caps Lock`(也就是大写锁定键)超过 0.3 秒后,就会开始用阿里云的 api 进行语音识别,松开按键后,会将识别结果自动输入。 - -因为使用了阿里云的 api,所以需要用户自己到阿里云申请,再填到 `token.ini` 中才能正常使用。 - -对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。 - - -### 视频演示 +作者为这个工具录制了使用视频演示、申请 api 的教程视频 请到 HacPai 帖子中进行查看:[Caps Wirter 发布:按住大写锁定键,进行语音识别输入](https://hacpai.com/article/1594371212477) -### 开箱即用 +## 🔮 开箱即用 -小白用户,只需要在 Release 界面下载打包好的 exe 文件,运行,会在同级目录生成一个 `token.ini` 文件,在 `token.ini` 中填入你阿里云拥有 **管理智能语音交互(NLS)** 权限的 **RAM访问控制** 用户的 **Accesskey Id**、**Accesskey Secret** 和智能语音交互语音识别项目的 **appkey** ,就可以正常使用了。详细步骤之后我录一个视频 +小白用户,只需要在 [Release](https://github.com/HaujetZhao/CapsWriter/releases) 界面下载打包好的 exe 文件,运行,会在同级目录生成一个 `token.ini` 文件,在 `token.ini` 中填入你阿里云拥有 **管理智能语音交互(NLS)** 权限的 **RAM访问控制** 用户的 **Accesskey Id**、**Accesskey Secret** 和智能语音交互语音识别项目的 **appkey** ,就可以正常使用了。 -### 开发使用 +详细申请、填写 API 的步骤请到 [Caps Wirter 发布:按住大写锁定键,进行语音识别输入](https://hacpai.com/article/1594371212477) 查看视频教程 + +### 🛠 开发使用 本工具是一个python脚本,上面小白下载的 Release 其实是用 pyinstaller 导出的 exe 文件,如果你想在源码基础上使用,就需要安装以下模块: @@ -69,4 +67,13 @@ 因为作者就是本着凑合能用就可以了的心态做这个工具的,所以图形界面什么的也没做,整个工具单纯就一个脚本,功能也就一个,按住大写锁定键开始语音识别,松开后输入结果。目前作者本人已经很满意。 -欢迎有想法有能力的人将这个工具加以改进,比如加入讯飞、腾讯、百度的语音识别api,长按0.3秒后开始识别时加一个提示等等等等。 \ No newline at end of file +欢迎有想法有能力的人将这个工具加以改进,比如加入讯飞、腾讯、百度的语音识别api,长按0.3秒后开始识别时加一个提示等等等等。 + +目前已知改进的方向: + +- 使用 VoiceRecognition 中的 google_recognize 进行识别,使用的是谷歌的免费语音识别 api,优势是不用用户个人申请 api 了,但是在中国大陆不太好使用。在海外的话会非常好用。 +- 使用 Baidu AI 语音识别 api,每个账户有 200 万次的免费额度。 +- 使用 Tencent AI 语音识别 api,每个账户有 5000 次的免费额度。 +- 使用讯飞的语音识别 api,每个账户有 1 年的免费使用时间。 + +欢迎有兴趣的贡献者对项目进行翻译(国际化),添加 Google、Bing 的 api,让海外用户也可以使用这个便捷的语音输入工具! \ No newline at end of file