GitHub - w-okada/asrclient

ASRClient

[日本語] [English] [한국어] [中文简体]

リアルタイム音声認識/Speech To Text/Automatic Speech Recognition(STT/ASR)のクライアントソフトウェアです。

認識したテキストをWebHook経由やWebsocoket経由でリアルタイムに取得することができます。

各種AIに対応していく計画です。

対応 AI

What's New

v.1.0.4 released
- source code is opened.

ダウンロード

Hugging Faceのリポジトリ

win_stdエディション：Windows向けのCPUで動作するエディションです。cuda版と比較して低速ですが、最近のそれなりのスペックのCPUであれば動きます。
win_cudaエディション：Windows向けのNVIDIAのGPUで動作するエディションです。GPUのハードウェアアクセラレーションにより高速に動きます。
macエディション：Mac(Apple silicon(M1, M2, M3, etc))向けのエディションです。

オンラインデモ

Colabでの実行が可能です。こちらのノートにアクセスし、左上のOpen in Colabボタンをクリックして開いてください。

使用方法

zipファイルを展開後、start_http.batを実行してください。表示された、URLにブラウザでアクセスしてください。
start_https.batを使用すると、リモートからでもアクセスすることができます。
(上級者向け)start_http_with_ngrok.batを使用するとngrokを用いたトンネリングを使用してアクセスすることができます。

note: macエディションは.batを.commandで読み替えてください。

リポジトリをクローンして使用する方法 (Advanced)

前提

poetry: how to install

準備

下記のコマンドを実行してください。

git clone https://github.com/w-okada/asrclient.git

cd asrclient
cd third_party
git clone https://github.com/reazon-research/ReazonSpeech
cd ..

poetry install

実行

下記のコマンドを実行してください。

poetry run main cui

下の画像のURLにアクセスしてください。

fatal error: Python.h: そのようなファイルやディレクトリはありませんのようなエラーが出る場合は、pythonのソースコードをインストールしてください。

sudo apt install python3-dev

No such file or directory: 'cmake'のようなエラーが出る場合は、cmakeをインストールしてください。

sudo apt-get install cmake

NVIDIAのGPU(cuda)を使用する場合

poetry remove onnxruntime-directml torch-directml
poetry add torch==2.3.1 --source torch_cuda12
poetry add onnxruntime-gpu==1.17.1 --source ort_cuda12

webhook client sample

python

下記のコマンドを実行してください。表示されるwebhookのurlをGUIに設定してください。

python .\client\webhook_server\generic_main.py

node

下記のコマンドを実行してください。表示されるwebhookのurlをGUIに設定してください。

node .\client\webhook_server\generic_main.js

socketio client sample

下記のコマンドを実行してください。 http://localhost:20000の部分はASRClientの起動URLを指定してください。

poetry run python_socket_io http://localhost:20000

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
.vscode		.vscode
asrclient		asrclient
client		client
scripts		scripts
settings		settings
tests		tests
third_party		third_party
web_front		web_front
.gitignore		.gitignore
README.md		README.md
README_cn.md		README_cn.md
README_en.md		README_en.md
README_ko.md		README_ko.md
build.bat		build.bat
licenses_by_license.json		licenses_by_license.json
licenses_flat.json		licenses_flat.json
mypy.ini		mypy.ini
pyproject.toml		pyproject.toml
w_okada's_ASR_Client.ipynb		w_okada's_ASR_Client.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ASRClient

What's New

関連ソフトウェア

ダウンロード

オンラインデモ

使用方法

リポジトリをクローンして使用する方法 (Advanced)

前提

準備

実行

NVIDIAのGPU(cuda)を使用する場合

webhook client sample

python

node

socketio client sample

About

Releases

Packages

Languages

w-okada/asrclient

Folders and files

Latest commit

History

Repository files navigation

ASRClient

What's New

関連ソフトウェア

ダウンロード

オンラインデモ

使用方法

リポジトリをクローンして使用する方法 (Advanced)

前提

準備

実行

NVIDIAのGPU(cuda)を使用する場合

webhook client sample

python

node

socketio client sample

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages