カテゴリ:ローカルAI

[音声認識AI] Whisper(Python版)で高精度な音声文字起こし【GPU対応/ローカル実行】

OpenAIのWhisperをPythonで動かし、日本語音声をGPU対応で爆速かつ高精度に文字起こしする手順を解説します。Python仮想環境の構築から、Whisperのインストール、モデル別の精度比較、バッチファイルによる自動化まで。音声解析をローカルで完結させたい方に最適!

[GPT-OSS] OpenAI公式 OSS LLM『GPT-OSS』を ローカルで動かす(Ollama / LM Studio)

GPT-OSS 20Bをローカル環境にインストールし、Ollamaで実行する手順をまとめた備忘録。環境構築の注意点、モデルの取得方法、エラー対処、実際の動作確認まで、初心者にもわかりやすく解説しています。

[音声認識AI] Whisper.cppを使って音声文字起こし【ローカル/オフライン/高精度】

Whisper.cppをWindows環境にインストールし、音声ファイルから高精度な文字起こしをローカルで実行するまでの手順を解説します。Visual StudioとCMakeを使ったビルドから、日本語モデルの導入、実行例まで。インターネット接続なしでも動作し、セキュアで高速。Python不要で軽量に動作させたい方におすすめ!

[音声LLM] VoiceLLMをWindowsで動作確認:LM Studio+音声認識

清水亮さんが公開したVoiceLLMはMacでの動作報告が多いが、実際にはWindows環境でも動作可能。LM StudioのOpenAI互換APIとローカル音声認識(sherpa-onnx WASM)を組み合わせ、音声入力→LLM応答→音声出力まで一通り動かした手順とハマりポイントをまとめました。