会議の録音を議事録にしたい、インタビュー音声をテキストに起こしたい、動画に字幕をつけたい。音声を文字に変換したい場面は意外と多いものです。
人の手で1時間の音声を文字起こしすると、慣れた人でも3〜4時間かかると言われます。外注すれば1時間あたり数千円〜1万円、有料アプリでも月額1,000〜2,000円が相場です。AI文字起こしの精度は年々上がっており、無料ツールでも下書きとして十分使えるレベルに到達しました。
結論:迷ったらLINE WORKS AiNote(旧CLOVA Note)がおすすめ。月300分まで無料で、日本語の認識精度が高く、話者分離にも対応しています。動画に字幕をつけたいならVrew、Googleアカウントだけでブラウザから即使いたいならGoogleドキュメントの音声入力が便利です。
この記事では、音声文字起こしが無料でできるアプリ・ソフトを5つに絞って紹介します。「会議の議事録」から「動画の字幕作成」まで、用途に合った1つが見つかるはずです。
無料の文字起こしツールを選ぶ3つのポイント
1. 月の文字起こし時間(無料枠)
ツールごとに月に使える時間の上限が大きく違います。1〜2時間の会議を月数回処理する程度なら無料枠で十分なケースが多いですが、毎週ミーティングがある人は枠の大きさがそのまま使い勝手に直結します。
2. 入力方式(録音するか、ファイルを取り込むか)
「会議をその場で録音して文字起こし」したいのか、「あらかじめ録音した音声ファイルをアップロード」したいのかで適したツールが変わります。スマホ録音派ならアプリ型、PCで音声ファイルを処理する派ならデスクトップ型が便利です。
3. 話者分離の有無
複数人が話す会議やインタビューでは、誰が何を話したかを自動で分けてくれる「話者分離」機能の有無で、後の編集の手間が大きく変わります。1人で話す音声メモなら話者分離は不要、複数人の議事録なら必須機能です。
早見比較表:無料で使える文字起こしツール5本まとめ
| ツール名 | 料金 | 月の無料枠 | 対応OS | 日本語精度 | おすすめ度 |
|---|---|---|---|---|---|
| LINE WORKS AiNote | 完全無料 | 月300分 | Web・iOS・Android | ◎ | ★★★★★ |
| Notta | 無料(有料版あり) | 月120分(1回3分) | Web・iOS・Android | ◎ | ★★★★☆ |
| Vrew | 無料(有料版あり) | 月120分 | Windows・Mac | ○ | ★★★★☆ |
| Googleドキュメント 音声入力 | 完全無料 | 無制限 | Chrome・Edge・Safari | ○ | ★★★★☆ |
| Whisper | 完全無料(オープンソース) | 無制限 | Windows・Mac・Linux | ◎ | ★★★☆☆ |
※ 2026年5月時点の情報です。最新の仕様は各公式サイトでご確認ください。
詳細比較表:話者分離・リアルタイム性・出力形式
| ツール名 | 入力方式 | 話者分離 | リアルタイム文字起こし | エクスポート形式 | 登録要否 |
|---|---|---|---|---|---|
| LINE WORKS AiNote | 録音・ファイルアップロード | ◎ | ○ | テキスト・編集ノート | 要LINE WORKSアカウント |
| Notta | 録音・ファイル・Web会議連携 | ○(有料は強化) | ◎ | TXT・SRT・DOCX等(有料) | 要Nottaアカウント |
| Vrew | 動画・音声ファイル | × | × | SRT字幕・動画書き出し | 要Vrewアカウント |
| Googleドキュメント 音声入力 | マイク入力のみ | × | ◎ | Googleドキュメント | 要Googleアカウント |
| Whisper | 音声ファイル | ×(標準) | △(CLI設定次第) | TXT・SRT・VTT・JSON | 不要(ローカル実行) |
各ツールを詳しく見る
1. LINE WORKS AiNote|月300分の無料枠が最大、日本語に強い
LINE WORKS AiNote(旧CLOVA Note)は、LINE WORKS社(旧LINE社)が提供する音声文字起こしサービスです。フリープランで月300分まで無料で使え、紹介する5本の中で最も無料枠が大きいのが特徴です。
日本語の認識精度に定評があり、会議やインタビューで自然な日本語の話し言葉を高い精度で文字に変換できます。複数人の会話を自動で話者ごとに分ける話者分離機能にも対応しているため、議事録作成にそのまま使える形でテキストが出力されます。
利用方法は2通り。スマホやPCで会議をリアルタイム録音するか、すでに録音した音声・動画ファイル(MP3・WAV・MP4等)をアップロードして文字起こしするかが選べます。文字起こしされたテキストは、Webブラウザ上で編集・話者ラベル変更・タイムスタンプ確認ができるため、議事録の仕上げまで1つのツールで完結します。
なお、無料のフリープランではAI要約機能とWeb会議録音機能は使えません。会議全体の要約や、ZoomなどのWeb会議の自動録音まで欲しい場合は有料のソロプラン(月額1,600円)以上を検討してください。
※ 旧CLOVA Noteは2025年7月31日にサービス終了し、後継のLINE WORKS AiNoteに統合されました。CLOVA Note時代から使っていた方は、データ移行ガイドが公式に用意されています。
メリット
- 月300分まで無料、紹介ツール中で最大の無料枠
- 日本語に強く、話者分離も自動で動作
- Web・iOS・Androidで使える、編集もブラウザで完結
デメリット
- 無料版ではAI要約・Web会議録音は使えない
- 音声データはサーバーで処理される(オフライン不可)
- LINE WORKSアカウントの登録が必要
👤 こんな人におすすめ
- 月数時間の会議やインタビューを文字起こししたい人
- 話者分離まで含めて議事録を仕上げたい人
2. Notta|1回3分の制限はあるが、UIと連携機能が秀逸
Nottaは、Notta株式会社が提供するクラウド型の文字起こしサービスです。フリープランでは月120分まで無料で使え、Webブラウザ・iOS・Androidの全プラットフォームに対応しています。
最大の特徴は使いやすさです。録音ボタン1つでリアルタイムに文字起こしが進み、話している途中でも画面上にテキストが表示されていきます。録音と同時に話者を区別したり、重要な箇所にマークを付けたりといった操作もシンプルなUIで完結します。
Zoom・Google Meet・Microsoft Teamsなど主要なWeb会議ツールとの連携機能を持ち、会議URLを登録しておくと自動で会議に参加して録音・文字起こしまで進めてくれます(一部機能は有料プラン)。多言語対応も強く、日本語・英語・中国語など複数言語の文字起こしと相互翻訳が可能です。
注意点は、フリープランは1回の連続録音が3分までに制限されている点です。長い会議をまるごと文字起こしする用途には向かず、メモや短い打ち合わせ、音声メモの起こしといった使い方が現実的です。本格的に長時間の議事録を取りたい場合は、プレミアムプラン(年額契約で月額1,185円、月1,800分・1回90分まで)の検討をおすすめします。
メリット
- UIが直感的で初心者でも迷わず使える
- Zoom・Google Meet等のWeb会議連携が強力
- 多言語対応&翻訳機能で海外ミーティングにも使える
デメリット
- 無料版は1回3分までの連続録音制限がある
- 長時間の議事録を取るには有料プラン前提
- 音声データはクラウド処理(オフライン不可)
👤 こんな人におすすめ
- 短い打ち合わせや音声メモを手早くテキスト化したい人
- Web会議の自動録音・文字起こしを試してみたい人
3. Vrew|動画字幕の自動生成に特化、YouTuber向けの定番
Vrewは、韓国VOYAGER X社が提供する動画編集&字幕生成ソフトです。動画ファイルを読み込むと、自動で音声を解析して字幕テロップを生成し、テキストエディタのように動画を編集できる独自の操作スタイルが特徴です。
無料版では月120分の音声分析が可能で、商用利用も認められています。動画から自動生成された字幕は、画面右側のテキストパネルで通常の文書編集のように修正でき、修正内容は即座に動画のテロップに反映されます。文字起こしだけでなく、字幕付き動画の書き出しまで1つのソフトで完結するため、YouTube・SNS用の動画制作で愛用者が多いツールです。
字幕の言語設定は日本語・英語・韓国語など多数に対応。AI音声で原稿を読み上げる機能や、自動翻訳して多言語字幕を作る機能なども搭載されています。
注意点は2つ。まず話者分離機能はありませんので、複数人の会議録音には不向きです。次に、無料版で書き出した動画にはVrewのウォーターマーク(ロゴ)が入ります。ロゴを消したい場合は有料プランが必要です。とはいえ、文字起こし結果のテキスト部分(SRT字幕ファイル)はウォーターマークと無関係に取り出せるため、純粋な文字起こし用途では問題なく使えます。
メリット
- 動画から自動で字幕を生成、テロップ編集まで一気通貫
- 文字起こし結果はSRT字幕として書き出し可能
- 商用利用OK、YouTubeやSNS動画にそのまま使える
デメリット
- 話者分離機能がなく、会議録音には不向き
- 無料版で書き出す動画にはVrewロゴが入る
- Windows・Mac専用、スマホアプリは非対応
👤 こんな人におすすめ
- YouTubeやSNS用の動画に字幕をつけたい人
- 動画ファイルから字幕テキストを抽出したい人
ここからは、ソフトのインストールが不要で、ブラウザやコマンドラインから手軽に使えるツールを紹介します。
4. Googleドキュメント 音声入力|ブラウザだけで完結、リアルタイム文字起こし
Googleドキュメントには、マイクで話した内容をリアルタイムにテキスト化する音声入力機能が標準搭載されています。完全無料で利用でき、Googleアカウントさえあれば追加のソフトインストールも不要です。
使い方は簡単です。Googleドキュメントを開いてメニューから「ツール」→「音声入力」を選択し、表示されたマイクアイコンをクリック。話した内容がそのままドキュメントに入力されていきます。日本語を含む100以上の言語に対応しており、句読点も「まる」「てん」と発声することで挿入できます。
PCだけでなく、スマホのGoogleドキュメントアプリでも音声入力に対応しているため、移動中の音声メモやブログ下書きなどにも使えます。テキスト化された内容はそのままGoogleドキュメントの強力な編集機能(共同編集・コメント・履歴)と組み合わせて活用できるのが大きな利点です。なお、Word文書の編集も視野に入れる場合は「Wordの代わりになる無料ソフト7選」も参考になります。
注意点は、マイク入力のリアルタイム文字起こし専用であること。すでに録音された音声ファイル(MP3やWAV)を読み込んでテキスト化する用途には使えません。録音済みファイルを処理したい場合は、PCのスピーカーから再生してマイクで拾わせる、という間接的な方法になります(精度は落ちます)。話者分離機能もありません。
対応ブラウザはChrome、Edge、Safariの最新版。Firefoxでは動作しないため、Firefoxユーザーは別ブラウザの利用が必要です。
メリット
- 完全無料・無制限、Googleアカウントだけで使える
- 100以上の言語に対応、リアルタイムでテキスト化
- ドキュメントの共同編集・コメント機能と連携
デメリット
- マイク入力専用、録音済み音声ファイルは読み込めない
- 話者分離機能はない
- Firefoxでは動作しない
👤 こんな人におすすめ
- マイクに向かって話して文章を作りたい人(音声入力)
- ブラウザだけで気軽に始めたい人
5. Whisper|OpenAI製のオープンソース、精度はトップクラス
Whisperは、OpenAIが2022年に公開したオープンソースの音声認識モデルです。MITライセンスで配布されており、商用利用を含めて完全無料で使えます。
精度の高さが最大の魅力です。99言語に対応し、特に日本語・英語の認識精度は商用サービスと並ぶか上回るレベル。雑音が混じった音声や、なまり・早口の話し方にも比較的強く、会議録音やインタビュー音声の文字起こしで安定した結果が得られます。
ローカル環境(自分のPC)で動作するため、音声データを外部サーバーに送らずに処理できるのがクラウド型ツールにはない強みです。社外秘の会議や個人情報を含むインタビューなど、プライバシーが重要な用途で安心して使えます。文字起こし結果はTXT・SRT字幕・VTT・JSONなど複数形式で出力可能です。
ただし、利用にはPython環境のセットアップ・ffmpegのインストール・コマンドライン操作が必要で、プログラミング未経験者にはハードルが高いのが正直なところです。GUIフロントエンドの「Whisper Desktop」「MacWhisper」(Mac専用)などサードパーティ製のラッパーツールを使えばマウス操作で扱えますが、それでも初期セットアップに多少の試行錯誤が伴います。
モデルサイズはtiny〜large+turboまで6種類が用意されており、PCのスペックと精度のバランスで選びます。一般的なノートPCならbaseまたはsmallモデル、ハイスペックPCならlargeモデルで最高精度を狙えます。
メリット
- 完全無料・オープンソース、商用利用OK
- 99言語対応、日本語の認識精度はトップクラス
- ローカル処理で音声データが外部に出ない
デメリット
- Python環境とコマンドライン操作の知識が必要
- 標準では話者分離に対応していない(別ツールとの併用が必要)
- 大きいモデルはGPUまたは高スペックPCが必須
👤 こんな人におすすめ
- 機密性の高い音声をローカルで処理したい人
- プログラミングに抵抗がなく、最高精度を求める人
用途別おすすめまとめ
| 用途 | おすすめツール | 理由 |
|---|---|---|
| 会議・インタビューの議事録 | LINE WORKS AiNote | 月300分の無料枠、話者分離対応 |
| 短い音声メモ・打ち合わせ | Notta | UIが優秀、Web会議連携も可能 |
| YouTube・SNS動画の字幕 | Vrew | 動画から自動字幕、編集も同じ画面で |
| マイクに話して文章作成 | Googleドキュメント | 完全無料・無制限、リアルタイム |
| 機密音声をローカル処理 | Whisper | データ外部送信なし、99言語対応 |
動画の編集まで一気にやりたい方は「Premiere Proの代わり|無料動画編集ソフトおすすめ7選」、画像やPDFの中の文字を抽出したい方は「OCRが無料でできるアプリ・ソフト5選」もあわせてどうぞ。
文字起こしで気をつけること
プライバシーと機密情報の扱い
LINE WORKS AiNote・Notta・Vrewなどクラウド型のツールは、音声データがサーバーにアップロードされます。各サービスとも商用レベルのセキュリティ対策を講じていますが、社外秘の会議や個人情報を含む音声を処理する場合は、各サービスのプライバシーポリシー・データ保管期間を確認しておきましょう。完全にローカルで処理したい場合はWhisperが選択肢になります。
文字起こし結果は必ず確認・修正する
無料ツールに限らず、自動文字起こしの精度は100%ではありません。固有名詞・専門用語・同音異義語の誤認識は起きやすいパターンです。議事録や記事の素材として使う場合は、必ず元の音声と照合して修正してください。タイムスタンプ機能のあるツール(LINE WORKS AiNote・Notta)を使うと、修正が必要な箇所をピンポイントで聴き直せて効率的です。
録音環境が精度を左右する
どんなに高性能なAIでも、録音環境が悪ければ精度は落ちます。会議室での録音なら全員の声が拾えるよう中央にマイクを置く、ノイズの多い場所での録音は避ける、複数人が同時に話さないよう司会を立てる、といった基本を押さえておくと文字起こし結果の質が大きく変わります。
よくある質問
Q. 無料の文字起こしツールでも実用的な精度が出ますか?
はっきり話されたクリアな音声であれば、紹介した5本のいずれも実用的な精度で文字起こしできます。LINE WORKS AiNote・Notta・Whisperは特に日本語の認識精度が高く、議事録のドラフトとしてそのまま使えるレベルです。ただし、専門用語や固有名詞は誤認識されることが多いので、目視での確認・修正は必須です。
Q. 1時間の会議を無料で文字起こしできますか?
LINE WORKS AiNoteのフリープラン(月300分)かVrew(月120分)が現実的です。Nottaは1回3分の制限があるため1時間の会議には不向きです。Googleドキュメントの音声入力は時間無制限ですがリアルタイム入力専用で、録音済みファイルは読み込めません。録音済みの会議音声を1時間まるごと処理するなら、LINE WORKS AiNoteが最有力です。
Q. スマホだけで文字起こしできますか?
LINE WORKS AiNote・Nottaのスマホアプリ(iOS・Android)であれば、スマホで録音→文字起こし→編集まで完結できます。Googleドキュメントの音声入力もスマホ版アプリに対応しています。Vrewは動画編集ソフトのためPC専用、WhisperはPC+Pythonセットアップが必要なのでスマホ単体では使えません。
Q. 有料の文字起こしサービスとの違いは何ですか?
主な違いは、月の文字起こし時間の上限・AI要約機能・話者分離の精度・サポート体制の4点です。無料プランは月数時間程度の利用に最適化されており、毎週何時間も会議がある業務利用では時間枠を使い切ります。AI要約・Web会議の自動録音・チーム共有といった発展機能も基本的に有料プラン専用です。週に数時間の利用を超える場合は、有料プランのコストパフォーマンスを比較してください。
まとめ:まずはLINE WORKS AiNoteから試してみよう
音声文字起こしは、会議・インタビュー・動画制作の作業時間を大幅に短縮してくれる便利な技術です。紹介した5つのツールはいずれも無料で使えるので、用途に合いそうなものから試してみてください。
- 会議や打ち合わせの議事録を取りたい → LINE WORKS AiNote
- 動画に字幕をつけたい → Vrew
- マイクに話して文章を作りたい → Googleドキュメント 音声入力
月の利用時間が無料枠に収まるなら、それだけで毎月数千円のコストカットになります。有料プランを検討するのは、無料枠を使い切ってからでも遅くありません。