- Bluesky ページを見る (新しいタブで開きます)
- Instagramページを見る(新しいタブで開きます)
- Facebookページで見る(新しいタブで開きます)
- YouTubeページを見る(新しいタブで開きます)
- Twitterページを見る(新しいタブで開きます)
- コピーしました
Whisper やその他の AI トランスクリプション モデルを使用して、Mac ディクテーション サービスを置き換えることができます。

クレジット: ジャスティン・ポット
目次
Macのテキスト読み上げ機能の使い勝手をもっと良くしたいと思ったことがあるなら、Spokenlyが解決策になるかもしれません。これはMacで最新のAIによる文字起こしを無料で利用できる無料アプリケーションです。キーボードショートカットでアプリケーションを起動し、入力したい内容を発声するだけで、画面に音声が表示されます。
現代のAIについてどう感じていても、話し言葉をテキストに変換する能力が優れていることは否定できません。リアルタイムの文字起こしでも、動画や音声ファイルの文字起こしでも、オープンソースのWhisperエンジンは正確かつ高速です。Spokenlyは、この技術をMacで利用できる無料アプリケーションです。
Mac App Storeで現在無料で入手できるこのアプリケーションをインストールすると、メニューバーに起動します。文字起こしは簡単です。右のコマンドボタンを長押しすると、上図のようなポップアップが表示されます。入力したい内容を声に出して、入力が終わったらボタンを離すと、現在アクティブなテキストフィールドにテキストが表示されます。

あなたも気に入るかもしれない
正直に言うと、アプリケーションをインストールしてそのまま使い始め、設定について考える必要はまったくありません。ほとんどそのまま動作します。ただし、より詳しく設定したい場合は、メニューバーアイコンをクリックして「一般設定」をクリックし、設定を開いてください。アプリケーションをメニューバー、ドック、またはその両方に表示するかを選択できます。複数のマイクを使用している場合は、どのマイクを優先するかも選択できます。また、書き起こしたテキストをデフォルトでクリップボードにコピーするかどうかも選択できます。
AIを試してみたい方は、「音声モデル」タブをチェックしてみてください。ここから、使用するAIモデルを選択できます。デフォルトでは、「Whisper Large v3」のオンライン版が使用されます。これは、話しているときにポップアップウィンドウに書き起こしを表示できる唯一のモデルです。ただし、Spokenly経由のGTP-4oなど、他にも使用できるモデルがあります。
クレジット: ジャスティン・ポット
オンラインサービスを使いたくない場合は、Whisperの様々なモデルをローカルにダウンロードして実行することも可能です。ハードドライブの容量、パフォーマンス、精度のバランスを見つける必要があります。自分に合ったモデルが見つかるまで、いくつかのモデルを試してみることをお勧めします。また、Deepgram、Fireworks、OpenAIのAPIキーも利用可能です(これらのサービスのいずれかに既に料金を支払っている場合)。
もしそれが何を意味するのか分からなくても、心配はいりません。デフォルトのモデルは非常にうまく機能します。そして、このアプリケーションには他にも掘り下げるべき機能があります。設定ウィンドウの「文字起こしファイル」タブでは、任意の動画または音声ファイルを追加して、タイムスタンプの有無にかかわらず文字起こしを作成できます。動画用の字幕ファイルの生成もサポートされています。
これまでのところどう思いますか?
クレジット: ジャスティン・ポット
さらに、パワーユーザー向けに設定できるツールもいくつかあります。「クイックコマンド」タブでは、文字起こしの代わりにアクションを実行する単語の組み合わせをいくつか選択できます。トリガーフレーズと、そのフレーズで実行したい操作(URLを開く、アプリケーションを起動する、Appleショートカットのいずれかを実行するなど)を選択するだけです。例えば、「Lifehackerを開く」をトリガーフレーズとして、当社のホームページをURLとして設定できます。そうすれば、「Lifehackerを開く」と発声するたびにLifehackerのウェブサイトが開き、あなたの生活がより豊かになるはずです(きっと)。
クレジット: ジャスティン・ポット
AIプロンプト機能を使うと、音声入力後にテキストを変更するプロンプトを設定できます。別のキーボードショートカットを選択し、テキストのプロンプトを入力するだけです。例えば、「このテキストをスペイン語に翻訳してください」というプロンプトを作成できます。AIによる翻訳の前に、カスタムキーボードショートカットを使ってテキストを書き起こすことができます。思いつく限りのあらゆるプロンプトが使えます。
これらの機能はどれも、いじくり回すほどに使いこなせるものばかりで、まさに私が好きなタイプのアプリです。しかも、この記事の執筆時点では完全に無料でありながら、プライベートな利用を可能にする機能も提供しています。文字起こしソフトウェアをもっと活用したい方は、ぜひお試しください。
ダウンロードニュースレター 技術ニュースを見逃さない
ジェイク・ピーターソン シニア技術編集者
ジェイクとチームからの最新の技術ニュース、レビュー、アドバイスを入手してください。
ダウンロードニュースレター テクノロジー 関連のニュースを見逃さないでください。ジェイクとチームからの最新のテクノロジーニュース、レビュー、アドバイスをお届けします。
次の記事へスクロールしてください