動画制作において、テキストをナレーション化したいってことありますよね?そんな時に便利なのが「AEJuice Voiceover AI」です。
AEJuiceの「Voiceover AI」は、その名の通り、人工知能を活用してテキストからナレーションを作成するプラグインで、ナレーションを使用した動画制作の作業効率を大幅にアップさせてくれます。
本記事では、Voiceover AIの魅力と使い方を初心者の方にもわかりやすく解説します。
AEJuice Voiceover AIとは?

AEJuiceの「Voiceover AI」はAIを活用して自然なナレーションを生成(Text to Speech)や音声から文字起こし(Speech to Text)してくれるツールです。
AfterEffects、Premiere Proだけでなく、様々な動画編集ソフトで利用する事が出来ます。
テキストを入力するだけで、プロフェッショナルな音声を数秒で作成できるので、制作時間を短縮しながら、視聴者を引き込む高品質な音声を提供することができます。
また、動画ファイルや音声ファイルを解析しテキストに変換する事も可能です。
Voiceover AIを使用するには、AEJuiceのアカウントの作成が必須なので、利用したい方はアカウントを作成しておきましょう。
- 簡単操作
-
テキストを入力してボタンを押すだけ
- 多言語対応
-
日本語を含む複数の言語(142言語)に対応。日本語の場合6つの音声プリセット(男性3、女性3)を利用できます。
- カスタマイズ可能
-
声のトーンやスピードを調整できる。
- 時間節約
-
手間のかかるナレーション収録が不要
- プロレベルのサウンドを生成
-
リスナーを引き込む素晴らしいプロ品質の音声が生成されます。
- 文字起こしも可能
-
ナレーションを生成するだけでなく、動画ファイルや音声ファイルを解析して音声をテキスト化してくれる機能も搭載
価格と変換可能時間
AEJuice Voiceover AIは、39ドル/月で利用でき、毎月240分間分のナレーション生成(text to speech)や文字起こし(speech to text)が可能です。
有料版を購入していない方は、毎月10分間だけ無料で利用できます。
Voiceover AIのインストール方法
AEJuice Voiceover AIを利用するには、AEJuice公式サイトからPack ManagerというツールをAEJuiceからダウンロードしてインストールする必要があります。
- AEJuiceの公式サイトからAEJuice Pack Managerをダウンロード
- AEJuice Pack Managerをインストール
- 利用するアプリケーションを起動
- After Effects or Premiere Proの場合
- AEJuice Pack Managerを起動し「Voiceover AI」をダウンロード
- その他のソフトウェアの場合
- Standalone版 AEJuice Pack Managerを起動し、「Voiceover AI」をダウンロード
- After Effects or Premiere Proの場合
Pack Managerのインストール方法は以下の記事で詳しく解説しているのでそちらを参照してください。

Pack Managerをインストールしたら、Pack Managerを起動し無料リスト一覧にある「Voiceover AI」をクリックしてダウンロード(※初回のみ)してください。

ダウンロードが完了すると、Pack Manager上で「Voiceover AI」パネルが開きます。

Voiceover AIの基本的な使い方(After Effectsの場合)
Voiceover AIは、有料版を購入していない方は、毎月10分間まで機能を無料で利用できます。
無料版でも音声を生成するにはAEJucieアカウントへのログインを行う必要があるので注意してください。
以下、After Effects版Pack Manager 4を使った使い方を解説します。他のソフトで利用する場合もほぼ同じ感じで使用できると思います。
テキストからスピーチ生成(Text to Speech)機能
まず、使用する音声を選択します。
左ペインに対応する言語がリスト表示されていますので、使用する言語を選択します。日本語なら「ja-JP」を選択します。上部の検索ボックスを利用して絞込み表示することが出来るので、検索ボックスの利用がおすすめ。
リストの右側の数字は、搭載している音声プリセットの数を表しています。

左ペインで使用する言語を選んだら、右ペインに、利用可能な音声プリセットが表示されます。
日本語の場合以下の6つの音声プリセットが用意されています。
それぞれの音声プリセットを使って「AEJuice Voiceover AIはユーザーが入力したテキストを音声に変換する事が出来ます」というテキストを音声に変換した結果を一緒に掲載しています。それぞれの声がどんな感じか確認してみてください。
- Daichi
-
- Keita
-
- Naoki
-
- Mayu
-
- Nanami
-
- Shiori
-
右ペインの波形が描かれているプリセットの上にマウスオーバーさせると、サンプル音声を聞くことが出来るので、使用したい音声を探します。

使用したい音声プリセットが決まったら、プリセットをダブルクリックします。または、プリセットを選択した状態で、右上の「生成」ボタンをクリックします。

AEJuice Pack Managerでアカウントにログインしていない場合は、このタイミングでアカウントにログインしろという以下のダイアログが表示されるので「Log in」ボタンをクリックしてログイン状態にしてから、再度プリセットをダブルクリックしてください。

以下のダイアログが表示されます。

- 使用音声プリセット名、使用言語名、利用可能な残り変換時間が表示されます
- Title:保存先フォルダ名に使用されます
- Enter text for voice over:音声化したいテキストを入力します
- 推定の消費変換時間が表示されます
Titleは入力必須ではありませんが、入力したタイトル名でフォルダが作成されその中に生成したファイルが保存されます。
音声の生成を行う前にプロジェクトファイルを保存しておくことをお勧めします。プロジェクトファイルを保存しておくと、生成ファイルはプロジェクトフォルダの中に保存されるようになります。
プロジェクトを保存していない場合は、”C:\Users\(ユーザー名)\AppData\Roaming\AE Framework\Unsaved Projects Backups\AEJuice Voiceover AI\”フォルダに中に保存されます。
③のEnter text for voice overの所に、音声化したいテキストを入力し、「Generate」ボタンをクリックします。
すると、音声化の処理が開始されます。完了するまで待ちましょう。

音声化が完了したら、以下の画面が表示され、生成した音声が1回再生されます。▶ボタンを押せば生成した音声を確認できます。

音声を生成した後は、以下の2つの対応を取れます。
- フォルダをオープンする
- タイムラインへのインポート

・フォルダをオープンする
「Open in Folder」ボタンを押すと、エクスプローラが起動しファイルの保存先フォルダが開かれます。

生成した音声ファイルは、mp3とwavファイルの2つのフォーマットで作成されます。
・タイムラインへのインポート
「Import to timeline」ボタンをクリックすると、生成した音声をタイムラインにインポートする事ができます。
After Effectsの場合、インポート時に以下のダイアログボックスが表示されるのですが、どれを選んでも変化はありませんでした。よくわかりませんが、どうもこのオプション機能は機能していないみたいです。「OK」ボタンをクリックします。

すると、以下の様に音声ファイル(mp3ファイル)がタイムライン上に配置されます。

スクリプトはSSMLで制御可能
AEJuice Voiceover AIは、XMLベースのマークアップ言語であるSSML(Speech Synthesis Markup Language:音声合成マークアップ言語)を、音声合成の制御に利用することが出来ます。
例えば、音声を倍速で生成したいなら以下の様に記述できます。
<prosody rate="+200%">
AEJuice Voiceover AIはユーザーが入力したテキストを音声に変換する事が出来ます
</prosody>
以下はこの設定で作成した音声です。
その他の設定方法については、以下の公式ドキュメントを参照してください。
https://outline.aejuice.com/doc/voiceover-documentation-JnPJtT090z
スピーチから文字起こし機能(Text to Speech)機能
AEJuice Voiceover AIには、音声からテキストに変換する機能も搭載されています。ただし、私が使用する環境においては、処理がいつまでたっても終わらないという不具合が生じており、あまりお勧めできない機能となっています。皆さんにも同じ現象が起きるかは不明。
スピーチから文字起こし機能を使うには、テキスト入力画面の左下にあるボタンを利用します。Analayze audio or videoと書いてある方のボタンは、一般的なautio または videoファイルを分析する時に使用するボタン、その隣のアイコンボタンの方は、Voiceover AIで出力した音声ファイルを逆分析する時に使用するボタンだと思われます。

通常のオーディオまたはビデオファイルから解析
画面左下の「Analayze audio or video」ボタンをクリックします。

Titleを入力すると保存フォルダ名として使用されます。Languageに音声ファイルで使われている言語を選択して「Browse」ボタンをクリックします。するとファイル選択ダイアログが表示されるのでファイルを選択します。

ファイルを選択すると、「Analyze」ボタンが有効になるので「Analayze」ボタンをクリックします。

/すると、以下の様に解析中の画面が表示されるのですが、これがいつまでたっても終わらない現象が私には起きています。

でも、テキスト化されたファイル自体は以下の様に作成されているので、どうもUIの終了処理がおかしいようです。ファイルが作成されているのに、UIの処理が終わらない場合は、×をクリックして処理を終了しちゃいましょう。

本来、正常に処理が終了している場合は、タイムラインにテキストを取り込んで字幕化できるはずなのですが、処理がうまく完了しない場合は、生成されたテキストを自分で処理するようにしてください。
アイコンボタンを使ってVoiceover AI出力オーディオを分析
「Analayze audio or video」ボタンの横にあるアイコンボタンは、Text to Speechで出力されたファイルを逆分析するためのものだと思われます。

「Analayze audio or video」ボタンを使う時と同じようなインターフェースで利用できます。
ただしこちらも処理が終了しない不具合が発生しているので、解説は省きます。
無料試用版で満足できなくなったら?
AEJuice Voiceover AIは、無料版だと毎月10分間しか利用する事が出来ません。
大量に音声を生成したい人や定期的に利用したい場合、この制限だとあっという間に引っかかってしまうでしょう。
この機能を無料で試して気に入った方は、有料版の購入を検討しましょう。
有料版を利用すれば、毎月240分まで変換できるようになるので、Voiceover AIを無料で使ってみて気に入った方は有料版の購入を検討してみましょう。
多数のパッケージが一度に手に入るベストセラーバンドル「I Want It All Bundle Lifetime」には、Voiceover AIの3ヶ月無料になるボーナス特典が付いています。


よくある質問 (FAQ)
- Voiceover AIは無料ですか?
-
有料で販売されていますが、有料版を購入していない場合は、毎月10分間分だけ無料で利用する事が出来ます。
- 他の動画編集ソフトでも使用できますか?
-
Adobe After EffectsやPremiere Pro版以外の動画編集ソフトを使用している場合は、スタンドアロン版AEJuice Pack ManagerからVoiceover AIを起動して使用する事が出来ます。ただし、After EffectsやPremiere Pro版のようなタイムラインへのインポート機能はありません。出力されたファイルを自身で動画編集ソフトに読み込ませて使用します。
- 日本語のナレーションの品質はどうですか?
-
非常に自然な音声が生成されます。当記事内に音声プリセット米の音声結果を掲載しているので確認してみてください。
- Text-to-Speechで利用できる言語は?
-
対応言語はこちら
- English, US (en-US, 28 voices)
- Afrikaans (South Africa) (af-ZA, 2 voices)
- Amharic (Ethiopia) (am-ET, 2 voices)
- Arabic (United Arab Emirates) (ar-AE, 2 voices)
- Arabic (Bahrain) (ar-BH, 2 voices)
- Arabic (Algeria) (ar-DZ, 2 voices)
- Arabic (Egypt) (ar-EG, 2 voices)
- Arabic (Iraq) (ar-IQ, 2 voices)
- Arabic (Jordan) (ar-JO, 2 voices)
- Arabic (Kuwait) (ar-KW, 2 voices)
- Arabic (Lebanon) (ar-LB, 2 voices)
- Arabic (Libya) (ar-LY, 2 voices)
- Arabic (Morocco) (ar-MA, 2 voices)
- Arabic (Oman) (ar-OM, 2 voices)
- Arabic (Qatar) (ar-QA, 2 voices)
- Arabic (Saudi Arabia) (ar-SA, 2 voices)
- Arabic (Syria) (ar-SY, 2 voices)
- Arabic (Tunisia) (ar-TN, 2 voices)
- Arabic (Yemen) (ar-YE, 2 voices)
- Azerbaijani (Latin, Azerbaijan) (az-AZ, 2 voices)
- Bulgarian (Bulgaria) (bg-BG, 2 voices)
- Bangla (Bangladesh) (bn-BD, 2 voices)
- Bengali (India) (bn-IN, 2 voices)
- Bosnian (Bosnia and Herzegovina) (bs-BA, 2 voices)
- Catalan (Spain) (ca-ES, 3 voices)
- Czech (Czechia) (cs-CZ, 2 voices)
- Welsh (United Kingdom) (cy-GB, 2 voices)
- Danish (Denmark) (da-DK, 2 voices)
- German (Austria) (de-AT, 2 voices)
- German (Switzerland) (de-CH, 2 voices)
- German (Germany) (de-DE, 15 voices)
- Greek (Greece) (el-GR, 2 voices)
- English (Australia) (en-AU, 14 voices)
- English (Canada) (en-CA, 2 voices)
- English (United Kingdom) (en-GB, 15 voices)
- English (Hong Kong SAR) (en-HK, 2 voices)
- English (Ireland) (en-IE, 2 voices)
- English (India) (en-IN, 2 voices)
- English (Kenya) (en-KE, 2 voices)
- English (Nigeria) (en-NG, 2 voices)
- English (New Zealand) (en-NZ, 2 voices)
- English (Philippines) (en-PH, 2 voices)
- English (Singapore) (en-SG, 2 voices)
- English (Tanzania) (en-TZ, 2 voices)
- English (United States) (en-US, 28 voices)
- English (South Africa) (en-ZA, 2 voices)
- Spanish (Argentina) (es-AR, 2 voices)
- Spanish (Bolivia) (es-BO, 2 voices)
- Spanish (Chile) (es-CL, 2 voices)
- Spanish (Colombia) (es-CO, 2 voices)
- Spanish (Costa Rica) (es-CR, 2 voices)
- Spanish (Cuba) (es-CU, 2 voices)
- Spanish (Dominican Republic) (es-DO, 2 voices)
- Spanish (Ecuador) (es-EC, 2 voices)
- Spanish (Spain) (es-ES, 15 voices)
- Spanish (Equatorial Guinea) (es-GQ, 2 voices)
- Spanish (Guatemala) (es-GT, 2 voices)
- Spanish (Honduras) (es-HN, 2 voices)
- Spanish (Mexico) (es-MX, 15 voices)
- Spanish (Nicaragua) (es-NI, 2 voices)
- Spanish (Panama) (es-PA, 2 voices)
- Spanish (Peru) (es-PE, 2 voices)
- Spanish (Puerto Rico) (es-PR, 2 voices)
- Spanish (Paraguay) (es-PY, 2 voices)
- Spanish (El Salvador) (es-SV, 2 voices)
- Spanish (United States) (es-US, 2 voices)
- Spanish (Uruguay) (es-UY, 2 voices)
- Spanish (Venezuela) (es-VE, 2 voices)
- Estonian (Estonia) (et-EE, 2 voices)
- Basque (eu-ES, 2 voices)
- Persian (Iran) (fa-IR, 2 voices)
- Finnish (Finland) (fi-FI, 3 voices)
- Filipino (Philippines) (fil-PH, 2 voices)
- French (Belgium) (fr-BE, 2 voices)
- French (Canada) (fr-CA, 3 voices)
- French (Switzerland) (fr-CH, 2 voices)
- French (France) (fr-FR, 14 voices)
- Irish (Ireland) (ga-IE, 2 voices)
- Galician (gl-ES, 2 voices)
- Gujarati (India) (gu-IN, 2 voices)
- Hebrew (Israel) (he-IL, 2 voices)
- Hindi (India) (hi-IN, 2 voices)
- Croatian (Croatia) (hr-HR, 2 voices)
- Hungarian (Hungary) (hu-HU, 2 voices)
- Armenian (Armenia) (hy-AM, 2 voices)
- Indonesian (Indonesia) (id-ID, 2 voices)
- Icelandic (Iceland) (is-IS, 2 voices)
- Italian (Italy) (it-IT, 15 voices)
- Japanese (Japan) (ja-JP, 7 voices)
- Javanese (Latin, Indonesia) (jv-ID, 2 voices)
- Georgian (Georgia) (ka-GE, 2 voices)
- Kazakh (Kazakhstan) (kk-KZ, 2 voices)
- Khmer (Cambodia) (km-KH, 2 voices)
- Kannada (India) (kn-IN, 2 voices)
- Korean (Korea) (ko-KR, 8 voices)
- Lao (Laos) (lo-LA, 2 voices)
- Lithuanian (Lithuania) (lt-LT, 2 voices)
- Latvian (Latvia) (lv-LV, 2 voices)
- Macedonian (North Macedonia) (mk-MK, 2 voices)
- Malayalam (India) (ml-IN, 2 voices)
- Mongolian (Mongolia) (mn-MN, 2 voices)
- Marathi (India) (mr-IN, 2 voices)
- Malay (Malaysia) (ms-MY, 2 voices)
- Maltese (Malta) (mt-MT, 2 voices)
- Burmese (Myanmar) (my-MM, 2 voices)
- Norwegian Bokmål (Norway) (nb-NO, 3 voices)
- Nepali (Nepal) (ne-NP, 2 voices)
- Dutch (Belgium) (nl-BE, 2 voices)
- Dutch (Netherlands) (nl-NL, 3 voices)
- Polish (Poland) (pl-PL, 3 voices)
- Pashto (Afghanistan) (ps-AF, 2 voices)
- Portuguese (Brazil) (pt-BR, 15 voices)
- Portuguese (Portugal) (pt-PT, 3 voices)
- Romanian (Romania) (ro-RO, 2 voices)
- Russian (Russia) (ru-RU, 3 voices)
- Sinhala (Sri Lanka) (si-LK, 2 voices)
- Slovak (Slovakia) (sk-SK, 2 voices)
- Slovenian (Slovenia) (sl-SI, 2 voices)
- Somali (Somalia) (so-SO, 2 voices)
- Albanian (Albania) (sq-AL, 2 voices)
- Serbian (Latin, Serbia) (sr-Latn-RS, 2 voices)
- Serbian (Cyrillic, Serbia) (sr-RS, 2 voices)
- Sundanese (Indonesia) (su-ID, 2 voices)
- Swedish (Sweden) (sv-SE, 3 voices)
- Swahili (Kenya) (sw-KE, 2 voices)
- Swahili (Tanzania) (sw-TZ, 2 voices)
- Tamil (India) (ta-IN, 2 voices)
- Tamil (Sri Lanka) (ta-LK, 2 voices)
- Tamil (Malaysia) (ta-MY, 2 voices)
- Tamil (Singapore) (ta-SG, 2 voices)
- Telugu (India) (te-IN, 2 voices)
- Thai (Thailand) (th-TH, 3 voices)
- Turkish (Turkey) (tr-TR, 2 voices)
- Ukrainian (Ukraine) (uk-UA, 2 voices)
- Urdu (India) (ur-IN, 2 voices)
- Urdu (Pakistan) (ur-PK, 2 voices)
- Uzbek (Latin, Uzbekistan) (uz-UZ, 2 voices)
- Vietnamese (Vietnam) (vi-VN, 2 voices)
- Chinese (Wu, Simplified) (wuu-CN, 2 voices)
- Chinese (Cantonese, Simplified) (yue-CN, 2 voices)
- Chinese (Mandarin, Simplified) (zh-CN, 21 voices)
- Chinese (Zhongyuan Mandarin Henan, Simplified) (zh-CN-henan, 1 voices)
- Chinese (Northeastern Mandarin, Simplified) (zh-CN-liaoning, 1 voices)
- Chinese (Zhongyuan Mandarin Shaanxi, Simplified) (zh-CN-shaanxi, 1 voices)
- Chinese (Jilu Mandarin, Simplified) (zh-CN-shandong, 1 voices)
- Chinese (Southwestern Mandarin, Simplified) (zh-CN-sichuan, 1 voices)
- Chinese (Cantonese, Traditional) (zh-HK, 3 voices)
- Chinese (Taiwanese Mandarin, Traditional) (zh-TW, 3 voices)
- Speech-to-Textで利用できる言語は?
-
対応言語はこちら
- English, US (en-US)
- Afrikaans (af-ZA)
- Arabic, Gulf (ar-AE)
- Arabic, Modern Standard (ar-SA)
- Chinese, Simplified (zh-CN)
- Chinese, Traditional (zh-TW)
- Danish (da-DK)
- Dutch (nl-NL)
- English, Australian (en-AU)
- English, British (en-GB)
- English, Indian (en-IN)
- English, Irish (en-IE)
- English, New Zealand (en-NZ)
- English, Scottish (en-AB)
- English, South African (en-ZA)
- English, US (en-US)
- English, Welsh (en-WL)
- French (fr-FR)
- French, Canadian (fr-CA)
- Farsi (fa-IR)
- German (de-DE)
- German, Swiss (de-CH)
- Hebrew (he-IL)
- Hindi, Indian (hi-IN)
- Indonesian (id-ID)
- Italian (it-IT)
- Japanese (ja-JP)
- Korean (ko-KR)
- Malay (ms-MY)
- Portuguese (pt-PT)
- Portuguese, Brazilian (pt-BR)
- Russian (ru-RU)
- Spanish (es-ES)
- Spanish, US (es-US)
- Swedish (sv-SE)
- Tamil (ta-IN)
- Telugu (te-IN)
- Thai (th-TH)
- Turkish (tr-TR)
- Vietnamese (vi-VN)
まとめ
AEJuiceの「Voiceover AI」は、プロフェッショナルなナレーションを手軽に実現できる革新的なツールです。
また、音声をテキスト化する事もできるので、字幕の作成に活用する事が出来ます。
テキストからナレーションをよく作成する人は、無料で試用できるので是非一度試してみてください。
- AEJuice Starter Pack
- AEJuice Export GIF
- Sound Effects Free
- AEJuice Toolbar
- Starter Pack VFX
- 2.5D Devices Collection
- Quick Folders
- Copy Ease
- Slides – Beginner Collection
- Shifter
- NeonMind AI
- Voiceover AI
- Free Lens Textures
- Anti-Static ToolBox
- Free VFX Assets
- AEJuice Google Material Icons
- Expressions Pack


コメント