PR AI フリ校

フリ校 voicy 2025年6月6日 Googleの無料音声生成AI Gemini Speech Generationがすごい ウミノさん

2024/08/02より金曜日担当はウミノさん

2025年6月6日 Googleの無料音声生成AI Gemini Speech Generationがすごい ウミノさん

Claude4さんにまとめてもらいました


サマリー
・Googleが開発した音声生成AI「Gemini Speech Generation
・非常に自然な日本語音声を無料で作成可能
・ポッドキャスト形式の会話を自分の言葉で指定できる
・Google AI Studio内で利用可能



基本情報
アクセス方法
・Google AI Studioにログイン
・「Generate Media」タブを選択
・「Gemini Speech Generation」機能を選択

利用条件
・Googleアカウントがあれば誰でも無料利用可能
・1日に使えるクレジット制限あり(十分な量は使用可能)
・商用利用も可能



■ 機能の特徴
音声生成モード
シングルスピーカーオーディオ: 1人での音声生成
マルチスピーカーオーディオ: 2人の掛け合い(ポッドキャスト形式)

音声バリエーション
10種類以上の男性・女性の声を用意
プリセット音声から選択(音声クローンは未対応)
日本語の認識精度が高い



■ NotebookLMとの比較
NotebookLM

・読み込んだ内容を自動でポッドキャスト化
内容のコントロールが困難
・スクリプト作成不要

Gemini Speech Generation
一言一句を自分で指定可能
・完全にカスタマイズされた内容
・事前のスクリプト準備が必要



■使用方法・コツ
スクリプト作成
・ChatGPTやGeminiでスクリプトを作成
・LPやWebサイトの内容をコピーして変換依頼
・ポッドキャスト形式に変換してもらう


音声生成のコツ
・漢字の読み方が不自然な場合はひらがなに変更
・「5日間」→「いつかかん」など
・再生成で品質向上が可能



■活用シーン
ビジネス用途
・プレゼンテーション音声
・商品・サービス紹介動画
・教育コンテンツのナレーション
・マーケティング動画の音声

個人利用
・YouTubeコンテンツ制作
・ポッドキャスト番組
・学習教材の作成
・趣味のコンテンツ制作



■注意点・制限事項
現在の制限
音声クローン機能は未対応
プリセット音声のみ利用可能
・1日の使用クレジット制限
・たまに漢字の読み方が不自然

改善方法
・不自然な読み方の場合はひらがな表記に変更
・複数回生成して最適なものを選択
・スクリプトの調整で品質向上



■ メリット・デメリット
メリット
完全無料で高品質な音声生成
・非常に自然な日本語音声
・細かなスクリプト制御が可能
・ポッドキャスト形式の対話生成
・豊富な音声バリエーション

デメリット
・スクリプト作成の手間
・音声クローン未対応
・1日の使用制限
・たまに読み方が不自然




■今後の展望
期待される機能
・音声クローン機能の追加
・より多様な音声バリエーション
・使用制限の緩和
・日本語読み上げ精度の向上



■まとめ
重要ポイント
・Google AI Studioの無料音声生成AI
・商用レベルの高品質な日本語音声
・ポッドキャスト形式の掛け合いが可能
・スクリプトの完全制御が可能



■おすすめする理由
・無料でありながら高品質
・操作が簡単で初心者でも使いやすい
・ビジネスから個人利用まで幅広く活用可能
・AI活用の第一歩として最適



■始め方
1.Google AI Studioにアクセス
2.Generate Mediaタブを選択
3.Gemini Speech Generationを試す
4.まずは簡単なスクリプトで体験


Googleの無料音声生成AI Gemini Speech Generationがすごい
ありがとうございます!

NotebookLMに続き、
Gemini Speech Generationも圧倒的な性能ですね。
分かりやすい比較もありがとうございます。

本当にAIの進化が速すぎて、
一週間前の放送内容がもう古く感じてしまうほどです。
きっとまた新しいツールが出てるんでしょうね(笑)

地道にコツコツ自分のペースで取り組んでいきます。
いつも最新情報を教えてくださって、ありがとうございます!

「フリ校ボイシー金曜日まとめ2025」
「フリ校ボイシー金曜日まとめ2024」
「フリ校ボイシー金曜日まとめ2023」もどうぞー


-AI, フリ校