コラム更新日:2026.03.16

生成 AI「Gemini」で、音楽生成が可能となりました。これまでのテキストや画像、動画などの生成に加え、「歌」を含む音楽制作がチャット画面から手軽に行えるようになっています。言葉でイメージを伝える、画像をアップロードするなど、音楽の専門知識なしにオリジナル曲の作成が可能です。

しかし、企業がビジネスで利用するには、セキュリティや著作権といった注意点も存在します。今回は、Gemini における音楽生成の基本や実際の生成手順、ビジネスで安全に活用するうえでの注意点などを網羅してご紹介します。

▼ビジネス向け Google Workspace の生成 AI Gemini なら、安全に 全社活用を目指せます。

\ Gemini 活用について相談無料! /

今すぐ相談する
TSクラウドロゴ

執筆・監修:TSクラウド編集部

Google Cloud の「プレミア認定」を保有する、Google Workspace 正規販売代理店です。業界歴 17 年、延べ 3,500 社以上の導入支援実績( 2026 年 2 月時点)に基づき、Google Workspace の最新機能から活用術、DX推進に役立つノウハウを専門的な視点で解説しています。

※情報は記事公開(更新)時のものです。Google Workspace の仕様や価格は変更される場合があるため、最新情報は必ず公式ページでご確認ください。

目次

Gemini で音楽生成ができる。音楽生成機能 Lyria 3 の実力

Gemini に音楽生成モデルが統合され、誰でも簡単に音楽を生成できるようになりました。テキストと画像などを使ったプロンプトによって、 ボーカル・楽器・歌詞で構成される曲を生成します。対応する音楽ジャンルは幅広く、日本語でも利用可能です。

Lyria 3 でできること

Gemini の音楽生成を支えているのは、音楽生成モデル「Lyria 3(リリア・スリー)」です。驚くことに、Lyria 3 では単なるメロディだけでなく、歌詞の文脈に合わせた歌声の感情表現や、楽器のアレンジなども再現可能です。生成される音声は、従来の AI 音楽に見られた特有のノイズや不自然な音の歪みが低減され、人間の声に近くなるなど、実用に耐えうる品質が保たれていることが特長です。

ボーカル付きの「30秒トラック」を自動生成

Gemini は、ボーカルを含めた最大 30 秒の音楽を生成します。ユーザーがプロンプトを入力すると、 AI がその内容に基づいて歌詞を作成し、メロディとともに歌い上げます。日本語をはじめ、英語やフランス語など複数の言語に対応しており、日本語のプロンプトで曲をつくることが可能です。

音声ファイル・カバーアート付きの動画をセットで共有

生成された音楽には、Google の画像生成 AI である「Nano Banana」によって作成されたカバーアートが自動的に付加されます。以下の 2 種類が同時に生成されますが、それぞれ個別にダウンロード可能です。

  • 音声だけのファイル(MP3 形式)
  • カバーアート付きの動画ファイル(MP4 形式)

ファイルを Google ドライブ に保存すれば、ファイルを共有して、他のユーザーに聴いてもらうこともできます。

日本語プロンプトや画像・動画からも直感的に生成

上述のとおり日本語に対応しているため、日常的な言葉で「明るいポップな感じ」「踊れるようなアップテンポで」「ギターの演奏」などとプロンプトに入力するだけで、音楽の専門知識なしに音楽を生成できます。対応している言語の範囲内で、外国語の歌詞で曲をつくることも可能です。

テキストだけでなく、画像や動画をアップロードして、「この写真に合う BGM をつくって」といった指示でも生成可能です。たとえば、自社商品の写真や動画を読み込ませると、AI が自動でその雰囲気を読み取って、歌詞とメロディを作成してくれます。Gemini の画像生成モデル「Nano Banana」で画像を生成し、その生成画像から音楽をつくることも可能です。言葉で説明するのが難しい場合でも、視覚的なイメージをそのまま音へと変換できる点が大きな強みです。

【実践】仕事で使える Gemini 音楽生成の活用アイデア

30 秒という短さは、ちょっとした効果音として利用しやすいと考えられます。ビジネスでは、以下のようなシーンが挙げられます。

  • SNS 動画の BGM:Instagram リールや TikTok など、自社プロモーション用ショート動画にオリジナルソングを付ける
  • 社内研修や動画マニュアルのイントロ:解説動画の導入部分に、集中力を高めるような曲を挿入する
  • 展示会ブースのループ再生:ブース内で流すことで、来場者の耳を惹きつける演出となる
  • 社内行事の効果音:新人の歓迎や社内の表彰式など、イメージに合わせた曲をつくり効果音として使用する など

Gemini の音楽生成は、誰でも短時間で「それらしい」音楽をつくれるのがメリット。本格的な楽曲制作は専門ツール(あるいは外注)で行い、ビジネスの現場における「ちょっとした演出」には Gemini を使うなど、使い分けるとよいでしょう。

Gemini で音楽を生成する方法

ここでは音楽の生成方法を、操作画面の画像つきで解説します。

【操作画面】音楽生成の手順

1.Gemini を開く

Gemini アプリまたはウェブ上で Gemini を開き、プロンプト入力欄の下部から「音楽を作成」を選択します。このとき、「リミックスするトラックを選択する」が表示されるので、任意で選択します。(トラックの選択については、このあと解説します)

2.プロンプト入力・画像ファイルを追加

通常のプロンプトのように、作成したい曲のテーマや雰囲気、出力する言語などを入力します。入力を始めると、自動でプロンプト候補が表示され、好みのものをクリックすれば入力欄に反映されます。

以下はプロンプトの例です。

例①:SNS ショート動画の BGM

一つの製品が完成していく様子に合わせた、組み立て工程のタイムラプスに合う BGM を作成して。ジャンルはモダンなアップテンポ。リズムに乗って作業が進むイメージで、クリアで知的な印象を与えるビート。

【ポイント】明るくポジティブな印象で、形のないものから製品が組み上がっていく、高揚感を演出します。

例②:展示会の自社ブースでループ再生

展示会ブースで流す、信頼感と先進性を感じる BGM を作成して。ピアノのメロディがメイン、歌詞はなし。雑踏の中でも耳に留まりやすく、清潔感のある雰囲気で。

【ポイント】自社ブランドを音に変換するイメージ。聴き疲れしない、説明の邪魔にならない安定感を重視します。

例③:研修の動画資料・マニュアルの導入部

社内研修動画のオープニング曲を作成して。ジャンルはシネマティックなオーケストラ風。最初は静かに始まり、後半に向けて少しずつ盛り上がる構成。ポジティブでやる気が出るような雰囲気にして。

【ポイント】「最初は静かに、後半に盛り上がる」といった構成の指示を出し、「これから始まる」という期待感と、集中を促す適度な緊張感のある曲をつくります。

画像や動画に合う音楽を生成したい場合は、ここで基になるファイルを追加します。Gemini が画像を読み取り、画像をイメージした音楽を生成できます。

3.生成

生成ボタンをクリックすると、音楽が生成され、Gemini 上の再生ボタンで確認できます。右上にダウンロードアイコンがあり、「音声のみ」または「動画(カバーアート付きの音声)」で、それぞれ保存可能です。

4.修正(新規作成)

曲が途中で切れているような終わり方だったり、言語の指定を忘れていたり、イメージと違うなど、一度でイメージ通りの曲ができるとは限りません。修正機能は発展途上で、一度生成した特定の曲のメロディだけを後から変えるといった「部分的な修正」は難しいため、「新規作成」でプロンプトを調整するとよいでしょう。

リミックスするトラックを選択する

音楽生成の画面上で、「リミックスするトラックを選択」できます。曲のベースとなるジャンルや雰囲気を指定する機能で、既存の楽曲を再編集するものではありません。「ラテンポップ」「8 ビット」「シネマティック」などからイメージに合うものを選べば、プロンプトで細かく指示しなくても、選択したスタイルに沿った高品質な生成が可能です。

トラック(音楽ジャンル)を選択すると、音楽スタイルが固定されます。たとえば「ワークアウト」を選ぶと、プロンプトで「スローな曲」と指示を出しても、ワークアウトに合うようなアップテンポの曲が生成されます。

理想の曲を作る「プロンプト」のコツ

よりイメージに近い音楽を生成するには、プロンプトでさまざまな要素を組み合わせるのがコツです。以下は、プロンプトの一例です。

  • ジャンルや時代:「90 年代」「カントリー調」「ラテン系」、複数を組み合わせることも可能
  • テンポとリズム:「スローなバラード」「BPM 100~120」「踊れる曲」
  • 楽器:ピアノ、ギターの旋律、サックスのソロ
  • ボーカル:声の質感や性別を指定、「ハスキーな女性」「ソフトな男性」「ベテランのロッカー」
  • 歌詞:具体的なキーワードで内容を指定する

プロンプトに画像ファイルを追加した場合は、Gemini が画像を読み取り、画像に関する言葉を含めた歌詞を生成することがあります。

AI ツールを利用する企業が知っておくべきリスクと注意点

生成 AI による音楽生成の業務利用においては、情報管理や権利関係について慎重な判断が求められます。

入力したデータが AI の学習に利用されるリスク

一般的な無料の AI ツールでは、入力したプロンプトやアップロードしたデータが、 AI の学習に利用されるリスクがあります。学習されたデータが他者の回答として出力される可能性を否定できず、音楽生成においても、プロンプトに独自の歌詞を入力する、未発表商品の画像をアップロードするなどは、意図しない情報漏洩となりかねません。

▼Gemini に学習させない設定や、企業が安全に AI を活用する方法は、こちらで詳しく解説しています。

他者の権利侵害やポリシー違反のリスク

プロンプトに特定のアーティスト名を入れて「○○風の曲を作って」と指示することは、意図的な模倣にあたります。声の質や歌い方といった要素は、その人自身が持つ商業的価値であり、これを無断で真似るような使い方は、本人から抗議を受けるだけでなく、企業の社会的信用を大きく損なうリスクを伴います。

多くの AI ツールでは、著名人の名前を入力することを制限しており、実在するアーティスト名や曲を指定すると生成を拒否されることがあります。こうした制限を回避して生成を試みる行為自体がポリシー違反にあたります。

生成した音楽は商用利用できるのか?

Google は、生成した音楽の商用利用を禁止していないため、利用自体は可能です。ただし、一般的に「AI が自動で作成した生成物には著作権が発生しない」と解釈されているため、権利保護の観点から生成した音源の販売などはおすすめできません。また、他社が同じ音楽を使っていても、著作権を根拠に使用を差し止めるのは困難です。

Google は生成物について、「SynthID」という電子透かし技術を使用しています。音楽の生成では、人間の耳には聞こえない信号を音声データに埋め込み、「AI によって自動で生成された音楽」と識別できる仕組みとなっています。注意が必要なのは、この技術はあくまでも「AI がつくったものであることを明確にする」もので、企業の法的責任を免除するものではない点です。偶然にも生成した音楽が既存の曲と酷似しており、著作権トラブルに発展した場合、最終的な責任は Google ではなく利用した企業が負うことになります。

商用利用を考えるなら、最新の Google 利用規約や法令解釈などに注意し、公開前に既存曲との類似性がないかチェックするなど、慎重な運用をご検討ください。

Google Vids は BGM 付き動画制作が可能

現在、Gemini による音楽生成は 30 秒制限など発展途上な部分もありますが、 Google Workspace の動画アプリ「Google Vids」を活用すれば、無料のストックメディア(動画クリップ、画像、音楽、効果音などの素材)を使用できます。AI が動画の内容を分析し、適した音楽を自動で選んでくれるので、担当者は選曲に悩むことなく、短時間で動画を作成できます。Google Workspace の強固なセキュリティ環境で作業するため、外部の AI ツールに情報を渡すことなく、安全に動画制作が完了するのもポイントです。

▼Google Vids については、こちらで詳しく紹介しています。

Gemini の音楽生成でビジネスシーンに彩りを

Gemini による音楽生成は、専門スキルや予算を必要とせず、直感的にオリジナル楽曲を生成できます。プレゼン資料に高揚感を加える、SNS 動画のブランドイメージを独自の楽曲で彩るといったことで、コミュニケーションの質を高める効果が期待できます。

一方で、ビジネスで利用する上では、セキュリティ設定や著作権といったコンプライアンスの遵守が不可欠です。Google Workspace の Gemini や Google Vids を活用することで、リスクをコントロールしながら、安心して新しい表現に挑戦できます。新しい手段として Gemini の音楽生成を活用して、自社のビジネスに新しい価値をプラスしていきましょう。

もっと読む