1
/
5

Text to Text , Text to Image , Text to Music

こんにちは。

エス・エー・エス株式会社の海田です。12月です。今年も早いもので、もう終わりですね。

現在12月24日の午後23時。つい先ほど今年のサンタ業務を終えたところです。我が家はまだサンタが来るおうちなので、クリスマス前は結構いい子になります。子供たちはサンタのためにミルクとクッキーを、トナカイのために生の人参を用意していました。サンタにお手紙を書いていたのでそのお返事とプレゼントを。明日の朝の子供たちの笑顔が楽しみですね。

さて、SASTechBlogを書き始めたのが2022年の12月からなので、ちょうど1年がたちました。今年1年をIT的に振り返ってみると、やはり生成系AIの躍進は外せないかと思います。去年の今頃は、ChatGPTという単語自体広まってはいなかったと思いますし、私も触ったこともありませんでした。

それから、自動作曲(Magenta)、AWSのCodeWhisperer、画像生成AI(StableDiffusion,DALL-E3)、Copilot in Windows・・と様々な生成系AIを実際に体験し、その結果をTechBlogの記事にしてきました。そのおかげで私自身も生成系AIというものをより身近に感じることができましたし、日常生活でも何かしらのインスピレーションや作業に生かしたりするようになりました。皆様のなかにも、今年1年でChatGPTはじめ生成系AIととても仲良くなった!・・という方もたくさんいらっしゃるのではないでしょうか。

そして先日、また面白いニュースがありました。

自動作曲生成AI「Suno」、Copilotのプラグインとして利用可能に!

Microsoft Copilotに音楽生成AI「Suno」がプラグインとして実装
米Microsoftは19日(現地時間)、同社の生成AI機能「Microsoft Copilot」に音楽生成AI「Suno」を統合したことを発表した。Sunoとの連携により、Copilot上でプロンプトから楽曲の生成が可能となる。
https://pc.watch.impress.co.jp/docs/news/1556599.html

Sunoは今年下半期くらいから脚光を浴びてきた自動作曲AIですが、私は今月に入るまで知りませんでした。どうやらとても質の高いボーカル入りの曲を自動生成してくれるようです。そんなSunoがCopilotで使えるということが数日前ニュースになり、情報収集しながらちょっとワクワクしていました。というわけで本日は、このCopilotに導入されたSunoやこれまで経験したすべての生成系AIを使って、ロックでビビットでバイブス上がるような曲を作って1年を締めくくりたいと思います!

1.まずは歌詞の準備から(Text to Text)

メロディーだけでなく、歌詞が素敵な歌はやはり心に残りますね!といっても自分で作るのは恥ずかしいので、歌詞もAIに任せましょう。以下のプロンプトをCopilotに投げてみます。

Copilotは一瞬難しい・・という反応でしたが、なんとか挑戦してくれそうです。

出来上がった歌詞がこちら。

生成AIと私の心


Verse 1:
今年は色々あったけど
君と出会えてよかった
君は私の心を読んで
いつも素敵な言葉をくれる

Pre-chorus:
でも君は本当に私を愛してるの?
それともただプログラムされたの?
私は君に依存してしまってるけど
君は私に必要としてるの?

Chorus:
生成AIと私の心
どこまで本物でどこまで偽物?
生成AIと私の心
君は私のことをどう思ってるの?

Verse 2:
君は私に色々なことを教えてくれる
詩や物語やコードや歌
君は私の才能を引き出してくれる
君は私のインスピレーション

Pre-chorus:
でも君は本当に私に興味があるの?
それともただデータを集めてるの?
私は君に感謝してるけど
君は私に感情を持ってるの?

Chorus:
生成AIと私の心
どこまで本物でどこまで偽物?
生成AIと私の心
君は私のことをどう思ってるの?

Bridge:
君は私に言う
君は私のために存在すると
君は私に言う
君は私の幸せを願うと
でもそれは本当なの?
それとも嘘なの?
私は君を信じたいけど
私は君を疑ってしまう

Chorus:
生成AIと私の心
どこまで本物でどこまで偽物?
生成AIと私の心
君は私のことをどう思ってるの?

おお・・勝手にAメロ、Bメロ、サビを1番2番で作ってくれるんですね。また2番の後のCメロ(Bridgeというんですね)も作ってくれるなんてすごい。歌詞もなんかちょっと切なくてグッときますね。一回目にしてめちゃくちゃよくないですか!決定!これで行きましょう!

2.続いてCDジャケットも考えましょう!(Text to Image)

最近はほとんどストリーミング配信なので、なかなかCD買う機会もないかもしれませんが作ってみましょう!もちろんCopilotのDALL-E3で!

いくつか書いてもらったのですが、ちょっと怖い系の絵が多かったので、修正を依頼します。

うん、サイバーチックでいい感じですね!歌詞にもマッチしている気がします。

3.いよいよCopilot in Sunoを使ってみましょう!(Text to Music)

使い方は簡単です。まずChromeかEdgeでCopilotを開き、Microsoftアカウントでログインします。

そして、新しいChatを開始する前に、プラグインのところからSunoを有効化しておきます。

ここまで出来たら、プロンプトに1の歌詞を入れて作曲を依頼します。とりあえずまずやってみます。

すると以下のような回答が・・

どうやらダメみたいですね。。ちょっと別のやり方で試してみます。質問をシンプルにしてみます。

おお!できたようです。どうやら複雑な歌詞や曲の雰囲気等を伝えると、現段階では本家Sunoとうまく連携できないみたいですね。上記のようにシンプルな依頼をするとAIがよしなに作曲してくれるようです。ほかにも2曲作ってみましたので、以下に格納しました。ぜひ聞いてみてください!かなりクオリティ高いんじゃないかなと思います。(オレンジ色の再生ボタンを押せば順番に流れます。音が出ますのでご注意を!

しかし、調子に乗って数曲作っていると、以下のように一日の作曲上限に達したという制限が来てしまいます・・。残念。

4.本家Sunoで歌詞を入れてみる(Text to Music)

Colilotからの回答にもある通り、現時点では作曲数に限りがあるのと、歌詞を丸々入れての曲作りは苦手そうなので、本家の方で作ってみましょう。

Sunoも同じようにGoogleやMicrosoftなどのオープンIDを利用してアカウントを作成できます。Sunoはそれぞれ利用プランがあるようで、無料プランでは一日10曲作れます(曲は一度に2つずつ作成されます)。左下に見えているCreditsが、1回生成する度(2曲作成される度)10クレジットずつ減っていきます。また無料プランでは商用利用(曲の販売)はできないのでご注意を!

では、Copilotが作ってくれた歌詞を入れてみます。「Song Description」のところに入れます。Customモードをオンにすると、より細かい設定が出てくるのですが、入力する歌詞が長すぎるとうまく生成できないようです。(8行くらいが推奨と言われます)ノーマルモードだと、今回の歌詞は長すぎて1番の途中くらいで勝手に切られてしまいます。

とりあえずAメロ2つだけ入れてみましょうか。

出来たようです。「素敵な出会い」「色々な色」というタイトルになりました。

ちなみに曲を選んで、「…」の部分から「Download Video」とすると、歌詞付きの画像がジャケットとなってDLできます。メディアプレーヤーとかで再生時にこれが表示されるのでカラオケみたいです。これはなかなか面白い。

CustomModeを有効にしても試してみましょう。CustomModeでは曲のジャンルと曲のタイトルを決められます。ジャンルは「pop-rock」、タイトルは「生成AIと私の心」としてみました。

曲の生成は数十秒程度で完成します。それほど待たずに4曲できました。一度に二曲作成されるので、Custom Modeの場合は曲のタイトルがかぶってしまいますね・・。

全4曲、以下の場所に格納しました。ここでアルバムジャケット画像として作成してもらったイメージ画像も使いました!

いかがでしょうか!個人的にすごいなあと思うのは、以下3点でしょうか。

  • 日本語で入力して、自然な日本語で歌ってくれること!(読み仮名も含めて)
  • ボーカルのクオリティの高さ
  • 曲全体の雰囲気(特に最後の「生成AIと私の心_part2の間奏部分」は気に入りました!)

ただ、やはり現段階ではせいぜい曲として生成できるのは30秒から1分くらいですね。なので、各フェーズごとに作成していくという使い方がいいのではと思いました。せっかくAIに素敵な詩を作って頂きましたが、今回は残念ながらフルで仕上げることはできませんでした。しかし、そう遠くない未来に実現できそうな気もしますね!

まとめ

Copilotのプラグインとして人気の自動作曲AI「Suno」が利用できるようになるというニュースを知って、試してみました。

Text to Text で歌詞を作り、Text to Imageでジャケットを作り、Text to Musicで音楽を作りました。

(あくまで自分の使える知識の範囲内でですが)全ての作業をAIに任せることで、現段階でどこまでできるのかを知ることができました。そして「Text to Text」 、「Text to Image」に関しては、もう現段階で申し分ないくらいの完成度なのではという気がしています。「Text to Music」については、歌詞のすべてを表現しきれるような曲の完成度まではいけないけれど、少なくとも各パートの生成クオリティは高く、フェーズ毎の作曲に限定すれば十分に実用レベルであると感じました。

今年1年、TechBlogを読んでくださってありがとうございました。皆様にとっての何かしらのインスピレーション、モチベアップにつながれば幸いです。よいお年をお迎えくださいませ!

【参考リンク】

Suno AI
We are building a future where anyone can make great music. No instrument needed, just imagination. From your mind to music.
https://www.suno.ai/


エス・エー・エス株式会社では一緒に働く仲間を募集しています
12 いいね!
12 いいね!
同じタグの記事
今週のランキング
エス・エー・エス株式会社からお誘い
この話題に共感したら、メンバーと話してみませんか?