1
/
5
This page is intended for users in Japan. Go to the page for users in United States.

<UUUMプロダクト一問一答!vol.5>【膨大なデータ量×UUUMならではの指標】YouTubeデータ解析システム「raptor」とは?

実はなかなか知られていないUUUMの開発部門「システムユニット」。 新しいプロジェクトの立ち上げを進めながら、社内にある約20個のプロダクトを日々運用 している同ユニットの、知られざる開発事情を連載で大公開! いよいよ5つ目のプロダクト紹介となる今回は、膨大なデータ処理を行うYouTubeチャンネルの解析システムraptor(ラプター)についてお伺いしました!

▼本日お話を伺ったのはこちらのお二人

中橋 研太郎(左)システムユニット グループリーダー
志田 みずほ(右)システムユニット PM

YouTubeチャンネルのデータ解析システム「raptor」

ーraptor(ラプター)とは、どのようなシステムですか?

志田)raptorはYouTubeのデータを分析・検索ができるシステムです。

通常、クリエイター本人や担当のバディ※は、YouTubeが提供しているアナリティクス画面を通じて、動画の視聴時間や視聴者の年齢層、性別など細かいデータを確認しています。ただ、このデータは特定のメンバーしか見ることが出来ないため、raptorではYouTube側から提供されているAPIを使用して社内全体でこれらのデータを見ることが出来るようにしています。

中橋)再生回数の着地予測など、raptorではYouTubeのアナリティクス内で見ることのできない指標を見れるようにしています。

また、アナリティクス内ではUUUMに所属しているクリエイターのチャンネル情報しか見れないのですが、raptor内ではシステムが把握しているYouTubeチャンネル界隈の全体の傾向や、UUUMに所属してないクリエイターのチャンネル分析も可能です。

※バディ:クリエイターの活動サポートやマネジメント業務を行うメンバー

志田)特定のチャンネルを登録しておけるマイリストという機能も持たせており、登録してあるチャンネル同士のデータ比較や、全体数の把握が出来るようになっています。これはチームで複数のYouTubeチャンネルを担当していることが多い弊社のマネジメントに寄り添っている機能です。

ー他の社内システムとの違いは何ですか?

中橋)たくさんデータを扱わなくてはいけないのと、元の情報が業務をしていると自然とたまるものではなく、YouTubeからAPIを使用してクローリングしているので、アーキテクチャという意味ではその他のシステムとはかなり異なります。

APIを使用してデータを持ってくるところは、基本的に並列処理が得意なGo言語を使って、同時平行で処理するのに適した設計になっています。そのデータは他の社内システムの場合は通常のMySQLに入れるのですが、raptorは一旦ビックデータを入れるためのデータストアであるBigQueryに入れています。

その後、社内でデータ解析がしやすい形にしたものを、MySQLに入れ直して社内で使用しています。そちらのフレームワークはRuby on Railsです。

ー実際にデータを分析することはありますか?

志田)分析チームが別であるので、raptorチームが分析することはないです。

中橋)データ解析ツールという言い方をすると、Tableauや回帰分析ができるように聞こえてしまうかもしれないですが、意味合いとしては可視化ツールに近いです。

データをたくさんためて、それを見やすい形で提供するというのが主で、例えば指標同士の相関関係などを調べたい場合は、データをエクスポートしてスプレッドシートや分析に使いやすいツールを使って分析をしてもらいます。

志田)raptorとしては、分析のためにほしいとオーダーがあったデータのうち、APIから取得できたり、取得できる数値から計算して出せるものを見やすい形で可視化して実装しています。

膨大なデータを扱うためのインフラ対策

ーraptor開発で特に注力されている点はありますか?

志田)他のシステムと比較すると社内の多くの方が使用するので、どなたでも使いやすくなるように気を遣っていますね。

中橋)raptorの場合、社内ツールですがUI・UXもデザイナーと一緒に作っています。検索できるパラメーターもがとても多いので、使いやすくする努力をしています。

また、開発に注力するっていう意味ですと、使うデータがBigQueryの状態では当然多いのですが、MySQLにコピーしてきた後もかなりデータが膨大です。検索するときにはElasticsearchを使っていますが、そこに格納するデータもすごく大きいので、インフラ構築の難易度は高いですね。

ー具体的にどのような対策を取られているんですか?

Railsから検索できる項目のデータが、本当に全てYouTube界にあるもので把握できるものを入れると、データ量が多すぎて難しいところがあるので、社内的によく使われるデータ範囲に絞ってMySQLの中に入れています。要らなくなったデータは取りあえず手元のデータベースからは削除して、社内のよく使っている分だけ残していますね。

また、インフラ自体のスケールアップは当然必要です。データベースの冗長化を他のシステムより行っていますし、リードレプリカを使用して割と大規模インフラのような構築をしています。

ーraptorを開発していて面白いと感じる点を教えてください!

志田)やはりクリエイターの方によって出てくる数字が全然違うので、その数字が見えることが面白いなと思います。あとは他のプロダクトの場合は、営業メンバーと会話する機会がほとんどないので、営業視点で見ている数字や使い方を知ることができるのは新鮮ですね。

中橋)技術的にいうと単純にデータを見せるだけという範囲では、割と典型的なウェブアプリの部分が多いのですが、raptorはビックデータを扱いますし、クローリングはGo言語を使っているので、技術的な面白さは結構あるのかなと思います。

また、UUUMというマルチチャンネルネットワーク(MCN)に加入してもらっているクリエイターだから取れるデータがあったりもします。そういったデータを直接呼び出して蓄積できる環境、なおかつこれだけ大規模なものはUUUM特有だと思うので、本当にUUUMならではのプロダクトだなというのは技術的にも感じるところです。

社内データの中でも、重要な位置にあるシステム

ー最後に、今後raptorが目指す方向性についてお聞かせください!

志田)raptor自体はクリエイターの成長をプロダクトで支えるということを主目的としていますので、その大きな目的に向かって日々開発をしていきたいと思います。

中橋)現在、システムユニット内のデータ分析チームが、会社全体と連携をしながらYouTubeやTwitter、Instagram、グッズの売上など、様々なデータを組み合わせてどのような行動がエンゲージメントに結びつくか等の分析をする動きがあります。その際にraptorが蓄積しているデータがかなり役に立ちます。社内でデータを扱うための重要な位置に、このシステムはいると感じています。

UUUM株式会社では一緒に働く仲間を募集しています
5 いいね!
5 いいね!
同じタグの記事
今週のランキング