Youtube要約

YouTubeの動画のコメントからword cloudを作成するAPIになります。

そして動画の単語とコメント欄の単語同士で類似度計算を行い,類似度の高い単語10個を出力します。

Youtube要約

※ここにword cloudが表示されます。読み込みに数十秒かかります。

頻出単語(頻出順)

類似度

使い方

  • STEP1

    STEP1

    YouTubeのURLを入力します。
    (https://youtube.com/watch?v=~~~
    の形であること, &t=が最後についているとエラーを起こします)

  • STEP2

    STEP2

    「要約する」のボタンを押します。そうするとword cloudが表示されます。同時に頻出単語が10個出力されます。

  • STEP3

    STEP3

    10単語から1個選択します。

  • STEP4

    STEP4

    選択した単語と類似度が高い単語10個と類似度が出力されます。

入力例

  • 入力例

    入力例

    今回はGReeeeNの「たけてん」という歌のMVを使いました。

  • 出力例

    出力例

    「要約する」ボタンを押すと、下の画像とコメント欄でよく使われている名詞(10単語)が出力されました。

入力例

word cloudに明石家という単語があるため,このMVがさんまさんにかかわるものであることがわかります。
加えて笑顔がテーマであることも頻出単語よりわかります。

そして,「ふみや」「莉子」など名前が多いこともわかります。
この2人はMVに出演してる俳優になります。
よって,この2人に注目してMVを見ている人が多いことがわかります。

10単語のうちから1つ類似度計算がしたい単語を選択します。
すると選択した単語と類似度が高い単語を出力してくれます。今回は「歌詞」を選択したいと思います。

「歌詞」と類似度が高い単語と類似度↓
漁港:0.22
全部:0.22
感動:0.21
永瀬:0.18
出演:0.18
エピそ―ド:0.17
from:0.17
ふみ:0.16
俳優:0.14
セレナーデ:0.14

1番目に類似度の高い「漁港」はこの歌が映画「漁港の肉子ちゃん」の歌だからです。
3番目に高い単語が「感動」でした。よって「たけてん」の歌詞は感動する歌詞であることがわかります。

解説

YouTube API を使って動画のコメントをすべて取得しています。コメントから名詞のみを抽出してword cloudを作成しました。同時にコメントの名詞からword2vecモデルを作成します。そのモデルを使って単語の類似度計算をします。word cloudと類似度の高い単語を見ることで動画の概要を理解することができると考えました。

応用

コメントから動画を見ている層の分析などが可能です。その分析を用いてターゲット層が多い動画に広告を出すことができます。

関連項目