こんばんは、蓬莱です!
このブログも、だいぶ淫夢記事が増えてきましたね。意図せず汚いブログになってしまっているのは残念ですが、自分が興味を持つ話題について胸を張って記事を書けるのは素晴らしいことだと思います(正当化)
さて。淫夢15周年を迎えた現在、その語録の数は優に100を超えます。その中で一番使われている語録は何なのか、皆さんほどの人物なら知りたくなりますよね?
幸いにもシルバーウィークの3連休に恵まれ、きちんとした解析を行うことができました。日本一使われている語録は何なのか? 調査結果をどうぞご覧あれ!
⚠ご注意
この記事は淫夢記事です。ホモ描写が苦手な方は、遠慮なく戻るボタンを連打してください。お願いします、何でもしますから!
検索でたどり着いた人は大丈夫ですが、いつもご愛顧いただいている人は要注意。いつものカジュアルな蓬莱さんの記事ではないですよ!!
調査方法と条件
さっそくですが、調査方法を述べましょう。
統計解析に特化したプログラム言語である、R言語にてデータを収集して分析します。R自体にはTwitterのデータを収集する機能はないので、パッケージに「TwitteR」を使用することにします。
Twitterを参照する意味
なぜTwitterの情報を参照するかと言うと、このツールが世の中をよく表していると思ったからです。現在においてTwitterを利用している人物は7~8割を超え、様々な客層がこのツールを利用しております。
さらに、Twitterは副アカウントが作り放題です。しかも複数アカウントの所持は、公式Twitterでも認めています。Facebookは個人情報を登録しないといけないため、複数アカウントの利用はできませんね。
アカウントを複数持てるので、本アカと裏アカの運営が容易にできます。本アカでは真面目な人物としてツイートし、裏アカでは趣味に突っ走る自分として活動する。よくある光景です。
本当はガンガン語録を使っていきたいけど、友達に淫夢ツイートを見られるのが憚られる…。という時は裏アカウントを作ってツイートすれば安心安全。
このように、人の目を気にせず語録を使うことができるツールがTwitterなのです。本音に近い情報を収集できるということは、情報的にも信頼できるものが得られます。
解析する語録
世の中に語録は腐るほどあるので、すべてを調査するわけにはいきません。
よって、一番使われているのではないかという主観の元、以下の10個のワードについて分析することにしました。
- やりますねぇ!
- はっきりわかんだね
- これもうわかんねぇな
- 〇〇スギィ!
- まぁ多少はね?
- じゃけん
- 何でもしますから!
- 何でもするって
- (迫真)
- 114514
まさに使用頻度トップ10にふさわしいメンツです。
「やりますねぇ!」なんてTwitterではかなり見られます。「何でもしますから!」なんて、淫夢民以外も使いそうなワードですね。
すべてトップに立てるポテンシャルを秘めています!
解析の流れ
クッソきったない解析方法を述べたところで、解析の流れについてお話しします。
さっさと結論を述べろと言われるかもしれませんが、実施した内容をきちんと述べることは論文でも大切なことだから、多少はね?
作成したプログラム
世界一価値のないプログラム(確信)
ご覧の画像が、蓬莱さんが作成したプログラムになります。検索したいワードを入力し、プログラムを流すだけで解析が終了します。
青四角で伏せてある部分は、Twitter APIです。このくだらない解析をするためだけに、開発者アカウントを作成しました。
ホント、ホモは無駄なことに情熱がありますね(小並)
ちなみに、このプログラムを作成するのに以下の記事を参考にしました。これらはTwitter分析でかなり有用なものになりますので、どうぞご参考下さい。
参考記事:RでTwitter検索する方法
期間ごとに回数を出力する
「やりますねぇ」の出力結果
検索ワードに「やりますねぇ」と指定してプログラムを流すと、このようなExcelデータ(csv)が出力されます。
中身を見てみると、きちんと抽出されているようですね(伏せてある部分は、ユーザーIDの部分)。ちなみにRTは省くように設定してあり、生のツイートだけを抽出するようにしてあります。
この一連の抽出方法を使い、ある期間ごとの語録使用数を出します。
今回は1日でどれだけ語録が使われているか計算してみます。期間は9月6日~9月12日の7日間です。
例えば「やりますねぇ!」の場合、以下の様なグラフが描けました。
「やりますねぇ」の解析結果
この結果を見ると、1日に2000回くらいは「やりますねぇ!」と呟かれているようです。
軽く1日に2000回と言っていますが、これは40秒に1回「やりますねぇ!」が使われていることになります。
…この国も行くところまで行ってしまってるようですね。自分は生きやすい世の中になって、ありがたいですが(確信)
解析結果
世の中で最もくさい結果
上記で述べた方法で、10個の語録について分析しました。先ほどの例で示した「やりますねぇ!」が緑色の線になりますが、なんとそれ以上に使われている語録があるのですね。正直かなり驚いています。
さて、目立つ折れ線は赤色です。1日に3500回ほど呟かれている驚異的な語録があることが判明しましたが、一体どの語録でしょうか?
私は「114514」が使用頻度トップと予想します。やはり数字は何にでも適用できますからね。114514年、114514倍、114514点など、汎用性抜群であるからです。
それでは、結果を見てみましょぅ!
1位:(迫真)がトップでした!!
なんと、これはまったく眼中にありませんでした。野獣先輩の並みならぬ語録を抑え、ダントツのトップを取ってしまった「(迫真)」。
やはりどんな文章にでも使えるから、使用率が高いのでしょうね。第2位の「○○スギィ!」も、汎用性が高いゆえに使用率が高かったのでしょう。
他の語録についても、Twitter上で満遍なく使われていることが分かりました。右の表に使用数の日平均と標準偏差を置いておきましたので、ご参考下さい。
なお、(迫真)に関しては、9月11日に外れ値的な結果があります。9月11日の値を平均値や標準偏差に換算してしまうと、ずれた結果になってしまうため、9月11日のデータを除いた平均値と標準偏差を右上の赤字で示しておきます。
最後に
こうして僕のシルバーウィークは終わりました。3連休を無駄にした感は否めませんが、悔いのない休日でしたね。
興味本位で日本一使われている語録を調べてみましたが、どの語録もまんべんなく使われていることに驚きを感じましたね。淫夢は未だ人気に衰え知らずのようです。
淫夢厨である自分も、まだまだ大手を振るって人生を歩んで行けそうですね!(迫真)
解析の補足
記事を締めくくったところで、解析についての補足を入れておきます。
語録の抽出作業では、キーワードの完全一致で行っています。つまり、「はっきりわかんだね」と検索すれば、「はっきり分かんだね」は抽出されません。
よって、こういった変換の違いがあるものは、2つの抽出作業を行い合計しております。以下はそういった作業を行った語録ですので、ご参考下さい。
- 「はっきりわかんだね」「はっきり分かんだね」
- 「これもうわかんねぇな」「これもう分かんねぇな」
- 「スギィ!」「スギィ!」