関連度について
2009年11 月 4日 (水) ブログクチコミレター
ブログクチコミサーチのユーザー向けに発行されたメールマガジンのバックナンバーです。
※ 仕様変更により、原文と内容が変更している場合がございます。
――――――――――――――――――――
ブログクチコミサーチといえばグラフと関連語表ですが、関連語表のランキングは2つの指標で切り替えられることをご存知ですか?
2つの指標とは「頻度」と「関連度」です。今回は、皆様から質問の多いこの違いについて説明します。他社にはない、話題の変化を知るには欠かせない機能です。ぜひご一読ください。

※「関連語」とは検索語の近くに書かれている言葉のことです。ブログクチコミサーチでは検索語を含む前後2文、計5文の中に書かれている言葉を解析の対象としています
―――――――――――――――――――――――――――――――――――
■頻度とは、
実際にその時期に検索語とともにその関連語が何回語られたかその回数を示しています。1つのブログの中に複数回、同じ言葉が書かれている場合、複数回カウントします。
■関連度とは、
独自のアルゴリズムで算出しており、検索語とのつながりの強さをスコアにしたものとなります。
実際は複雑な数式となっていますので考え方を単純化して説明しますと、関連語の「ブログ全体での出現頻度」と検索の期間において「検索語と一緒に出現する頻度」の割合から算出しています。
つまり、「検索語と一緒に出現する頻度」が高い言葉でも、「ブログ全体での出現頻度」も高い場合には、検索語とのつながりは弱いと判定します。
逆に「検索語と一緒に出現する頻度」が低い言葉でも「ブログ全体での出現頻度」が低い場合には、検索語とのつながりが強いと判定されます。
―――――――――――――――
●具体例で解説してみます。
―――――――――――――――
「携帯電話」と検索します。関連語として出てくる中の「メール」と「iPhone」に着目して説明します。
頻度順で見てみると、「メール」が1位となり、「iPhone」は10位以下となってしまいます。しかし関連度順でみてみると「iPhone」が上位に入ってきます。
これはどういうことか?というと、
例えば
「iPhone」が「携帯電話」と一緒に書かれた数を 500とします。また、「メール」が「携帯電話」と一緒に書かれた件数を 5,000とします。
頻度順で見てみると5,000 > 500 ですので、「メール」が「iPhone」よりも上位に来ます。
次に、関連度順です。
「メール」という言葉は、「携帯電話」以外の言葉とも多く書かれています。
過去に書かれた総頻度を50万回とすると、この時期に「携帯電話」と一緒に書かれた回数の割合は 5,000/500,000 で1% となります。
「iPhone」は?というと、ここ2、3年でかかれ始めた言葉ですので、過去に書かれた回数は少ないです。この回数を1万回とすると、この時期に「携帯電話」と一緒に書かれた回数の割合は 500/10,000 で5%となります。
1% < 5% ということで、「iPhone」のほうが関連度が高いということとなります。
※ここでは、わかりやすく説明するために単純な数字を使っています。
実際はもっと複雑な式になっていますが、考え方は同じです。
―――――――――――――――
● 要するに・・・
―――――――――――――――
頻度順では一般的な言葉がランクインし、関連度順では珍しい言葉がランクインすることになります。
■ 頻度のランキングは、書かれた数が多い順ですので、変化はあまりありませんが納得感のあるランキングとなります。
■ 逆に、関連度ランキングでは、特徴的な言葉を見ることが出来、時系列で見ていくことで、話題の変化をつかむことが出来ます。他社にはないサービスの一つとなります。
この2つのランキングには上記のような特徴があります。リサーチの目的で使いわけてみてください。
kizasi Marketing PLUSのTwitterをフォローする
コメント