Kakaoマップで飲食店を選ぶとき、最初に見るのは星評価だ。評価4.8にレビュー500件あれば、ほとんどの消費者は疑いなく訪問を決める。

Naverは2023年に飲食店の星評価を廃止した。Kakaoも決済認証や現地写真認証制度を導入していることを見ると、どのプラットフォームも星評価の限界を認識していると言える。

では、Kakaoマップの星評価は実際どれほど正確なのだろうか。ソウル・京畿の84,736店に寄せられた175万件のレビューを全数分析し、星評価の信頼性を検証してみた。

1

Kakao評価4.8以上、その98.9%がグルメ店に分類された

分析では「Goldレビュアー」という概念を導入した。Kakaoマップで50件以上のレビューを書き、平均星評価が2.5〜4.2点のレビュアー、つまり甘すぎず厳しすぎない、バランスの取れた評価者たちだ。このGoldレビュアーを中心に、全レビュアーへ信頼度の重み付けを行い、加重ポジティブ率を算出した。75%以上ならグルメ店、50%以上なら悪くない、30%未満なら注意に分類される。

Kakao評価4.8以上の店8,248店をこの基準で判定した結果、98.9%がグルメ店に分類されることが分かった。「悪くない」は1.1%、「普通」以下は0.02%にすぎなかった。満点5.0の店2,995店はすべてグルメ店だった。

98.9%
Kakao評価4.8以上の店のうち「グルメ店」判定の割合
Chart 1
Kakao高評価店の実際の判定分布
加重ポジティブ率ベースの判定 · 判定不可を除外 · 69,069店
グルメ店 (75%+) 悪くない 普通 注意 4.5+ 4.8+ 5.0 91.1% 8.5% 98.9% 100% 0.39% 0.02% 0%
右側の数値:「普通+注意」を合算した失望率。Kakao評価が4.5を超えるだけでも、失望する確率は0.39%にすぎないことが分かった。

Kakao評価4.5以上を選んだとき、「普通」以下の判定が出る確率は0.39%。4.8なら0.02%まで下がる。数字だけ見れば、Kakaoの星評価はかなり正確だと言える。

では、星評価の嘘は存在しないのだろうか。データをもう一段深く見ると、話は変わってくる。問題は星評価そのものではなく、その星評価を構成するレビュアーの質にあった。

2

レビュー500件より、Goldレビュアー数が正確性を左右する

一般的には、レビューが多いほど星評価は正確だと考えられている。500件なら30件より信頼できる、という直感だ。しかしデータは別の様相を示す。

Kakaoの星評価と加重分析スコアの差が0.5点を超える割合、つまり「星評価誤差率」を、レビュー数ではなくGoldレビュアー数で分類して比較した。

Chart 2 — 核心
Goldレビュアー数別の星評価誤差率
Kakao星評価と加重分析スコアの差が0.5点以上の割合
0% 10% 20% 30% 40% 0.5点以上の誤差割合 Gold 0人 4,474店 33.6% Gold 1–2人 16,918店 30.0% Gold 3–4人 15,486店 21.6% Gold 5–9人 21,141店 15.7% Gold 10–19人 6,408店 7.4% Gold 20人+ 4,642店 1.4% Goldがなければ3店に1店は不正確 Gold 20人+ → 誤差1.4%
Goldレビュアーが0人だと、3店に1店でKakaoの星評価が0.5点以上ずれる。20人以上なら誤差率は1.4%に収束する。
33.6%
Gold 0人のとき
星評価誤差率
1.4%
Gold 20人+ のとき
星評価誤差率

Goldレビュアーが1人もいない店では、3店に1店(33.6%)でKakaoの星評価が実態と0.5点以上ずれていることが分かった。一方、Goldが20人以上いる店では、その割合は1.4%まで下がった。星評価の正確性を決めるのはレビューの量ではなく、レビュアーの質であることを定量的に示す結果だ。

実際、レビューが500件あってもGoldレビュアーが1〜2人しかいない店は星評価の信頼性が低く、レビューが50件でもGoldが10人以上いれば誤差率が顕著に低いことが確認された。

3

「クリーン」な店は、むしろKakaoが過小評価している

分析では、星評価の水増しレベルを3段階に分類する。識別力のないレビューの割合が40%を超えるか、Kakaoの星評価と加重スコアの差が0.5点を超えれば「注意」、20%/0.3点なら「疑い」、それ以外は「クリーン」だ。

注目すべきなのは、「クリーン」等級の店のデータである。

Chart 3
バブル等級別のKakao星評価の歪みと失望率
Kakao−加重スコアのギャップ + 「普通+注意」判定の割合
等級 Kakao−加重スコアのギャップ 普通+注意の割合 店数 クリーン 正常 −0.39 19.0% 39,743 疑い 軽微 −0.15 15.5% 20,823 注意 深刻 +0.48 55.0% 8,503 「クリーン」な店では、Kakaoの星評価は実際よりむしろ0.39点低い。 「注意」等級では+0.48点の過大評価、普通以下の割合は55%。

「クリーン」等級の店では、Kakaoの星評価は加重分析スコアより0.39点低いことが分かった。厳しいレビュアーたちの評価のほうが、むしろKakao平均より高かったわけだ。Kakao評価3.9の「クリーン」な店が、実際には4.3レベルである可能性があるという意味だ。

一方、「注意」等級ではKakaoが0.48点過大評価されており、「普通+注意」判定の割合は55%に達した。同じKakao評価4.3でも、バブル等級によって実態はまったく異なるのだ。

4

Kakao評価4.5なのに、実際は1.38の店が存在する

Kakao評価4.0以上でありながら、「普通」以下の判定を受けた店は772店だった。これらの店について、Kakaoの星評価と加重分析スコアの差を判定別に分けてみると、一貫したパターンが浮かび上がる。

Chart 4
判定別のKakao水増し度とGoldレビュアー数
Kakao 4.0+ の店 · 判定不可を除外
判定 Kakao vs 加重スコアのギャップ 平均Gold数 店数 グルメ店 −0.07 6.1人 26,009 悪くない +0.08 7.7人 10,492 普通 +1.10 2.8人 712 注意 +1.32 1.7人 60 「普通」/「注意」判定の店のGold数平均は1.7〜2.8人。グルメ店の半分にも満たない。

グルメ店判定の店は、Kakaoの星評価と加重スコアの差が−0.07点で、事実上ほぼ同じ水準だった。「悪くない」も+0.08点で誤差範囲内にある。

一方、「普通」判定の店ではKakaoが1.1点過大評価されており、「注意」判定では1.32点過大評価となった。Kakao評価4.2の店が、実際には2.9レベルという意味だ。これらの店の共通点は、Goldレビュアーが平均1.7〜2.8人と、ほとんどいないことだった。

具体的な事例を見ると、このパターンはさらに鮮明に表れる。

店名 Kakao 加重スコア ギャップ Gold 判定
양*** 삼성역점 4.5 1.38 +3.12 1人 普通
남****** 양주덕계점 4.6 2.24 +2.36 1人 普通
바******* 별가람역점 4.6 2.67 +1.93 3人 普通
당**** 신촌점 4.6 3.14 +1.46 5人 普通
판** 수내직영점 4.5 3.33 +1.17 2人 普通

양*** 삼성역점のケースでは、Kakao評価は4.5だが、加重分析スコアは1.38で、3.12点の乖離があった。Goldレビュアーは1人にすぎなかった。판** 수내직영점はレビュー573件とデータ量は十分だが、Goldは2人しかいなかった。レビュー数が多くても、信頼できるレビュアーが不在なら、星評価の意味は薄れてしまうのだ。

「普通」以下の判定を受けた772店の共通点は明確だ。平均Goldレビュアー2.4人、Kakao評価の過大評価幅は+1.1点。星評価を検証するバランスの取れた評価者が不在であるという、構造的な問題を示している。

5

星評価より、星評価を作る人の構成が重要だ

Kakaoの星評価そのものが嘘をついているわけではないことが確認された。問題は、すべてのレビューが平等に星評価へ反映されるという構造にある。レビュー3件の初心者ユーザーと、200件以上のレビューを書いた経験豊富なレビュアーの星評価が、同じ重みで平均に反映されているのだ。

Naverが星評価を廃止したことも、Kakaoが決済認証や現地写真認証を導入したことも、同じ問題意識から出発したように見える。星評価そのものより、星評価を構成するレビュアーの質を評価するメカニズムが不在である点こそが、核心的な限界なのだ。

グルメ店選びの実践チェックリスト

バブル等級「クリーン」 + Gold 5人以上
Kakaoの星評価がむしろ過小評価されている区間。評価3.9でも、実際は4.3レベルの可能性がある。
バブル等級「疑い」または Gold 3人未満
加重ポジティブ率もあわせて確認。レビュー数よりGold数を見るほうがよい。
バブル等級「注意」
Kakaoの星評価から0.5点引いて判断したい。この区間の55%が「普通」以下だった。

175万件分析の結論は明確だ。Kakao評価4.8は、ほぼ常に正確だった。嘘が生じていたのは星評価の数字そのものではなく、Goldレビュアーがいないのに星評価だけ高い店だった。

消費者の立場では、星評価の数字そのものよりも、その数字を作り出したレビュアーの構成をあわせて確認することが重要だ。レビュー数を数える代わりに、経験豊富でバランスの取れたレビュアーが何人いるのかを見ることが、星評価の嘘を避ける最も現実的な方法になりうる。