看美食店评论时,常会遇到同一家店同时出现“人生美食店”和“再也不去”的情况。看星级分布,5分和1分会同时大量出现,3分却几乎没有。站在消费者的角度,这确实让人困惑。
这样的店通常被称为“喜恶分明”店。但喜恶分明的店,真的就是应该避开的地方吗?我们对首尔·京畿道81,679家店铺按评论者逐一进行了星级标准差全量分析,用数据审视了这些意见分化店铺的真实面貌。
“全票一致很无聊” — 喜恶分明店铺的规模
本次分析采用了应用评论者可信度权重(credibility)的加权标准差(σ)。这是对 Gold 评论者(评论50条以上、平均星级2.5~4.2)赋予更高权重后计算出的共识度指标。当 σ 超过1.35时,就会被归类为评论者之间意见差异明显的“喜恶分明”店铺。
* 加权标准差(σ):与一般标准差不同,它不会将所有评论者的星级一视同仁。对评论经验丰富、平时评价较为平衡的评论者(高 credibility)赋予更大权重来计算偏差。平均星级极端偏高或偏低的评论者权重会降低,因此这是一个能在减少噪音的同时,只捕捉“真实意见差异”的指标。
在81,679家店铺中,σ 超过1.35的共有15,935家。也就是说,占整体的19.5%,每5家里就有1家属于喜恶分明店铺。相对地,σ 低于1.0的共识型店铺有34,853家(42.7%),而介于1.0~1.35之间、意见略有分化的区间有18,281家(22.4%)。
值得关注的是,随着 σ 升高,加权正向率(WPR)会持续下降。σ 0.0~0.5 区间的平均 WPR 为99.0%,但在1.35~1.5区间降至54.9%,到2.0以上时更跌至50.2%。意见越分化,越难判断一家店是否算得上“美食店”,这是很自然的现象。
* 加权正向率(WPR, Weighted Positive Rate):给出4分及以上星级的评论者权重总和,除以全部评论者权重总和所得的比例。与简单正向率不同,它会给予经验丰富、判断力更强的评论者的正面评价更高比重。75%以上判定为“美食店”,50%以上为“还不错”,30%以上为“普通”,低于此则判定为“注意”。
不过,即使在 σ 1.35 以上区间,平均 WPR 仍高于50%。这意味着,喜恶分明的店并不等于不好吃。意见分化与不好吃,数据上显示是两回事。
同一家店里,5分和1分会同时出现
为了更清楚地看见“喜恶分明”的真实面貌,我们单独提取了被判定为“美食店”的店铺,并比较了 Gold 评论者的星级分布。共识型美食店(σ < 1.0)与喜恶分明型美食店(σ > 1.35)之间的差异非常鲜明。
在共识型美食店中,Gold 评论者给出5分的比例为52.6%;而在喜恶分明型美食店中,这一比例为49.5%。也就是说,最高分比例几乎相近。但1分比例方面,共识型美食店仅为0.4%,而喜恶分明型美食店高达19.8%,相差约50倍。
更值得注意的是,中间地带的缺失。在喜恶分明型美食店中,Gold 评论者给出3分的比例仅有4.7%。与共识型美食店的11.4%相比,还不到一半。“要么喜欢,要么讨厌”,几乎没有中间态,这正是喜恶分明最本质的特征。
喜恶分明 = 个性的证据
哪一类食物最容易引发意见分化?按业态分析喜恶分明比例后发现,中餐(31.0%)最高,其后依次是海鲜/生鱼片(30.4%)、곱창/막창(烤肠/烤大肠)(30.4%)、肉类/烤肉(29.8%)。这些品类的共同点在于,食材新鲜度、火候带来的焦香、调味浓淡等,都有很大的个人口味介入空间。
相比之下,咖啡馆(22.2%)或糕点/烘焙店(22.0%)的喜恶分明比例相对较低。在这类比起味道差异,更容易受氛围和视觉呈现影响评价的业态中,意见分化也就没那么明显。
喜恶分明店铺常见的标签也很有特点。在基于 LLM 的语义分析提取出的39个标签中,喜恶分明店铺里显著更常出现的标签是“吵闹”(2.5% vs 1.6%)、“聚餐/团体”(10.0% vs 7.7%)、“宽敞/有团体座位”(39.3% vs 32.2%)。
相反,在喜恶分明店铺中明显更少出现的标签则是“很潮/有氛围感”(15.1% vs 24.6%)、“Instagram 氛围感”(7.0% vs 11.6%)、“温馨”(5.0% vs 9.5%)、“安静”(6.8% vs 10.5%)。
“个性鲜明的产品会导致消费者之间的评价分散度变大,但这种分散本身,正体现了该产品的自我表达价值。”
— “Self-Expression Cues in Product Rating Distributions”, Journal of Consumer Research, Stanford GSB (2017)这与斯坦福商学院的研究结果完全一致。喜恶分明型美食店并不是适合发到 Instagram 的空间,也不安静,更谈不上温馨。相反,它们往往吵闹、宽敞,适合多人同行。正因为个性鲜明,才会引发意见分化,而不是因为不好吃才让人意见不一。
喜恶分明并不是刷评操纵
当意见出现极端分化时,人们很容易怀疑是不是被操纵了。会想到“是不是竞争对手刷了1分差评”,这很自然。但数据讲述的是另一个故事。
我们对给喜恶分明型美食店打1分的5,181名评论者资料进行了全量分析。结果显示,39.4%是 Gold 评论者。也就是说,评论50条以上、平均星级2.5~4.2——这些经验丰富、平时评价较为平衡的人,确实给出了1分。相反,那种疑似“刷差评”的单条评论者(新建账号后只留1条1分评论)比例仅有9.0%。
与共识型美食店相比,差异就更明显了。在给共识型美食店打1分的评论者中,Gold 评论者仅占2.9%;而单条评论者(疑似刷差评)比例却达到14.9%,反而高于喜恶分明型美食店。更容易发生“1分攻击”的一方,不是喜恶分明店,而是共识型美食店。
| 1分评论者类型 | 喜恶分明型美食店 | 共识型美食店 |
|---|---|---|
| Gold 评论者(50条+,μ 2.5~4.2) | 39.4% | 2.9% |
| 单条评论者(疑似刷差评) | 9.0% | 14.9% |
| 3条以下(lowN) | 18.6% | 30.8% |
| 1分评论总数 | 5,181条 | 15,603条 |
给喜恶分明型美食店打1分的评论者,平均评论数为130.5条,中位数为33条。他们并不是只针对某一家店恶意打1分,而是平时本来就活跃写评论、经验丰富的消费者。换句话说,喜恶分明型美食店收到的1分,不是攻击,而是真实感受。
我们还比较了缺乏辨别力的评论(也就是所谓“夸夸机器人”)比例。结果显示,共识型美食店为21.5%,喜恶分明型美食店为22.5%,几乎没有差异。数据中并未观察到喜恶分明店铺更容易聚集操纵性评论的现象。
Gold 评论者占比
Kakao 评分
平均评论数
在 Kakao 评分与加权分析分数之间的差距(rating gap)上,两者出现了不同。共识型美食店为 Kakao 4.44、Score 4.66,差值为 -0.21;喜恶分明型美食店则为 Kakao 4.06、Score 4.46,差值为 -0.40。两组都属于Kakao 评分低于实际价值的区间,也就是说,Kakao 评分都比加权分数更低。
关键在于,喜恶分明型美食店的 Kakao 评分是4.06。这比共识型美食店的4.44低了0.38分。如果只靠 Kakao 评分来选店,喜恶分明型美食店往往不会进入视野。那些隐藏在4.0~4.2评分区间里的喜恶分明型美食店,单靠 Kakao 评分其实是找不到的。
语义分析也验证了这种“喜恶分明”的真实性。在同一家店里同时出现“极力称赞”和“不推荐”表达的比例,喜恶分明型美食店为8.7%,共识型美食店为4.8%,高出1.8倍。也就是说,对于同一道菜,有人深受感动,也有人大失所望。
喜恶分明型美食店的画像
下面来看看数据中呈现出的喜恶分明型美食店典型画像:Gold 评论者达到10人以上、σ 超过1.5,同时仍被判定为美食店(WPR 75%+)的店铺。
| 店名 | 业态 | Gold | σ | WPR |
|---|---|---|---|---|
| 와*** | 烘焙店 | 20人 | 1.53 | 79% |
| 셀*** | 汉堡 | 25人 | 1.50 | 79% |
| 모*** | 高级餐饮 | 13人 | 1.51 | 78% |
와***是一家烘焙店。Gold 评论者20人,σ 1.53,WPR 79%。评论中既有“脆得惊人”这样的极高赞誉,也有“这位大叔怎么这么没礼貌?”这样的批评。这是一个非常典型的模式:对味道评价不错,但在服务上意见明显分化。
셀***是一家汉堡专门店。这里会同时出现“汉堡里能排前三”这样的好评,以及“面包胚有点用力过猛”这样的意见。모***则是一家高级餐饮店,评论里既有“每一小口都让人感受到用心与创意,令人感动”,也有“相比以往的套餐,这次显得有些单调”。
对这三家店的语义分析显示,被指出最多的缺点是“不亲切”(合计123次)。这说明,喜恶分明的本质并不是味道不好,而是个性太强,以至于人们会在服务和氛围上产生分歧。也就是说,味道本身是经过验证的,但在其他要素上容易出现明显的喜恶分化。
如果只看 Kakao 评分,这些店大多只是4.0~4.1左右,并不是特别显眼的高分店。但在基于 Gold 评论者的加权分析中,它们会被判定为美食店。正因为意见分化,星级被拉低;又因为星级不高,消费者往往就这样错过了它们。
去喜恶分明型美食店前的检查清单
对15,935家喜恶分明店铺的分析,最终得出的结论是:喜恶分明不是品质问题,而是个性问题。它不是刷评操纵,也不是不好吃。只是因为个性太强,所以对某些人来说是“人生美食店”,对另一些人来说却会觉得不舒服。
一家获得一致好评的店当然更安全。然而,真正令人惊喜的体验,很少出现在所有人都一致认同的地方。数据表明,喜恶分明型美食店虽然可能会踩雷,但一旦合口味,带来的满足感甚至会超过那些共识型美食店。