맛집 리뷰를 보다 보면 같은 가게에 "인생 맛집"과 "다신 안 감"이 나란히 붙어 있는 경우가 있다. 별점 분포를 보면 5점과 1점이 동시에 쏟아지고, 3점은 거의 없다. 소비자 입장에서는 당황스럽다.
이런 가게를 흔히 '호불호'라고 부른다. 그런데 호불호 가게는 정말 피해야 할 곳일까. 서울·경기 81,679개 가게의 리뷰어별 별점 표준편차를 전수 분석해, 의견이 갈리는 가게의 실체를 데이터로 들여다봤다.
"만장일치는 재미없다" — 호불호 가게의 규모
분석에는 리뷰어 신뢰도 가중치(credibility)를 적용한 가중 표준편차(σ)를 사용했다. Gold 리뷰어(50건 이상 리뷰, 평균 별점 2.5~4.2)에 높은 가중치를 부여해 산출한 합의도 지표다. σ가 1.35를 넘으면 리뷰어 간 의견 차이가 뚜렷한 '호불호' 가게로 분류된다.
* 가중 표준편차(σ): 일반 표준편차와 달리 모든 리뷰어의 별점을 동일하게 취급하지 않는다. 리뷰 경험이 풍부하고 평소 균형 잡힌 평가를 하는 리뷰어(높은 credibility)에 더 큰 가중치를 부여해 편차를 산출한다. 극단적으로 높거나 낮은 평균 별점을 가진 리뷰어는 가중치가 낮아져, 노이즈 없이 '진짜 의견 차이'만 포착하는 지표다.
81,679개 가게 중 σ가 1.35를 넘는 곳은 15,935곳으로 나타났다. 전체의 19.5%, 5곳 중 1곳이 호불호 가게인 셈이다. 반면 σ가 1.0 미만인 합의 가게는 34,853곳(42.7%), 1.0~1.35인 약간 갈림 구간은 18,281곳(22.4%)이었다.
주목할 만한 것은 σ가 높아질수록 가중 긍정률(WPR)이 일관되게 하락한다는 점이다. σ 0.0~0.5 구간의 평균 WPR은 99.0%이지만 1.35~1.5 구간은 54.9%, 2.0 이상에서는 50.2%까지 떨어진다. 의견이 갈릴수록 맛집 판정이 어려워지는 것은 자연스러운 현상이다.
* 가중 긍정률(WPR, Weighted Positive Rate): 4점 이상 별점을 준 리뷰어의 가중치 합을 전체 가중치 합으로 나눈 비율. 단순 긍정률과 달리, 경험 많고 변별력 있는 리뷰어의 긍정 평가에 더 큰 비중을 둔다. 75% 이상이면 '맛집', 50% 이상이면 '괜찮음', 30% 이상이면 '보통', 그 이하면 '주의'로 판정한다.
그러나 σ 1.35 이상 구간에서도 평균 WPR은 50%를 웃돌았다. 호불호 가게라고 해서 맛이 없는 것이 아니라는 뜻이다. 의견이 갈린다는 것과 맛이 없다는 것은 별개의 문제로 나타났다.
같은 가게에서 5점과 1점이 동시에 나온다
호불호의 실체를 더 선명하게 보기 위해 '맛집' 판정을 받은 가게만 따로 추출해 Gold 리뷰어의 별점 분포를 비교했다. 합의된 맛집(σ < 1.0)과 호불호 맛집(σ > 1.35)의 차이는 극명했다.
합의된 맛집에서 Gold 리뷰어의 5점 비율은 52.6%, 호불호 맛집에서는 49.5%였다. 최고점 비율은 거의 비슷한 셈이다. 그런데 1점 비율은 합의된 맛집 0.4%에 대해 호불호 맛집은 19.8%로 나타났다. 약 50배 차이다.
더 주목할 만한 것은 중간 지대의 부재다. 호불호 맛집에서 Gold 리뷰어의 3점 비율은 겨우 4.7%에 불과했다. 합의된 맛집의 11.4%와 비교하면 절반 이하다. "좋다" 아니면 "나쁘다", 중간이 없는 것이 호불호의 본질적 특성으로 나타났다.
호불호 = 개성의 증거
어떤 종류의 음식이 가장 의견이 갈릴까. 업종별 호불호 비율을 분석한 결과 중식(31.0%)이 가장 높았다. 해물/회(30.4%), 곱창/막창(30.4%), 육류/고기(29.8%)가 뒤를 이었다. 이들은 공통적으로 재료의 신선도, 불맛의 세기, 양념의 강도 등 취향이 개입할 여지가 큰 업종이다.
반면 카페(22.2%)나 제과/베이커리(22.0%)는 상대적으로 호불호 비율이 낮았다. 맛의 편차보다 분위기와 비주얼이 평가에 영향을 미치는 업종에서는 의견이 덜 갈리는 것이다.
호불호 가게에 달리는 태그도 특징적이다. LLM 기반 시멘틱 분석에서 추출한 39개 태그 중 호불호 가게에서 유의미하게 더 많이 등장하는 태그는 "시끄러운"(2.5% vs 1.6%), "회식/단체"(10.0% vs 7.7%), "넓은/단체석"(39.3% vs 32.2%)이었다.
반대로 호불호 가게에서 현저히 적은 태그는 "힙한/감성"(15.1% vs 24.6%), "인스타감성"(7.0% vs 11.6%), "아늑한"(5.0% vs 9.5%), "조용한"(6.8% vs 10.5%)으로 나타났다.
"개성이 뚜렷한 제품은 소비자 간 평가 분산이 커지지만, 그 분산 자체가 해당 제품의 자기표현적 가치를 나타낸다."
— "Self-Expression Cues in Product Rating Distributions", Journal of Consumer Research, Stanford GSB (2017)스탠퍼드 경영대학원의 연구 결과와 정확히 일치하는 패턴이다. 호불호 맛집은 인스타그램에 올릴 만한 공간이 아니고, 조용하거나 아늑하지도 않다. 대신 시끄럽고, 넓고, 단체로 가는 곳이다. 개성이 뚜렷하기 때문에 의견이 갈리는 것이지, 맛이 없어서 갈리는 것이 아닌 셈이다.
호불호는 조작이 아니다
의견이 극단적으로 갈리면 조작을 의심할 수 있다. "경쟁 업체가 1점 테러를 한 것 아닌가"라는 생각이 드는 것은 자연스럽다. 그러나 데이터는 다른 이야기를 하고 있었다.
호불호 맛집에 1점을 준 리뷰어 5,181명의 프로필을 전수 분석했다. 39.4%가 Gold 리뷰어였다. 리뷰 50건 이상, 평균 별점 2.5~4.2 — 경험이 풍부하고 평소 균형 잡힌 평가를 하는 사람들이 1점을 준 것이다. 반면 테러가 의심되는 1건 리뷰어(계정 만들고 1점만 남긴 경우) 비율은 9.0%에 불과했다.
합의된 맛집과 비교하면 차이가 더 선명해진다. 합의된 맛집에 1점을 준 리뷰어 중 Gold는 겨우 2.9%인 반면, 1건 리뷰어(테러 의심)는 14.9%로 호불호 맛집보다 오히려 높았다. 1점 테러가 더 많이 일어나는 쪽은 호불호 가게가 아니라 합의된 맛집이었다.
| 1점 리뷰어 유형 | 호불호 맛집 | 합의된 맛집 |
|---|---|---|
| Gold 리뷰어 (50건+, μ 2.5~4.2) | 39.4% | 2.9% |
| 1건 리뷰어 (테러 의심) | 9.0% | 14.9% |
| 3건 이하 (lowN) | 18.6% | 30.8% |
| 1점 리뷰 총 수 | 5,181건 | 15,603건 |
호불호 맛집에 1점을 준 리뷰어의 평균 리뷰 수는 130.5건, 중앙값은 33건이었다. 이들은 해당 가게에서만 악의적으로 1점을 남긴 것이 아니라, 평소에도 활발하게 리뷰를 쓰는 경험 많은 소비자였다. 호불호 맛집의 1점은 테러가 아니라 진심인 셈이다.
변별력 없는 리뷰(이른바 '칭찬봇') 비율도 비교했다. 합의된 맛집 21.5%, 호불호 맛집 22.5%로 거의 차이가 없었다. 호불호 가게에 조작 리뷰가 더 많이 몰리는 현상은 관찰되지 않았다.
Gold 리뷰어 비율
카카오 평점
평균 리뷰 수
카카오 평점과 가중 분석 점수의 갭(rating gap)에서는 차이가 나타났다. 합의된 맛집은 카카오 4.44, Score 4.66으로 갭이 -0.21이었다. 호불호 맛집은 카카오 4.06, Score 4.46으로 갭이 -0.40이었다. 두 그룹 모두 카카오 평점이 가중 점수보다 낮은, 즉 카카오 평점이 실제 가치보다 낮게 나오는 구간에 속한다.
핵심은 호불호 맛집의 카카오 평점이 4.06이라는 점이다. 합의된 맛집 4.44보다 0.38점 낮다. 카카오 평점만으로 가게를 고르면 호불호 맛집은 눈에 들어오지 않는다. 평점 4.0~4.2 구간에 숨어 있는 호불호 맛집은 카카오 평점으로는 찾을 수 없는 셈이다.
시멘틱 분석에서도 호불호의 진정성이 확인됐다. '극찬'과 '비추'가 한 가게에서 동시에 나타나는 비율은 호불호 맛집 8.7%, 합의된 맛집 4.8%로, 1.8배 높았다. 같은 메뉴에 대해 누군가는 감동하고 누군가는 실망하는 구조다.
호불호 맛집의 초상
데이터에서 나타난 호불호 맛집의 전형적인 프로필을 살펴본다. Gold 리뷰어가 10명 이상이고 σ가 1.5를 넘으면서도 맛집 판정(WPR 75%+)을 받은 가게들이다.
| 가게명 | 업종 | Gold | σ | WPR |
|---|---|---|---|---|
| 와*** | 베이커리 | 20명 | 1.53 | 79% |
| 셀*** | 버거 | 25명 | 1.50 | 79% |
| 모*** | 파인다이닝 | 13명 | 1.51 | 78% |
와***는 베이커리다. Gold 리뷰어 20명, σ 1.53, WPR 79%. 리뷰에는 "겁나 바삭함"이라는 극찬과 "이 아저씨 왜 이렇게 4가지가 없죠?"라는 비판이 공존한다. 맛에 대한 평가는 좋은데 서비스에서 의견이 갈리는 전형적인 패턴이다.
셀***는 버거 전문점이다. "버거 중 세 손가락"이라는 후기와 "번이 좀 오버스러움"이라는 의견이 동시에 달린다. 모***는 파인다이닝으로, "작은 한입들은 정성과 아이디어에 감동"이라는 리뷰와 "기존 코스에 비해 단조로운 편"이라는 리뷰가 교차한다.
세 가게의 시멘틱 분석에서 가장 많이 지적된 단점은 "불친절"(합산 123건)이었다. 호불호의 본질은 맛이 나쁜 것이 아니라, 개성이 너무 강해서 서비스와 분위기에서 의견이 갈리는 것으로 나타났다. 맛은 검증된 곳이지만, 그 외의 요소에서 호불호가 갈리는 구조다.
카카오 평점만 보면 이 가게들은 4.0~4.1 수준으로, 눈에 띄는 고평점이 아니다. 그러나 Gold 리뷰어 기반 가중 분석에서는 맛집으로 판정된다. 의견이 갈린다는 이유로 별점이 낮아지고, 그 별점 때문에 소비자가 지나치게 되는 것이다.
호불호 맛집, 가기 전 체크리스트
15,935곳의 호불호 가게를 분석한 결론은 이렇다. 호불호는 품질의 문제가 아니라 개성의 문제였다. 조작도 아니었고, 맛이 없는 것도 아니었다. 개성이 너무 강해서 누군가에게는 인생 맛집이고 누군가에게는 불편한 곳이 되는 것이다.
만장일치로 좋다는 가게는 안전하다. 그러나 모두가 동의하는 곳에서 놀라운 경험이 나오는 경우는 드물다. 호불호 맛집은 실패할 수 있지만, 성공했을 때의 만족도는 합의된 맛집을 넘어서는 것으로 데이터가 보여주고 있다.