數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自CDA數(shù)據(jù)分析師
今年的第92屆奧斯卡可謂是大片云集,入圍的影片不僅藝術(shù)性極高,而且市場口碑都極佳。當(dāng)中有黑幫片《愛爾蘭人》,經(jīng)典IP《小婦人》,昆汀的《好萊塢往事》,戰(zhàn)爭片《1917》,另類超級英雄片《小丑》等等,真正稱得上是神仙打架。
可誰也沒想到,當(dāng)中韓國電影《寄生蟲》爆冷成為了最大的贏家。
這部由韓國導(dǎo)演奉俊昊自編自導(dǎo)的影片,一舉拿下最佳影片、最佳導(dǎo)演、最佳原創(chuàng)劇本和最佳國際電影四座奧斯卡獎杯,創(chuàng)造歷史成為奧斯卡史上首部非英語最佳影片。
作為曾經(jīng)戰(zhàn)斗在與韓國爭奪端午節(jié)到底是誰發(fā)明的一線鍵盤俠,C君一下子吃了一筐檸檬,酸到不行。今天我們就來聊聊韓國的這筐檸檬,不對,這部電影《寄生蟲》。
Show me data,用數(shù)據(jù)說話
今天我們聊聊《寄生蟲》
點擊下方視頻,先睹為快:
不一樣的奧斯卡,原汁原味的韓國電影
說到《寄生蟲》橫掃本屆奧斯卡,你可能會說我們有李安啊,不是也拿獎過嗎?要知道作為奧斯卡的寵兒,李安導(dǎo)演在2001年憑借《臥虎藏龍》獲得奧斯卡外語片,在2006年和2013年各憑借《斷背山》和《少年派的奇幻漂流》收獲最佳導(dǎo)演獎,而還未獲得最佳影片的殊榮。
這次韓國導(dǎo)演奉俊昊憑借《寄生蟲》拿下四座大獎,直接超越了李安導(dǎo)演的記錄。
無論我們怎么說,李安拿最佳導(dǎo)演的那兩部電影都是屬于好萊塢電影,李安甚至都該歸為好萊塢的導(dǎo)演,英語說的賊溜。
但反觀《寄生蟲》,扎扎實實的一部韓國電影,韓國人拍韓國事兒,從導(dǎo)演到演員,從主演到配角,愛喝酒的奉俊昊導(dǎo)演甚至連英語都不會說(頒獎詞還得要現(xiàn)場翻譯幫忙),而他之前的作品也都是韓國本土的電影。
他自己也在臺上發(fā)表領(lǐng)獎感言的時候說:“我要感謝昆汀把我的電影放到他的觀影表單里面,讓全世界更多人知道了我的作品。”
但就是這樣一個韓國本土導(dǎo)演,在今年大片云集的情況下拿走份量最重的4個奧斯卡小金人,尤其是歷史上首次囊括最佳外語片和最佳電影,也為韓國第一次拿到了奧斯卡,絕對的硬實力。
近年頻頻開掛的韓國電影
回顧這幾年,韓國電影就像開掛一樣,每年都會出爆款。比如警匪片《惡人傳》;根據(jù)村上春樹小說改編的《燃燒》;揭露殘酷社會現(xiàn)實的《熔爐》幾乎部部口碑炸裂,在口味苛刻的豆瓣上都在7.7分以上。
奉俊昊導(dǎo)演其實在韓國早已家喻戶曉,除了《寄生蟲》,他的這些作品也都耳熟能詳。
2006年的《漢江怪物》(豆瓣7.4分)是當(dāng)時韓國少見的科幻電影,票房自上映以來整整保持了六年韓國票房冠軍之位直至2012年才被《盜賊同盟》趕超。
2013年的《雪國列車》(豆瓣7.4分)該片的故事發(fā)生在一個被氣候變化毀掉的未來世界,所有的生物都擠在一列環(huán)球行駛的火車上。該片首日在韓國上映就刷新了單日最高票房紀(jì)錄。
而2003年的《殺人回憶》更是在豆瓣評分高達8.8分,是許多影迷的必刷片,也影響了之火許多同類型影片。同時,這部影片改編自真實事件華城連環(huán)殺人案,公映時引起了強烈的社會探討,令人欣慰的是在2019年9月《殺人回憶》的殺手原型也被緝拿歸案。
讓我們回到《寄生蟲》這部影片,榮獲這么多大獎,這部電影到底好在哪兒?
《寄生蟲》講的是什么故事
《寄生蟲》主要講述的是,住在廉價的半地下室出租房里的一家四口,原本全都是無業(yè)游民。在長子基宇隱瞞真實學(xué)歷,去一戶住著豪宅的富有家庭擔(dān)任家教,之后他更是想方設(shè)法把父親、母親和妹妹全都弄到這戶人家工作,過上了“寄生”一般的生活…
《寄生蟲》表面上反映的是韓國社會的真實情景,內(nèi)核上卻展現(xiàn)了所有社會都存在的階級矛盾這一主題。從劇本設(shè)定上,窮人一家混進富人一家寄生于此,然后發(fā)現(xiàn)早有另一家寄居籬下,兩家窮人為了爭奪寄生權(quán)你死我活,整個故事從開始的搞笑到最后的慘劇,沖突與轉(zhuǎn)折中充滿了黑色幽默。即使是韓語的故事,也能幾乎讓所有的觀影者都產(chǎn)生理解和共鳴,這不是一部電影,這就是一部涵蓋了社會道德和人與人關(guān)系的文學(xué)作品。
當(dāng)我們在深刻分析,一本正經(jīng)地寫影評的時候,愛喝酒的奉俊昊導(dǎo)演,是這么調(diào)侃:
當(dāng)然這種說法沒錯,但我認為主要原因是電影開頭兩個年輕人,拿著手機到處找wifi,全世界的人不都是這樣嗎?很多觀眾從開頭就找到了共鳴。”
真是你拿了大獎,說什么都好聽。
那觀眾又怎么看呢?
我們爬取了《寄生蟲》在豆瓣上的影評數(shù)據(jù)。整個數(shù)據(jù)分析的過程分為三步:
以下是具體的步驟和代碼實現(xiàn):
獲取數(shù)據(jù)
豆瓣從2017.10月開始全面限制爬取數(shù)據(jù),非登錄狀態(tài)下最多獲取200條,登錄狀態(tài)下最多為500條,本次我們共獲取數(shù)據(jù)521條。
為了解決登錄的問題,本次使用Selenium框架發(fā)起網(wǎng)頁請求,然后使用xpath進行數(shù)據(jù)的提取。
如下圖所示,本此數(shù)據(jù)爬取主要獲取的內(nèi)容有:
# 導(dǎo)入所需包
import numpy as np
import pandas as pd
import time
import requests
import re
from lxml import etree
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
def login_douban():
'''功能:自動登錄豆瓣網(wǎng)站'''
global browser # 設(shè)置為全局變量
browser=webdriver.Chrome()
# 進入登錄頁面
login_url='https://accounts.douban.com/passport/login?source=movie'
browser.get(login_url)
# 點擊密碼登錄
browser.find_element_by_class_name('account-tab-account').click()
# 輸入賬號和密碼
username=browser.find_element_by_id('username')
username.send_keys('你的用戶名')
password=browser.find_element_by_id('password')
password.send_keys('你的密碼')
# 點擊登錄
browser.find_element_by_class_name('btn-account').click()
def get_one_page(url):
'''功能:傳入url,豆瓣電影一頁的短評信息'''
# 進入短評頁
browser.get(url)
# 獲取網(wǎng)頁
browser.get(url)
# 解析網(wǎng)頁
html=etree.HTML(browser.page_source)
# 提取用戶名
user_name=html.xpath('//div/div[2]/h3/span[2]/a/text()')
# 提取用戶主頁
user_url=html.xpath('//div/div[2]/h3/span[2]/a/@href')
# 提取推薦星級
star=html.xpath('//div/div[2]/h3/span[2]/span[2]/@title')
# 提取評論時間
comment_time=html.xpath('//div/div[2]/h3/span[2]/span[3]/@title')
# 星級和評論時間bug處理,有的用戶沒有填寫推薦星級
star_dealed=[]
for i in range(len(user_name)):
if re.compile(r'(\d)').match(star[i]) is not None:
star_dealed.append('還行')
# 相同的索引位置插入一個時間
comment_time.insert(i, star[i])
else:
star_dealed.append(star[i])
# 提取短評信息
short_comment=html.xpath('//div/div[2]/p/span/text()')
# 提取投票次數(shù)
votes=html.xpath('//div/div[2]/h3/span[1]/span/text()')
# 存儲數(shù)據(jù)
df=pd.DataFrame({'user_name': user_name,
'user_url': user_url,
'star': star_dealed,
'comment_time': comment_time,
'short_comment': short_comment,
'votes': votes})
return df
def get_25_page(movie_id):
'''功能:傳入電影ID,獲取豆瓣電影25頁的短評信息(目前所能獲取的最大頁數(shù))'''
# 創(chuàng)建空的DataFrame
df_all=pd.DataFrame()
# 循環(huán)翻頁
for i in range(25):
url="https://movie.douban.com/subject/{}/comments?start={}&limit=20&sort=new_score&status=P".format(movie_id,i*20)
print('我正在抓取第{}頁'.format(i+1), end='\r')
# 調(diào)用函數(shù)
df_one=get_one_page(url)
# 循環(huán)追加
df_all=df_all.append(df_one, ignore_index=True)
# 休眠一秒
time.sleep(1)
return df_all
if __name__=='__main__':
# 先運行登錄函數(shù)
login_douban()
# 休眠兩秒
time.sleep(2)
# 再運行循環(huán)翻頁函數(shù)
movie_id=27010768 # 寄生蟲
df_all=get_25_page(movie_id)
爬取出來的數(shù)據(jù)以數(shù)據(jù)框的形式存儲,結(jié)果如下所示:
從用戶主頁的地址可以獲取到用戶的城市信息,這一步比較簡單,此處的代碼省略。
數(shù)據(jù)預(yù)處理
對于獲取到的數(shù)據(jù),我們需要進行以下的處理以方便后續(xù)分析:
代碼實現(xiàn):
# 定義轉(zhuǎn)換函數(shù)
def transform_star(x):
if x=='力薦':
return 5
elif x=='推薦':
return 4
elif x=='還行':
return 3
elif x=='較差':
return 2
else:
return 1
# 星級轉(zhuǎn)換
df_all['star']=df_all.star.map(lambda x:transform_star(x))
# 處理日期數(shù)據(jù)
df_all['comment_time']=pd.to_datetime(df_all.comment_time)
# 定義函數(shù)-獲取短評信息關(guān)鍵詞
def get_comment_word(df):
'''功能:傳入df,提取短評信息關(guān)鍵詞'''
import jieba.analyse
import os
# 集合形式存儲-去重
stop_words=set()
# 加載停用詞
cwd=os.getcwd()
stop_words_path=cwd + '\\stop_words.txt'
with open(stop_words_path, 'r', encoding='utf-8') as sw:
for line in sw.readlines():
stop_words.add(line.strip())
# 添加停用詞
stop_words.add('6.3')
stop_words.add('一張')
stop_words.add('這部')
stop_words.add('一部')
stop_words.add('寄生蟲')
stop_words.add('一家')
stop_words.add('一家人')
stop_words.add('電影')
stop_words.add('只能')
stop_words.add('感覺')
stop_words.add('全片')
stop_words.add('表達')
stop_words.add('真的')
stop_words.add('本片')
stop_words.add('劇作')
# 合并評論信息
df_comment_all=df['short_comment'].str.cat()
# 使用TF-IDF算法提取關(guān)鍵詞
word_num=jieba.analyse.extract_tags(df_comment_all, topK=100, withWeight=True, allowPOS=())
# 做一步篩選
word_num_selected=[]
# 篩選掉停用詞
for i in word_num:
if i[0] not in stop_words:
word_num_selected.append(i)
else:
pass
return word_num_selected
key_words=get_comment_word(df_all)
key_words=pd.DataFrame(key_words, columns=['words','num'])
數(shù)據(jù)可視化
用Python做可視化分析的工具很多,目前比較好用可以實現(xiàn)動態(tài)可視化的是pyecharts。我們主要對以下幾個方面信息進行可視化分析:
總體評分分布
截止到目前為止,《寄生蟲》在豆瓣電影上有超過63萬人評價,網(wǎng)站上的總體評分為8.7分,這個分數(shù)無疑是非常高的。好于97% 喜劇片,好于94% 劇情片。
從評分星級來看,5星的占比最高,占總數(shù)的35.21%,4星以上的比重占到50%以上,給到3星以下的比重比較少,僅10%不到。
代碼實現(xiàn):
# 總體評分
score_perc=df_all.star.value_counts() / df_all.star.value_counts().sum()
score_perc=np.round(score_perc*100,2)
# 導(dǎo)入所需包
from pyecharts.faker import Faker
from pyecharts import options as opts
from pyecharts.charts import Pie, Page
# 繪制柱形圖
pie1=Pie(init_opts=opts.InitOpts(width='1350px', height='750px'))
pie1.add("",
[*zip(score_perc.index, score_perc.values)],
radius=["40%","75%"])
pie1.set_global_opts(title_opts=opts.TitleOpts(title='總體評分分布'),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_left="2%"),
toolbox_opts=opts.ToolboxOpts())
pie1.set_series_opts(label_opts=opts.LabelOpts(formatter="{c}%"))
pie1.render('總體評分分布.html')
評分時間走勢圖
評論的熱度在2019年8月份最高。可能是出網(wǎng)上資源的時候吧...
代碼實現(xiàn):
time=df_all.comment_date.value_counts()
time.sort_index(inplace=True)
from pyecharts.charts import Line
# 繪制時間走勢圖
line1=Line(init_opts=opts.InitOpts(width='1350px', height='750px'))
line1.add_xaxis(time.index.tolist())
line1.add_yaxis('評論熱度', time.values.tolist(), areastyle_opts=opts.AreaStyleOpts(opacity=0.5), label_opts=opts.LabelOpts(is_show=False))
line1.set_global_opts(title_opts=opts.TitleOpts(title="時間走勢圖"),
toolbox_opts=opts.ToolboxOpts(),
visualmap_opts=opts.VisualMapOpts())
line1.render('評論時間走勢圖.html')
評論用戶城市分布
接下來分析了評論者所在的城市分布。
從觀影評價城市來看,北京占到絕大多數(shù),其次是上海。這跟微博統(tǒng)計的數(shù)據(jù)基本一致。
代碼實現(xiàn):
# 國內(nèi)城市top10
city_top10=df_all.city_dealed.value_counts()[:12]
city_top10.drop('國外', inplace=True)
city_top10.drop('未知', inplace=True)
from pyecharts.charts import Bar
# 條形圖
bar1=Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(city_top10.index.tolist())
bar1.add_yaxis("城市", city_top10.values.tolist())
bar1.set_global_opts(title_opts=opts.TitleOpts(title="評論者Top10城市分布"),
toolbox_opts=opts.ToolboxOpts(),
visualmap_opts=opts.VisualMapOpts())
bar1.render('評論者Top10城市分布條形圖.html')
評分詞云圖
代碼實現(xiàn):
from pyecharts.charts import WordCloud
from pyecharts.globals import SymbolType, ThemeType
word=WordCloud(init_opts=opts.InitOpts(width='1350px', height='750px'))
word.add("", [*zip(key_words.words, key_words.num)],
word_size_range=[20, 200], shape='diamond')
word.set_global_opts(title_opts=opts.TitleOpts(title="寄生蟲電影評論詞云圖"),
toolbox_opts=opts.ToolboxOpts())
word.render('寄生蟲電影評論詞云圖.html')
從電影短評的分詞來看,主要集中對“奉俊昊”導(dǎo)演的探討上。畢竟在此之前,讓大家說出一個韓國導(dǎo)演的名字,大家還是有點摸不著頭腦的,就知道殺人回憶、漢江怪物挺好看。
其次關(guān)于“窮人”“富人”“階級”等影片故事內(nèi)核的關(guān)注度也很高。
這里面就有一句大家最常提及的臺詞,引人深思:不是“有錢卻很善良”,是“有錢所以善良”,懂嗎?如果我有這些錢的話,我也會很善良,超級善良。
與此同時針對影片的劇情“反轉(zhuǎn)”,“鏡頭”等拍攝手法也是觀眾的焦點。
很有意思的是,看本片時觀眾還會跟《燃燒》等韓國電影進行比較。這里也推薦大家可以去看看《燃燒》,也是非常不錯的一部作品。
結(jié)語
最后,被檸檬酸到不行的我們,可以繼續(xù)當(dāng)個鍵盤俠去羨慕一下韓國的電影審查制度。但最根本的還是年輕的鍵盤俠們真正長大到要去拍電影、審查電影的時候,能不能真正如自己所說的那般帶來改變。當(dāng)然也可以學(xué)學(xué)中國足球,我們是不是可以歸化一個韓國導(dǎo)演?
如果對這一期的數(shù)據(jù)感興趣,可以訪問data.cda.cn下載,自己分析了試試。
最后附上本屆奧斯卡的完整獲獎名單~
家星等級是阿里巴巴國際站綜合評判平臺商家服務(wù)海外買家的意愿及能力的分層體系。旨在幫助平臺商家提升服務(wù)海外買家的能力,并基于大數(shù)據(jù)的應(yīng)用來實現(xiàn)買賣雙方更精準(zhǔn)的匹配,促進交易更高效的達成。
—關(guān)于商家星等級—
1、商家星等級一共包含一星、二星、三星3個等級,商家的信息展示、溝通服務(wù)、交易轉(zhuǎn)化、履約保障四大能力項須同時滿足一定標(biāo)準(zhǔn)才能成為星級商家。
2、四大能力項中最低的一項決定商家的星級,每個能力項對應(yīng)的星級標(biāo)準(zhǔn):
3、商家當(dāng)月的評定星等級由上一個自然月月末當(dāng)天商家的數(shù)據(jù)表現(xiàn)所決定。
商家可進入MY ALIBABA工作臺首頁—數(shù)據(jù)管家—商家星等級板塊進行查看。
4、評定星等級和預(yù)測星等級的區(qū)別:
① 評定星等級展示的是商家當(dāng)月的星等級,商家當(dāng)月星級客戶權(quán)益由此決定。評定星等級在MA后臺每月5日更新,當(dāng)月保持不變。
② 預(yù)測星等級展示的是商家當(dāng)月每天星等級相關(guān)指標(biāo)變化的結(jié)果,是當(dāng)前商家成長趨勢及綜合實力變化的參考值。預(yù)測星等級和四大能力項數(shù)據(jù)在MA后臺每天更新,并有2天的延遲。
更多星等級詳細信息和常見問題可參考商家星等級專題:
https://waimaoquan.alibaba.com/bbs/read-htm-tid-3814226-1-fid-215.html
—星級商家權(quán)益—
1、星級商家享受全網(wǎng)流量、產(chǎn)品工具和服務(wù)上的階梯權(quán)益。
2、一星是參加營銷活動的基礎(chǔ)門檻,二、三星享受活動優(yōu)先入駐權(quán)。
—最新升星利好—
1、三月新貿(mào)節(jié)行業(yè)會場及特色會場招商報名優(yōu)先權(quán)。
三月新貿(mào)節(jié)以2019年1月5號公布的星等級為報名標(biāo)準(zhǔn)。
(具體報名規(guī)則以最終實際上線頁面為準(zhǔn))
2、“新星之火”12月升星活動
12月評定星等級為0星的服務(wù)中客戶,在2019年1月評定星等級變?yōu)?星及以上的可同時獲得以下獎勵資源:
3、信用保障訂單交易服務(wù)費/基礎(chǔ)服務(wù)費折扣優(yōu)惠
自2018年12月12日起至2019年3月31日止,商家的信用保障訂單根據(jù)選用的不同出口方式將享受以下對應(yīng)費用折扣優(yōu)惠:
信用保障交易服務(wù)費優(yōu)惠詳情請見論壇貼:
https://waimaoquan.alibaba.com/bbs/read-htm-tid-4103390-fid-341.html
以上活動及優(yōu)惠詳情均以活動方官方發(fā)布的活動細則為準(zhǔn)。
—升星攻略及課程—
想了解更多關(guān)于升星的信息,歡迎登陸相關(guān)論壇專題及外貿(mào)學(xué)院學(xué)習(xí)了解。
商家星等級介紹(含最新版攻略下載):
https://waimaoquan.alibaba.com/bbs/read-htm-tid-3814226-1-fid-215.html
外貿(mào)學(xué)院商家星等級系列課程(課程已更新):
https://peixun.alibaba.com/series/detail_CS2YJ09U.htm
————————————
想要一起升星享受優(yōu)惠,歡迎加入我們,戳右側(cè)鏈接:
https://air.alibaba.com/apps/aliseller/admittanceMoblie/leadsMobailPage.html?code=20033
或者
日常生活中,我們經(jīng)常會看到不同的平臺使用不同的評分制度來展示用戶對產(chǎn)品或服務(wù)的評價。例如,豆瓣和虎撲采用10分制,而淘寶店鋪和美團點評則選擇5分制。那么,為什么同樣是為了反映用戶評價的功能會有不同的分制呢?這背后是否有著特定的考量?
最近在人人都是產(chǎn)品經(jīng)理上看到了一個非常有意思的問題。為什么豆瓣、虎撲等用十分制評分,而淘寶店鋪、美團點評等用五分制?(https://wen.woshipm.com/question/detail/8s2csf.html)。這個問題我從來沒有注意過,去app上一看,果然如此。豆瓣、虎撲都是十分制,淘寶、美團都是五分制。
那么問題來了,為啥同樣都是評價性質(zhì)的功能,還要搞不同的分制呢?是不是可以統(tǒng)一成五分制或十分制呢?如果不能,背后有什么考量嗎?
想探究以上的這些問題,就要搞清楚星級評分的一些基本概念。從本質(zhì)上講,星級評分是評估產(chǎn)品質(zhì)量或受歡迎程度的一種算法。在一定意義上,星級評分能夠比較真實地反映用戶對產(chǎn)品的評價或情感,是一種相對客觀的方法。
回想一下,每次去吃一家不太熟悉的餐館,場景是不是先看一下大眾點評上的分數(shù)咋樣,然后再決定去不去。這就是星級評分的好處,它不需要用戶很繁瑣地看具體評價,可以通過一個分數(shù),直接獲知一個產(chǎn)品或是店鋪的優(yōu)劣,大大節(jié)省了用戶決策的時間成本。另外,這些數(shù)據(jù)對于一些有良心的企業(yè),也是監(jiān)控他們的產(chǎn)品是否得到消費者的信賴和支持的良好指標(biāo)。
星級評分這種收集用戶反饋的方式非常常見。目前主流的評價方式,都是給一個五顆星,然后把所有人的評價通過一個算法轉(zhuǎn)化成分數(shù),分數(shù)有五分制和十分制之分。其他的星級評價方式,諸如三星級,十星級都見過,但是不較五星級少見。
回到文章開頭的五分制和十分制的問題。既然星級評分就是一種算法,那是不是也可以只給兩顆星星讓用戶去評價,或者一個贊的按鈕,一個踩的按鈕來評價呢?我覺得是沒有問題的,因為這也是一種評價,也反映了用戶比較真實的看法和情感。
所以,是什么東西影響使用的評分方式和分制呢?
從心理測量學(xué)角度來說,星級評價可以看做是一種量表。而心理測量學(xué)中被廣泛使用的測量方法是李克特量表。這是一種總加量表類型的一種,主要是用來反映填寫者整體的認同程度和主觀評價。一般量表大多采用5級,但是也有7級的,6級的,甚至11級的。
但是從成本角度來說,誤差成本會隨著量表等級的增加逐步降低,回答成本會隨著量表等級的增加而增加。很好理解,回答的星級越多,越能夠真實反應(yīng)用戶對產(chǎn)品的滿意程度和評價,但是星級越多,讓用戶回答起來就會非常痛苦,最好的就是能夠既讓誤差沒那么大,用戶填寫起來也不太痛苦。這里貼一個網(wǎng)上的圖,圖顯示,星級為5的時候,是最優(yōu)的。
既然星級評價是一種量表,那就需要考慮一些量表指標(biāo),比如,信效度、區(qū)分度等。
最近在開奧運會,我用奧運會的一個項目舉例子說明一下信效度。一個射擊運動員,每次都射擊6環(huán),我們可以說他信度高,所以,信度代表的是量表的可靠程度。還有一個運動員,雖然不是每次都能夠射擊同一環(huán)數(shù),但是要不就是10環(huán),要不就是9環(huán)。我們可以說這個運動員效度比較高。
所以,效度代表的是量表的準(zhǔn)確程度。區(qū)分度呢,就是這個量表測量的東西,一定能夠把不同水平的人給區(qū)別開。如果靶子設(shè)定的特別大,槍法好和槍法差的都能很輕松地打出10環(huán),那這個靶子的區(qū)分度就非常差。
搞清楚了這幾個概念,我們就看一下,不同星級評價數(shù)量對這幾個指標(biāo)的影響。
曾經(jīng)有學(xué)者做研究表明,7個等級的星級評價要比5個等級的星級評價能得到更可靠的結(jié)果,也就是信度會更高些。但是,信度和等級數(shù)量之間并不是線性關(guān)系。另外的研究表明,等級數(shù)量超過9個時,不同等級的差異就沒有意義了,不會再提供更多的有效信息,反而會讓用戶填寫起來非常累和困惑。
通過以上的分析,星級評價的等級數(shù)基本錨定在5到9個左右。這和人類短時記憶的容量,7±2個組塊的數(shù)量不謀而合。所以,在星級評價數(shù)量的選取的時候,也要遵循用戶的使用習(xí)慣。
首先用戶是非常不喜歡思考的。對一個事物的評價,最優(yōu)解就給我一個好還是不好的選項,二極管思維是最受大多數(shù)用戶的喜愛了。但是這種評價的區(qū)分度又太差。又想評價準(zhǔn),又想有區(qū)分度,又想不讓用戶那么累,避免評價數(shù)過少,最后分析下來,只有5個等級是最合適的了。
評價都是為了還原用戶對產(chǎn)品整體的認同程度和主觀評價。那么,準(zhǔn)確和恰當(dāng)是非常重要的。
比如,B站上,用戶對視頻的評價就只有頂或者踩。在B站,用戶對視頻的評價,不是一個譜系,而是一個是或否的關(guān)系,要不好看,要不難看,沒有稍微不好看,或者稍微好看,這對于用戶來說,區(qū)分好看和稍微好看非常有難度,且沒有必要。這種情況下,就可以犧牲區(qū)分度,采用兩星級評價。
但是對于電影來說,需要評價的維度特別多,如果僅僅用頂或者踩,準(zhǔn)確性會大大折扣。所以,主流的網(wǎng)站,大多采用5等級星級評價。
回到開頭我們討論的那個現(xiàn)象,會發(fā)現(xiàn),不管是十分制的豆瓣、虎撲,還是五分制的點評、美團。都采用的是五等級的星級評價。但是分數(shù)最終呈現(xiàn)卻不是一樣的。這有什么講究嗎?
要想知道不同分制的區(qū)別,我們就要知道分數(shù)是咋算出來的。具體的規(guī)則細節(jié)肯定是獲取不到,我們也不需要知道的那么詳細。
簡單來說,分數(shù)主要還是來自于分數(shù)平均(可以看一下豆瓣CEO阿北的回答)。我理解,算法主要是處理評價是否可信的問題,比如,阿北提到的,“和影托或者其他非正常個人意見PK”,“時間和打分這自身的情況”。
這些都是在識別,某一個或某一些評價是否是真實的評價,而不是刷的,或者只是因為個人情緒,惡意給的差評。
算法可以理解是一個門檻,這個門檻只讓真實的評價進去,只要你能進去,那算法就簡單了,就是計算平均分,阿北也說了嘛,“接近和還原普通觀眾最原汁原味的平均觀影意見。”
其他的平臺也應(yīng)該是這種考慮和算法。
那么,同樣的五等級評分,有的是五分制,為啥有的十分制呢?
兩種分制的不同,可以理解成,分制越大,區(qū)分度越大,越能夠?qū)⒓毼⒌暮脡牟顒e體現(xiàn)出來。所以,分制的不同,要回歸用戶。
如果某個平臺上的用戶,對某個事物具體比較高的了解程度和鑒賞水準(zhǔn),那就需要比較高的分制。如果某個平臺上的用戶,對某個事物沒有高的了解程度,那就需要給用戶一個相對來說較為簡單明了的分數(shù),那就需要一個稍微低一點的分制。
所以,這就是為啥同樣的五等級評分,美團用五分制,而豆瓣用十分制。
問卷設(shè)計:量表到底是要用5級還是6級?– 人人都是產(chǎn)品經(jīng)理
評價體系用什么規(guī)則好?豆瓣是5星10分制,時光網(wǎng)是10星10分制,淘寶是5星5分制 – 知乎
量表等級,5分、7分、10分哪種更好?等級量表數(shù)據(jù)應(yīng)該如何分析?
為什么豆瓣、虎撲等用10分制評分,而淘寶店鋪、美團點評等用5分制?
本文由 @孟老濕 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自pixabay,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
*請認真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。