图片来源@视觉中国

文|游戏披萨,作者 | 但丁的方舟,编辑 | 张友发

互联网时代的前夜,南加州大学的三名校友在1999年创办了网站Metacritic(后文简称M站)——一个尽可能覆盖所有娱乐产品的综合性评分网站。创始人多伊尔总结过它的宗旨:“让消费者们知道怎么才能最好地使用他们的时间和金钱。”

汇聚多家媒体得出均分,比单一媒体评分更具说服力,在相当长一段时间里,M站评分扮演着游戏口碑风向标的角色,以至某些发行商给游戏的奖金也会和M站评分挂钩。黑曜石工作室制作人克里斯·阿维隆就曾透露,由于比预期目标低了1分,他的团队错过了100万美元奖金。

M站的一项特性是取“加权平均分”,多伊尔对此表示:“我们的系统里权重是不透明因素,这是我们的独家秘方。”它选择媒体的标准同样不透明,像IGN、Eurogamer这样规模较大的媒体,总部和某国分站可能会被同时收录到一款游戏的评分列表里。

M站的长期竞争对手GameRankings在收录媒体上更加严格,且会计算绝对平均值,不过这家网站已经在2019年年底宣布关闭,原域名直接重定向至M站,原团队表示只会“带来更多经典的游戏评论”,不再提供评分服务。

改变原有评价体系的也不止一家,知名媒体Eurogamer早在2015年就放弃了1-10分的评分机制(分站仍保留),采用“推荐”、“精品”等区间评级。

老牌网站或媒体寻求变化的原因不难理解,移动互联网的到来、直播和视频平台的兴起都改变了原有媒介生态。“自媒体”的门槛降低后,一来玩家的发声渠道变多、发声成本减少,都能对一款游戏各抒己见,而媒体评测人员本质上也只是“更专业的玩家”,给出的评分本就无法避免主观色彩。二来通过观看直播和视频,玩家们也能在初步了解游戏后决定是否购买,不再依赖“评分”和“口碑”。

大环境变化是旧有评测体系必然面临的困境,但要将一款游戏的“评分权”完全交给玩家,现阶段似乎也行不通。

有关“差评轰炸”的案例不胜枚举,前段时间赛车游戏《GT7》就因为微交易、维护时间长等问题,在M站上的用户评分被刷到了1.5/10,成为该站史上分数最低的PlayStation游戏。

Steam上规模较大的刷差评事件则有缺中文的《足球经理》、突然涨价的《尼尔:机械纪元》等。有开发人员对披萨君回忆,自家游戏因为添加了一段角色可能死亡的隐藏剧情,Steam、WeGame等几个平台的好评率都在短短几天内从90%跌到了50%。

除了“故意差评”,还有“故意好评”,即以说反话、玩梗的形式拉高游戏评分,2018年时TapTap 上的《贪玩蓝月》就曾“中招”,官方不得不发了一则“关于恶意评价5星的的情况处理”声明,去掉冗余评分后游戏评分从8.3分降到了1.8分。

在很多时候,“玩家评分”只是表达情绪的一种方式,无法代表游戏内容质量的优劣好坏。

游戏评分为何难统一

理想状况下,具体的“分数”背后都应该有某种稳定的评价体系作为支撑,而探讨应该如何评价一款游戏,就避不开游戏带有的“商业”和“艺术”双重属性。

据Newzoo统计,2021年全球游戏市场规模已达1803亿美元,一个客观、庞大的市场支撑着“游戏首先是商品”的说法。“游戏归根结底是一种商品,商品能满足消费群体的需求就是合格、成功的。”一位旗下买断制作品销量达200万份的公司高层告诉披萨君,“只要玩家愿意持续不断地投入时间,真心愿意付费,那就可以说这是款好游戏。游戏毕竟不是衣食住行那样的必需品,而是消遣品。游戏制作者也得找准足够的玩家群体才能生存,不然容易曲高和寡。”

在消费逻辑里,情绪化评分也具有一定合理性。游戏的优化问题、网络问题乃至提供的语种不全,都可以解释为消费者因为使用体验不佳,进而行使了自己的评价权。

更极端的情况是,一些游戏相较其他内容产品,还提供着“内容消遣”之外的功能。某大厂员工向披萨君坦言:“大部分人看电影还是想看到好内容,但大家玩游戏的目的是有区别的,有些人可能想玩好游戏,有些人玩游戏就不是为了玩游戏的,可能是想花钱享受‘虐人’的快感,可能是想找个地方发泄负面情绪……”

如果不用区分游戏内容品质的“好”与“坏”,评分就没有存在的意义了。此外,但凡涉及充值,不同玩家的消费力度就会有差距,“游戏的ARPU(平均活跃用户收入)很高,一些网游私服可能就靠几个玩家养整个服务器,其他都是机器人,这时评分也没有意义。”上述大厂员工表示。

但商品属性并非游戏的全部。国内去年试行的《游戏审查评分细则》,就提出过从观念导向、原创设计、制作品质、文化内涵和开发程度5个维度对送审游戏进行打分。从行业及玩家认知的角度,“第九艺术”的名号也已经伴随游戏多年。

一旦进入艺术范畴,基于欣赏或鉴赏的评分就需要一定的评判依据。

“首先明确并非所有游戏都叫艺术,就好像绘画是艺术,我画的就不是。”制作人亚恒向披萨君分享了他给游戏划分的6个评判维度:商业成绩;玩家影响力;制作水平;游戏艺术价值(指与交互、系统、玩法相关的设计);一般艺术价值(人文、社会、美学等普适审美体验);作者性。

“其实普通玩家没有义务做鉴赏。”他表示,而奖项则是另一个极端,代表着一定要依循鉴赏目的来做评选,“不同奖项的侧重点也不一样,比如TGA会比较看重制作水平、一般艺术价值和商业成绩,IGF会看重游戏艺术价值和作者性。”

受访者供图

奖项的评选标准固然和普通玩家关系不大,但游戏也没有一套被资深爱好者们普遍认同的评判标准。媒体评测一般会有画面、系统、叙事等大致维度,再根据各个维度的表现打出综合分,是否精准暂且不论,这套话语体系在普通玩家中的普及度也不算高。

而类似豆瓣、IMDB这类第三方影视社区,聚集起一批爱好者群体(电影领域即“影迷式观众”)是它们能影响行业的先决条件。对“好游戏”的认知太过分散和个人化,导致目前国内游戏社区的“众评”版块很难具备影响力。

专注手游的TapTap是个例外,创立初期,TapTap曾以“发言前答题”的形式向用户传达社区文化,建站理念比较接近打造硬核玩家社区。不过由于手游自身轻量化的特性,迄今还是很难看到基于某些标准的完整评测,更为常见仍是感性打分。

深究下去,这是因为游戏在学术研究和基础教育这两个重要领域的失语。

从事游戏研究的学者刘梦霏曾在采访中表示:“参照兄弟行业影视,学界和业界的关系很健康,研究和评论影视有门槛是一种共识,至少得有阅片量才能输出靠谱的意见。”

但在现在的社会共识里,玩家要评论一款游戏不要求“玩过很多游戏”,也极少有院校会开展涉及游戏理论及游戏评论的研究。

另一方面,鉴赏需要后天培养,每个人小时候都会在学校或家庭里被推荐书单、影单,接受一些“优秀作品”的熏陶。哪怕一辈子不迈进专业领域,抱有兴趣的人多年积累下来也会形成大致的判断框架,有自己关于作品好坏的模糊认知,但游戏并没有这种待遇。

大部分玩家从未有意训练过自己的“游戏素养”,游戏这种文娱载体在任何第三方平台也就没法形成稳定的受众评分。

如果从1962年的《Space War》算起,电子游戏到现在的历史只有整整60年,本身技术迭代速度飞快,目前更多作为消费品存在、不被赋予更多文化意义也非常正常。“评分”只是露出海面的一角冰山,下方如果要形成稳固的、被广泛认知的欣赏、鉴赏体系,恐怕还需要给游戏以岁月。

推荐内容