蓝鲸TMT记者 陈蓉
马蜂窝数据造假事件随着对峙双方的不断发声,正在愈演愈烈。
10月21日,自媒体人“梓泉”通过其公众号发布《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》,称国内头部旅游UGC社区马蜂窝2100万点评中1800万条数据涉嫌抄袭,后者随即陷入舆论风暴。
马蜂窝回应称,“点评”这一项UGC内容仅占马蜂窝整体数据量的2.91%,该文章“部分言论歪曲事实,是有组织的攻击行为”,随后马蜂窝以侵犯名誉权为由,将深圳市乎睿数据有限公司、自媒体人丁子荃告上法庭。
自媒体人“梓泉”亦奋起应对,于23日凌晨推送最新文章,指责马蜂窝在回应中偷换概念、避实就虚,称团队后续将逐步放出经司法公证的更多证据,力证马蜂窝造假事实。乎睿数据团队也向蓝鲸TMT记者发来最新回应,后者表示,公司曝光数据造假纯属顺手为之,没有针对任何个人或企业,有如此大的反应“始料未及”。
业界对马蜂窝“造假门”事件空前关注,但意见纷纭。有人认为自媒体文章揭露行业“造假潜规则”冰山一角,为其叫好,但亦有专业人士认为,数据搬运为行业竞争现状,点评等造假或不影响其核心估值。截止发稿,马蜂窝方面未有更多回应。
造假风波乍起
马蜂窝“造假门”源于自媒体人梓泉在其公众号发布《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》文章,该文章称,作为一家主打用户生产内容的旅游网站,马蜂窝的2100万条“真实点评”接近于核心资产。
然而,经过名为乎睿数据的团队对网站进行分析,马蜂窝上存在7454个抄袭账号,合计从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了572万条餐饮点评与1221万条酒店点评。
22日马蜂窝发布相关回应称,自媒体文章所述的马蜂窝用户数量,与事实和第三方机构数据都严重不符。其表示,UGC(用户原创)内容数据中,游记和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,问答占比10.26%。“点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的帐号数量在整体用户中的占比更是微乎其微,马蜂窝已对这部分帐号进行清理。”
但类似回答遭遇乎睿团队质疑,在“梓泉”关于此事最新篇《我承认,我们是有组织攻击马蜂窝的》的推文中,乎睿团队直指马蜂窝“点评数仅占总体数据量2.91%”这一解释为偷换概念,将点评数据大小与绝对数量混淆;另一方面,乎睿团队认为,涉嫌虚假点评账号占总体用户比例虽小,但贡献了85%的点评,其作用不在小。并直指平台回避诸如操纵“问答”板块活跃度、暗箱操作内部员工中奖等问题。
今日(23日)凌晨,乎睿数据团队向包括蓝鲸TMT在内的媒体发来加盖公章的最新公司声明,称截至目前,乎睿团队至今的分析内容都以事实和数据为依托。
根据天眼查信息显示,深圳市乎睿数据有限公司注册于2018年1月,注册资本102万人民币,其法定代表人为吴昊。据其介绍,乎睿数据团队目前仅有三名创始成员,一名曾就职于 Instagram担任广告组技术带头人,另一位为师从某一线 NLP(Natural Language Processing,自然语言处理)学者博士生,今年春季休学回国,剩下一位为从“某十亿级 IOT 初创企业”离职员工。
乎睿团队向蓝鲸TMT记者表示,在深入分析前,团队就已发现许多尚未披露过的数据异常。一些有数千条点评的抄袭账号在个人主页中却只显示 300 条。而在今年七八月份,该 bug 突然被修复,在抄袭账号主页完整查看数千条点评内容,于是团队对大量可疑行为进行了视频录屏和截屏截图,并进行了司法公证。团队也对于确定的分析内容,以及点评消失的抄袭账号链接都进行了收录。
乎睿团队称,他们同时掌握了部分接管抄袭账号的马蜂窝内部员工的信息,由于涉及隐私并未提及。乎睿数据向蓝鲸TMT强调,曝光马蜂窝数据造假,纯属顺手为之,没有针对任何个人或企业,并表达了希望此事能促进市场规范的意愿。
业界争鸣商业竞争不合理现状
在文章发布后,争论点一度聚焦在数据造假是否合理合规,自媒体人“梓泉”表示团队意在揭露行业不正当现象,称在“大家都接受了这件事情”的情况下,“点出来皇帝没穿衣服,反而会被嘲笑 ‘不会阅读空气’”。
一位大型生活服务类互联网公司技术人士向蓝鲸TMT记者解释,由于法律漏洞的存在,互相搬运数据,这在国内互联网企业确实是司空见惯的行为。“知道的BAT都这么干过。” 而为应对竞争对手,公司都会有专门的反爬虫团队。而在乎睿数据的推文中,马蜂窝涉嫌抄袭的点评也因携程团队设置的反爬内容而暴露出错误。
#p#分页标题#e#该人士透露,诸如大众点评等此前属于数据富矿,各家同一赛道的互联网公司都对其用户评论虎视眈眈。“爬虫技术算是互联网企业的矛与盾,大家互相攻防”,并表示行业对此事的认知已经习以为常至“在技术人看来,这是技术不过关,才被别家把数据爬走。”
品途商业评论称,此次事件过后,马蜂窝估值或从175亿大幅下调至20亿。但有业内人士向蓝鲸TMT记者表示,投资人对于企业类似搬运数据、加工抄袭的行为未必不知情,但DAU(日均活跃用户)、订单量和文章数才是投资人关心的核心指标,且日活等有第三方机构的报告作为参考,点评造假或不触及马蜂窝商业核心。
蓝鲸TMT记者联系到某头部旅游UGC平台前员工,其表示对此事件不便予以置评,但她认为,作为主打内容社区,如果当前量级是由灌水而来,马蜂窝造假门对于类似企业估值的确会有影响。
电子商务研究中心生活服务电商分析师陈礼腾认为,在平台发展前期为了吸引用户适当采用抓取或许可以理解,但对于已经成长起来的“独角兽”来而言,长期存在这种方式,不管是平台行为,还是商家所为,就存在欺骗消费者嫌疑,且随时可能引爆,对平台造成“毁灭性伤害”。
北京志霖律师事务所赵占领律师表示,用户点评信息的权益到底属于谁,目前法律上并没有明确的规定。但对平台来说,集聚用户、收集信息并且维持用户活跃度,往往需要投入大量的人力物力,并且需要经过长时间的积累,马蜂窝的抄袭行为如果属实,就涉嫌不正当竞争。
此类旅游类平台对于旅游景点线路,或者是其他的一些评价的信息介绍越多越丰富,平台就越有吸引力、越有竞争力。在这种情况下,其他的在线旅游平台未经某家旅游平台的允许,擅自抓取平台上用户所发布的信息,这种行为实际上属于是违反诚实信用原则,是不正当竞争行为。
OTA竞争中,马蜂窝如何杀出重围?
马蜂窝由陈罡和吕刚创立于2007年,自2010年开始商业化运营后,在携程、去哪儿等老牌旅游平台和阿里飞猪等OTA巨头的夹击中杀出重围,成长为旅游UGC赛道具有相当体量的独角兽。
据其公布的数据显示,目前马蜂窝平台每月有近1.2亿活跃用户,其中85%来自其移动端,网站用户号称每月发布超过13.5万篇旅游文章。2017年马蜂窝GMV达到100亿,其中交易额主要来自自由行、酒店交易。此外还有一部分收入来自于广告业务。
有意见认为,最近几年,在线旅游流量在头部OTA企业集中明显,而马蜂窝的优势则是依靠平台存在的大量游记攻略UGC社区内容,解决了昂贵的流量难题。从2015年开始,马蜂窝打造“内容+交易”的商业闭环,以内容进行电商变现,其中自由行是其业务亮点。
今年8月份,有外媒报道称,马蜂窝在新一轮融资中筹集至多3亿美元,此轮融资公司估值定为20亿至25亿美元,长达数月的融资谈判正在进行之中。去年12月,马蜂窝宣布完成1.33亿的D轮融资,投资者包括美国General Atlantic、Ocean Link、淡马锡、元泰投资和厚朴投资,以及已有投资者——今日资本、启明和高瓴资本。
马蜂窝的GMV规模在巨头对比之下并不突出。如携程2017年GMV为6000亿,阿里飞猪在2016年达到千亿,但相较其他平台,马蜂窝在2017年各季度用户APP的使用时长和活跃度较好,用户表现出高度忠诚度。根据易观此前发布的《2018年在线旅游市场年度报告》显示,其APP人均使用时长在1.9~3.5小时,流量和黏性较好。
依托优质UGC内容起家,并被寄予“差异化竞争”希望的马蜂窝,此次造假风波持续发酵,如何影响正其正在进行中的新一轮融资,有待继续观察。