马蜂窝被捅48小时:爆料再出锤马蜂窝起诉还有阴

  10月20日晚间,随着微信公众号“小声比比”的一篇文章,马蜂窝们平静的周末夜晚再也无法继续。在“小声比比”发布的《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》文章中,他们基于乎睿数据的提供的数据分析,认为马蜂窝2100万条评论的“线万条抄袭而来。

  文章称,即使将抄袭定义十分严格(一字不差才算抄袭),他们还是在马蜂窝平台发现了7454个抄袭账号,平均每个账号从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评和1221万条酒店点评,占到马蜂窝官网总点评数的85%。

  文章还指出,一些抄袭账号的内容前后矛盾,并且马蜂窝疑似直接调用Google翻译接口机翻yelp等英文平台内容,连翻译错误等都原封不动地保留了下来。

  除了罗列详细的抄袭证据,乎睿数据提取的15000个账号还具有惊人的同一特征:同时活跃、同时平淡,餐饮和酒店点评在周中即工作时间更加活跃,在周末却断崖式下跌,这与其他点评网站恰好相反。

  此外,文章还指出马蜂窝不仅抄袭、抓取其他网站的点评,还有员工专门对这些点评进行编辑加工。

  在“小声比比”第一篇文章在周日的一早引发了10万+的点击阅读狂欢之后,10月21日晚间,该公众号再发文章,称马蜂窝平台将原文提到的点评从账号个人主页中删除了,但在搜索引擎的搜索栏还能找到,餐厅页上的点评也还能看到。

  此外,在第二篇文章中还指出马蜂窝的游记、问答等内容的存在大量机器水军评论以及与商家合作的营销嫌疑。

  在马蜂窝被指数据造假事件蔓延的第一天即21日周日,马蜂窝方面除“正在核实相关情况”以外,并无其他实质性内容对方发布。直到“小声比比”第二篇文章发布,也就是10月22日周一一早,马蜂窝方面终于对质疑发布了正式声明。

  对于餐饮等点评趋势与大众点评等出现明显不符的质疑,马蜂窝表示,餐饮点评不是马蜂窝的内容核心,作为旅游平台而非本地生活服务网站,将马蜂窝的数据与本地生活服务类APP进行比较,并认为马蜂窝员工有组织抄袭,存在明显的误导倾向。

  马蜂窝认为平台在运营过程中确实存在审查漏洞,以致产生了一些不法商家的违规行为等,但是将这些漏洞问题归结全部在马蜂窝身上,并将其描述为一座“鬼城”,是有失公允的,马蜂窝表示“小声比比”的这一行为是有组织的攻击行为。

  值得注意的是,虽然马蜂窝在声明中表明涉嫌虚假账点评的内容只占评论的一小部分,但是对于“小声比比”文章中之指出的虚假评论等问题原因并没有给出令人信服的解释。

  虽然问题原因没有解释,但是在事件爆发一天多的时间里,马蜂窝不单单只做出了回应声明这些事情,“小声比比”中指出的许多问题商户和评论内容,出现了被清空的现象。

  10月22日下午,每日旅游新闻记者对比发现,“宝贝饭堂”为苏州的商家,目前马蜂窝官网、APP,以及美团上的用户评价已清空。马蜂窝上也已找不到“问答小班长8号”等用户信息。

  对于一家以旅游攻略等内容见长的公司,被质疑内容85%有问题,可以说是具有毁灭性的。对于马蜂窝而言,2006年6月上线月正式运营,从成立至今,攒下的1亿位旅行者,2100万条点评,3亿8千万次攻略下载,是马蜂窝在激烈的旅游市场竞争中实现差异化并异军突起的核心资本,也是马蜂窝近年来不断转型、依然赖以生存的最坚定基石。

  可以说,无论是对马蜂窝及其用户来说,这次的数据被指造假,产生的影响可以说是轰动性的。

  对于用户而言,当然有很大一部分用户是对所曝光事件的震惊与愤怒,但也有很多用户,尤其是马蜂窝的使用者表示,在使用马蜂窝的时间里,它在自己的旅行上给出了许多切实可行的帮助。他们并不认为马蜂窝的数据真的如曝光文章所言那么的令人惊悚。

  相比起用户两极化的反应,旅游行业从业者则显得淡定从容许多。多位从业者都向记者表示,无论是何种类型的UGC(用户在线生成内容),在其冷启动之处,每家企业都会搬运内容。这种搬运,有官方授权搬运,有诱导用户自行发布,也有做号团伙搬运等等,在这一列搬运中,运用互联网技术手段,“网络爬虫”方式搬运的方式作为快速有效。

  有旅游社交内容的从业人士解释,旅游UGC的网页爬虫抓取,在行业内是比较常规的操作,主要是为了丰富内容和类型,让网站显得用户活跃,流量大。这与许多电商企业中国的销量、评论、粉丝灌水,本质上并没有太大差异。但新京报评论指出,与商铺刷量吸引用户在其店铺购买商铺的本质有所不同的是,店铺刷量并不损害用户的利益(如果商品内容是真的话),但搬运、抄袭其他网站用户的评论数的行为比商铺刷量拙劣的多,这一行为也将影响市场对于整个行业的信任度。

  在马蜂窝的声明中,记者注意到,虽然“小声比比”指出马蜂窝涉及抄袭的数据占其总点评数的85%,但马蜂窝并没有将重点放在了对问题数据比例的论证上。这主要是因为85%的数据看似确凿、有出处,但事实上,却经不起推敲。如前文所将,网页爬虫、内容搬运是从事行业常见操作。所以对于那些被拿来作为参照对象的点评内容而言,其原创性并不好考证,也就是说,文中所说的来自其他网站的点评内容极有可能也不是原创的,也是被原网站抓取甚至抄袭而来的。

  虽然在绝大部分的UGC平台的网民协议中,都有关于版权的声明,一般由两部分构成:一是明确本平台产生的内容,其他主体不得非法获取;二是用户在平台发布的自创内容,版权归本平台所有。但新京报评论指出,按照著作权法的规定,版权声明中的第二部分内容是无效的,因为用户自己完成的作品,版权当然归属用户,网民协议是格式合同,平台不能掠人之美。法律是这样规定的,司法实践也是这样判决的,至今为止,尚未有生效判决支持过平台的这个条款。

  新京报评论还指出,如果平台产生的内容版权归属于yoghurt,那么平台在他人非法抓取内容时,可以竞争法进行维权。

  此外,并非所有内容都不能抓取。首先,用户自己在多平台发布的信息,这属于用户自由,首发平台没有权利进行限制。其次,对于一些生活类、广告类的信息发布,用户自身就希望信息的扩散,这类信息的抓取应推定符合用户意愿。最后,按照国际通用的robots协议,平台是可以决定哪些可以抓取,哪些不能抓取,符合规则的行为不仅不侵权,而且还有利于信息的传播。

  ”小声比比“用抓取的评论内容对马蜂窝的做了一个底朝天的分析解读,认为这些操作都是马蜂窝为了实现快速增长有意而为之。而在声明中,虽然马蜂窝并没有对质疑的问题给出明确解释,但在没有否认行业常规操作的同时,也指出许多内容是部分不法商家的违规操作。马蜂窝指出,一直以来,公司都在严厉打击游记和问答中的违规广告行为,平均每周处理26000条违规广告信息,查封15000个违规账号。

  此外,也有业内人士表示,许多商家在马蜂窝等平台上线后,为了得到更好的展示位置、评分等,会自己人工添加评论或刷评论,这是因为马蜂窝内部对商家有一套评分系统,其中点评率是一个很重要的指标,如果你所经营的旅游产品没有人写点评,数据自然就会很难看。

  除了商家方面,对于一些旅游点评人而言,为了更好的获得一些利益、增加自己的知名度,他们也会通过买粉、买量、抄袭的方式增加点评阅读量、评论量、内容提交量。而这一部分的人通过一段时间的运作和积累之后,就会逐渐成为圈内小有名气的达人、甚至会发展成为旅游网红,因此为契机点,以获得更多的商业合作机会以及赚钱平台。

  当然,不可否认,这其中,肯定存在平台与商家、旅游达人合作、互相利用的操作可能性。事实上,目前,对于马蜂窝尚未解释的诸多问题中,马蜂窝在内容方面的运营操作存在问题,是毋庸置疑的。

  同时,“小声比比”还指出马蜂窝那些增长诡异的点评操作背后,都与其寻求融资有关。但机缘巧合的是,“小声比比”的这次爆料,也被许多人质疑存在“融资暗战”嫌疑。就在今年8月17日,外媒曾报道,有知情人士透露,马蜂窝正在着手新一波融资,目标筹集至多3亿美元,此轮融资对该公司的估值定为20亿至25亿美元。消息人士称,马蜂窝希望利用融资获得更好的旅游资源和产品,并更好地将其现有旅游内容商业化。

  如果外媒报道属实的话,根据事件的进展时间推算,在过去的两个月的时间里,马蜂窝的新一波融资洽谈进展到关键时刻的10月份,却爆出了这一黑料。

  事实上,去年12月,马蜂窝刚获得了来自美国泛大西洋资本集团、淡马锡等机构投资的1.33亿美元。在经济下行期,不到一年的时间里,再次发起新一波大手笔融资,这着实另许多业内企业眼红。要知道,曾经领先许多的另一家旅游社交平台穷游,在2016年获得一笔融资之后,截至目前就没有新的融资信息传出。

  据新京报独角鲸科技报道,有业内人士透露,这次的刷屏文或来自于友商或新成立的数据公司乎睿,涉嫌融资暗战。但不可否认的是,无论是谁真正捅了马蜂窝,都势必影响马蜂窝的下一轮融资。

  21日晚间,爆料人梓泉曾回应称,乎睿数据公司最初只是想去写一个模型想去鉴定餐饮点评的真假参加数据比赛,本想拿马蜂窝做一个试验,没想到直接把马蜂窝掀了一个底朝天。

  根据天眼查的信息显示,深圳市乎睿数据有限公司是一家2018年1月11日注册的公司,注册资本为102万,“乎睿”商标在2018年5月注册。团队目前成员仅有三人。

  但显然这样的说法并没有说服马蜂窝。就在马蜂窝发布声明当晚(10月22日晚间),马蜂窝向新京报记者证实,公司起诉深圳乎睿数据有限公司、丁子奎名誉侵权案获立案。

  IT与知识产权律师赵占领告诉记者,认定是否涉及名誉侵权的关键点在于他人发布文章中是否存在不实或侮辱性表述;此次“小声比比”公众号与乎睿团队文章中提到马蜂窝涉嫌用户数据造假、虚假点评,如进入司法程序被告对此有举证责任。

  此次马蜂窝就被指评论造假一事,起诉乎睿公司名誉侵权,并非是旅游UGC领域的第一起起诉案例。据相关媒体报道,2008年4月起,携程发现“去哪儿”网站酒店栏目内,有数万个页面均转载有携程酒店点评文章。携程表示,这些酒店点评已成为携程会员预订酒店的重要参考及衡量标准,是属于携程的珍贵信息资源。

  在发现“去哪儿”网站的侵权行为后,携程于2008年6月 19日、7月4日、7月11日三次发函给“去哪儿”要求其停止侵权行为,“去哪儿”在 2008年6月23日向携程回函,对转载内容做了部分修改外,未做其他任何改正措施并一直持续至携程发起诉讼之日。

  法院经过审理确认,携程拥有该网站内容及资源的版权,酒店点评等相关内容的著作权归携程公司所有,“去哪儿”行为明显属于侵权,应依法承担侵权责任。

  旅游UGC的口水战在2014年还爆发过一次。2014年4月,马蜂窝CEO陈罡也曾经在微博公开炮轰去哪儿网通过虚假评论造假,称去哪儿网的刷点评行为已经动摇到了行业诚信的根基。

  此外,同样是UGC领域,小红书和大众点评也就“搬运”用户评价发生过纠纷。7月28日,小红书APP官微发布消息称,大量用户向其反映大众点评疑冒用小红书用户名称账号,批量建立虚假账号,抄袭及搬运用户在小红书发布的原创笔记。要求大众点评立即采取删除所有侵权链接、关闭侵权账号等相应措施。一天后,大众点评回应称接到投诉后立即采取相关技术措施,在7月27日完成所有内容排查与全部清理下线,并通过技术手段确保该类问题不再出现。

  因此,在中国政法大学传播法研究中心研究员朱巍看来,不论此次事件如何定性,都给以UGC为主的平台提了醒,要做到合法合规至少要保证以下几点。第一,非广告类的用户信息,平台不能随便抓取。第二,对于一些质量很好的非本平台信息,若想获取一定要征求发布者的同意,至于原发平台所谓的网民协议约束,在法律上是无效的。第三,爬虫抓取的信息,不要欲盖弥彰地修改内容,去掉水印或者创造出假网民发布,这种行为会导致性质变化,真的上升到诉讼可能无法以技术中立性抗辩。