感冒药也能引发交通事故:教师资格证成绩几年后不能查询  [舆情]

文章来源:新浪财经发布时间:2019年02月18日 14:42  【字号:      】

感冒药也能引发交通事故 馬蜂窩回應數據造假指控:文章失實,系有組織攻擊#標題分割#

原標題:馬蜂窩回應數據造假指控:稱自媒體文章失實,系有組織攻擊馬蜂窩旅游網10月22日發表聲明稱,稱某自媒體發布的文章失實。針對該文中歪曲事實的言論,和已被查證的有組織攻擊行為,馬蜂窩將采取法律手段維護自身權益。

早前報道:近日,一篇來自乎睿數據的文章刷爆了網絡。

文章指出,馬蜂窩的2100萬條“真實點評”中,有1800萬條都是通過機器人從競爭對手那里抄襲的。

截至目前,馬蜂窩尚未就此作出回應。本文作者為“梓泉乎睿數據”,原文標題《估值175億的旅游獨角獸,是一座僵尸和水軍構成的鬼城?》。本文內容轉載自“小聲比比”,不代表鳳凰網旅游觀點。提起馬蜂窩,大家應該并不陌生,世界杯期間“為什么要去馬蜂窩”的洗腦廣告,一度登上熱搜。

據報道,馬蜂窩估值已經達到了25億美元,也就是175億人民幣。

作為一家主打用戶生產內容的旅游網站,馬蜂窩的2100萬條“真實點評”,接近于核心資產。

但自媒體“小聲比比”通過對比數據指出,馬蜂窩這2100萬“真實點評”里面有1800萬條是通過機器人從點評和攜程等競爭對手那里抄襲過來的。

“小聲比比”表示,發現馬蜂窩的數據異常源于一次巧合,偶然注意到馬蜂窩點評增長趨勢非常詭異,點評的數量,在特定時間節點指數級上升隨后斷崖式回落,我們懷疑,這幾個節點和融資有關系。

去翻點評后發現了很多自相矛盾的奇怪現象:網絡截圖在抓取大眾點評、藝龍、攜程等競品網站內容,并進行對比后,結論讓人震驚。

據“小聲比比”統計,就拿餐飲來說,抓取了馬蜂窩上116萬家餐廳并抽取了三分之一的樣本,然后定了一個非常嚴格的“抄襲“標準:一字不差的抄襲,才算抄襲,十句話有一句不同,就不算抄襲。

以這個為抄襲標準,同時,以抄襲150個不同的大眾點評賬戶為”抄襲賬號“標準。

還是在馬蜂窩上,發現了7454個抄襲賬號平均每個人從攜程、藝龍、美團、Agoda、Yelp上抄襲搬運了數千條點評,合計抄襲572萬條餐飲點評,1221萬條酒店點評,占到官網聲稱總點評數的85%。

統計結果“小聲比比”表示,這還是我們把抄襲定義的非常嚴格的情況下統計出來的結果,如果把抄襲定義的更加寬泛,馬蜂窩還能剩下幾條原創點評,我都說不準,而且這些賬號很多都有官方背書。網絡截圖根據自媒體賬號“小聲比比”的調查結果,共有以下三大疑點:抄襲實錘一:這些抄襲賬號出現了很多自相矛盾的靈異現象。比如這個性別是“女”的問答小班長二號,先是去桐鄉找女朋友,在同一天,給老公在上海定了全季酒店,而且和女友在南京漢庭睡得很好。網絡截圖抄襲實錘二:因為Yelp上的評論是英文的,抄的時候直接調用Google翻譯接口。回答詞不達意,還把“簡明英漢詞典”給搬運了過來,在馬蜂窩上搜“簡明英漢詞典,可以看到大量機翻點評。網絡截圖抄襲實錘三:不慎把不該抓取的內容抓了進來。網絡截圖“小聲比比”表示,不僅如此,這些抄襲賬號,除了貢獻內容和活躍度,也活躍在各種官方的抽獎之中,并且屢次成為各種自由航行、特等獎等大獎的“幸運得主”。比如這次抽獎,價值一萬塊的自由行獲獎者連帶三個索尼微單獲獎者全是抄襲賬號,,四個賬號合計貢獻了11521條抄襲點評。網絡截圖還有這種更夸張的,一個節選式抄襲賬號,連續中獎12次:網絡截圖一個馬蜂窩福利性質的搶購,很多人都說沒有搶到,然后有一個人發帖炫耀說搶到了兩次,愿意傳授秘籍,在知乎上一搜ID,原來是內部員工。網絡截圖最后,文章作者稱,刨除了7554個作弊賬號,在余下的所有賬號中選擇了1萬5千個最活躍的賬號,這1萬5個大V的點評熱力圖,在2015年中旬,這1萬5千人突然同時活躍,然后到2016年初,同時沉寂,令人存疑:評論熱力圖作者通過對比馬蜂窩和大眾點評的餐飲點評趨勢圖發現,大眾點評是用戶周末點評比較活躍,周中比較冷寂,馬蜂窩的大部分用戶集中在周中寫點評,一到周末,斷崖式下跌,酒店點評也是同樣的趨勢:評論趨勢圖相較而言,攜程是周末比周中明顯要多,而馬蜂窩用戶的酒店點評周中比周末多,一到周末,斷崖式下跌。再對比每日餐飲點評數量趨勢,大眾點評是在午飯和晚飯活躍,馬蜂窩用戶則相反,午飯和晚飯時點評少,工作時間(10點-12點)、(2點-5點)更活躍:評論趨勢圖“小聲比比”在文中表示,根據上述分析,我們得到了馬蜂窩的主流用戶畫像:他們是一群每天朝九晚五吃喝玩樂,在午晚飯以及周末干正事的人,他們是一群能夠同時在地球不同地方同時出現,并且反復切換性取向的人?同時,自媒體還表示,將附上乎睿數據的75頁完整馬蜂窩起底報告,一時在網絡激起千層浪。互聯網觀察家、科技先生創始人柳華芳認為,數據造假是互聯網誕生之日起就并村的,從alexa排名造假,到網站內容數據造假,說明造假層次越來越高,越來越仿真化,從假結果、假排名到假運營,有時候投資機構也是睜一只眼閉一只眼。柳華芳指出,內容數據造假有三大問題,一是對被抓取方不公平,二是誤導消費者,三是以虛假繁榮帶真實繁榮,說明了行業競爭激烈和資本浮躁;蜘蛛抓取別人內容是互聯網暗河里很常見的事兒,百度知道、公眾號等都是重災區,有的是為了內容流量,有的是為了運營豐滿。馬蜂窩此前就曾被指出游記抄襲。

来源:新浪财经




(责任编辑:蒙鹏明)

附件:

感冒药也能引发交通事故 -相关新闻

专题推荐