信息摘要:
事件營銷之百度事件脈絡的算法詳解:百度事件脈絡在關鍵詞上的展示會隨著事件的轉發量而增加,當然,如果事件的熱度下降了,展現的廣度也會隨著縮小。新聞事件距離,新聞集合去噪,時間片類聚,代表新聞選取,可以輕輕松松的了解到整個事件發展的全過程,有效的提高獲取
如果你在百度之中輸入“黃海波”、“巴西世界杯”等熱門詞匯時會發現,右側首次出現一條時間軸信息圖,這就是事件脈絡。這是百度新推出的一種搜索效果,它是按照時間的順序將整個事件的發展過程,按照時間軸的組織方式呈獻給用戶,讓用戶迅速的掌握一個事件的來龍去脈。
百度事件脈絡在關鍵詞上的展示會隨著事件的轉發量而增加,當然,如果事件的熱度下降了,展現的廣度也會隨著縮小。下面,讓我們朗創網絡營銷一起來了解一下百度事件脈絡的算法:
新聞事件距離:在新聞發布高峰期間隔1小時,要比在新聞發布的低谷期間隔一小時,造成的時間跨度更長。一般上午是新聞發布的高峰,下午兩點到四點也是。對不同時間段的新聞發布數量進行統計,可以幫助到后續的時間片聚類。
新聞集合去噪:不同媒體對事件的報到的時效性是不一樣的,進行時間片聚類之前,還應該去除掉相似的新聞,為了避免同一類新聞太過相似,比較特征向量,利用該特征向量,如果新聞集合太大,就應該利用站點的權威性進行過濾。
時間片類聚:每一篇新聞,抽取發布時間;根據發布時間,把一個新聞事件集合內的新聞進行排列。將新聞按照發布時間投放到時間軸上,如果事件的發展比較明顯,就能在時間軸上看到一些新聞比較密集的區域,這個區域就是我們想要獲得的新聞發展的個個階段。
代表新聞選取:新聞來源的站點的權威性如何,該新聞是否在第一時間進行發布,新聞的轉載量如何等等。
通過對具體例子進行分析我們也可以發現事件脈絡中展現的額信息發布日期,即時間脈絡中的日期,誤差多不會超過一天;發布時間一般會集中在早上8點~11點,以及下午13~16點且轉發量較大,基本在500以上。
事件脈絡是以時間為主線的方式來進行呈現的,這樣用戶就不用再自我梳理,可以輕輕松松的了解到整個事件發展的全過程,有效的提高獲取信息的效率,并且對用戶進行深入引導。
搜索引擎的目的在于滿足人們的需求,能夠更好地對搜索結果進行匹配與分類,與用戶之間形成完美的互動,這就是搜索引擎發展的大趨勢。