最近看數據,謊言與真相這本書,裡面提到很多有趣的以大數據為基礎所做出的論證
其中資料來源當然很多都是從google搜尋紀錄的分析來的(其他還有一些色情網站的搜尋統計XD)
Google有提供Google correlate這個工具可以做關鍵字相關性分析
其中有一段提到google搜尋引擎跟網路剛開始的搜尋引擎運作原理,以前的搜尋引擎是利用網頁中關鍵字出線的次數做指標,但這樣網頁本身可以塞入很多熱門關鍵字來提高本身搜尋排序。google想到要其他網頁其他網頁提到該關鍵字的時候連結到這個網頁的次數作為指標,大大提升了搜尋的準確度。
沒有留言:
張貼留言