話說國外的互聯網人士就樂于研究和創新,整天都在想著怎么研究個新東西新發明來為網民服務,或者忙著分析和調研一件東西的意義,有強大的鉆研和創新精神。反觀國內互聯網,我只能說“呵呵”,大家都明白的。近來看到一個消息說,國外有人研究了能預測哪個微博能火的模型算法,其實這個研究模型倒很有意思,最起碼對于有心人和很多以微博為賺錢手段的商業公司是個不錯的東西。當然這個模型很容易讓人聯想到之前google推出的電影票房預測模型,能夠提前一個月預測電影上映首周的票房收入,據說準確率高達94%。
微博是否能火算法的由來
還是先介紹了這個能夠預測微博是否能火的模型吧,據說是來自國外三所大學的研究人員提出的一個預測微博流行度的模型,這三個人分別是來自麻省理工學院斯隆管理學院的助理教授Tauhid Zaman、華盛頓大學的Emily Fox和賓夕法尼亞大學沃頓商學院的Eric Bradlow。這個模型是一個插件,該插件叫做“Twouja”,“Twouija”一詞本是Twitter和“Ouija board”(通靈板,國外很流行的一種游戲,用來預測未來)的合寫。
他們是拿美國主流的社交網站來做試驗,通過分析Twitter和Facebook這種社交網站的社會化數據作為研究依據。當然既然是預測微博流行度的模型,側重點自然是分析Twitter上人們的行為和轉發動作。
他們這個模型的公式并不在意微博的內容,研究者之一Tauhid Zaman說“我不能告訴你什么樣的微博會走紅網絡,但我可以馬上告訴你哪個微博能火”。
Zaman發現在被轉發數量上,一個名人,如前籃球運動員林書豪和一個無名博客有明顯區別。Zanman說,“但在固定一段時間之后,人們微博被轉發的次數就趨于一致了”。他們發現在微博發出去后的十分鐘里,名人的微博和普通人的微博差不多,都能達到這條微博最終被轉發總數的相似比例(差不多50%)。這項研究說明Twitter是曇花一現的,轉瞬即逝。
“微博發出去后幾分鐘里的效果就預示了這條微博以后的能產生多大影響”。比如說,在一條微博發出去10分鐘后:名人的微博可以在10分鐘內被轉發125次,最終總共可能會被轉發250詞。而一個普通人的微博在10分鐘內只被轉發了3次,可能最終會被轉發6次。
Zaman表示,這個微博流行度的計算模型用數學術語叫做“對數正態分布”,它的使用依據是人們行為的一致性:“它非常了不起,就好像把人氣分成了好幾個等級——他人對于一條博客的反應,和在發出后一段時間內被轉發的次數占總次數的比例一樣,都非常穩定”。
預測微博是否能火的模型有何價值?
研究者Zaman相信,這個模型可以幫助社交媒體用戶更好的把握時間線,得到更加精良的信息。這是因為,如果你關注了很多人,重要的博客可能會被大量的微博沖走,最終錯失信息。他說可以通過對新出內容的流行度來進行排序,來生成用戶的社交時間軸。“實際上可以建立一個系統,對時間軸上的內容進行排序,序的依據是兩種度量方式:最終流行度和發出時間”。
他還說這個模型有可能會催發“微廣告”。這種廣告可以嵌在個人社交媒體的內容里,因為這個模型會預測出多少人會看到該內容。
,