Archive for 十一月, 2016

方法論:用簡單的統計獲得一個中上的結果

2016-11-29

 今天看到光年更新一篇文章,從一大堆內容中提取出現頻率和重要性高的關鍵詞。應用于seo關鍵詞研究、文章或者網站是否主題相關,優化文章標題或者文案。統計seo流量關鍵詞和ppc關鍵詞。

原理:一個詞庫,自動分詞,然后統計出現頻率,根據頻率+詞性,就有一個權重計算。根據權重得分,來應用場景,快速得到一個對未知行業的中位數判斷。
 
想起四年前做淘寶的時候,剛開始介入一個行業,做標題、首圖、描述時用到的方法,

 

  • 標題:拆分詞詞組,統計出現頻率。
  • 首圖:特征分解,是否有模特,產品圖片在左還是在右,是否有營銷文案(特價,買一送一),主色調(紅、藍)
  • 描述:拆解成參數介紹,首圖,細節圖,成功案例,品牌介紹,客戶反饋,行業排名,應用場影,模特圖,好評返現等,統計大家都有的元素,必加,統計出現位置靠前的元素,然后綜合因素,重組基礎描述,再通過后期的運營數據(后臺數據和客服問題反饋)再調整。

總結方法論:對未知行業預判之前,綜合現有的行業標桿,拆解共同元素,統計比率,再切入分析,快速達到中位數結果。

alexa前100萬網站列表下載與應用

2016-11-14

1、直接上結果:

alexa前100萬網站列表下載:

http://s3.amazonaws.com/alexa-static/top-1m.csv.zip

2、在哪里找到這個列表的

https://support.alexa.com/hc/en-us/articles/200449834-Does-Alexa-have-a-list-of-its-top-ranked-websites

3、找的方法

用google查詢  site:alexa.com top-1m.csv.zip

4、這個列表有什么用?

(1)例子1:判斷域名應用率,國內域名應用率

  1. 先把國內經常會用的域名后綴列出來:com、cn、com.cn、net、net、gov.cn
  2. 從列表中篩選出這些域名
  3. python爬蟲遍歷,再次確認他們語言是中文
  4. 再拆分后綴,統計數據,計算占比
  5. 一直在吹噓的某些泡沫后綴,其實可以完全不計了,米農要跳過這些泡沫,不要玩。也可以看前綴,看看有那些優秀的網站用的是什么域名前綴,還是否有這樣的前綴機會。同時也可以找到優秀域名將來可能會啟用的域名,提前布局。當然還有一種域名就更牛了,直接是行業詞,例如geyan.com xiaohua.com 或者大流量站,上升流量站還沒有收購終端域名,都值得提前布局。

(2)例子2:挖行業詞庫

  1. 如例子1找到這些中文站,爬蟲抓取標題
  2. Search標題的核心詞,舉例:手表,就搜索“表”按alexa排序,牛叉的行業站就出來了
  3. python遍歷愛站關鍵詞,就是行業詞庫了

更多應用場景,等你來開發

中国云南11选5走势图