原創(chuàng)|行業(yè)資訊|編輯:陳俊吉|2017-11-09 16:23:18.000|閱讀 344 次
概述:基于 Github 和 Stack Overflow 上的活躍度以及 Google 搜索結(jié)果,The Data Incubator 最近制作了一個 23 個熱門深度學(xué)習(xí)庫的排名。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
基于 Github 和 Stack Overflow 上的活躍度以及 Google 搜索結(jié)果,The Data Incubator 最近制作了一個 23 個熱門庫的排名。
下表顯示了標(biāo)準(zhǔn)化后的分?jǐn)?shù),其中值 1 表示高于平均值的一個標(biāo)準(zhǔn)偏差(平均值為 0)。 例如,Caffe 在 Github 中的活動是一個高于平均水準(zhǔn)的標(biāo)準(zhǔn)差,而 deeplearning4j 接近平均水平。見末尾的方法。
該排名基于三個同等重要的部分:Github(star 和 fork),Stack Overflow(標(biāo)簽和問題)和 Google 搜索結(jié)果(總和以及季度增長率)。這 3 部分是通過可用的 API 獲得的。想弄一個全面的深入學(xué)習(xí)工具包列表不容易,所以在最后選取了我們認為具有代表性的五個不同的列表(有關(guān)詳細信息,請參閱下面的方法)。計算每種度量的標(biāo)準(zhǔn)化分?jǐn)?shù),使我們能夠看到在每個類別中哪些包是脫穎而出的。
TensorFlow 在所有計算度量上的平均值上至少有兩個標(biāo)準(zhǔn)偏差。TensorFlow 和第二大流行框架 Caffe 相比,在 Github 上的 fork 數(shù)幾乎是后者的三倍,在 Stack Overflow 上的問題總量是后者的六倍以上。TensorFlow 由 Google Brain 團隊于 2015 年首度開放,已經(jīng)超過了眾多的高級庫,如 Theano(4)和 Torch(8),成為我們榜單的首位。TensorFlow 雖然與在 C++ 引擎上運行的 Python API 一起分發(fā),但表中的幾個庫可以將 TensorFlow 用作后端,并提供它們自己的接口。這些庫包括了 Keras(2),將很快成為 TensorFlow 和 Sonnet 的核心部分(6)。TensorFlow 的流行可能是其通用的深度學(xué)習(xí)框架,靈活的界面,好看的計算圖形可視化和 Google 的重要開發(fā)人員和社區(qū)資源的合力下的結(jié)果。
Caffe 在我們的名單上排名第三,除了 TensorFlow 外,Caffe 其在 Github 上的活躍度比其他競爭對手都要多。Caffe 傳統(tǒng)上被認為比 Tensorflow 更專業(yè),并且專注于圖像處理,目標(biāo)識別和預(yù)先訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)。Facebook 于 2017 年 4 月發(fā)布了 Caffe2(11),并且已經(jīng)排在了深入學(xué)習(xí)庫的上半部分。Caffe2 是一個更輕巧、模塊化和可擴展的 Caffe 版本,包括循環(huán)神經(jīng)網(wǎng)絡(luò)。Caffe 和 Caffe2 是相互獨立的倉庫(repo),所以數(shù)據(jù)科學(xué)家可以繼續(xù)使用最初的 Caffe。然而,有一些遷移工具,比如如 Caffe Translator,它提供了一種使用 Caffe2 來驅(qū)動現(xiàn)有 Caffe 模型的方法。
Keras(2)是排名最高的非框架庫。Keras 可以用作 TensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)的前端。在所有的三個衡量標(biāo)準(zhǔn)上, Keras 的表現(xiàn)均優(yōu)于平均水平。Keras 的流行可能是由于其簡單性和易用性。Keras 允許快速的原型化,但代價是犧牲了從框架直接運行而產(chǎn)生的一些靈活性和控制。數(shù)據(jù)科學(xué)家在數(shù)據(jù)集上做深度學(xué)習(xí)的相關(guān)實驗時,Keras 受到了他們的青睞。隨著 R Studio 最近發(fā)布了 Keras 的界面,Keras 的發(fā)展和受歡迎程度還在不斷延續(xù)。
在新的的海洋中,Theano(4)是我們的排名中最古老的庫。Theano 開創(chuàng)性地使用了計算圖(computational graph),并在研究界普遍做深度學(xué)習(xí)和機器學(xué)習(xí)之時仍保持流行。Theano 本質(zhì)上是一個 Python 的數(shù)值計算庫,但可以與像 Lasagne 這樣的高級深度學(xué)習(xí)庫(15)一起使用。雖然 Google 支持 TensorFlow(1)和 Keras(2),F(xiàn)acebook 支持 PyTorch(5)和 Caffe2(11),MXNet(7)是 Amazon Web Services 的官方深度學(xué)習(xí)框架,Microsoft 設(shè)計并維護了 CNTK(9),Theano 在沒受到行業(yè)巨頭的正式支持下依然流行。
2017 年初,Google 的 DeepMind 公開發(fā)布了 Sonnet(6)的代碼,這是一個以 TensorFlow 為基礎(chǔ)的高級面向?qū)ο髱臁onnet 的 Google 搜索結(jié)果返回頁數(shù)比上個季度增長了 272%,是我們列表中所有庫中最大的。盡管 Google 在 2014 年收購了英國人工智能公司DeepMind,但 DeepMind 和 Google Brain 仍然在大體上是獨立團隊。DeepMind 專注于通用人工智能,Sonnet 可以幫助用戶為他們的具體 AI 想法和研究做頂層設(shè)計。
PyTorch(5)是我們表中增長速度第二的庫,該框架的唯一接口是 Python。與上季度相比,PyTorch 的 Google 搜索結(jié)果增加了 236%。在我們排的 23 個開源深度學(xué)習(xí)框架和包裝器中,只有三個沒有 Python 接口:Dlib(10)、MatConvNet(20)和OpenNN(23)。在 23 個庫中,C ++ 和 R 接口分別只有 7 個和 6 個。雖然數(shù)據(jù)科學(xué)界在使用 Python 方面有些接近同一個共識,但對深度學(xué)習(xí)庫而言,還有很多的選擇。
當(dāng)然,有些庫由于已經(jīng)存在了更長的時間會有更高的數(shù)據(jù),因此排名更高。唯一考慮到這一點的指標(biāo),是 Google 搜索季度增長率。
數(shù)據(jù)呈現(xiàn)中遇到的一些困難:
所有源代碼和數(shù)據(jù)都在上。
我們首先從五個不同的來源中生成了 23 個開源深度學(xué)習(xí)庫的列表,然后收集了所有這些庫的指標(biāo),以獲得排名。Github 的數(shù)據(jù)基于 star 數(shù)和 fork 數(shù)、Stack Overflow 的數(shù)據(jù)包含包名稱的標(biāo)簽和問題,Google 搜索結(jié)果則基于過去五年的 Google 搜索結(jié)果總數(shù),并計算結(jié)果在過去三個月與前三個月相比的季度增長率。
一些注意事項:
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn