2018年了，MXNet 发展的如何了？

2015是深度学习框架的黄金一年，到了2018年，我倒是感觉已经进入稳定期。两个月前跟tensorflow团队聊了一次，在讨论未来五年大方向时，包括jeff dean在内都赞同框架本身已经是进入稳定期，tf因为有包括搜索和广告在内的重要用户，所以大变动可能性不高。mxnet同样也是这样，amazon内部和多个大的aws用户的产品都依赖mxnet。可以预见，未来的大趋势是让前端更好用，更加稳定，而且不断改进性能，特别的是新模型和新硬件。

同时，我们也注意到深度学习应用的普及在加速。很大一部分新用户其实不关心是用什么框架，而是如何快速上手某个算法，并应用到自己的研究或者公司项目中去。所以一年前开始mxnet社区开始了下面这四个项目：

面向初学应用的深度学习教程：动手学深度学习 – 动手学深度学习文档。过去一年里这个网站有超过一百万的浏览，PDF也被下载十万+次。同时配套社区的评论也超过了五千。
快速上手最新的CV和NLP模型：GluonCV: a Deep Learning Toolkit for Computer Vision，http://gluon-nlp.mxnet.io/ 这两个项目复现了数十篇重要论文，有些模型比目前最好的公开版本还要好，也做了一些研究性的工作。之后会写blog来介绍。
2018年是新AI硬件涌现的一年，预计之后几年还会加速。mxnet社区分流了很多人力去开发http://tvm.ai/ 。例如天奇在过去一年半主要在做TVM。TVM使得训练好的模型能够很简单的高效的部署到各个平台上（Intel CPU/GPU，Nvidia GPU，ARM CPU/GPU，TPU类似的新硬件）。目标是“train once, deploy everywhere”

我的个人建议是，框架只是一个工具，是为应用服务。我们的目标应该是深度学习本身，包括了解各个算法，知道state-of-the-art中的各种细节，和懂得如何将技术应用到实际中去。在学习算法的过程中了解框架的使用，从而使得你的开发更快。所以，如果你想：

学习深度学习技术，可以参考《动手学深度学习》这个教程。
有了一定的知识，而有关注的模型。如果这个模型刚好在GluonCV和GluonNLP中，可以去了解重复state-of-the-art结果的各种细节和trick，并用它们来进行快速开发。
想知道如何部署训练好的模型，特别是关心性能和新的平台，可以参考TVM。

如果你有不同的想法，欢迎跟我们留言 🙂

来源：知乎 www.zhihu.com

作者：李沐

【知乎日报】千万用户的选择，做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 12 个回答，查看全部。