学习资源

[DNN] 尝试理解深度神经网络的Large-batch魔咒

257
知乎用户
最近贵司的“一小时训练ImageNet”论文在国内外各种刷屏(https://research.fb.com/publications/imagenet1kin1h/),看了一下,确实非常实用主义的文章,介绍很多有用的trick,包括系统实现上的很多坑都覆盖到了。其中谈到加速训练的难点之一是:需要用到更大的mini-batch size,而这通常会降… 显示全部

荐译一篇通俗易懂的策略梯度方法讲解

125
杜客 CS231n资源在专栏文章中
版权声明:本文智能单元首发,本人独立原创翻译,禁止未授权转载。前言:策略梯度(Policy Gradient)类方法是增强学习的重要组成部分。关于策略梯度的讲解,有David Silver的增强学习课程视频他在ICML2016上对深度增强学习的介绍,有John Schulman在暑期… 显示全部

卷积神经网络工作原理直观的解释?

444
YJango日本会津大学人机界面实验室 博士在读 深度学习/人…

数学里的 e 为什么叫做自然底数?是不是自然界里什么东西恰好是 e?

63K
张英锋 好答案不在对错,在于让心智获得更多自由…
收录于 知乎周刊 编辑推荐 63604 人赞同

深度学习中 Batch Normalization为什么效果好?

643
魏秀参南京大学 计算机科学与技术博士在读 欢迎关注我的专…

机器学习中用到哪些矩阵知识,如果要补这些知识,求推荐合适的书籍资料?

711
知乎用户

有哪些命令行的软件堪称神器?

int32bit 精通Linux、OpenStack、Docker等单词拼写

怎样做出优秀的扁平化设计风格 PPT 或 Keynote 幻灯片演示文稿?

29K
胖子邓 公众号:胖子邓

机器学习算法线上部署方法

168
携程技术中心 聊技术,话人生 | 微信公号ctriptech
我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,直接套用一个公式就好了,速度飞速,肯定满足工程要求。这个时候你又屁… 显示全部

有哪些特殊的搜索引擎?

知乎用户
上一页 1 2 3 ... 10 下一页

加入知乎

与世界分享你的知识、经验和见解

验证码
已有帐号?

关于创建者

知乎用户

换一换

热门收藏