标签:技术/机器学习/深度学习



PyTorch源码分析(2)——动态图原理

深度学习 框架 PyTorch 源码

1. 回顾与本文概述2. 算子支持、Dispatch机制1. dispatch原理2. PyTorch算子流程3. 反向传播1. 反向算子及其注册2. PyTorch反向计算原理3. 反向算子有哪些4...

PyTorch源码解析(1)- 整体预览

深度学习 框架 PyTorch 源码

1. 代码架构2. 前端&后端1. 概念2. 前端3. 后端4. 前后端交互3. 动态图、静态图1. 概念2. PyTorch图原理概述 第一篇文章节作为整体预览,一方面介绍代码的整体架构,一方面普及...

深度理解卷积神经网络CNN

机器学习 CNN

作者:张雨石自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-con...

为什么神经网络会有很多局部最优点?

机器学习 深度学习

这其实是一个理解上的误区:陷入局部最优其实不是神经网络的问题,在一个非常高维的空间中做梯度下降,这时的local minimum是很难形成的,因为局部最小值要求函数在所有维度上都是局部最小的。实际情况...

关于卷积的理解

机器学习 CNN

https://graphics.stanford.edu/courses/cs178/applets/convolution.html

NCCL中设置不同的RDMA优先级

网络 深度学习 RDMA QoS NCCL

具体方法IB piority原理PFCDCQCN交换机ECN与QoS设置优先级与环境变量设置主机和交换机上的一些配置 NCCL用在分布式深度学习训练中时,如果所在集群流量混杂,则可以考虑调整优先级Qo...