改进神经网络 - 服务器托管|北京服务器租用|机房托管租用|IDC托管租用|机房机柜带宽租用-价格及费用咨询

Improve NN

文章目录

Improve NN
- train/dev/test set
- Bias/Variance
- basic recipe
- Regularization
- - Logistic Regression
  - Neural network
  - other ways
- optimization problem
- - Normalizing inputs
  - vanishing/exploding gradients
  - weight initialize
  - gradient check
  - - Numerical approximation
    - grad check

train/dev/test set

0.7/0/0.3 0.6.0.2.0.2 -> 100-10000

0.98/0.01/0.01 … -> big data

Bias/Variance

偏差度量的是单个模型的学习能力，而方差度量的是同一个模型在不同数据集上的稳定性。

high variance ->high dev set error

high bias ->high train set error

basic recipe

high bias -> bigger network / train longer / more advanced optimization algorithms / NN architectures

high variance -> more data / regularization / NN architecture

Regularization

Logistic Regression

(

)

→

(

)

∑

(

)

(

)

∥

L2;; regularization:minmathcal{J}(w,b)rightarrow J(w,b)=frac{1}{m}sum_{i=1}^mmathcal{L}(hat y^{(i)},y^{(i)})+frac{lambda}{2m}Vert wVert_2^2

$L 2 re gu l a r i z a t i o n : min J (w, b) \to J (w, b) = \frac{1}{m} i = 1 \sum m L (\overset{y}{^}^{(i)}, y^{(i)}) + 2 m ∥ w ∥_{2}^{2}$

Neural network

∥

[

]

∥

∑

[

]

∑

[

−

]

(

[

]

)

(

[

]

[

]

$F ro b e ni u s n or m ∥ w^{[l]} ∥_{F}^{2} = i = 1 \sum n^{[l]} j = 1 \sum n^{[l - 1]} (w_{i, j}^{[l]})^{2} Dro p o u t re gu l a r i z a t i o n : d 3 = n p . r an d m . r an d (a 3. s ha p e . s ha p e [0], a 3. s ha p e [1] k ee p . p ro b) a 3 = n p . m u lt i pl y (a 3, d 3) a 3/ = k ee p . p ro b$

other ways

early stopping
data augmentation

optimization problem

speed up the training of your neural network

Normalizing inputs

subtract mean

∑

(

)

−

mu =frac{1}{m}sum _{i=1}^{m}x^{(i)} x:=x-mu

$= \frac{1}{m} i = 1 \sum m x^{(i)} x := x -$

normalize variance

∑

(

)

sigma ^2=frac{1}{m}sum_{i=1}^m(x^{(i)})^2 x/=sigma

$^{2} = \frac{1}{m} i = 1 \sum m (x^{(i)})^{2} x / =$

vanishing/exploding gradients

[

]

[

−

]

[

]

[

]

[

]

→

(

[

]

)

→

∞

[

]

Irightarrow (w^{[l]})^Lrightarrowinfty w^{[l]} $y = w^{[l]} w^{[l - 1]} \dots w^{[2]} w^{[1]} x w^{[l]} > I \to (w^{[l]})^{L} \to \infty w^{[l]} I \to (w^{[l]})^{L} \to 0$

weight initialize

(

)

(

−

)

[

]

(

)

∗

(

−

)

var(w)=frac{1}{n^{(l-1)}} w^{[l]}=np.random.randn(shape)*np.sqrt(frac{1}{n^{(l-1)}})

$v a r (w) = \frac{1}{n ^{(l - 1)}} w^{[l]} = n p . r an d o m . r an d n (s ha p e) * n p . s q r t (\frac{1}{n ^{(l - 1)}})$

gradient check

Numerical approximation

(

)

′

(

)

(

)

−

(

−

)

f(theta)=theta^3 f'(theta)=frac{f(theta+varepsilon)-f(theta-varepsilon)}{2varepsilon}

$f () =^{3} f^{'} () = \frac{f ( + ) - f ( - )}{2}$

grad check

[

]

(

)

−

(

−

)

[

]

c
服务器托管网

∥

−

∥

服务器托管网

∥

$d_{a pp ro x} [i] = \frac{J ( _{1} , \dots _{i} + \dots ) - J ( _{1} , \dots _{i} - \dots )}{2} = d [i] c h ec k : \frac{∥ d _{a pp ro x} - d ∥ _{2}}{∥ d _{a pp ro x} ∥ _{2} + ∥ d ∥ _{2}} 1 0^{- 7}$

服务器托管，北京服务器托管，服务器租用 http://www.fwqtg.net

相关推荐: SpringBoot 集成 WebSocket，实现后台向前端推送信息

SpringBoot 集成 WebSocket，实现后台向前端推送信息在一次项目开发中，使用到了Netty网络应用框架，以及MQTT进行消息数据的收发，这其中需要后台来将获取到的消息主动推送给前端，于是就使用到了MQTT，特此记录一下。 1、什么是webs…