Skip to content

网络初始化/Initializing neural networks #959

@junxnone

Description

@junxnone

Reference

Brief

UseCase

  • 任意常数初始化方法(包含 Zero) 阻止学习不同特征
  • 太小/太大 初始化 会导致学习缓慢/发散(梯度消失/梯度爆炸)
  • 合适的初始化值
    • 激活值的均值应为零
    • 每一层激活值的方差应该保持一致

1y9IIX9tuH

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions