当梯度太大时,参数的调整会变得过于剧烈,网络的学习变得不稳定,甚至会导致训练失败。
这就像你在陡峭的悬崖边滑落,一下子失去了控制。
网络的参数变化过大,导致结果变得很不稳定,甚至完全错误。
概括地说:
梯度消失就像在一座越来越平的山坡上,梯度变得很小,神经网络不知道该怎么调整,进而学习变得很慢,甚至无法进步。
梯度爆炸就像从悬崖边滚下去,梯度变得很大,网络的学习变得过于剧烈,结果会非常不稳定,训练过程变得不可控。
这两个问题经常会出现在深层神经网络中。
而这也是马库斯所要倾诉的困扰。
“说起来,最近的研究还卡在了‘梯度消失’的问题上。”马库斯苦笑着说道,靠在沙上,“我们在训练一些更深层次的神经网络时,现模型一旦过一定的深度,反向传播算法中的梯度会逐渐趋近于零,根本无法有效更新权重。深度越大,梯度就越容易消失,整个网络的学习效率大幅下降。”
马库斯知道林枫硕士是麻省理工学院的计算机硕士,因此也就全都用专业术语表述了。
对于这些林枫当然能听明白,非但能听明白,而且作为一个资深的人工智能从业人员。
林枫也清楚知道马库斯面临的难题。
林枫对ai的展也有所了解,涉及到梯度问题在o年是深度学习研究中的一个巨大挑战。
甚至可以说解决不了梯度问题就很难有真正的深度学习,也就不会有后来的人工智能成果的一系列井喷。
林枫心说,自己这是一不小心站在了技术展的最前沿了吗?
不得不说,这种举手投足之间就能影响时代命运的感觉是真的无比美妙。
“梯度消失的问题一直存在,尤其是深层网络。梯度爆炸倒是相对好解决,但梯度消失会直接导致学习过程停滞不前。”林枫沉思片刻,补充道,“这不仅是你们实验室的问题,也是整个领域的瓶颈。反向传播的基本原理决定了,当信号在网络中层层传递时,梯度的变化会以指数级缩小。”
马库斯脑海中泛起了大大的问号,梯度爆炸问题好解决吗?
他怎么觉得梯度爆炸问题也挺麻烦的?
不过聊天本来就是求同存异,既然林同样认为梯度消失难以解决就够了。
马库斯也没纠结为什么林说梯度爆炸容易解决,而是继续就梯度消失表观点说道:“是啊,哪怕有了re(修正线性单元)激活函数的引入,虽然能在一定程度上减轻梯度消失,但对深层网络还是不够。”
林枫想了想,说道:“你们有考虑过改进网络结构吗?”
喜欢不朽从二零一四开始请大家收藏:(yg)不朽从二零一四开始更新度全网最快。
请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。
星际文相亲养娃 蓄意谋欢 诱哄!占有!周少跪求夫人二婚! 分手后我在娱乐圈杀疯了 月亮盏 易,三国 心动肆吻 当魅魔成为被抛弃的Omega 拜托,爹系男友超宠的! 星际文花店主他很香 娇贵雄虫直播爆红 妖月悬空,开局觉醒双星核 今夜勾欢 (足球同人)[足球]冰山社恐型门将 黎明之后[破镜重圆] 娶了旺夫小夫郎之后 天龙:别人练武我修仙 暗诱!明甜!被疯批恶犬搂入怀 叫我如何不恋他 落日归挽
上辈子,周尧只想当咸鱼,创造了七大传奇IP天神系列,却被他用白菜价卖给了好友。后来家族的产业遭遇危机,他却什么力都帮不上,终于落了个家破人亡的下场,而他...
获得系统,将乡村民宿一步步打造成世界上最好的酒店。全球酒店最大的数据商str负责人德勒双手抱头世界上最豪华的酒店居然在华夏川省眉州市下一个不知名的小山村中,你敢信别拿我们希尔顿集团和那家华...
松软的戚风蛋糕酥脆的牛角面包可口的慕斯蛋糕蓬松的手撕面包网红的脏脏包。甜的咸的,酥香的,口感饱满的。种种精致诱人的面包蛋糕似乎都能从这一家小小的烘培坊找到。这是一个关于烘培的故事。阅读指南...
阿玖最新章节列小说阿玖春温一笑著阿玖全文阅读一句话文案裴家独生女的幸福生活。裴家在接连有了八个孙子之后,终于迎来小孙女阿玖的降生,合家欢喜。慈爱祖父祖母,痴心爹娘,八个哥哥,小阿玖的婴...
她曾经历了长平之战,鉴证了数十万人的坑杀。她曾率领大秦铁骑,与六国逐鹿天下。她见过天下三分,山河破碎。也听过那袅袅的隆中琴音。贞观盛世她曾一醉今朝,那千古女帝又是如何芳华?她鲜衣怒马过,也曾羽扇纶巾。做过田舍农,也为过教书生。却没人知道,这么一个人,活了两千年。嘛,比较轻松悠哉的历史文吧,因为个人原因可能并不能做到完全符合历史,经得起考证。但我会尽力查全资料来写的。第一次写这种文章,我还是希望写的有趣一些,哈哈。最后,变身慎入哈。...
平凡了几十年的程佳终于不平凡了一回,她,重生了重生成了一个胎儿远离城市,远离现代化,生活在七十年代的小渔村,程佳佳的日子不要太逍遥遛狗斗鸡,上山下水,还有个妹控的小哥哥保驾护航,再来个憨厚老实...