让深度学习告别密集计算,新技术可减少95%计算量
莱斯大学的计算机科学家已经改编了一种普遍使用的技术来快速检查数据从而削减计算量,因此深度学习所需的能耗和时间也有所削减。
(资料图片)
莱斯大学的计算机科学家已经改编了一种普遍使用的技术来快速检查数据从而削减计算量,因此深度学习所需的能耗和时间也有所削减。
[[193636]]
莱斯大学的助理教授 Anshumali Shrivastava 说,「它应用于任何深度学习架构,该技术都能亚线性地扩展,也就是应用到的深度神经网络越大节省的计算越多。」
该研究将会发布在今年的 KDD 会议上被介绍,它解决了谷歌、Facebook、微软等大公司面临的***难题之一。这些大公司都在争相建立、训练、部署大量的深度学习网络来发展不同的产品,例如自动驾驶汽车、翻译、邮件智能回复。
Shrivastave 和莱斯大学的研究生 Ryan Spring 表示该技术来自于哈希法(hashing),一种行之有效的数据检索方法,经过改编可极大地减少深度学习的计算成本。哈希法使用哈希函数将数据转换为易管理的小数值哈希(被称作 hash)。哈希被存储在表格中,类似于印刷书中的索引。
Spring 说:「我们的方法融合了两项技术——巧妙的本地敏感性哈希法变体(variant of locality-sensitive hashing)和稀疏反向传播变体——以减少计算需求,且不附带大量的精确度损失。例如,在小规模的测试中发现我们可以降低 95% 的计算,但是和通过标准方法获取的精确度依然差 1% 以内。」
深度学习网络的基本构建块是人工神经元。尽管在 1950 年代就被作为生物大脑神经元的模型,人工神经元还仅仅是把输入数据转化为输出结果的数学函数和方程式。
在机器学习中,所有神经元都有相同的初始状态,就像白纸一样,它们会随着训练拥有各自的特定功能。在训练中,神经网络「看到」了大量数据,每个神经元都会成为识别数据中特定模式的专用结构。在***层,神经元执行简单的任务。例如在图像识别应用中,底层神经元或许用于识别亮/暗,或是物体的边缘。来自这些神经元的输出会被传递到网络中下一层的神经元那里,经受其他模式的识别和处理。仅有几层的神经网络即可识别面部、猫狗、交通指示牌和校车等概念。
Shrivastava 说:「向神经网络层级添加更多的神经元能扩展其表现性能,而我们希望神经网络没有大小上限,据报道谷歌正在尝试训练一个包含 1370 亿神经元的模型。」相比之下,对于训练和部署这样的神经网络可能会有计算力的限制。
他说:「如今使用的大部分机器学习算法都开发于 30 至 50 年前,设计时并未考虑计算复杂性。但有了大数据之后,在资源上有了基本的限制,比如计算周期、能耗和存储。我们实验室旨在解决这些限制。」
Spring 表示,大规模的深度网络中,哈希法将会极大地节省计算量和能耗。
他说:「节能随着规模而增加是由于我们利用了大数据之中的稀疏性。例如,我们知道一个深度网络有 10 亿个神经元。对于任何给定的输入,比如一只狗的图片,只有其中的几个会变兴奋。按照数据用语,我们将其称为稀疏性,而正是由于稀疏性,我们的方法将在网络变大之时节能更多。因此,当我们展示了 1000 个神经元的 95% 的节能时,数学表明我们可以为 10 亿个神经元实现超过 99% 的节能。」
论文:通过随机化哈希的可扩展和可持续的深度学习(Scalable and Sustainable Deep Learning via Randomized Hashing)
链接地址:https://arxiv.org/abs/1602.08194
摘要:为了能在复杂的数据集上进行学习,当前深度学习架构正变得越来越大。这些架构需要极大量的矩阵乘法运算以训练数以百万计的参数。相对地,还有另一个正在发展的趋势想要将深度学习引入低功耗的、嵌入式的设备中。这些矩阵运算(深度网络的训练和测试都需要)在计算和功耗上都有很高的成本。我们提出了一种全新的基于哈希法(hashing)的技术,可以极大地减少深度网络的训练和测试所需的计算量。我们的方法结合了自适应 dropout(adaptive dropout)和用于***内积搜索(maximum inner product search)的随机化哈希(randomized hashing),从而可以有效地选择有***激活(activation)的节点。我们用于深度学习的新算法可以运行在显著更少(稀疏)的节点上,从而可以极大减少前向和反向传播的总计算成本。因此,我们的算法可以仅使用 5% 的总乘法量就平均保持在原模型准确度的 1% 的范围内。这里提出的基于哈希法的反向传播有一个独特的性质:其更新总是稀疏的。因为这种稀疏的梯度更新,我们的算法可以***地用于异步和并行的训练,可以通过增加内核的数量来实现近乎线性的加速。我们通过在几个真实数据集上的严格评估证明了我们提出的算法的可扩展性和可持续性(能效)。
算法 1:使用随机化哈希的深度学习
图 2:一个使用随机化哈希的神经网络的可视化表示
图 2中(1) 通过对每一隐藏层的权重进行哈希操作来构建哈希表;(2) 使用该层的随机化哈希函数来对该层的输入进行哈希操作;(3) 查询该层用于活动集 AS 的哈希表;(4) 仅在该活动集中的神经元上执行前向和反向传播。隐藏层中实心涂色的神经元是活动神经元。(5) 对更新后的权重重新执行哈希至新的哈希位置,从而更新 AS 权重和哈希表。
标签:
让深度学习告别密集计算,新技术可减少95%计算量
2023-05-05
云南省安宁市实验学校举办2023年“和润杯”班级足球联赛
2023-05-05
全球看点:震撼!腾讯、联通新组建公司,相中通州!
2023-05-05
焦点快报!与硅谷银行牵连颇深,高盛遭美国政府调查
2023-05-04
曹县华申木业有限公司_对于曹县华申木业有限公司简单介绍|焦点关注
2023-05-04
全球今日报丨全球首块3D打印鱼片出炉,明年或走上餐桌
2023-05-04
最新!家长看过来!长春市2023年义务教育招生入学政策解读_热点在线
2023-05-04
当前热文:邯郸人才市场_邯郸人才市场
2023-05-04
大额可转存单值得买吗?有什么缺点?
2023-05-04
清华大学“校长杯”十周年庆之科教育人研讨会举办 全球热文
2023-05-04
云南省安宁市实验学校举办2023年“和润杯”班级足球联赛
全球看点:震撼!腾讯、联通新组建公司,相中通州!
焦点快报!与硅谷银行牵连颇深,高盛遭美国政府调查
曹县华申木业有限公司_对于曹县华申木业有限公司简单介绍|焦点关注
全球今日报丨全球首块3D打印鱼片出炉,明年或走上餐桌
最新!家长看过来!长春市2023年义务教育招生入学政策解读_热点在线
当前热文:邯郸人才市场_邯郸人才市场
大额可转存单值得买吗?有什么缺点?
清华大学“校长杯”十周年庆之科教育人研讨会举办 全球热文
多伦多私立高中排名(邯郸市私立高中排名)-新消息
静音平板手推车A宁德静音平板手推车A静音平板手推车厂家|焦点要闻
2023.5.4 A 账户实盘 343
高考朝阳区一模和二模谁难-今日热讯
曝泰国正与宁德时代洽谈电池厂建设等7条快讯
重要言论_天天时讯
焦点热文:五一假期铁路公安机关守护1.1亿人次旅客平安出行
历年高级会计师报名人数&考试通过率统计 前沿资讯
帕金斯:必须停止对哈登能重回火箭登的期待了 我更想关注马克西_热讯
[假期小结]:五一期间己二酸市场盘整运行_焦点热文
小农户要融入现代大农业
朝闻国盛:震荡格局延续 结构继续均衡 每日速讯
汉能太阳能(东方财富网自选股)
天天热头条丨扬帆配资实力强大炒股平台:投资成长股和价值股有何不同?如何选择?
周生生黄金价格今天多少一克(2023年05月04日)
智飞生物:23价肺炎多糖疫苗已申请生产注册、四价流感疫苗、人二倍体狂苗已完成临床试验
全球视讯!【读财报】A股5月近3000亿元解禁 万泰生物解禁规模居前
Apollo牵头的财团接近达成以每股30美元收购Arconic
科技之光照耀医界:AR与AI能为医疗带来什么? 今日要闻
岁月深处有一支歌
- 广州新增7家国家3A级旅游景区
- 环球快消息!铜仁旅游客运站未按时发车且态度十分恶劣
- 美联储加息后油价延续跌幅 WTI原油跌破70美元 百事通
- 镇海区气象台发布大风黄色预警【Ⅲ级/较重】【2023-05-04】
- 非农是什么意思什么是非农数据_大非农是什么意思 天天亮点
- 省钱宝防恶意点击软件下载_省钱宝防恶意点击 全球看热讯
- 假面骑士Faiz Axel Blaster
- 每日视点!fgo赝作活动攻略副本_fgo赝作活动攻略
- 故宫藏粉彩瓷器-当前速讯
- 要闻速递:立讯精密:与奇瑞汽车在Tier1项目上的合作一直处在良好状态
- 【快播报】7295c手机壳_7295c
- 环球快资讯丨冬天夜钓鲫鱼技巧 夜钓鲫鱼钓深还是钓浅
- 镇江五一文旅市场消费持续升温,游客人数暴涨|每日消息
- 太原联艺怎么样画室
- 中国人放鞭炮的意义,专家称是最科学的!
- 环球观天下!谁将是中国的“底特律”?
- 星际战甲司书在哪_当前讯息
- 今日要闻!贵州百灵2022年净利润增长16.64% 今年首季迎开门红
- 全球热讯:南怀瑾先生:这样才叫“了生死”,千万不要搞错
- 近现代书画专场(二)| 北京荣宝线上文物拍卖会(第14期)-天天视讯
- 4月28日抗肿瘤相关企业成交额排行榜(TOP20)
- 尚惠国际幼儿园_尚惠国际
- 游客登台献唱一展歌喉,民歌路演浪漫温馨
- 问渠那得清如许丨历时十年,河南这位90后为“红旗渠牺牲第一人”立传
- 丽珠得乐的功效与作用禁忌_丽珠得乐的功效与作用
- 全球短讯!摩根大通前瞻美联储决议日资产表现:美股可能大涨2.5% 也可能跌1.25%
- 环球时讯:“淄博烧烤”的数万游客来自哪儿?63%来自本省
- 锂离子电池板块上市公司股票一览(2023/5/2)
- 叙利亚外交部谴责以色列针对阿勒颇国际机场的空袭 全球速看料
- 款待英文_款待
- 五一假期交通出行量持续高位运行,明日迎返程高峰
- VOGUE官方把蔡徐坤认成王嘉尔 基本情况讲解|精选
- 最新!@眉山考生,5月这些报考热点请注意 全球热文
- 最新快讯!降雨+返程,请关注这份安全提示!
- 世界观察:年度报告发布!2022年河北81.63%公积金贷款用于购买首套住房
- 世界播报:“潮汐式旅游”如何兼顾品质与安全?
- 因地制宜提高农业机械化水平
- dnf怎么退工会_dnf退工会教程
- 退费申请书应该怎么写_退费申请书范文|环球今热点
- 外螺纹r1/2的尺寸_r1 2外螺纹尺寸 天天消息
- 环球新动态:暴力小游戏大全_暴力游戏大全
- 环球热头条丨【MLP】《机械小马国3:绝续存亡》(5)无尽自由之森
- 李梦:完成梦想的路上一定有坎坷 年轻人不要怕&要勇敢向前
- 荆门签约 17个昆虫及大健康产业项目
- 第一共和银行收购案虽已尘埃落定 业界却仍在争论是否会有下一个_全球速看
- 辽宁省铁岭市2023-05-02 06:32发布大风蓝色预警 热点评
- 全球短讯!科技艺术开启体验消费新模式
- spss中文版安装-spss中文版
- 漳泽农商银行|靳惠忠慰问“五一”坚守岗位一线员工
- 世界微资讯!丈夫刷短视频刷到失踪3年 妻子失踪如何申请离婚