面临的远程工作挑战以及如何克服
|
如此巨大的参数量,也为模型推理部署带来了挑战。以机器翻译为例,目前 WMT[4]比赛中 SOTA 模型已经达到了 50 层以上。主流深度学习框架下,翻译一句话需要好几秒。这带来了两个问题:一是翻译时间太长,影响产品用户体验;二是单卡 QPS (每秒查询率)太低,导致服务成本过高。 因此,今天给大家安利一款速度非常快,同时支持非常多特性的高性能序列推理引擎——LightSeq。它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。 LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验,降低企业的运营服务成本。 相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势: 1. 高性能 LightSeq推理速度非常快。例如在翻译任务上,LightSeq相比于Tensorflow实现最多可以达到14倍的加速。同时领先目前其他开源序列推理引擎,例如最多可比Faster Transformer快1.4倍。 2. 支持模型功能多
LightSeq支持BERT、GPT、Transformer、VAE 等众多模型,同时支持beam search、diverse beam search[5]、sampling等多种解码方式。下表详细列举了Faster Transformer[7]、Turbo Transformers[6]和LightSeq三种推理引擎在文本生成场景的功能差异: 听得见的代码普通人很难看懂代码,却有机会听懂代码。 在微信小程序“代码变音乐”里,选择滴滴的“口罩检测”、“智能派单”等功能,点下“生成音乐”按钮,它们背后密密麻麻、艰涩难懂的代码,在“转换机”里流转,经由映射,便被转为风格各异的音乐。 “智能派单”对应的音乐欢快激昂,“失物找回”映射而成的音乐悦耳悠扬,“疲劳提醒”代码转成的音乐则大气舒畅…… 这5段台前可感知的音乐,是由滴滴的5个常用功能映射而来。在1024程序员节这个特殊的节日,滴滴的几个程序员们组成了一个兴趣小组,在两三天的业余时间内将滴滴App背后的代码变成了音乐,并制作成小程序,让程序员敲出的代码变成了公众能感知到的语言。
在这个小程序里,用户还可以自行新建代码或者选择随机一段代码,一键将其映射为音乐。普通人不识代码,却也能借由代码之手,创造音乐——这是来自程序员们的浪漫。
检查是否有语法错误-n:
(编辑:桂林站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

