科技翻译技巧科技视界国外科技网站
火山翻译团队卖力人坦言,在锻炼数据量小的场景下,“并行翻译”的质量比拟传统手艺处于优势
火山翻译团队卖力人坦言,在锻炼数据量小的场景下,“并行翻译”的质量比拟传统手艺处于优势。可是当锻炼数据范围变大后,“并行翻译”会逐步减少差异外洋科技网站,以至反超传统手艺。今朝“并行翻译”手艺已使用在火山翻译产物中外洋科技网站,用以撑持字节跳动的部门营业。
7月16日动静,在WMT2021国际机械翻译大赛上,翻译团队以“并行翻译”体系参赛,得到德语到英语标的目的机械翻译角逐主动评价第一位。“并行翻译”在国际大赛初次表态,就胜利击败了从左向右逐词翻译的“自回归模子”手艺科技视界外洋科技网站,突破后者在机械翻译范畴的绝对统治职位。
在客岁的WMT2020角逐中,火山翻译得到中英、德英、德法等5个语向翻译冠军,本年以全新手艺夺魁更是一次主要的打破。据引见外洋科技网站,火山翻译已撑持50多个语种、近3000个语向的翻译,不只使用在飞书科技视界、昔日头条等字节跳动旗下产物外洋科技网站,也经由过程火山引擎向企业客户供给手艺效劳。
火山翻译团队卖力人引见说科技视界,“自回归模子”更靠近人类浏览风俗科技视界,逐词顺次第天生翻译科技视界,每个输出的词都依靠于之前的词,当输出文本较长大概模子比力庞大时外洋科技网站,机械翻译的速率很慢;“并行翻译”则是由机械同步输出一切的词,能够充实操纵并行计较,将翻译速率进步数十倍科技视界。句子越长,速率提拔越较着。
据悉,WMT2021是由国际计较言语学协会ACL举行的天下顶级机械翻译角逐,德英语向是该赛事合作最剧烈的大语种项目之一。
“并行翻译”的手艺难点是怎样构成连接语句。对此,火山翻译团队接纳了一项立异的渐进进修方法,由简朴到庞大、由片断到整句锻炼“并行翻译”模子。在连结极高翻译速率的同时,“并行翻译”的质量明显提拔。