翻译技术

语音识别 | ASR 工具 Whisper 的法语识别效果测评

这学期 CAT 课程学习中,字幕翻译部分引起了我比较大的兴趣,与陈老师交流后老师给我推荐了 OpenAI 最近开发的 ASR(自动语音识别)软件 Whisper。在查阅资料后,我发现这一软件的识别效果据说达到了人类水平,且可以识别不同口音,这让我十分好奇,并决定进行测评。作为口译专业的学生,我们平时练习中会接触到大量的视频音频,制作听力文本可以方便我们复习回顾,有时老师也会提供听力文本帮助大家理解,使用 ASR 工具可以让这项工作事半功倍。另外,字幕翻译也是我们学习和工作中可能遇到的翻译类型,在制作视频字幕时,第一步常常要对视频进行语音识别,ASR 工具的使用大有裨益。本文将记录 Whisper 的安装方法(包括 Python、PyTorch、git 和 ffmpeg 的具体安装方式),测评其在特殊口音、背景噪声和技术术语方面法语语音识别效果,并比较 tiny、base 和 medium 三个模型的识别能力,测评部分将使用讯飞的语音识别工具进行对照。

文本处理|捷速OCR文字识别软件功能测评——以德文扫描图片文本为例

在实际的工作过程中,尤其是在专业的翻译公司做译员,可以要求客户或者任务发出者提供可编辑的文本;在对方无法提供或无意提供的情况下,就需要译员自己对原文本进行预处理,自然也会产生额外的费用,由此可得出,作为一名译员,掌握文本预处理的基本方法就显得十分重要,也是为真正进入翻译步骤需要做的必要准备。

机器翻译 | 非文学文本德英语对使用 DeepL Translator 的翻译效果探究

德语和英语在语言、句式等各方面存在很大差异,翻译中转换结构以准确传达信息也存在一定难度。无线电设备指令属于非文学的信息性文本,其中有着非常多的专业术语,译者在翻译之前还需要掌握一定的技术背景信息。目前为止,对于德语中的术语处理,借助谷歌翻译或是其他机器翻译得出的结果经常不够准确。
现如今,5G通信已经是全世界都在讨论的话题。随着5G时代的到来,无线电技术更是推动了如物联网、智慧城市、自动驾驶等产业的蓬勃发展。2014年5月,欧盟官方公报正式公布无线电设备指令2014/53/EG,该指令已取代无线电与电信终端设备指令(R&TTE指令)。自2017年6月13日起,所有无线电设备必须符合新指令的要求。本文选取了欧盟无线电设备指令作为研究对象,因为在欧盟指令的官网上官方提供了不同语言版本的指令,以便于各个欧盟成员国以其为蓝本制定出各自国内适用的法律。
本文拟借助DeepL Translator这一机器翻译软件对非文学文本着手:即从德语译入英文,观察该软件对于非文学文本的德英语对翻译效果。

语料库 | 自建新闻德语语料库

在日常学习的过程之中,会接触到一些双语的材料,如果能自建语料库,对德语学习的帮助很大。选择新闻题材是因为,在复习备考专八考试的过程中,这类材料是接触最频繁的,是最常见的听力练习素材。新闻语言具有规范工整的特色,因此在学习这类材料的过程中,常用的一些动词和搭配具有很好的积累价值。同时,当积累达到一定数量之后,在遇到相似新闻反复出现的情况下,可以利用检索的功能,针对相似的表达找到多种合适的翻译方案。本文将介绍自建新闻德语语料库的方法。

搜索案例 | 法语本地化译文验证

在全球经济一体化背景下,各跨国公司要想抓住消费者,除了考虑产品本身的质量问题等因素外,还需要考虑产品是否会在另一个市场内出现“水土不服”的现象。因此,就必须针对当地市场,使其产品与服务“本地化”。对于翻译和审校来说,如何表达得更“地道”,如何验证目标语言“是否这样讲”,就显得尤为重要。除此之外,在提交审校结果过程中,各环节间“如何做到沟通清楚”也是不容小觑的问题。