美国最佳转录服务推荐(2023年)

一个人看着显示Temi主页的MacBook屏幕。照片:Rozette Rago
无论您需要分享会议内容还是快速解析采访录音,使用转录服务都是将音频录音转换为可读文本的劳动密集型任务的良好外包方式。经过30小时的研究,我们测试了七个转录服务的能力来转录录制的电话通话,发现Temi是需要了解音频文件要点并希望快速且经济实惠地转录的人们的最佳选择。然而,如果您愿意支付更多费用(并等待更长时间),GoTranscript将提供几乎完美的转录。

我们的选择:Temi

Temi

几分钟之内,Temi返回的转录比其他人工智能服务产生的更易读,即使音频文件不完美或者单词难以理解。

从Temi购买(每分钟25美分)

基于人工智能的转录服务对于查找音频录音中的特定位置或快速浏览内容非常有用。它们不能返回足够完美的结果,以至于您可以在不回头检查实际音频内容的情况下复制引用。在我们的测试中,Temi的转录在基于人工智能的选项中最易读,即使我们的音频包含行话或背景噪音,语法和单词准确性也是可以接受的。(如果您的录音有噪音,有非美国口音,包含言语障碍或其他挑战,请使用雇佣人工转录员的公司。)转录结果在几分钟内到达,内置的文本编辑器让您可以轻松清理完成的转录 - 这是必要的,因为即使是顶级的基于人工智能的服务(如Temi),最多也只能正确识别约75%的单词。因为Temi快速且相对便宜(每分钟音频25美分),所以对于那些自己支付转录费用、不期望转录结果完全无误并且不介意做一些清理工作的人来说,这是一个很好的选择。

另一个不错的选择:GoTranscript

GoTranscript

GoTranscript的人工转录员在几天内返回了几乎100%准确的转录,并且不会因为包含重口音的录音而犹豫不决。

从GoTranscript购买(每分钟90美分)

如果您希望获得最准确的转录,并且您(或您的公司)愿意为此支付额外费用,GoTranscript是最好的服务。如果您的音频包含困难口音,或者您需要转录其他语言的内容,这也是一个很好的选择。以Temi的四倍左右的费用,一个真实的人将为您转录音频,并在几天内返回几乎完美的转录。我们测试的其他使用人工转录员的公司准确度几乎相当,但GoTranscript返回的工作速度更快,愿意处理最具挑战性的音频文件,支持多种口音和48种语言。

我们推荐的一切 {#我们推荐的一切}

研究

为什么您应该相信我们

我是一名专业记者,多年来进行了一千多次采访。 虽然我通常以免费且老式的方式(在播放和倒带每个句子时快速打字,同时对自己的声音感到不适)转录自己的采访音频文件,但我尝试过许多其他选项。转录服务一直以来都是最有效的选择。在本指南中,除了进行深入测试外,我还阅读了有关转录服务的现有评论,并咨询了论坛以找到常见推荐的选项。

适合人群

需要音频文件的文本版本的专业人士和爱好者,如记者、学生、广播员等,可以通过使用转录服务获益。这些服务可以节省手动打字转录一份文字稿所需的时间,并且可以轻松搜索采访内容,从大量录音中找到音频样本,或者完成大部分引用的转录工作。请记住,我们在本指南中几乎完全使用TapeACall应用程序录制的电话通话进行了测试。它们在其他类型的音频(例如面对面录音)上可能表现不同。
基于人工智能的转录服务是比使用实际人员进行转录更为非正式、更快速和更便宜的选择。即使是最好的人工智能服务也不是完美的,但它们足够准确,可以帮助您回想起录音的要点并帮助您找到特定部分。这对于需要以视觉方式解析采访的人非常有用,例如经常录制采访的记者、录制课堂内容的学生或需要记住会议内容的专业人士。无论如何,记者都需要对引用进行双重检查,因此选择基于人工智能的服务并支付较少的费用是有意义的。但是,如果您选择使用人工智能服务,您需要花时间清理文本。如果您计划发布整个转录或需要在专业环境中使用完全准确的文本文件,那么请放弃基于人工智能的服务,选择雇用真人的服务。最好的人工智能服务几乎100%准确,只有在处理高度专业化的语言(如街道名称)时才会遇到困难,这使它们更适合需要准确记录音频文件中所说内容的人。希望对一集节目进行完整转录的播客制作人、需要详细记录会议内容以在公司内部分发的专业人士,或者准备长篇问答文章的记者可能会发现,使用人工转录员可以节省大量时间。但是请准备好为比起人工智能服务更高的准确性支付更多费用,并且除非您愿意支付更多费用以加快结果,否则需要几天的交付时间。

我们的选择标准

一个人用iphone录制自己的声音。
照片:Rozette Rago
我们搜索了记者、作家和播客经常访问的论坛,找到了一系列常用的转录服务。我们还阅读了PoynterTechRadarPCMag的评论。为了决定要测试哪些服务,我们考虑了以下几个标准:

  • 可读性: 选择转录服务最重要的因素是转录结果的可读性,因此我们检查了样本的语法和拼写。我们还研究了服务的自我报告准确性以及其他人的使用经验。在人工支持的转录服务中,我们更倾向于那些声称准确率至少为99%的服务。许多基于人工智能的服务不报告准确性,但我们测试的一个选项声称对于清晰的音频至少有90%的准确率。

  • 成本: 无论是您的雇主或客户支付您的转录费用,还是由您自己承担,成本效益都很重要。 我们发现,最常推荐的AI服务每分钟音频的费用约为25美分,而雇佣人工转录员的服务每分钟清晰音频的费用高达2美元。

  • 交付时间: 基于AI的服务最多需要一到两分钟来返回转录,但人工转录员可能需要几天才能交付转录。如果长时间延迟会打断您的工作流程或导致您错过重要的截止日期,与匆忙的人工转录相比,AI服务要便宜得多。由于我们看到了如此广泛的交付时间范围,我们分别考虑了AI服务和真人转录的宣传截止日期。对于后者,我们只考虑那些能在一周内返回转录的转录服务,并特别注意他们是否承诺在几小时甚至几分钟内完成。

  • 支持复杂音频: 并非所有音频文件都是在专业录音棚中录制的,因此最好的转录服务应该愿意或能够处理背景噪音、行话和口音。虽然我们只测试了使用美国和法国口音的英语演讲者的录音,但我们还注意到每个服务声称支持的语言和口音。例如,Temi等一些服务明确表示他们不支持美国英语以外的语言或口音,而Trint等其他服务则提供多种语言和口音的转录。我们在本指南中优先考虑美国英语。

  • 转录编辑器: 最好的服务会无限期地保留您的转录在线数据库。他们还会为您提供一个浏览器空间或移动应用程序,在这里您可以轻松地使用简洁的设计进行工作,编辑文本,在文本中的任何位置单击时听取音频回放,并更改音频的速度。基于AI的服务容易出错,因此在服务的网站上跳转并编辑转录是很好的。由于人工转录员非常准确,我们认为对于这些服务来说,包含许多在线编辑功能并不重要。

  • 用户界面: 允许您直观快速地上传音频文件的网站会使整个转录过程更加愉快。我们更喜欢在一个页面上布置额外功能,例如添加时间戳或选择更快的交付时间,并显示这些附加功能的费用。我们不喜欢在下订单后才显示费用的服务,或者要求我们通过多个页面下订单,或者外观混乱的服务。

  • 安全和隐私: 虽然我们不建议将敏感音频文件上传到转录服务,但我们仍然研究了每家公司保护客户数据的政策。我们调查了公司使用的加密类型,以及他们是否提供保密协议,并寻找他们采取的其他安全措施。

我们的测试方法

因为我们发现可读性是最重要的因素,所以我们使用各种对话和不同音频质量水平测试了每个服务。我们根据真实采访编写了两个脚本,反映了一个好的转录服务应该能够处理的不同类型的内容:

  • 我们的237字的“控制脚本”讨论了无人机,包括常见词汇和数字,并以一系列包含英语所有字母和声音的句子结束。它还包括一个说话者在另一个说话者上讲话的打断。
  • 我们的172字的“行话脚本”包括关于电池、粒子物理学和地名的行话。
    两位专业演员使用TapeACall这款记者常用的iPhone录音应用程序录制了他们朗读这两个脚本的音频。我还录制了一个带有法国口音的女性朗读整个控制脚本的音频。 总体而言,我们进行了四次录音:
  • 控制脚本(清晰版):演员清晰地朗读控制脚本,没有背景噪音,以测试每个转录服务的最佳结果。
  • 控制脚本(带背景噪音):两位演员在背景音乐和狗叫声中朗读控制脚本,以测试服务是否能够捕捉到重要的音频。
  • 控制脚本(带口音):一位带有法国口音的女士朗读控制脚本,以衡量哪些服务在处理非美国口音时表现更好。
  • 术语脚本(清晰版):演员清晰地朗读术语脚本,没有背景噪音,以测试服务如何处理不常见的单词。

在2020年的第二轮测试中,我们添加了另一个音频样本:我们使用iPhone的语音备忘录应用程序录制了一次会议,这个样本旨在测试当音频文件不是由TapeACall等应用程序生成时,服务的表现是否会发生显著变化。

我们将所有音频样本提交给每个转录服务,并记录上传样本所需的时间,以及我们在使用界面时的体验。我们计时每个服务返回完成的转录所需的时间,并将转录与原始脚本进行比较,以评估准确性。

我们以两种方式衡量转录的质量。首先,我们阅读每个转录,并根据与其他服务的转录相比易于理解程度对其进行排名,这是我们标记为“可读性”的因素。然后,我们计算正确的单词数量,并将该数量除以总单词数,生成反映准确性的百分比。尽管从这个百分比可以得出结论,但是将“电池”转录为“电池”和将“电池”转录为“篮球”之间存在显着差异。因此,尽管原始准确性很重要,但我们认为可读性更重要。

我们还记录了每个转录的总成本,并测试了每个服务的编辑器,以确定使用起来是否容易(或困难)。最后,我们检查每个服务是否提供有用的选项,例如时间戳、添加姓名的能力和提交词汇的地方。

我们的选择:Temi

一位正在查看显示Temi主页的MacBook屏幕的人。
照片:Rozette Rago

我们的选择:Temi

Temi

在几分钟内,Temi返回的转录比其他人工智能服务产生的转录更易读,即使音频文件不完美或单词难以理解。

从Temi购买(每分钟25美分)
Temi是快速、廉价转录的最佳选择。在我们的测试中,它在可读性和准确性方面击败了其他基于人工智能的服务,并且返回的转录时间只需几分钟或几小时,而不是人工转录服务通常需要的几天。当准确性不完美时,它的基于Web的编辑器可以让您轻松地进入转录并调整文本或听取同步的音频。 这也是我们测试过的AI选项中价格第二低廉的选择,因此对于自由职业者或任何自费支付的人来说,这是一个经济实惠的选择。

2018年基于AI的英语全字母句转录结果 {#ai-based-transcription-results-of-english-pangrams-in-2018}

|----------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 原始全字母句 | “The beige hue on the waters of the loch impressed all, including the French queen, before she heard that symphony again, just as young Arthur wanted.” |
| Temi转录 | “the face you on the waters of the lock and press all including the French queen before she heard that symphony again, just as young Arthur wanting” |
| Otter转录 | “the face you on the waters of the lock and press all inclusive French queens before she heard that Symphony against just a young Arthur want” |
| Trint转录 | “the space shoe on the waters of the lock and perhaps all a French queen before she heard the symphony again. Just did Arthur want” |

基于AI的转录服务在全字母句方面遇到了困难,因为其中包含了不寻常的短语。尽管Temi的转录远非完美,但它是最容易阅读的。上面展示的转录是根据清晰的控制脚本录音生成的。
在我们2018年的测试中,Temi在所有四个测试录音中返回了比OtterTrint更易读的转录结果,而且在准确率方面也是最高的。Temi的控制转录的第一部分讨论了无人机法规,语法准确且易读。第二部分由全字母句组成,准确性较低。总体而言,准确率为73%。

2018年术语填充演讲的基于AI的转录结果 {#ai-based-transcription-results-of-jargon-filled-speech-in-2018}

|---------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 原始脚本 | “Researchers make neutrino beams by accelerating positively charged protons and smashing them into beryllium or carbon. This produces pions and kaons.” |
| Temi转录 | “researchers make new train of these by accelerating positively charged protons and smashing them into beryllium or carbon that's produced is pions and cans” |
| Otter转录 | “researchers make neutrino these by accelerating positively charged protons and smashing into beryllium or carbon this produces pions encounter” |
| Trint转录 | “researchers make neutrino beams by accelerating positively charged protons and smashing them into a volume of carbon. This produces Tientsin can” |

我们发现Temi的术语转录最易读,但这并不意味着它的准确性很高。在这种情况下,它将“neutrino beams”误认为“new train of these”。
当我们在测试录音中添加背景噪音时,Temi仍然比竞争对手表现更好。在这种情况下,Temi的AI只比控制录音多出了一些错误,这意味着即使您的音频不完全清晰,仍然值得使用Temi。Temi的术语转录甚至比其在控制录音上的工作更准确;术语转录的第一部分讨论了电池,我们认为Temi在这方面的结果是AI服务转录中最易读的。最后一部分包括La Cienega、Wayzata Boulevard和Schuylkill等难以发音的地名。这部分让Temi困惑了,就像人工转录员一样。 最后,Temi在我们2020年制作的会议录音的转录中只有一个错误。

价格比较(AI服务与人工转录选择){#price-comparison-ai-services-vs-human-transcription-pick}

|---------------------------------------------|--------------------------------------------------------------------------|
| 服务 | 每分钟音频价格(清晰音频,不包含附加服务或折扣) |
| Temi | $0.25 |
| Otter | 免费(每月前600分钟,有限制) |
| Trint | 订阅价格从每月$48起 |
| GoTranscript (我们的人工转录选择) | $0.90 |

对于较长的文件,我们最喜欢的AI服务Temi和我们最喜欢的真人服务GoTranscript之间存在很大的价格差异。
Temi每分钟上传音频收费25美分,是我们测试的最便宜的选择之一(除了免费但准确率极低的Otter和YouTube)。只有在每月上传至少240分钟音频时,Trint的无限制订阅模式才更便宜。Temi背后的算法不关心音频的复杂程度,因此价格始终保持不变,无论您提交什么样的音频。与此相反,人工转录服务的价格从每分钟80美分起,根据音频复杂性和附加功能而增加。Temi每次返回的转录时间为两到五分钟,这意味着每分钟音频的转录时间为一到两分钟。有些昂贵的人工选项可以在几小时内返回文件,但大多数非AI服务(包括我们的选择GoTranscript)至少需要几天才能提供结果。
在我们尝试的编辑器中,Temi的编辑器排名第二,我们可以通过它检查和更正错误。Trint和Rev使用相同的编辑器,我们认为它是我们最喜欢的,因为它看起来更好,尽管没有额外的功能。Temi的网站会永久存储您的所有转录,并允许您在Web浏览器中进行编辑,让您可以同时处理文本和音频。相比其他一些服务,我们更喜欢这种安排,其他服务要求您在办公软件文档中编辑文本,并单独控制音频播放器。使用Temi,您可以在转录中的任何位置单击以听取该段音频并输入更正。您可以减慢音频播放速度或点击按钮倒退五秒钟。界面还提供了突出显示和删除文本的工具。完成后,您可以将转录下载为PDF、Word文档或文本文件,或通过电子邮件或链接共享。
Temi的上传和结账过程快速简便。视频:Signe Brewster
在我们测试的所有服务中,Temi的平均上传时间仅次于最快的。您只需导航两个页面:上传页面和付款页面,两者都不需要您提交有关文件的其他信息。用户界面现代而清晰,因此上传文件和编辑转录非常直观。
Temi表示它使用TLS 1.2加密存储和传输数据,我们认为这已经足够安全,并且您可以请求非披露协议。Temi表示除非您共享转录的链接,否则没有人员会查看您的数据。您还可以选择在下载后从网站上删除文本和音频文件;如果您认为录音内容敏感,我们建议您这样做。

缺点但不是致命问题

Temi不允许您提前提交演讲者姓名或行业术语(尽管您可以在事后使用该公司的编辑工具进行编辑),这是其他服务提供的改善转录质量的功能之一。 它还不会保存付款信息;在我们的测试中,每次上传音频文件时都需要重新提交这些详细信息。一个解决方法是使用PayPal或预先充值您的账户,这样可以加快结账速度。然而,即使我们需要重新输入信用卡信息,通过上传和付款流程所需的时间仍然不到一分钟,与我们测试的其他服务的体验相似。您还可以一次上传多个文件,以减少结账的次数。

可读性排名(AI支持的服务与我们的人工选择){#readability-rankings-ai-backed-services-vs-our-human-pick}

|----------------------|-------------|------------|----------------|------------|
| | 控制 | 行话 | 背景 | 口音 |
| Temi(AI) | 4 | 4 | 4 | 3 |
| Otter(AI) | 6 | 6 | 6 | 5 |
| Trint(AI) | 5 | 5 | 5 | 4 |
| GoTranscript(人工) | 1 | 2 | 2 | 1 |

在我们测试的AI选项中,Temi生成的转录文本始终是最易读的。在这个表格中,“1”表示可读性最好的服务,“6”表示最差的服务。
Temi的其他缺点与每个基于AI的服务都是共同的---避免这些问题的唯一方法是支付更多的费用让人工完成转录。首先,尽管Temi在可读性和准确性方面击败了其他基于AI的服务,但它仍然返回了充满错误的转录文本。您应该将Temi视为帮助您找到音频录音中的特定位置或回忆整体内容的工具,而不是完美准备引用用于出版的服务。
与我们尝试的其他AI服务一样,Temi在包含口音的音频上尤其困难。由于它不承诺支持除美式英语以外的语言或口音,我们对它在我们演讲者的法语口音上遇到困难并不感到意外。如果您需要几乎完美的带有口音演讲者的文件转录,我们建议支付更多费用让真人完成转录服务。
Temi的演讲者检测和时间戳功能较差,这是我们在所有AI服务中看到的趋势。它将我们的转录文本作为一个长段落归属于“演讲者1”,即使我们提交的录音中有三个演讲者。它的转录文本有一个初始的“00:00”时间戳,但没有进一步的注释。点击文本中的任何位置都会给您提供该部分的时间戳;然而,如果需要可视化表示,则需要自行进行格式化。

真人高准确度转录:GoTranscript

一台显示gotranscript主页的MacBook屏幕。
照片:Rozette Rago
如果您需要适合出版的转录文本,或者带有口音演讲者的音频文件的转录文本,GoTranscript是最佳选择。它是我们测试的最易读和最准确的转录服务之一,始终返回几乎100%准确的转录文本。与AI为基础的服务(如Temi)相比,雇用人工转录员的服务需要几天才能返回转录文本,并且价格显著更高。 但是如果你不想花时间清理转录稿的话,这个价格是值得付出的。

2018年不同脚本和音频质量水平的准确性测试 {#accuracy-tests-for-different-scripts-and-audio-quality-levels-in-2018}

|----------------------|-------------|------------|----------------------|------------|
| | 控制组 | 行话 | 背景噪音 | 口音 |
| GoTranscript (人工) | 97% | 85% | 97% | 99% |
| Scribie (人工) | 89% | 90% | 98% | n/a |
| Rev (人工) | 87% | 90% | 96% | 78% |
| Temi (AI) | 73% | 71% | 73% | 42% |

GoTranscript在各种脚本和音频文件上获得了高分,并且在许多情况下,它的转录稿是最容易阅读的。Scribie拒绝转录我们的法语口音音频文件。
在转录我们的控制脚本时,GoTranscript的错误数量是我们尝试过的所有服务中最少的。这些少量错误包括将“part of”打成“in part”,以及将“$1,440”写成“$1,414”。在包含了包含英语中所有字母的短句的部分中,GoTranscript是完美的。当我们提交了带有故意背景噪音的相同脚本时,转录只有类似的小错误。两个单词被替换为“unintelligible”,这是我们从人工转录员那里看到的一种常见策略,以避免插入错误的单词;这种方法使问题区域特别容易发现,以便您可以介入并编辑转录稿。
充满行话的录音的前两部分,整体准确性略低于竞争服务的人工工作,只有少数几个不准确的单词。但我们发现两个地方的单词被替换为“inaudible”或“unintelligible”。GoTranscript正确地识别了Mulholland Drive和Bala Cynwyd等专有名词,但该服务在最后一部分的其他地名上四次插入了“unintelligible”标签,这对其准确性评分产生了相当大的影响。
GoTranscript是我们尝试过的唯一能够准确转录非美国口音录音的服务。以99%的准确率,GoTranscript对我们的法语口音音频样本的转录是我们收到的最准确的转录,远远超过Rev的78%准确率的转录。Scribie根本没有给我们返回转录,称该文件太难了。

价格比较(人工转录与我们的AI选择) {#price-comparison-human-transcription-vs-our-ai-pick}

|----------------------|-----------------------------------------------------------------------|
| 服务 | 每分钟音频的价格(清晰音频;无升级或折扣) |
| GoTranscript (人工) | $0.90 |
| Scribie (人工) | $0.80 |
| Rev (人工) | $1.25 |
| Temi (AI) | $0.25 |

让人转录您的录音可以提高准确性,但价格也更高。
GoTranscript是我们测试的第二便宜的真人服务:您上传的前180分钟录音每分钟收费90美分,并且如果您上传更多,可以享受终身折扣。对于带有背景噪音或口音的文件,它会额外收费,这意味着为了使用GoTranscript转录我们的五个测试录音,我们的成本几乎是Temi的四倍。然而,如果您想要人工转录的准确性,没有其他办法可以节省费用。 多个服务提供试用积分或优惠码,GoTranscript提供10美元的免费积分供您使用。

2018年的转录交付时间 {#transcription-turnaround-time-in-2018}

|----------------------|----------------|----------------|----------------------|----------------|
| | 控制 | 行话 | 背景噪音 | 口音 |
| GoTranscript(人工) | 1天22小时 | 1天22小时 | 1天22小时 | 1天17小时 |
| Scribie(人工) | 3天8小时 | 2天9小时 | 3天8小时 | 不适用 |
| Rev(人工) | 8分钟 | 2小时 | 35分钟 | 2小时 |
| Temi(AI) | 4分钟 | 2分钟 | 2分钟 | 5分钟 |
| Otter(AI) | 不到一分钟 | 不到一分钟 | 不到一分钟 | 不到一分钟 |
| Trint(AI) | 不到一分钟 | 不到一分钟 | 不到一分钟 | 不到一分钟 |

准确的转录由真实的人完成,需要时间。Scribie拒绝转录我们的法语口音音频文件。
如果您有截止日期并且需要高度准确的转录文件,您需要支付GoTranscript的加急处理费用,或选择其竞争对手之一。为了获得最便宜的价格,我们选择了最慢的交付时间:五天。您可以选择付费的交付时间,最快可以在六到十二小时内完成。GoTranscript花费了1天17小时到1天22小时来返回我们的转录文件,但更长的音频文件可能需要整整五天。Scribie花费了两到三天来返回我们的转录文件,但Rev在交付时间上轻松击败了GoTranscript,几小时内就给我们提供了文件。所有基于AI的服务都更快。但是,如果您有时间,我们认为值得等待几天以获得更准确的转录文件。
GoTranscript订单流程中添加文件页面的截图。
大多数使用真实人员的服务在结账时需要您提供更多信息以确定准确的定价。GoTranscript的结账页面清楚地显示每个附加选项如何影响总费用。截图:Signe Brewster
GoTranscript的编辑器不是我们测试的服务中最好的,但由于其转录文件几乎没有错误,您可以预期使用它的时间比其他服务要少。虽然它缺少竞争对手Rev包含的一些功能,例如高亮显示和跟读选项(类似于卡拉OK机器在您进行时突出显示单词),但它通过简洁和易用性弥补了这一点。您可以在文本的任何位置单击以播放该部分音频并进行更改。在我们的测试中,转录员准确地识别了不同的发言人,每次发言人更换时,都会开始一个新的段落,并且文本上清楚标有时间戳(我们付费选择的选项)。其他人工转录服务也都能准确地做到这一点,而基于AI的服务则无法做到。
上传过程很简单:在您发送音频文件后,GoTranscript会要求您选择有关录音的详细信息,包括发言人数量以及音频是否质量低或带有口音。您还可以选择时间戳或字幕等选项。明确指出了额外收费的情况,并且表单包括一个提交发言人姓名或特殊术语的位置,以帮助转录员改进他们的工作。
GoTranscript对安全性做出了一些承诺。该公司表示使用2048位SSL加密来传输和存储数据,我们认为这足够安全。GoTranscript要求转录员签署保密协议,但您也可以提交自己的协议供他们签署。音频文件还被分成五到十分钟的片段,并分散在不同的转录员之间,以确保没有人完整地听到整个录音。 转录完成后,GoTranscript会从其系统中删除录音,但您仍然可以在其服务器上访问转录内容(我们建议您在下载后删除敏感文件)。GoTranscript还为医疗和法律等敏感行业的转录项目提供专家服务。

如果您考虑使用像GoTranscript这样的人工服务,值得考虑的是转录员通常获得的低工资。GoTranscript的竞争对手Rev因其低工资而近来成为新闻焦点,但GoTranscript的Glassdoor页面也充满了关于低工资的投诉。您还应考虑您提交的录音是否可能令人不安,并且是否会让人在工作中经历意外的创伤。

竞争对手

基于AI的服务

Trint是一家知名的基于AI的转录服务,它在我们测试的所有服务中拥有最好的编辑器和最快的交付时间。它还宣传其能够转录多种英语口音和12种欧洲语言。然而,在我们的测试中,它的准确性不如Temi,对于所有四个音频样本,可读性较差,同时价格更高。Trint采用订阅模式,每月48美元起,可供一个用户使用,每年84个文件,还提供每月60美元的无限选项。如果您每月至少上传240分钟的音频或在团队中工作,根据成本考虑,无限选项可能更适合您。

Otter每月提供600分钟的免费转录(只要您直接从应用程序或Zoom录制),这使其成为任何想要在没有预算的情况下转录和整理大量采访的人的理想选择。尽管我们2020年的测试结果显示Temi更准确,但Otter在某些情况下击败了Trint。然而,就可读性而言,Otter始终得分最低,有时转录结果看起来像胡言乱语。它易于使用,上传时间最快,编辑器也不错。

如果您正在寻找免费的转录选项,您还可以尝试YouTube:将音频录制转换为视频,上传到YouTube,然后使用该网站的字幕服务免费生成转录(出于安全原因,请确保将上传设置为私密)。然而,YouTube的上传过程需要很多工作和时间,因此我们很快就淘汰了这个选项。如果您想要免费的转录,最好使用Otter。

人工转录

如果您需要真人进行准确转录,但只有几个小时的交付时间,Rev可能是一个不错的选择。Rev拥有最好的编辑工具(实际上,它与基于AI的Trint使用的是同一个编辑器),并且是我们测试的所有人工服务中上传过程最简单的。尽管它比我们尝试过的所有基于AI的服务更准确,但它始终返回了最难以阅读和错误最多的转录(除了术语转录外,它在准确性上并列第一),同时也是我们测试的服务中最昂贵的。Rev的转录结果仍然可读,但如果您有时间可以等待更便宜和更准确的GoTranscript服务的转录结果,我们认为这是值得的。

Scribie是我们测试的所有服务中返回转录所需时间最长的,它拥有最差的编辑器、最慢的上传过程和最差的用户界面。当我们提交了一个带有外国口音的演讲者的音频样本时,Scribie拒绝了它;一位客服代表表示,该文件对于该服务来说太短且太复杂,无法找到愿意转录的人。Scribie也拒绝了一个更长的带口音文件。 如果您只偶尔需要提交音频文件或者有很多清晰的音频文件,Scribie可能仍然是一个不错的选择---它是我们尝试过的最便宜的真人服务,并且它生成了易于阅读和准确的转录。但是,如果您希望确保您的上传每次都能被接受,请避免使用它。

纽约时报精选头像
纽约时报精选

纽约时报旗下的产品评测平台,帮助您百里挑一!

原创文章,作者:纽约时报精选,如若转载,请注明出处:https://pingcer.com/nytimes/best-transcription-services/

(0)
上一篇 12 9 月, 2023
下一篇 12 9 月, 2023

猜您喜欢