你是否舉辦一個播客或者運行一個YouTube頻道,文本可以讓你的內容更廣泛的受眾。人工智能(AI)轉錄軟件可以代替繁瑣的手工轉錄,免去你的工作。他們可以產生高達90%的準確拷貝您的媒體文件,並在一個flash!
我測試了5款基於AI的頂級轉錄工具,並使用帶有背景噪音的低質量音頻以及帶有最小氛圍音效的清晰音頻。以下是對他們表現的快速比較:
軟件 |
可讀性(10分) |
準確度(10分) |
||||
Sonix |
低Q清Aud
|
低Q清Aud
|
||||
Trint |
低Q清Aud
|
低Q清Aud
|
||||
特米 |
低Q清Aud
|
低Q清Aud
|
||||
水獺 |
低Q清Aud
|
低Q清Aud
|
||||
深, |
低Q清Aud
|
低Q清Aud
|
現在,在我們回顧這些轉錄軟件之前,讓我們看看你應該考慮哪些因素來為你的創意項目選擇一個。
表的內容
如何選擇抄寫服務?
以下是選擇轉錄軟件時需要考慮的因素:
- 準確度和音頻質量:即使是最好的轉錄軟件也有90%的準確率,因為轉錄軟件使用的機器學習模型決定了轉錄的質量。然而,你的成績單的質量也很大程度上取決於你錄音的質量。有些轉錄軟件受背景噪音的影響比其他的更大,這意味著你需要上傳不同類型的音頻和視頻文件來檢查準確性。為了達到100%的準確性,你需要編輯你從機器轉錄軟件得到的草稿或使用基於人類的轉錄軟件。
- 周轉時間和易用性:人工智能軟件轉換1小時的視頻/音頻大約需要30分鍾,人工軟件轉換24輪。
- 時間戳和自動轉換:時間戳使文字記錄很容易導航,當您跟隨文字記錄與音頻編輯或糾正文字記錄。功能強大的轉錄軟件可以讓您指定時間戳顯示的頻率,如每15秒,或何時揚聲器更改音頻。
- 下載的格式:通常所有的轉錄工具都允許你以。txt或docs的形式下載你的文件,你可以在Microsoft Word、穀歌docs等文件中打開,以進一步編輯或分享它們。強大的轉錄軟件還可以讓您下載的VTT/SRT格式的文件,這對生成Youtube, Facebook, Vimeo和Instagram視頻字幕很有用。
- 安全:優秀的轉錄工具會在處理音頻/視頻文件後刪除它們或以其他方式丟棄它們,從而盡量減少存儲在服務器上的數據量。您還應該完全控製您的數據,刪除所有副本的成績單沒有任何麻煩。
- 成本:有些軟件按小時收費,或者按分鍾收費,例如,特米每分鍾收費0.25美元。一個值得信賴的軟件永遠不會聲稱以固定的價格提供無限的轉錄時間,因為這將使他們破產。這類工具的定價並不透明,而且會產生隱藏費用。現在你已經知道了如何製作優秀的轉錄軟件,讓我們詳細瀏覽一下我下麵提到的選項。
Sonix的界麵略顯笨拙和過時,但你可以拖放文件,或者從Zoom、Youtube、Dropbox和Drive上傳文件。
它會給你一份簡短的報告,說明文稿的質量,以及草稿是否需要大量編輯,以及非常自信、相當自信、稍微自信的詞語的百分比,以及改進錄音的技巧。
你可以添加時間碼,倒帶和前進,改變播放速度,添加字幕,查看每個說話者說的單詞數,向Sonix字典添加單詞,使用查找和替換功能,添加注釋,並自定義編輯器界麵。然而,對於低質量的音頻文本,Sonix需要提高其準確性。
優點:
- 它有一個強大的編輯器。
- 你可以直接與Zoom和Zapier集成。
- 它會給你一份關於轉錄稿質量的報告,以及它需要完美編輯的大致數量。
- Sonix允許你直接從Zoom、Youtube、Dropbox和Drive上傳文件。
缺點:
- 它不能轉錄低質量的音頻,甚至精度的最低百分比。
- 您可能會在導出成績單時遇到延遲。
- 理解編輯功能可能需要一些時間。
可讀性:
雖然Sonix在初稿中完全改變了腳本,但由於大部分句子都是可讀的,所以可讀性為8/10。它是可以理解的,可以被不同的說話人分成段落。
第二份成績單近乎完美,在可讀性上獲得9分,因為隻有幾個單詞被省略,每句話都很有意義。
精度
我不能得分的第一個文字記錄,因為它甚至沒有模糊相似的音頻文件。第二次錄音的準確率達到了90%,Sonix甚至把其他AI軟件檢測錯誤的單詞都錄了出來。
Trint有很多強大的功能,它不僅僅是抄寫,它還可以將你的文件翻譯成31種不同的語言。界麵很古怪,可以選擇上傳文件、創建新文件夾、重命名文件、導出文件、與同事共享文件、查看版本曆史以及直接從儀表板創建新故事。
您還可以訪問詞彙構建器、Trint播放器和大量有用的集成,如Zoom。
您可以使用鍵盤快捷鍵進行編輯,如劃線、高亮顯示、添加標記、使用查找和替換功能、撤消和重做更改、添加注釋、調整時間代碼和播放速度。
雖然Trint有很多有用的功能,但它在轉錄音頻方麵做得一般,甚至是其他大多數人工智能軟件都能正確轉錄的連貫音頻。至於有背景噪音的第二次錄音呢?這簡直是一場災難。
價格:有五種定價方案:一種可定製的企業計劃和三種轉錄文件的免費試用,沒有時間限製。
- 起動器: 60美元/月,按年計費,7份轉錄文件。
- 先進的:每月$75,按年計費,不受日常記錄的限製。
- 箴:每月$85,按年計費,不受日常記錄的限製。
- 專業團隊: $85/用戶/月,按年計費,不受日常記錄的限製。
優點
- 您可以導出您的文件在多種格式,如DOCS, SRT, VTT, TXT, STL, EDL, HTML。
- 它可以讓您看到每個編輯文本的版本曆史。
- Trint將腳本翻譯成31種不同的語言。
- 有一個通話記錄功能,你可以直接從儀表板上使用。
- 您可以創建公共鏈接來共享您的成績單。
缺點
- 為了獲得更好的轉錄效果,你需要在沒有任何噪音的背景下優化音頻。
- 它不能準確地轉錄電話。
可讀性
在第一次帶氛圍音的錄音中,Trint不能充實出一個可讀的腳本,並且沒有一個句子是有意義的,因此,我不能給它任何分數。
第二種轉錄得到7分(滿分10分),因為它最多是平均水平,句子有意義,但缺少或隨機標點
精度
很遺憾,特林特不能準確地記錄電話記錄。但在第二次轉錄中,除了單詞和句子的錯位和遺漏外,準確率為75%。
特米在轉錄低質量音頻和清晰音頻方麵都做得很差。它甚至無法區分兩個說話者,也無法分辨出相當連貫的單詞和句子。
遺憾的是,我不能在兩種情況下都得到50%的內容正確,因為編輯器非常容易使用和方便。
您可以雙擊任何單詞來播放您的媒體從該特定的單詞,搜索關鍵字與它的查找和替換功能,標記重要的單詞或引號與高亮工具,使用標簽作為快捷方式播放和暫停音頻,並利用enter鍵添加揚聲器。
Temi還可以讓您分享您的完整或突出顯示的部分,從儀表板和下載為微軟word, pdf,純文本,SRT,和VTT格式,或沒有時間戳。
價格:這是相對便宜的,因為它收費0.25美元每分鍾的音頻,適合你是一個嚴格的預算。還有一個45分鍾的免費試用音頻。
優點
- 它能在幾分鍾內生成文本。
- 該編輯器功能強大,易於使用。
- 它可以讓你分享和下載你的文本和字幕文件格式,如.docx, .txt, .srt, .vtt。
- 你可以得到一個免費的文字45分鍾的媒體文件測試軟件。
缺點
- 準確率低於平均水平。
- 如果你的音頻包含背景噪音或口音與美國口音不同,你就不能指望它產生可讀的結果。
- 特米不能準確地轉錄電話錄音。
可讀性
這些句子很突兀,而且語法不正確,使它們難以辨認。它隻能從眾多的講話者中轉錄出兩段話,並將兩段話混合在一起,因此它在第一個文本中獲得了0分,在第二個文本中獲得了8分。
精度
對於第一個音頻,我給Temi 3分(滿分為10分),因為它漏掉了大部分內容,並沒有準確地轉錄其他音頻內容。第二個文本的得分為8/10,因為除了錯誤放置的單詞和片段外,它的大部分內容都是準確的。
Otter的實時筆記功能最適合團隊內部交流,它是Zoom會議主持人的一個插件,可以實現實時轉錄和筆記
Otter的界麵很吸引人,也很時髦,它還提供了一個視頻瀏覽,幫助你了解如何利用它的所有功能,讓你設置每日議程,安排會議,創建一個小組,共享文件和文件夾,等等。
這款語音轉文本轉錄軟件有一個web界麵,桌麵應用程序,以及iOS和Android上的移動應用程序。
在我測試這兩個音頻時,我對在轉錄頂部添加的關鍵詞印象深刻。它使工作很容易跳到句子,關鍵字是使用時,點擊它。
第一個音頻的轉錄是錯誤的。如果我認為其他軟件很糟糕,那麼Otter更糟糕,因為它把整個腳本變成了無意義的句子。然而,幾乎沒有背景噪音的音頻更容易理解。
編輯文本是一個順利的過程。您可以高亮顯示,複製,添加圖片和照片到特定的單詞,並將文件導出為TXT, DOCS, PDF, SRT文件,或共享URL鏈接到您的Otter組的人
價格:有一個基本方案,600分鍾的轉錄和3個導入文件免費使用,有以下三種定價方案:
- 箴: 8.33美元/月,以自定義詞彙和先進出口每年開票。
- 業務:每月20美元,每年收費,配有Zoom現場筆記和字幕。
優點
- 你可以直接從儀表板上錄製音頻。
- 它可以讓你給特定的單詞添加圖片。
- 您可以在儀表板頂部看到文本的所有關鍵字。
- 奧特可以讓你自動標記和重新匹配揚聲器。
- 在背景噪聲較少或無背景噪聲的情況下,其精度可達85%。
- 您可以直接與Zoom集成。
缺點
- 缺少單詞和不準確的標點可能會導致語法錯誤。
- Otter很差地轉錄未過濾的音頻。
- 沒有以VTT格式導出的選項。
可讀性
《Otter》的背景噪音音頻值為3/10,因為它在一定程度上是可讀的,但卻難以理解。清晰的音頻可讀性得分為8/10,因為標點符號不正確,甚至在某些地方漏掉了。
準確性:
對於第一份音頻稿,我的評價是0,因為它毫無意義。奧特甚至連說話人的發音都不正確,也沒有在背景噪音更小的情況下轉錄出清晰的句子。
第二份成績單的準確性為9/10,因為它不僅正確地識別了說話者的數量,而且省略了更少的單詞,幾乎沒有一兩個錯誤。
兩份音頻文本都有明顯的差異。在有背景噪音的錄音中,describe漏掉了一半以上的單詞,其餘的都錯了。然而,它完成了一個近乎完美的工作,轉錄了清晰的音頻文件。它省略了幾個單詞,其中5個是錯誤的,很容易編輯。
在第二段音頻中,describe幾乎準確地將音頻分為兩段,不像第一個音頻會分解成單詞和片段。
價格:它的媒體轉錄費用是每分鍾2美元,可以免費轉錄4個小時。
優點
- 它能在不到15分鍾的時間裏轉錄30分鍾的音頻文件。
- 在相幹音頻文件的轉錄中,你可以期望90-95%的準確率。
- 該編輯器很簡單,但具有注釋功能和時間戳。
- 描述允許您將文件直接導出到專業編輯軟件,如Reaper、Final Cut Pro、Adobe Audition和Premiere Pro。
缺點
- 它不能對帶有背景噪聲的音頻文件產生準確的轉錄。
- 描述無法在線獲得,您必須下載其桌麵版本。
可讀性
看看第二個轉錄文件。
它的語法還不錯,標點正確,清晰易讀,沒有斷句,也沒有突兀的句子,隻有一行被分成了一個新的段落。因此,對於一個清晰的音頻文件,我給它的可讀性打9分。
不清晰的音頻在可讀性上得分為1分,因為它既不能被理解,也不能將腳本分成可掃描的段落,並使用適當的標點符號。甚至連揚聲器都無法被探測到。
精度
對於第一份成績單,我給描述2分(滿分10分),而對於第二份成績單,我給8.5分(滿分10分)。這種轉錄工具在處理低質量音頻時表現不佳,而人類轉錄員在這方麵做得更好。但是,你可以期望高達95%的轉錄精度為清晰的音頻與小的環境噪聲。
最終的想法
如果你正在尋找最準確的高質量的音頻與基本的編輯軟件,然後描述是你最好的選擇。另一方麵,Sonix適合於平均精度,廣泛的編輯工具,並直接集成Zoom和Zapier。
然而,如果你想要一個用於辦公室培訓、信息等的轉錄軟件,那麼我強烈推薦Otter的實時筆記功能,它是Zoom會議主持人的一個插件,可以實現實時轉錄和筆記。