Amazon Transcribe Medical – 醫療領域的即時語音辨識服務及其相關應用
前言
人們在看病時總會向醫師告知自身的症狀,過程中醫師也會不斷地記錄著相對應的病歷資料。儘管現在的電子健康紀錄系統(EHR)已大幅簡化這些記錄流程,但因長時間的工作疲勞導致醫師無法專心傾聽患者的話,進而造成醫療品質下降、效率低落等問題。
目前市面上有許多針對相關議題的解決方案,例如:雇用一名抄寫員負責記錄病況,讓醫師能夠專注於與病患溝通,但卻變相增加醫院的人事成本,所以此作法在小型診所中很難推廣;更有研究指出當有抄寫員在旁時,會增加病患壓力導致難以坦率的說出自己最真實的情況,降低了診斷效果。
除了抄寫員外,也有許多語音筆記轉錄成文字的解決方案,通常會外包給廠商,但大多需要一到三個工作日才能夠拿到轉錄後的結果,而造成文件歸檔時程的問題,以至於目前還未有一個有效的解決方案能夠改善此問題。
Amazon 於 2019 年 12 月推出了 Transcribe Medical,一個符合 HIPAA 法案的全託管自動語音辨識 (ASR) 服務,試圖透過此服務解決上述問題。
使用情境
Amazon Transcribe Medical 非常類似於先前推出的 Amazon Transcribe,差別於此服務專注於醫療產業的語音辨識,能高度辨識醫療相關的專業術語,開發者可以透過此服務與自身系統整合,或將轉錄後的結果輸入電子病歷 (EHR) 系統,讓醫師能更專注於病患本身,而不必中斷對話去做醫療筆記。除了用做 醫療文字紀錄 外,還可以用於 遠距醫療的字幕、藥物安全檢測(Drug Safety Monitoring) 甚至是 醫療分析 等使用場景,減輕醫師負擔外也同時增進了病患的醫療體驗。
目前 Transcribe Medical 支援的醫學領域包括: 家庭醫學、內科醫學、小兒科與婦產科(OB-GYN),已有一些國外知名的 EHR 系統業者整合 Transcribe Medical 到自家的 EHR 系統中,此部分將於使用案例中進行詳細的解說。
想用聽的請點這:Spotify Podcast、Apple Podcast、Google Podcasts、KKBOX Podcast
如何運作
由於此服務為全託管服務,開發者僅需要準備帶有麥克風的設備並透過 API 將即時語音串流至 Transcribe Medical,就能夠得到轉錄後的結果。需使用 WebSocket 協定建立連線,同時要注意以下事項:
- 支援即時轉錄 16 kHz 的音訊
- 支援即時轉錄串流音訊 4 小時
- 會以 單字 為單位紀錄時間戳記與信心程度(以下為範例)
[{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[{"Alternatives":[{"Items":[{"Content":"Huh","EndTime":3.54,"StartTime":3.37,"Type":"pronunciation"},{"Content":"?","EndTime":3.54,"StartTime":3.54,"Type":"punctuation"}],"Transcript":"Huh?"}],"EndTime":3.58,"IsPartial":true,"ResultId":"a9c9f4cc-1306-4373-8549-7d806373f47c","StartTime":3.37}]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[{"Alternatives":[{"Items":[{"Content":"Hello","EndTime":3.84,"StartTime":3.37,"Type":"pronunciation"},{"Content":".","EndTime":3.84,"StartTime":3.84,"Type":"punctuation"}],"Transcript":"Hello."}],"EndTime":3.88,"IsPartial":true,"ResultId":"a9c9f4cc-1306-4373-8549-7d806373f47c","StartTime":3.37}]}},{"Transcript":{"Results":[{"Alternatives":[{"Items":[{"Content":"Hello","EndTime":4.02,"StartTime":3.37,"Type":"pronunciation"},{"Content":".","EndTime":4.02,"StartTime":4.02,"Type":"punctuation"}],"Transcript":"Hello."}],"EndTime":4.48,"IsPartial":true,"ResultId":"a9c9f4cc-1306-4373-8549-7d806373f47c","StartTime":3.37}]}},{"Transcript":{"Results":[{"Alternatives":[{"Items":[{"Confidence":0.83,"Content":"Hello","EndTime":4.43,"StartTime":3.37,"Type":"pronunciation"},{"Content":".","EndTime":4.43,"StartTime":4.43,"Type":"punctuation"}],"Transcript":"Hello."}],"EndTime":4.88,"IsPartial":false,"ResultId":"a9c9f4cc-1306-4373-8549-7d806373f47c","StartTime":3.37}]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}},{"Transcript":{"Results":[]}}]
- 數字標準化
- ex: ” 22 percent ” –> ” 22%”
- 支援兩種對話類型的轉錄:
- 口述轉錄
- 對話轉錄
根據問診場景不同可能會有不同轉錄方法,倘若選擇 口述轉錄 ,通常以 單人自白 的方式闡述內容;對話轉錄 適合 問答類型的場合,結果會以對話的方式呈現(兩者結果皆會以 JSON 格式回傳)。
如何開始
開發者可以透過主控台或開發套件來使用 Transcribe Medical,讀者倘若想測試此服務不妨透過主控台進行簡單的測試:
- 登入 AWS 主控台後,確認使用者擁有 IAM 權限後便可進入 Transcribe 主控台。
-
於左側 Transcribe Medical 選擇 Real-time transcription。
-
在此我們選擇 Dictation(口述轉錄)。
-
點選 Start streaming 後嘗試閱讀以下文句,便可於 Transcription output 中看到轉錄後的結果。
The liver attachments to the adrenal kidney were divided and the liver was reflected superiorly.
轉錄結果有可能會因為發音與腔調等因素導致誤判。
在應用層面,國外也有人透過開發套件呼叫 API 的方式實作一個簡單的網頁應用並提供相關的展示影片。
客戶案例與使用案例
Cerner 為知名 EHR 系統提供商,其系統部署在全球數千個醫療中心,目前 Amazon Transcribe Medical 在此系統中是為一個 自動抄寫員 角色,透過轉錄 API 來進行醫療文字紀錄,雖然目前尚在測試階段,但仍為 EHR 系統帶來一大突破性的發展。
使用 Transcribe Medical 轉錄出文字後,還可以透過 Comprehend Medical 來針對這些醫療文字做進一步的分析。
Comprehend Medical 也是一個針對醫療領域的自然語言分析(NLP)服務,所以這兩個服務非常適合搭配使用,將 Transcribe Medical 分析後的文字進一步送入 Comprehend Medical 中進行語意分析。
結論
雖然 Amazon Transcribe Medical 能夠有效地解決上述諸多問題,但畢竟此服務才剛發布不久,尚有許多待改善之處,例如:支援的語言、串流的時間等;此外 Amazon 仍呼籲此服務無法取代專業醫療建議、診斷或治療,只能夠作為輔助醫師的工具。