辨認手寫筆跡對于我們來說是一件十分困難的事情,而對于軟件機器人來說,更是如此。
如今,明信片、銀行支票、汽車保險理賠、新冠肺炎疫苗接種記錄等各類手寫文件對于企業而言仍是不可或缺的文件。不論是郵局或稅務部門等公共部門機構,還是銀行、保險公司等組織,各個企業都有相應的手寫文件需要處理。
根據信息和圖像管理協會(AIMM)的研究, 目前49%的數據均源自于紙張。在日常生活中,還有大量人們在平板電腦上輸入的手寫信息。因此,提取和理解筆跡的能力對文檔工作流程的自動化和加速企業的數字化轉型至關重要。
無論是手寫在紙上的信息,還是手寫到平板電腦上的信息,手寫文本從識別的角度來說都不是標準化的,就像人們用筆在紙張或電子屏幕上寫字一樣,筆跡識別通常都具有較大的難度。
一般而言,手寫文檔的數字化都會涉及到人工處理流程。不僅耗時,且不夠準確,經常會帶來客戶體驗差和效率延遲等問題。同時,人工識別的重復性、繁雜性可能會影響員工的工作效率及工作興致,致使員工無法去完成更高附加值的工作。
此外,大多數筆跡識別的解決方案都無法充分滿足本地部署、云部署以及混合部署等筆跡處理場景的需求。
筆跡識別引擎,深度解析文本
為了幫助我們的客戶解決這些難題,在 中內嵌了一個筆跡識別引擎.
筆跡識別使用了在大量數據集基礎上訓練的深度學習模型, 這些數據集包含各種分辨率和手寫樣式的圖像。與處理手寫體的傳統方法不同,使用深度學習的優勢在于,我們的模型可以將初始手寫樣本作為基礎進行歸納,然后使用該模型繼續對每個數據樣本進行學習。
同時,這種方法的另一個優勢在于,深度學習模型可以從圍繞手寫文本的文檔元素中學習上下文,對手寫文本進行有理推斷。例如,如果在顯示為常用表單區塊的欄目中手寫輸入 (例如街道地址或醫保編號),那模型就可以更快地解析筆跡。
多環境部署,靈活修正錯誤字段
Form 的一部分涉及筆跡識別解決方案,它依賴于為數據提取創建的文檔模板。
Form 可以查找和提取信息,如復選標記、機器文本、大寫和小寫、潦草字跡、刪除線,以及簽名檢測,讓用戶在可預測的字段和位置中提供手寫信息的結構化表單。
在下面的屏幕截圖中,我們可以看到W-9,即“請求納稅人標識號和認證”的表單,這是一個企業所有者和獨立承包商常用的美國IRS表單。如圖所示,它其中有一些筆跡字段和簽名。
面對這樣的筆跡文檔,用戶可以借助于精準的筆跡引擎進行處理。并且,還可以持續地訓練和優化該引擎。在根據文檔和業務需求對筆跡信息進行進一步檢查時,筆跡信息將會被發送到人工驗證站點進行進一步審查。此時,如果機器人不能確定提取字段的準確性,員工便可以對提取的字段進行確認或修正。
如下圖,我們可以看到我們的用例是如何在 中處理、顯示的電腦手寫輸入不能使用,該W-9表單,業務用戶使用該表單手動評估電腦手寫輸入不能使用,即可自動捕獲難以辨別的文檔區域。
更重要的是,支持多環境部署,包括云部署、本地部署和混合部署。這為筆跡識別應用場景提供了巨大的靈活性,各企業可根據其特定的業務場景實施強大的手寫識別解決方案。金融機構、醫療保健公司或公共部門等企業為遵守隱私要求需要完全避免手寫識別流程,因而支持多環境部署對這些企業尤其重要。
在的服務客戶中,有一家美國的大型醫療保健公司就有場景部署問題。這家醫療保健公司希望簡化處方藥和服務的事先授權流程,該企業每年都要手工處理幾百萬份的手寫表格,時常會出現授權延誤、人工抄送筆跡錯誤等業務問題,并且,此類文件的掃描和低分辨率讓這些問題更加嚴重。
但出于數據隱私和敏感性方面的嚴格要求,以及1996年《醫療保險便攜性和責任法案》(HIPAA),這家醫療保健公司無法使用云解決方案優化業務。所以,這家醫療保健公司在內部部署了 ,以此來解決筆跡難題。
可以讀取格式文本和手寫文本的混合表單,任何需要人工驗證的提取信息都會被發送到人工驗證站進行人工重點識別。的這一技術在提高表單處理效率的同時,還遵守了用戶數據的隱私合法性。
通過 ,該企業實現了事先授權流程自動化,極大減少人工識別筆跡的錯誤率。
總結
現在,手寫信息的自動化處理仍然是一個不小的技術挑戰。筆跡識別引擎正在穩步應對該挑戰,積極且有效的解決更多筆跡識別的問題。