1. 達觀動態

    達觀愿與業內同行分享 助力各企業在大數據浪潮來臨之際一起破浪前行

    達觀OCR,圖像文字抽取算法平臺滿足業務場景快速定制

    ——全新OCR平臺:表格、海外發票、財務票據、機構文檔一鍵結構化

    人工智能在當下已經不再是新潮的概念,在下一代技術躍進出現之前,業務場景的落地比讓人眼花繚亂的技術名詞更具備現實價值。對于大部分企業客戶,業務部和技術部之間的相互依賴關系共同促進了技術在內部的使用,業務需求和技術能力相輔相成。OCR技術能夠把光學文字轉變為計算機字符,但對于文本和數據處理工作,將紙質文檔上的數據通過人工智能技術變成計算機結構化數據,則能更有效地搭建知識橋梁,將人力從重復的人工錄入轉移到非重復的數據分析,產生更深層次的業務價值。

    lQLPDhsNxehYVbXNAczNBDiwFsDgv-m8o7AB5z0vXsDJAA_1080_460
    達觀OCR平臺基于機器學習和深度學習技術研發,在易用的前提下實現了高準確率的數據抽取,助力企業各類單據的高效錄入。
    lQLPDhsNxkvigwDNAwvNBDiwvbC5KnalnLEB5z3SYMBTAA_1080_779
    達觀OCR平臺基于領先的視覺技術、跨模態語義理解技術開發,利用海量的圖像、文檔訓練出底層模型。進一步擴展業務定制能力,為企業提供強大的視覺基礎模型以及一整套視覺任務定制與應用能力。包括基礎模型訓練、結構化識別訓練、場景分類識別訓練、版面分割識別訓練等算法單元。
    抽取模塊

    集成多種達觀自研算法,以極低的學習成本,讓非技術業務員快速上手,快速應用抽取功能,將單據錄入工作簡化為結果校對工作,數倍提高原有工作效率。
    lQLPDhsNxl0rj9bNASXNA62wKIbyqtlxip4B5z3u7UBTAA_941_293
    1. 內置模型抽取;集成自研的標準化識別產品,包括多種小語種識別和數十種常見卡證抽取。
    2. 模版抽取-簡單易用的模版標注;采用多種標注方式,支持錨點和無錨點標注,快速準確抓取目標信息。
    3. 模型抽取;應用最新多模態和集成算法,表現出高魯棒性和良好的泛化性。
    4. 分類器識別;分類器作為一個平臺功能的技術定義,在實際使用中對應我們的業務流場景,實現的功能是對打包或批量上傳的單據數據完成自動分類抽取,并進一步定義審核校驗等業務屬性。通過定義分類規則或訓練專研的分類器模型,關聯對應抽取文檔,構成一個分類器識別單元。常見的業務流諸如銀行開戶業務流、企業資質審查業務流等。
    抽取結果展示

    lQLPDhsNxmFXrKTNAibNA-iw2r6bcKMdYCAB5z31owBrAA_1000_550
    lQLPDhsNxmTrNTrNAgLNA-iwqvLqdsb1gzAB5z379kBTAA_1000_514

    lQLPDhsNxmkXUiHNAerNA-iwYGw3elhzZfcB5z4CtMBTAA_1000_490

    基礎模型模塊

    基礎模型模塊包括功能豐富的標注模塊和底層OCR模型訓練評估模塊,滿足底層模型的標注和訓練需求。

    lQLPDhsNxmyq2BTNAYTNAmuwcdU22_nWfQ4B5z4IJMBrAA_619_388
    • 數據標注模塊:支持文字標注和版面標簽標注,通過機器預標注-人工修改的方式極大提高了標注效率,滿足定制化場景的真實數據快速迭代。
    • 數據生成模塊:能夠通過靈活定義版式、字符、內容等來實現生成數據擴展,以滿足模型訓練的數據需求。
    • OCR基礎模型訓練:支持檢測、識別、版面分析等類型的模型訓練功能,能夠從標注或生成數據靈活切分,自由編排訓練策略。底層基于達觀自研算法調優,通過流程化配置完成底層模型的訓練。
    權限模塊

    權限模塊設計了一套角色、用戶、組結構的權限系統,滿足靈活的權限配置和數據管理需求。

    目前達觀OCR平臺已經賦能銀行、券商、報關、制造業、電商等多個行業的頭部客戶,為其降低大規模抽取任務的定制門檻和抽取成本,節約企業人力資源,提高工作流效率,提升用戶體驗。

    市場上的人工智能產品琳瑯滿目,我們希望產品的使用價值高于技術噱頭,達觀OCR平臺從積累的無數客戶場景和需求中孵化而出,以產生使用價值為驅動,助力企業搭建繁重紙質數據的數字化橋梁,走上降本增效的高速路。