投行業務項目組的實際工作中,存在大量的文檔處理工作,包括項目盡調階段的各類工作底稿、項目上報階段的全套申報材料、以及受托管理/持續督導工作中的定期報告審核及底稿制作,所涉及的文檔數據量龐大、格式繁多且文檔質量參差不齊,單純依靠人工進行資料錄入、文檔審核、項目質控將耗費大量的人力成本,工作效率低下且準確度難以保證。
達觀數據基于公司自研的四大能力平臺,即IDPS文檔智能審閱平臺+NLP平臺+OCR平臺+RPA流程自動化機器人,針對投行業務實際工作中的項目盡調、項目申報、受托管理/持續督導三大工作階段,提供全流程的綜合解決方案。
在投行項目盡調、受托管理或持續督導階段,工作留痕及底稿歸檔是貫穿始終的重要工作內容,也是項目組勤勉盡責的重要依據。然而實際工作中,底稿文檔中大量文檔為PDF、掃描件、圖片等非結構化文檔,格式多種多樣,電子和紙質文件數據存在共通難的問題,給業務人員帶來了極大的文件內容審核及底稿歸檔難度。
達觀數據基于自研的各項底層技術,并密切結合業務需求,開發了投行底稿結構化抽取平臺?;诠鈱W字符識別技術(OCR),融合自然語言處理技術(NLP)及流程自動化機器人(RPA)技術,將債券承做、股權IPO底稿中的各類文檔進行結構化解析;基于業務需求提取底稿文檔中的關鍵信息,便于業務人員進行底稿歸檔及快速檢索;實現數據結構化及核查記錄自動生成;并可以與投行內部的項目管理及底稿管理系統打通,自動獲取底稿文檔并將審核結果回傳,輔助業務人員處理復雜的底稿文檔,提升工作效率及準確度。
投行底稿結構化抽取平臺支持的底稿文檔類型包括但不限于:征信報告、借款合同、融資租賃合同、土地證、房產證、保證擔保合同、抵押擔保合同、不動產評估報告、轉賬憑證、審計報告等。


按照工作底稿的編制要求,平臺將抽取到的關鍵信息,自動生成核查過程中相應的工作底稿,完成工作留痕。例如關于對外擔保、資產受限、有息債務、募集資金使用、資產所有權情況的核查等。
在投行項目組的實際工作中,所收集的銀行流水數據量大、時間跨度長,各家銀行的版式不統一,且大多為掃描件或照片,單純處理流水的時間可能長達幾個月,耗時耗力。特別是證監會最新修訂的《首發業務若干問題解答》,對銀行流水核查提出了更高的要求,投行IPO業務中銀行流水核查已成為監管處罰的重災區,已有多家券商因關聯交易、關聯方資金占用、銀行賬戶核查等與發行人銀行流水相關的問題被罰。因此,如何高效率完成銀行流水的真實性和完備性的校驗、對重要數據進行統計和分析、準確識別其中的風險成為投行從業人員面臨的重要挑戰。
達觀數據自研的銀行流水核查系統,產品成熟、開箱即用、靈活部署,包含流水解析、歸一化處理、流水校驗、流水核查、經營分析等功能模塊,將掃描件流水和電子銀行流水解析后的結構化數據,基于大量標注訓練的多銀行多流水模板實現自動匹配,形成標準化流水數據,結合流水分析系統全面的、自動化的探測項目風險。
在投行項目申報過程中,申報材料質量問題是監管的常見處罰點之一,例如提交的申報材料存在財務數據前后不一致、披露口徑出現明顯差異、信息披露內容前后矛盾等問題。項目組需花費大量時間完成以招股說明書、募集說明書為核心的全套申報材料撰寫、校對、交叉比對工作,確保申報材料質量。
達觀數據自研的投行文檔審核產品,按照《證券法》、《公司法》、《票據法》等相關規定,針對債券募集說明書、招股說明書、年報/半年報等文檔內的文本內容及財務數據進行篩查與糾錯,并結合股、債、財會的相關語料進行語義理解,對項目文檔進行全面的糾錯。

在涉及證券文書報送的工作中,不同文檔間信息交叉核驗是個高頻需求。例如,項目組常需從審計報告中摘取部分數據至招股說明書、債券募集說明書或年報中,當審計報告中的數據發生修改時,項目組則需要從頭梳理修改的內容,以保證披露信息的準確與完備。
達觀數據自研的投行文檔審核產品,具備跨文檔審核功能,支持募集書/招股書與審計報告、年報、主承銷商核查意見等不同文檔間的交叉核對。

目前的投行工作流程中,存在自動化程度低、效率低的痛點。達觀數據圍繞投行業務全流程,從項目盡調、申報材料審核、受托管理/持續督導、到貫穿項目始終的底稿制作等業務場景,將AI技術深度賦能投行業務,幫助業務人員從重復機械的工作中解放出來,大幅提升投行業務效率和準確度,為業務部門降本增效。