未來屬於會用AI的企業!自己做的免費智慧發票助手,簡單又強大_風聞
智能相对论-智能和车,边评边测;未来和家,且品且鉴2小时前
文 | 智能相對論
作者 | 陳泊丞
報銷發票的整理、歸納和處理在公司的日常運行中扮演着極為重要的角色,但同時這又是一件極為繁瑣且重複性較強的工作,那麼我們是否可以基於AI技術打造一個智能化的發票助手,幫助財會人員快速識別發票信息、整理歸檔,全面提供工作效率?基於這個想法,我們嘗試了多款大模型產品,發現智譜多模態大模型GLM-4V-Flash的推出,正好可以很好地支持我們創建一個智能化的發票助手,為財會工作帶來全新的解決方案。
01、什麼是GLM-4V-Flash?
GLM-4V-Flash是智譜開放平台(bigmodel.cn)新上線的免費的視覺理解模型。自此,**智譜迎來全免費最強“全家桶”產品,**不僅基於4V系列模型的各項優秀能力,更在圖像處理上實現了精確度的提升,具備多語言、多模態處理能力,支持包括中文、英語、日語、韓語、德語在內的26種語言,並支持圖像描述生成、圖像分類、視覺推理、視覺問答(VQA)以及圖像情感分析等高級圖像處理功能。
**基於智譜開放平台的“全家桶”產品,**能夠針對特定垂直行業提供精準的場景解決方案,**以低成本投入助力開發者迅速融入大模型時代,無需顧慮大模型圖像處理的高昂成本。**同時,GLM-4V-Flash無論是在信息提取、內容創作,還是圖片識別等領域都具備不錯的性能表現和效果反饋,真正將模型的基礎能力轉化為實際應用場景解決方案。
02、基於GLM-4V-Flash,如何打造智慧發票助手?
智慧發票助手是一個多學科交叉應用的結果,涉及OCR、NLP、計算機視覺、機器學習等多個領域的技術協同工作,以確保發票信息的快速、準確提取和處理。隨着技術的發展與應用的深入,這一系統的準確性和效率也會不斷提高,從而輔助財會人員高效地處理相關工作。
智慧發票助手的打造需要用到GLM-4V-Flash以下這些能力:
**1.多模態處理能力:**用於分析發票圖像的整體佈局,識別文本內容、表格、框線和其他視覺元素,這對於正確解析複雜格式(特別是非結構化的數據)的發票至關重要。此外,這一能力還可以用來檢測發票的完整性(例如是否有缺失部分)以及是否為篡改過的文件,以確保發票的合規性。
**2.多語言理解能力:**考慮跨國企業或跨國業務需求,會有不同國家的發票報銷,可用於識別不同國家的語言,拓展智慧發票助手的應用範圍。
**3.規則引擎:**根據預定義的業務邏輯和法規要求來驗證發票信息的正確性和合規性。例如,檢查税率是否正確應用,或者確認發票上的公司註冊號是否存在並有效等等。
**4.自適應學習與自動化工作流:**隨着應用深化,智慧發票助手將可以形成一個完整的發票處理流水線,從接收到發票圖片開始,經過多模態處理、識別,再到最終的驗證和歸檔,整個過程都可以被高度自動化,同時還可以根據新出現的發票類型或用户提供的反饋不斷優化自身的性能。
03、GLM-4V-Flash實操
一、API調用申請
打開鏈接:
https://bigmodel.cnutm_source=4&utm_campaign=yrgzh&_channel_track_key=ztOmCKeq
2.申請調用:GLM-4V支持同步調用
二、以下為調用實操:
在這裏,我們調用了GLM-4V-Flash系列模型,以實現圖像內容的精準識別,來完成對報銷發票的處理。
同時,為了讓應用更像一個智能化的AI助手,我們還簡單地對其進行了命名,叫作“鈴聲易寫1.0”,並配上「智能相對論」的圖標Logo,以及對文字內容進行了區別配色,輸出為一個直觀的聊天窗口,只需要對話即可完成智慧發票助手的工作。
上傳發票信息:為了進一步測試性能,我們選擇了把所有發票整理到同一個文件夾內,同時上傳。
我們在網上找了兩張不同的發票,分別為紙質中文發票照片、電子中文發票圖片,來讓GLM-4V-Flash進行識別。
識別成功:我們還讓GLM-4V-Flash在識別後自動歸納重點信息,並輸出為一個csv表格,方便財會人員查看、校對。
從輸出表格信息可見,GLM-4V-Flash成功識別了報銷發票的重要信息,包括買賣雙方名稱、税號和消費金額、税率、税額等等。
當我們只上傳一張發票圖片,不需要GLM-4V-Flash輸出表格,而是完整的識別信息,可以看到GLM-4V-Flash基於多模態處理能力,會對整張發票進行全面的識別,精準歸納出圖片上的一切信息,甚至是發票的蓋章情況。
也就是説,如果能進一步用好GLM-4V-Flash的這一能力,我們所打造的智慧發票助手不僅能識別發票信息,甚至還可以驗證發票的蓋章情況,確認合規性,又進一步節省了財會人員的校對流程,大大提高工作效率。
為了進一步驗證GLM-4V-Flash的多語言識別能力,同時考慮到外國沒有發票形式,大多采用消費單據來作為報銷憑證,結合實際場景需求,我們又上傳了一張全英文的消費單據。
結果顯示,GLM-4V-Flash依舊可以很好地識別消費單據的具體內容,且條理非常清晰。那麼,我們只需要進一步像前面那樣,讓GLM-4V-Flash將這些信息整理歸納,並輸出到同一張csv表格中,就能統一不同國家發票、單據的報銷彙總。
當然,若要得到一個更“聰明”的智慧發票助手,我們還需要進一步預定義GLM-4V-Flash的業務邏輯和法規要求,從而讓其更好地識別、驗證並歸納公司發票信息。但是,不可否認,有了上述這些強大能力的支持,我們想要基於智譜開放平台來打造一個智慧發票助手,並不複雜。
04、人人都能開啓企業的數智化轉型升級
基於實操表現來看,GLM-4V-Flash具備強大的多模態處理能力、多語言識別能力,**不需要開發者做過多的操作就能調用,用於打造一個不錯的智慧發票助手。**那麼,在這個基礎上,只要我們基於智譜開放平台,根據不同的業務需求打造多個AI助手,再進行彙總、協同,融入公司的數智化流程以及加入公司的外掛知識庫進行訓練、微調,我們很容易就能實現公司的數智化轉型。
比如,我們現在已經擁有了一個智能識別、整理歸納的智慧發票助手,再把智慧發票助手與公司OA(如供應鏈採購、員工差旅、營銷活動等)結合起來,自動識別各種重要節點的發票信息,並智能化生成各種電子報表,就能協助財會部分做好財務管理、成本控制等,同時也更好地協助業務部門的工作。而這樣的能力再拓展,用於合同管理、檔案歸納等重要文書工作,也將加速公司資產數智化,全面推進公司轉型升級。
**可以預想,隨着智譜開放平台“全家桶”產品的開放調用,企業的數智化轉型也就有了非常強大的技術能力支持,**只需要基於公司對業務的理解和需求,再進行簡單的調用、開發,就能很容易得到一個全面且強大的AI應用,支持各類重點業務的發展。智譜開放平台的技術能力是沒問題的,重點在於公司應該如何去用它,構建自己的AI應用模式。
*本文圖片均來源於網絡
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、複製或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯繫。
•AI產業新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸佔”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什麼》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、雲計算、開發者以及背後的芯片、算法等。