《AI報報報》是一檔 每天更新、專為忙碌的你打造的 AI 新聞快報節目。給你沒聽過但快爆紅的 AI 趨勢,我們都用 最精簡、最有料、最有趣的方式報給你聽。
每天只要 3~5 分鐘,帶你掌握全世界的 AI 新聞,上班、吃飯、搭車都能聽,一點也不浪費時間。
跟上 AI 時代,從《AI報報報》開始!
🔔 記得訂閱,天天都有新消息!
Powered by Firstory Hosting
《AI報報報》是一檔 每天更新、專為忙碌的你打造的 AI 新聞快報節目。給你沒聽過但快爆紅的 AI 趨勢,我們都用 最精簡、最有料、最有趣的方式報給你聽。
每天只要 3~5 分鐘,帶你掌握全世界的 AI 新聞,上班、吃飯、搭車都能聽,一點也不浪費時間。
跟上 AI 時代,從《AI報報報》開始!
🔔 記得訂閱,天天都有新消息!
Powered by Firstory Hosting
**最新出的一款基於LLM的文件解析模型的輕量級:MonkeyOCR,效能好速度快**
其3B在中文文檔解析任務上平均表現超過了Gemini 2.5 Pro和Qwen2.5-VL-72B
對於多頁文件解析,其處理速度達到每秒0.84頁,超過了MinerU的0.65頁/秒和Qwen2.5-VL-7B的0.12頁/秒
相較於MinerU,MonkeyOCR在九種中英文文件類型上平均表現提升了5.1%,公式辨識提升了15%,表格辨識提升了8.6%
MonkeyOCR採用「結構偵測-內容辨識-關係預測」三元組模式,在簡化傳統分層方法的多工具流程的同時,避免了直接使用多模態模型處理整文檔頁的低效性
支援多種類型中英文文檔,暫不支援照片文檔
github:https://github.com/Yuliang-Liu/MonkeyOCR
Become a free member and never miss an update: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw
Support this show: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw
Leave a comment and share your thoughts: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments