图片转Word表格识别的大幅优化

《扫描仙人》春节期间也没闲着，主要对表格识别（图转word中的表格）的效果做出了一定优化。写这篇文章之前，我随便找了几个表格，尝试了一下，给各位用户老爷展示一下。下面的表格，都是从老演员《扫描全能王》母公司的财报中获得的，绝对随便截图的。以下为了统一，全部先放原图，再放表格识别后的Word截图。

1个大表格

总体上内容基本是正确的，但有2个问题：

字号总体偏小了。由于现在还没有开发字号预估的模型，字号，列宽，行高等，都是通过后处理规则实现的，所以经常会出现字号不是大了，就是小了的问题。在后面几个测试用例中，也存在相同的问题，后面还需要优化。
最后一行没显示全。这次优化的重点就是让表格的列宽尽可能符合原图，文字也尽量填满单元格，不溢出到单元格外面。但是在表格的边缘行和列，还是有些问题，没想到第一个测试用例就把这个问题给暴露了，我就说测试用例真的是随便挑的。

我一共测试了5张图，第3章，第4张，第5张，也基本是类似的情况，所以就不赘述了。

一个bad case

这个表格看上去不难，但是识别的结果应该说完全错了。因为我目前的做法是，先对图片进行了版面识别，然后再将版面识别的结果送入大模型。看了下这倒霉的版面识别结果。。。表格的位置切分错了，所以传给大模型的根本就不是一个表格，也就导致了产生了一个完全乱套的表格。

不过这个问题也不用太担心，优化后的版面识别已经在路上了，只不过我个人时间，能力着实有限，进度没有规模化的公司搞的那么快罢了。

总的来说，优化后的表格识别，在图转word的表格显示上，比之前有了大幅进步，在同等价格的扫描产品中，是不是“遥遥领先”了？

还有一件事

整个2月份，除了上述优化外，《扫描仙人》的首页也被升级了，升级后的首页，终于支持在全部文件中任意的搜索和排序了。带有新首页的1.1.3版本，已经提交到应用商店审核，不日将上线，首页符合您的审美吗？

编辑于 2026-03-04 · 著作权归作者所有

相关文章

再见 Kindle！高颜值电子书阅读神器，一键解锁所有格式！超好用手写笔记神器，狂揽 1.4 万 Star！你电脑上「最引以为豪」的软件是什么？让WPS软件起飞——配置优化技术盘点最好用的免费电脑软件有哪些？终于找到它了！Umi-OCR：这个离线文字识别神器，免费、批量、超安全！有什么神仙软件，一辈子都不想删掉?5 款巨良心的免费宝藏软件最新便携版本：这7款KMS激活工具，电脑必备！翻遍全网才找齐！这8款完全免费的纯净神器，每一个都舍不得删，太良心了 ZeroClaw ，让你的旧电脑变身“自动化秘书”微信这几个地方不删除，别人不登录也能看你的聊天记录！为了记会议纪要，我为什么从手机+电脑迁移到录音笔？盘点11款越用越上头的神软件，好评如潮不到 1MB 的效率神器，简直好用到爆！你电脑上「最引以为豪」的软件是什么？有哪些优秀的 Windows 小工具，类似 everything？开会人必看：TicNote Pods录音耳机，从录音到整理一条龙，省下的是你的加班时间 2025 年入手过的 App 盘点一个神器，群控所有电脑，办公效率直接翻倍！

推荐内容

打了12345，不管用怎么办？你被哪个后来知道很sb的BUG困扰过一周以上吗？我国以前禁用过手机WIFI，为什么后来又允许了？2026年最新！下载安装Google Play商店保姆级教程（无需Root，全机型可用）普通人的汽车基础知识有多差？2026年土耳其区Apple ID注册教程及避坑指南