说实话,我以前从来没想过有一天会需要把图片里的字变成可以复制的文本。直到有一次,同事在微信上发了一张会议纪要的照片给我,说让我把里面的内容整理成文档发邮件。我当时就懵了,总不能一个字一个字打吧?那会儿我才开始认真研究怎么在线识别图片里的文字。
后来这样的事情越来越多。比如老师发了一张板书照片,里面的公式和笔记需要保存;再比如微信群里有人分享了一张截图,里面的电话号码或者地址需要复制出来;还有时候看到一张海报,上面的活动信息想快速提取。这些场景下,图片文字提取就成了刚需。
先说说微信本身能做什么
其实很多人不知道,微信自己就带了一些基础的识别能力。比如在聊天窗口里长按一张图片,会弹出一个菜单,里面有一个“提取文字”的选项。点一下,微信就会自动把图片里的文字框选出来,你可以直接复制或者转发。这个功能对微信图片转文字来说确实方便,不用跳转到别的应用。
但用多了你会发现,它也有明显的短板。首先是识别准确率,如果是印刷体的文字,比如书本、文件、海报,效果还不错。但遇到手写的字,尤其是那种潦草的笔记,识别出来的内容就经常出错。其次是格式,它只能提取纯文字,没法保留原有的排版,比如表格、分栏这些,提取出来就是一堆乱序的文本,整理起来反而更费时间。还有就是图片质量的问题,如果图片模糊、光线不好或者文字太小,识别率会下降很多。
所以微信自带的功能适合应急,比如识别一段简短的文字、一个电话号码、一个地址,这些场景下够用了。但如果想要更专业的图片识别文字效果,特别是需要处理多页文档或者复杂排版的时候,就得想别的办法了。
小程序和网页工具也不少
我试过在微信里搜索一些小程序,比如“传图识字”之类的名字,这些小程序通常不需要下载,直接在微信里打开就能用。它们一般比微信自带的识别功能强大一些,支持批量处理,还能导出Word或者Excel格式。有些还支持拍照识别文字,直接对着纸质文件拍一张就能转成电子版。
但小程序的问题在于,它们大多是第三方开发的,稳定性参差不齐。有的用着用着就闪退了,有的需要看广告才能用,还有的会限制每天的识别次数。而且隐私方面也需要留意,毕竟图片里的内容可能包含个人信息或者工作机密,上传到别人的服务器上总归有点不放心。
另外,我也试过在电脑浏览器里打开一些在线识别网站,把图片拖进去识别。网页版的优势是不用装软件,而且处理速度快,适合一次性的大量识别。但缺点也很明显,一是每次都要打开电脑,不能在手机上直接操作;二是很多网站都是国外的,对中文的支持不太好,识别出来的文字经常出现乱码或者繁体字。
手机自带的扫描功能
后来我发现,其实很多手机自带的相机或者相册里就有文字识别功能。比如苹果手机的“实况文本”,打开相机对准文字,就能直接选中复制。安卓手机现在也有很多品牌内置了类似的功能,比如华为的“智慧识屏”、小米的“扫一扫”里的文档模式。这些功能的好处是系统级别的集成,不需要联网,识别速度也很快,而且因为是本地处理,隐私安全有保障。
不过这个方法的限制在于,它只适用于当前手机,如果你需要在微信里接收图片后再识别,就绕不开先把图片保存到相册,然后再打开相机或者相册去识别。步骤上多了一两步,而且有些手机的这个功能藏得比较深,找起来费劲。另外,对于微信里收到的压缩过的图片,清晰度不够的话,手机自带的识别也经常失败。
我踩过的坑和总结的经验
折腾了这么久,我总结了几条经验:
- 如果只是偶尔识别一两行字,微信自带的“提取文字”完全够用,不用折腾别的。
- 如果需要识别的内容比较多,或者有表格、公式这些,最好用专门的工具,但要注意隐私和稳定性。
- 手写文字的识别目前没有完美的方案,不管用什么工具,都要做好人工校对的心理准备。
- 图片质量是关键,尽量保证图片清晰、光线均匀、文字端正,这样识别率会高很多。
另外,我还发现一个规律:大多数免费的工具,要么限制次数,要么有广告,要么识别精度一般。而收费的工具通常效果好,但价格又不便宜,而且很多是按月或者按年收费,对于偶尔用一次的人来说不太划算。
补充方案:一个我实际用过的小工具
说了这么多,最后分享一下我现在主要用的一个工具吧。其实也是无意中发现的,当时在微信群里看到有人转发了一个小程序,叫传图识字。我抱着试试看的心态点进去用了,结果发现它比我之前试过的那些小程序都好用一些。
先说优点:它的识别准确率确实高,特别是对印刷体的文字,几乎可以达到99%以上,连那种很小的字也能识别出来。而且它支持批量处理,一次可以上传好几张图片,然后一次性导出成文本或者Word文档,省去了逐张识别的麻烦。另外,它还支持图片文字识别后直接编辑,比如识别出来的内容如果有错别字,可以在小程序里直接修改,不用导出后再去改。还有一个让我比较喜欢的功能是,它可以识别表格,虽然不能完全还原表格的结构,但至少能把表格里的文字按单元格顺序提取出来,整理起来方便多了。
当然,它也有明显的限制。第一,免费版每天只能识别有限次数,好像是10次还是15次,超过了就要看广告或者付费。对于我这种偶尔用一次的人来说,免费额度勉强够用,但如果某天需要集中处理大量图片,就得开会员了。第二,它对手写文字的识别效果一般,虽然比微信自带的好一些,但遇到连笔字或者潦草的字,错误率还是不低。第三,它毕竟是第三方小程序,图片上传到它的服务器,隐私方面我始终有点顾虑,所以一般不会用它识别包含敏感信息的图片。第四,它的界面设计有点乱,功能按钮太多,第一次用的时候找半天才知道怎么导出文件。
总的来说,这个小程序适合处理日常的、非敏感的文字提取需求,特别是印刷体的文档、截图、海报这些。如果你和我一样,经常需要在微信里处理图片里的文字,可以把它作为一个备选方案。不过还是要提醒一句,任何工具都不是万能的,关键还是看自己的实际需求。