客户甩来一张发票截图,我又盯着屏幕敲了半小时

上周三下午两点,我在咖啡店赶项目结案,客户微信甩来五张发票截图让我录入金额和日期。我一边 zoom 开会一边手动敲数字,敲到第三张发现多打了一个零,整张表全乱了。那一刻我真想把电脑合上走人。如果你也经常收到客户的各种截图——问卷、手写反馈、活动海报——需要把里面的信息一条条抄下来,我太懂那种眼睛发酸的感觉了。

GLM-5V-Turbo 是什么,谁在用

GLM-5V-Turbo 是智谱刚发布的多模态大模型,简单说就是它能「看图说话」:你给它一张图,它能读懂里面的文字、表格甚至布局关系,然后直接输出你要的结构化信息。做电商的朋友老周,上个月开始用它批量提取竞品店铺的活动海报信息——哪天开始、折扣多少、适用什么品类——原来要花一晚上逐张看,现在半小时搞定。智谱的研究者做这个模型,就是想让 AI 不只是聊天,而是能像人一样「看懂」界面,成为真正的数字助手。不过这工具不是所有人都需要,如果你平时基本不处理图片信息,现在不试也没事。

你今天复刻成本

这步我搞错过——一开始我以为要用代码部署模型,折腾两天没跑通,后来发现直接用智谱的在线对话界面就能传图提问。钱:免费额度足够日常用,超出后按图片张数计费,大概几分钱一张。时间:第一次上手 15 分钟,包括注册和试一张图。技术门槛:会截图和打字就行,不需要懂任何编程术语。第一步:打开 chatglm.cn(智谱的对话页面),注册账号后点对话框旁边的「图片」按钮,上传你的截图,然后打字问它「把这张图里的所有金额和日期列成表格」。

分人群建议

如果你刚起步、客户还不多:先用免费额度偶尔处理截图就好,别急着研究 API 对接,把时间花在找客户上更值。 如果你有 1-2 个稳定客户:我会建议把常用的提取需求整理成固定提问模板,比如「提取发票金额、日期、开票方」,存到备忘录里每次复制粘贴,能再省几分钟。 如果你在扩规模、每月处理大量图片:这时候可以考虑让会技术的朋友帮你把智谱的 API(就是程序自动调用模型的方式,不需要你手动传图)接到你的工作流里,实现批量自动提取。不过这个不是必须的,手动传图完全够用,别给自己加不必要的压力。