几年前特别具有挑战性的用例现在变得可以实现

Telemarketing List delivers accurate contact databases to enhance lead generation and customer outreach. Connect with the right prospects quickly and efficiently.
Post Reply
pappu6327
Posts: 254
Joined: Thu Dec 26, 2024 4:53 am

几年前特别具有挑战性的用例现在变得可以实现

Post by pappu6327 »

关键信息提取
在关键信息提取任务中,我们会得到一个文档页面,例如收据的扫描件,然后尝试提取特定的和预定的信息,例如公司的名称和地址、收据的日期、收据的金额等。M -LLM(例如Qwen2-VL或GPT-4o)也是这项任务的有力候选者,这要归功于它们的文本生成功能,当答案像这项任务一样非常开放时,它们非常有用。微调可能会有所帮助,但通常不是必需的。

在这种情况下,M-LLM 通常会被提示生成一个JSON对象,其属性与目标字段完全对应。与文档分类相比,函数调用或结构化输出等结构化文本生成技术对于符合预期格式至关重要。

Dataiku 中的文档 AI
借助 Dataiku 项目库中公开且可重复使用的示例项目, Dataiku 用户可以开 秘鲁电话号码数据 始探索上述各种技术。具体来说,该项目展示了如何:

使用 Unstructured、InternVL 和 GPT-4o执行布局分析和 OCR ;
微调 UDOP 或利用 GPT-4o 或 Qwen2-VL 进行文档分类;
用GPT-4o或Qwen2-VL根据文档回答问题并评估相应的答案;
使用 GPT-4o 或 Qwen2-VL 从文档中提取特定字段;
在一个简单的Web 应用程序中公开这些功能。
结论
文档 AI 的最新进展使越来越多的任务实现了自动化。在这种情况下,M-LLM 以其多功能性、用户友好性、零样本或少量样本能力以及高性能而脱颖而出,并可能在这一领域发挥越来越重要的作用。不过,一些替代方案仍然有效,特别是对于实时用例或在 M-LLM 的计算成本过高的低资源环境中。

准备好接收更多技术内容了吗?

从 dataiku 的专家那里了解有关数据科学、分析和人工智能(包括 GenAI)的详细信息。
Post Reply