使用LLM从页面中提取结构化数据
/extract
(开放测试版)/extract
端点简化了从任意数量的URL或整个域名收集结构化数据的过程。提供URL列表,可选地包含通配符(例如,example.com/*
),以及描述所需信息的提示或模式。Firecrawl处理爬取、解析和整理大数据或小数据集的细节。
/extract
https://firecrawl.dev/some-page
https://firecrawl.dev/*
/*
时,Firecrawl 将自动爬取并解析该域中所有可发现的URL,然后提取请求的数据。此功能为实验性质;如果遇到问题,请通过电子邮件 help@firecrawl.dev 联系我们。
/*
)。true
时,提取可以跟随指定域之外的链接。prompt
。底层模型将为您选择一种结构,这对于更具探索性或灵活性的请求非常有用。
enableWebSearch = true
将扩展爬取范围,超越提供的URL集。这可以从链接的页面捕获支持或相关信息。
以下是提取关于行车记录仪信息并使用相关页面数据丰富结果的示例:
/extract
仍处于Beta阶段,功能和性能将继续发展。我们欢迎错误报告和反馈以帮助我们改进。