将任何URL转换为干净数据
prompt
给端点来无模式提取。LLM 会选择数据的结构。
extract
对象接受以下参数:
schema
: 用于提取的模式。systemPrompt
: 用于提取的系统提示。prompt
: 用于无模式提取的提示。wait
操作,以留出足够的时间让页面加载。
location
对象及其属性:
country
: ISO 3166-1 alpha-2 国家代码(例如,‘US’, ‘AU’, ‘DE’, ‘JP’)。默认为’US’。languages
: 请求的首选语言和地区优先级数组。默认为指定位置的语言。/crawl
端点的工作原理非常相似。它提交一个批量抓取作业并返回一个作业 ID,用于检查批量抓取的状态。
SDK 提供同步和异步两种方法。同步方法将返回批量抓取作业的结果,而异步方法将返回一个作业 ID,您可以使用该 ID 来检查批量抓取的状态。
/batch/scrape/{id}
端点,使用作业 ID 检查批量抓取的状态。此端点应在作业仍在运行或作业完成后立即使用,因为批量抓取作业会在 24 小时后过期。