Firecrawl Python SDK 是 Firecrawl API 的封装,帮助您轻松将网站转换为 Markdown。
注意:这是使用已弃用的 Firecrawl API v0 版本。我们建议切换到 v1。
FIRECRAWL_API_KEY
,或将其作为参数传递给 FirecrawlApp
类。scrape_url
方法。它接受 URL 作为参数,并返回抓取的数据作为字典。
crawl_url
方法。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取作业的其他选项,如最大页面数、允许的域名以及输出格式。
wait_until_done
参数决定该方法是否应等待爬取作业完成再返回结果。如果设置为 True
,该方法将定期检查爬取作业的状态,直到完成或达到指定的 timeout
(秒)。如果设置为 False
,该方法将立即返回作业 ID,您可以手动使用 check_crawl_status
方法检查爬取作业的状态。
wait_until_done
设置为 True
,crawl_url
方法将在作业完成后返回爬取结果。如果作业失败或停止,将引发异常。
check_crawl_status
方法。它接受作业 ID 作为参数,并返回当前爬取作业的状态。