注意:此文档使用的是 v0 版本的 Firecrawl API,该版本已被弃用。我们建议切换到 v1。
安装
要安装 Firecrawl Rust SDK,请在您的Cargo.toml
文件中添加以下内容:
使用
- 从 firecrawl.dev 获取 API 密钥。
- 将 API 密钥设置为环境变量
FIRECRAWL_API_KEY
或将其作为参数传递给FirecrawlApp
结构体。
抓取 URL
使用scrape_url
方法抓取单个 URL,并处理错误。它接受 URL 作为参数,并返回抓取的数据作为 serde_json::Value
。
爬取网站
使用crawl_url
方法爬取网站。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取任务的其他选项,例如要爬取的最大页面数、允许的域和输出格式。
检查爬取状态
使用check_crawl_status
方法检查爬取任务的状态。它接受任务 ID 作为参数,并返回当前爬取任务的状态。
取消爬取任务
使用cancel_crawl_job
方法取消爬取任务。它接受任务 ID 作为参数,并返回爬取任务的取消状态。
从 URL 提取结构化数据
通过 LLM 提取,您可以从任何 URL 中轻松提取结构化数据。以下是如何使用它的方法:搜索查询
要搜索网页,获取最相关的结果,抓取每个页面并返回 Markdown 格式的内容,可以使用search
方法。该方法接受查询作为参数,并返回搜索结果。