Firecrawl Rust SDK 是一个库,可帮助您轻松抓取和爬取网站,并将数据以适合语言模型(LLMs)使用的格式输出。
注意:此文档使用的是 v0 版本的 Firecrawl API,该版本已被弃用。我们建议切换到 v1。
Cargo.toml
文件中添加以下内容:
FIRECRAWL_API_KEY
或将其作为参数传递给 FirecrawlApp
结构体。scrape_url
方法抓取单个 URL,并处理错误。它接受 URL 作为参数,并返回抓取的数据作为 serde_json::Value
。
crawl_url
方法爬取网站。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取任务的其他选项,例如要爬取的最大页面数、允许的域和输出格式。
check_crawl_status
方法检查爬取任务的状态。它接受任务 ID 作为参数,并返回当前爬取任务的状态。
cancel_crawl_job
方法取消爬取任务。它接受任务 ID 作为参数,并返回爬取任务的取消状态。
search
方法。该方法接受查询作为参数,并返回搜索结果。