安装
要安装 Firecrawl Node SDK,您可以使用 npm:Node
使用
- 从 firecrawl.dev 获取一个 API key。
- 将 API key 设置为环境变量
FIRECRAWL_API_KEY
或将其作为参数传递给FirecrawlApp
类。
Node
抓取 URL
要抓取单个 URL 并处理错误,请使用scrapeUrl
方法。它接受 URL 作为参数,并返回抓取的数据作为字典。
Node
爬取网站
要爬取网站并处理错误,请使用crawlUrl
方法。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取作业的其他选项,如最大爬取页面数、允许的域名和输出格式。
Node
异步爬取
要异步爬取网站,请使用crawlUrlAsync
方法。它返回爬取作业的 ID
,您可以用它来检查爬取作业的状态。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取作业的其他选项,如最大爬取页面数、允许的域名和输出格式。
Node
检查爬取状态
要检查爬取作业的状态并处理错误,请使用checkCrawlStatus
方法。它接受 ID
作为参数,并返回当前爬取作业的状态。
Node
取消爬取
要取消异步爬取作业,请使用cancelCrawl
方法。它接受异步爬取作业的 ID 作为参数,并返回取消状态。
Node
映射网站
要映射网站并处理错误,请使用mapUrl
方法。它接受起始 URL 作为参数,并返回映射的数据作为字典。
Node
使用 WebSockets 爬取网站
要使用 WebSockets 爬取网站,请使用crawlUrlAndWatch
方法。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取作业的其他选项,如最大爬取页面数、允许的域名和输出格式。
Node
错误处理
SDK 处理由 Firecrawl API 返回的错误,并引发适当的异常。如果在请求过程中发生错误,将会引发带有描述性错误消息的异常。上面的示例展示了如何使用try/catch
块处理这些错误。