设置
- 首先,从您的 Firecrawl 仪表盘 获取您的 Firecrawl API 密钥。
- 配置您的 SourceSync.ai 命名空间以使用 Firecrawl 作为网页抓取提供者:
使用
配置完成后,您可以使用 SourceSync.ai 的网页抓取端点,并利用 Firecrawl 的功能。以下是主要的摄取方法:URL 列表摄取
抓取特定的 URL:网站爬取
使用自定义规则爬取整个网站:站点地图处理
处理站点地图中的所有URL:功能
使用Firecrawl与SourceSync.ai时,您可以访问以下功能:- JavaScript渲染支持
- 自动速率限制
- CSS选择器内容提取
- 深度控制的递归爬取
- 站点地图处理
资源
如需额外支持:- 邮件:support@sourcesync.ai
- Discord:加入我们的社区