AI 系统通用数据预处理层,支持 18 种来源抓取、多源冲突检测、AI 增强与 20+ 平台一键导出。
Skill Seekers 是面向 AI 系统的通用数据预处理层,解决从异构来源获取知识并转化为 AI 可消费结构化资产的端到端问题。
数据获取(18 种来源):文档网站(智能 SPA 发现,优先使用 llms.txt)、GitHub 仓库(深度 AST 解析,支持 Python/JS/TS/Java/C++/Go 6 种语言)、本地代码库、PDF(含 OCR 与表格提取)、视频(YouTube/Vimeo/本地,支持转录与帧 OCR)、多种文档格式(.docx/.epub/.pptx/.ipynb/OpenAPI/RSS 等)以及协作平台(Confluence/Notion/Slack/Discord)。
知识处理:支持多来源合并为单一知识资产,自动发现文档与代码之间的不一致,提供基于规则或 AI 驱动的冲突解决与文档差距分析。默认调用 Claude API 生成 500+ 行的 SKILL.md,也可通过 --agent/--agent-cmd 切换为 Kimi、Codex 或自定义 Agent。
多平台导出:12 种 LLM Skill 格式(Claude ZIP+YAML/Gemini tar.gz/OpenAI ZIP/MiniMax/Kimi/DeepSeek/Qwen/OpenRouter/Together/Fireworks/Generic Markdown)、3 种 RAG 框架(LangChain/LlamaIndex/Haystack)、5 种向量数据库(Pinecone/ChromaDB/FAISS/Qdrant/Weaviate)、4 种 IDE 助手规则(Cursor/Windsurf/Cline/Continue.dev)及 IBM Bob skill 目录。
其他特性:内置 MCP Server(自然语言交互)、嵌入服务器(FastAPI + sentence-transformers + VoyageAI)、24+ 框架预设(Godot/React/Vue/Django/FastAPI 等)、Claude Code 插件。
部署方式:基于 Python ≥3.10,通过 Click CLI 驱动(skill-seekers create/package/upload),支持 pip/uv 安装、Docker/Docker Compose、Helm Chart(K8s)、GitHub Action、Homebrew tap。MIT 许可证,当前版本 3.6.0。
待确认:首次发布日期未标注;3,194+ tests 的覆盖率未公开验证;SkillSeekersWeb.com 未实际访问验证;Homebrew 具体安装命令未展示;S3/GCS/Azure 云存储上传 CLI 用法未在 README 中说明。