Agent Park - Agent 项目导航

全部项目

17 个项目

Peekaboo 🫣

✨

基于 AI 视觉理解的 macOS GUI 自动化工具，通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作

模型与推理框架多模态MCP

查看详情 →

vllm-mlx

🧠

面向 Apple Silicon 的 vLLM 风格推理服务器，基于原生 MLX 后端，单进程同时暴露 OpenAI 与 Anthropic 兼容 API，支持多模态统一服务、Continuous Batching、Paged KV Cache、SSD 分级缓存等生产级特性。

多模态大语言模型Python

查看详情 →

OpenMontage

✨

首个开源 Agent-first 视频制作系统，提供 12 条结构化管线与 52 个生产工具，在 AI 编程助手中以自然语言驱动端到端视频生产。

自然语言处理多模态AI代理

查看详情 →

Rapid-MLX

✨

Apple Silicon 本地 AI 推理引擎，提供 OpenAI 兼容 API，支持多模态、Tool Calling 和智能云端路由。

AI代理大语言模型MCP

查看详情 →

npcpy

✨

面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库，提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。

模型与推理框架大语言模型多模态

查看详情 →

NodeTool

✨

节点式可视化 AI 工作流与 LLM Agent 构建平台，支持本地运行模型与多模态编排，提供桌面端、Web、CLI、移动端全矩阵交付形态。

模型与推理框架大语言模型多模态

查看详情 →

AutoRound

✨

Intel 官方的大语言模型与视觉-语言模型后训练量化工具包，基于 SignRound 算法支持 2-4 bit 极低比特量化与自动混合精度方案生成，可跨 Intel CPU/GPU、NVIDIA GPU、Habana Gaudi 部署。

多模态大语言模型Transformers

查看详情 →

mlx-openai-server

✨

面向 Apple Silicon 的本地 OpenAI 兼容多模态 API 服务器，支持文本、视觉、音频转录与图像生成/编辑模型的统一部署。

深度学习大语言模型多模态

查看详情 →

RCLI

✨

面向 macOS Apple Silicon 的全链路端侧语音 AI 助手，集成 STT、LLM、TTS、VLM、RAG 与系统操作控制，完全离线运行。

模型与推理框架大语言模型多模态

查看详情 →

trackers

✨

即插即用的多目标跟踪（MOT）Python库，提供SORT和ByteTrack等经典算法的模块化实现。采用检测器无关设计，可配合任意目标检测模型（YOLO、DETR等）使用，支持视频文件、摄像头、RTSP流等多种输入源。提供统一CLI工具与Python API，内置CLEAR、HOTA、Identity等标准MOT评估指标计算功能。

多模态深度学习SDK

查看详情 →

每页

第 1 / 2 页 · 共 17 条

按分类筛选

固定项目分类

按领域筛选

按产品形态筛选

全部项目

Peekaboo 🫣

vllm-mlx

OpenMontage

Rapid-MLX

npcpy

NodeTool

AutoRound

mlx-openai-server

RCLI

trackers

保持更新