宅记 / ZaiGie

把想法接成可运行的工具

Agentic 智能应用 通用工具链 私有化部署 视频推理 边缘设备
>_ zaigie@home-lab ~

“持续连接 · 小步快跑 · 让工具发光”

宅记 / ZaiGie 头像
Agentic 应用 planning
私有化部署 offline
推理引擎 running
通用工具 ready
边缘设备 syncing
>_ system.log 10:24:09  service.agent [ plan ] 10:24:10  service.voice  [ ok ] 10:24:10  service.vision [ ok ] 10:24:11  service.tools  [ ok ] 10:24:11  edge.node     [ sync ]

02ABILITIES MAP

能力地图

从公开项目里提炼出的长期问题域
应用工程化
与信息化落地能力
Agentic + FullStack

Agentic 应用编排

  • 任务规划 / 工具选择 / 多步执行
  • MCP / 插件协议 / 外部系统接入
  • RAG / 记忆 / 上下文工程
  • 评测反馈 / 人工确认 / 可回放轨迹
AgentToolsMCP

语音 ASR/TTS

  • 语音识别 ASR(流式 / 批量)
  • 语音合成 TTS(多音色 / 可控)
  • 说话人分离 / VAD / 标点恢复
  • 多语言支持 / 自定义词表

OCR/VLM 文档解析

  • 通用 OCR(印刷体 / 手写体)
  • 版面分析 / 表格识别 / 公式识别
  • 多模态理解 VLM(图文问答 / 摘要)
  • 结构化输出(JSON / Markdown)

统一 API 与任务引擎

  • Agent / Model / Tool 统一网关
  • 异步任务队列 / 结果回调 / 重试机制
  • 模型路由 / 负载均衡 / 限流熔断
  • 权限边界 / 用量统计 / 审计日志

实时视频推理

  • 实时检测 / 跟踪 / 分析管线
  • 低延迟 / 高吞吐 / 可观测
  • 可视化与告警联动
  • 边缘摄像头 / RTSP / ONVIF
PythonC/C++ONNX

通用工具与运维

  • CLI / API / Webhook 工具服务
  • 部署编排 / 配置管理 / 日志中心
  • 监控告警 / 指标看板 / 审计追踪
  • 备份恢复 / 自动化运维脚本
GoPythonTypeScriptCLI

边缘设备与 IoT

  • 嵌入式与边缘计算落地
  • 设备通信 / 协议适配 / OTA 升级
  • 本地推理 / 离线运行 / 数据缓存
  • 低功耗优化 / 稳定性治理
C/C++MQTTESP32 / Pi

部署与后端适配

  • Docker / Docker Compose
  • 一键启动 / 离线部署 / 资源隔离
  • 模型热更新 / 版本适配 / 健康检查
  • 存储适配(本地 / NAS / S3 兼容)
核心技术栈 / Tech Stack
  • Python服务 / 脚本 / 数据处理
  • Go高并发 / 工具链
  • TypeScript面板 / 可视化 / 自动化
  • FastAPI高性能 API 框架
  • Agentic工具编排 / RAG / MCP
  • Docker容器化 / 一致性部署

工作方式

先让它跑起来,再让它可靠
原型先行,快速验证用最小闭环验证想法,能用再优雅。
本地优先,隐私优先数据默认留在本地,掌控权在自己手中。
可观测,才可靠日志 / 指标 / 链路,问题有据可查。
自动化,减少重复能脚本化的脚本化,能 CI 的就别手动。
写清楚,才好协作文档与图示先行,代码只是实现。

从想法到可运行系统的迭代路径

想法Idea 原型Prototype 服务化Service 部署与观测Operate 沉淀为资产Reusable
# 让原型成为可运行的系统 $ make dev# 本地优先,快速启动 $ make api# 后端接口与任务入口 $ make infer# 模型 / CV 管线验证 $ make edge# 边缘节点与离线运行 $ make release# 镜像、文档与观测配置

可交付能力

Agentic、后端、CV 与边缘一起落地
后端服务与任务引擎REST / WebSocket / gRPC、异步队列、回调、权限与状态管理。
CV / 多模态推理管线实时视频推理、OCR/VLM 文档解析、结构化输出与评测样例。
边缘设备与离线运行RTSP / ONVIF、设备协议适配、资源约束、缓存与健康检查。
模型服务与 RAG 应用私有化部署、向量检索、记忆管理、知识库问答与摘要。
可观测与 DevOpsDocker Compose、CI/CD、指标 / 日志 / 链路、告警与回放。

多能力系统交付形态

WebAPICLI
API Gateway
Auth
认证
API
后端服务
Vision
CV 管线
Agent
编排引擎
Queue
任务队列
Model
推理服务
Storage
状态存储
Agent / RAGCV / OCREdge RuntimeHuman Review
PostgreSQLRedisQdrantMinIOPrometheus

交付包 / Delivery Kit

$ system healthcheck ✓ api-gateway     Ready ✓ inference-worker Ready ✓ edge-node       Synced ✓ observability  Ready

05NOTES

工程笔记

把复杂问题整理清楚,也是一种产品能力。
Private AI

模型服务不是“接一个模型”,而是把模型变成可路由、可组合、可运维的服务引擎。

统一网关、异步任务、模型热更新、离线部署和可观测,是私有化 AI 从演示走向可用的关键。

Realtime Vision

实时视频推理的难点通常不在模型,而在管线吞吐、延迟预算和异常恢复。

输入源、队列、推理、结构化输出和告警联动要作为一个系统一起设计。

Local First

能在本地稳定跑起来的工具,才更容易被信任、复现和扩展。

默认本地、可 Docker 化、日志完整、文档清楚,是我偏爱的工具落地方式。

宅记 / ZaiGie 头像

你好,我是 宅记 / ZaiGie

喜欢把想法变成工具,也享受把复杂问题理清楚的过程。一起做些有用又有趣的事吧!

GitHub
@zaigie
Email
jokerrwho@yeah.net
$ whoami Zaigie $ motto “代码是手段,解决问题才是目的。开放让我们走得更远。”
© 2026 宅记 / ZaiGie 蜀ICP备18030837号-1