AI AGENT HARNESS PORTFOLIO

刘世鑫

AI 产品经理|Agent Harness 产品实践者|企业 AI 应用落地负责人

把复杂业务,翻译成可执行的 Agent Harness。

15 年复杂行业管理经验 + 近两年 AI 产品与 Agent 实战。
我关注的不是做一个 AI Demo,而是如何把模型能力放进真实任务链,让 AI 输出可复核、可审计、可评估、可交付。

ContractAI 为桌面端原型,Web Demo 使用脱敏样例与模拟解析结果。

15 年
复杂行业管理
近 2 年
AI 产品实战
10+
AI 原型 / 蓝图 / Demo
100M+
近 30 天 Token 使用
百万级
Agent 教程播放
ContractAI
桌面端原型实战

展示口径用于作品集说明,具体数据可按真实后台核准。

我关注的真实问题

Agent 真正进入企业场景后,难点往往不在一次成功演示,而在边界、过程、失败和持续评估。

模型之后的问题

模型越来越强,真正难的是让它进入真实任务:上下文怎么组织,工具怎么调用,状态怎么保存,失败怎么恢复。

企业场景的边界

合同、资金、审批、外部发送这类高风险场景,AI 不能直接替人决定。产品要设计人审、留痕、回放和责任边界。

Agent 的可评估性

我不只看一次 Demo 是否成功,更关注任务成功率、用户接管率、失败分类、Token 成本和反馈是否进入评估集。

Main Project

ContractAI|合同智能解析 Agent Harness 原型

将 PDF / 图片合同转化为可校验、可修正、可导出、可追踪的结构化合同台账,验证高风险企业场景下 AI Agent 的人审闭环、审计留痕和本地安全存储机制。

ContractAI 演示视频

请将真实录屏替换为 public/contractai-demo.mp4。文件缺失时,本区域仍作为演示占位显示。

Demo flow: Upload / Parse / Review / Ledger / Exportpreload=metadata

核心能力:复杂行业经验与 Agent 的桥梁

复杂业务抽象

业务流 / 审批流 / 合同流 / 资金流 / 风控流

Agent Harness 产品化

Agent Loop / Tool Use / MCP / Memory / Context

企业 AI 落地

权限 / 复核 / 审计 / 验收 / 风险边界

AI 原生原型

Cursor / v0 / Bolt / Codex / Gemini

评估与反馈闭环

任务成功率 / 失败分类 / 用户接管率 / Token 成本

最终目标

把模型能力封装进真实业务系统,让 AI 输出可确认、可追踪、可评估、可交付。

Agent Harness 架构说明

以数据流水线的视角设计 AI 系统,将不确定的模型推理封装入稳定的工程链路中。

更多产品原型与工程探索

TokenRadar|桌面端 AI API 成本雷达

本地 LLM API 网关 + Token Observability 工具,用于统计不同 Agent、项目、模型和 API Key 的 Token 消耗、调用成本、失败率、延迟和异常使用。企业版可演进为 AI FinOps & API Key Governance Platform。

Local API GatewayToken ObservabilityAI FinOpsAPI Key Governance

OpenClaw / Hermes 移动端部署实践

将开源 Agent 框架部署到安卓手机环境,验证本地 Agent 的低成本运行、环境适配、后台常驻和普通用户使用门槛,并通过公开视频获得大量真实用户反馈。

OpenClawHermesTermuxLocal AgentUser Feedback

AI FDE Workbench|现场部署工程师工作台

面向企业 AI 现场部署工程师,设计自然语言驱动的工作台,辅助完成客户需求理解、数据接入、业务 ontology 建模、Agent 装配、调试和交付报告生成。

FDEAgent AssemblyOntologyPlannerEval / Release

企业知识库与 AI Agent 工作流

设计 RAG 增强企业知识库,并从单轮问答扩展到多步骤任务执行,支持知识检索、资料生成、流程推进、人工审批和结果归档。

RAGWorkflowHuman-in-the-loopPermissionAudit Log

职业路径|复杂行业到 AI 产品

从地产运营、工程管理、新能源投资,到 AI Native 产品化实践。

2023–至今

独立 AI 产品实验室 / 企业 AI 应用落地实践

Agent、RAG、OCR、AI 工作流、TokenRadar、ContractAI、FDE Workbench

2023–至今

工商业分布式光伏投资开发公司股东

项目获取、收益测算、合同协同、运维管理、产业 AI 场景验证

2021–2022

实地集团

集团大运营、159 个在建项目、风控机制、产业公司协同

2019–2021

佳兆业集团

大运营、投资、融资、经营分析、预算管理

2009–2019

龙湖集团

复杂项目、工程运营、组织建设、流程机制沉淀