模型之后的问题
模型越来越强,真正难的是让它进入真实任务:上下文怎么组织,工具怎么调用,状态怎么保存,失败怎么恢复。
AI AGENT HARNESS PORTFOLIO
AI 产品经理|Agent Harness 产品实践者|企业 AI 应用落地负责人
15 年复杂行业管理经验 + 近两年 AI 产品与 Agent 实战。
我关注的不是做一个 AI Demo,而是如何把模型能力放进真实任务链,让 AI 输出可复核、可审计、可评估、可交付。
ContractAI 为桌面端原型,Web Demo 使用脱敏样例与模拟解析结果。
展示口径用于作品集说明,具体数据可按真实后台核准。
Agent 真正进入企业场景后,难点往往不在一次成功演示,而在边界、过程、失败和持续评估。
模型越来越强,真正难的是让它进入真实任务:上下文怎么组织,工具怎么调用,状态怎么保存,失败怎么恢复。
合同、资金、审批、外部发送这类高风险场景,AI 不能直接替人决定。产品要设计人审、留痕、回放和责任边界。
我不只看一次 Demo 是否成功,更关注任务成功率、用户接管率、失败分类、Token 成本和反馈是否进入评估集。
Main Project
将 PDF / 图片合同转化为可校验、可修正、可导出、可追踪的结构化合同台账,验证高风险企业场景下 AI Agent 的人审闭环、审计留痕和本地安全存储机制。
请将真实录屏替换为 public/contractai-demo.mp4。文件缺失时,本区域仍作为演示占位显示。
业务流 / 审批流 / 合同流 / 资金流 / 风控流
Agent Loop / Tool Use / MCP / Memory / Context
权限 / 复核 / 审计 / 验收 / 风险边界
Cursor / v0 / Bolt / Codex / Gemini
任务成功率 / 失败分类 / 用户接管率 / Token 成本
把模型能力封装进真实业务系统,让 AI 输出可确认、可追踪、可评估、可交付。
以数据流水线的视角设计 AI 系统,将不确定的模型推理封装入稳定的工程链路中。
本地 LLM API 网关 + Token Observability 工具,用于统计不同 Agent、项目、模型和 API Key 的 Token 消耗、调用成本、失败率、延迟和异常使用。企业版可演进为 AI FinOps & API Key Governance Platform。
将开源 Agent 框架部署到安卓手机环境,验证本地 Agent 的低成本运行、环境适配、后台常驻和普通用户使用门槛,并通过公开视频获得大量真实用户反馈。
面向企业 AI 现场部署工程师,设计自然语言驱动的工作台,辅助完成客户需求理解、数据接入、业务 ontology 建模、Agent 装配、调试和交付报告生成。
设计 RAG 增强企业知识库,并从单轮问答扩展到多步骤任务执行,支持知识检索、资料生成、流程推进、人工审批和结果归档。
从地产运营、工程管理、新能源投资,到 AI Native 产品化实践。
Agent、RAG、OCR、AI 工作流、TokenRadar、ContractAI、FDE Workbench
项目获取、收益测算、合同协同、运维管理、产业 AI 场景验证
集团大运营、159 个在建项目、风控机制、产业公司协同
大运营、投资、融资、经营分析、预算管理
复杂项目、工程运营、组织建设、流程机制沉淀