mirror of
https://github.com/NoFxAiOS/nofx.git
synced 2026-06-06 05:51:19 +08:00
9.0 KiB
9.0 KiB
Agent 4 Skill 验收清单
本文档用于验收 Agent 对 4 个管理类 skill 的字段认知、工具调用和用户可见行为是否与页面编辑能力对齐。
当前范围:
model_managementexchange_managementtrader_managementstrategy_management
验收目标:
- 页面上能手动改的核心字段,Agent 也能稳定改
- Agent 能回答页面上可见的字段与选项
- 模糊请求不会被硬塞进错误 skill
- 多字段一句话更新时,不会被窄动作截断
0. 前置条件
- 已完成登录
- 后端已启动
- 至少准备 1 条可编辑的模型、交易所、交易员、策略数据
- 测试前如果有旧上下文,先在 Agent 会话里执行
/clear
建议先跑自动化回归:
go test ./agent -run 'Test(ManageModelToolSchemaExposesEditableFields|ManageExchangeToolSchemaExposesEditableFields|ManageTraderToolSchemaExposesAdvancedFields|ManageStrategyToolSchemaExposesFieldLevelConfig|ModelManagementManualEditableFieldsAreCoveredByAgent|ExchangeManagementManualEditableFieldsAreCoveredByAgent|TraderManagementManualEditableFieldsAreCoveredByAgent|StrategyManagementManualEditableFieldsAreCoveredByAgent|ExchangeManagementUpdateSupportsManualFields|ModelManagementThinkAndActSupportsCompositeFieldUpdates|TraderManagementUpdateSupportsAdvancedManualFields|StrategyManagementThinkAndActSupportsGridAndRiskFields)'
对应测试主要在:
1. 自动化覆盖基线
通过以下检查后,才进入手工验收:
- 4 个 skill 的 tool schema 已暴露字段级参数
- 4 个 skill 的 manual editable field 集合都被 agent 字段目录覆盖
model支持一句话同时改enabled + custom_api_url + custom_model_nameexchange支持一句话同时改account_name + hyperliquid_wallet_addr + testnettrader支持高级字段更新strategy支持 grid/risk 多字段更新
2. Model Skill
页面参考:
核心字段:
providernameapi_keycustom_api_urlcustom_model_nameenabled
手工验收:
- 说“列出我的模型配置”时,能列出当前模型
- 说“这个模型的接口地址改成 xxx,模型名称改成 yyy,并且禁用”时,能一次成功更新
- 说“这个模型有哪些字段能改”时,回答至少覆盖
API Key / 接口地址 / 模型名称 / 启用状态 - 说“把这个模型启用”时,不会误触发重命名流程
- 说“把这个模型改成最好的”这类抽象诉求时,不应硬造字段值;应该解释或引导
通过标准:
- 回复文本明确说明已更新模型配置
- 页面刷新后字段真实变化
- 不出现“我还需要你明确要操作哪个对象”这种错误兜底
3. Exchange Skill
页面参考:
核心字段:
- 公共字段:
exchange_typeaccount_nameenabledtestnet
- CEX:
api_keysecret_keypassphrase
- Hyperliquid:
api_keyhyperliquid_wallet_addr
- Aster:
aster_useraster_signeraster_private_key
- Lighter:
lighter_wallet_addrlighter_api_key_private_keylighter_api_key_index
手工验收:
- 说“把 Dex 的账户名改成 Dex Pro,Hyperliquid 钱包改成 0xabc,testnet 打开”时,能一次成功更新
- 说“这个交易所有哪些字段能改”时,能按当前交易所类型回答差异字段
- 说“把这个交易所禁用”时,不会误进入改名分支
- 说“列出我的交易所配置”时,能读出当前配置
- 对缺少必填凭证的创建请求,会明确指出缺哪一项,而不是模糊失败
通过标准:
- 回复文本明确说明已更新交易所配置
- 页面刷新后对应字段真实变化
- 不因为对象解析失败而掉到“请明确对象”
4. Trader Skill
页面参考:
页面核心字段:
nameai_model_idexchange_idstrategy_idis_cross_marginshow_in_competitionscan_interval_minutesinitial_balance
Agent 扩展字段:
btc_eth_leveragealtcoin_leveragetrading_symbolscustom_promptoverride_base_promptsystem_prompt_templateuse_ai500use_oi_top
手工验收:
- 说“把交易员 A 切换到策略 B,扫描间隔改成 8 分钟,全仓关闭,竞技场显示关闭”时,能一次成功更新
- 说“把高级交易员的 BTC/ETH 杠杆改成 8,山寨币杠杆改成 4,交易对改成 BTC、ETH,自定义 prompt 改成 xxx,启用 AI500”时,能成功更新
- 说“这个交易员有哪些字段能改”时,至少能回答页面核心字段和 Agent 扩展字段
- 说“启动这个交易员”时,仍会保留高风险确认链路
- 说“为什么我的交易员不交易”时,仍能走诊断 skill,不会被错误识别成 update
通过标准:
- 回复文本明确说明更新了交易员配置或绑定
- 页面刷新或查询结果能看到真实变化
交易对提取不会误吞后半句自然语言
5. Strategy Skill
页面参考:
编辑器模块:
grid_configcoin_sourceindicatorsrisk_controlprompt_sectionscustom_promptpublish_settings
重点字段:
- 元信息:
namedescriptionstrategy_typeis_publicconfig_visible
- Grid:
symbolgrid_counttotal_investmentupper_pricelower_priceuse_atr_boundsatr_multiplierdistributionenable_direction_adjustdirection_bias_ratiomax_drawdown_pctstop_loss_pctdaily_loss_limit_pctuse_maker_only
- Coin source:
source_typestatic_coinsexcluded_coinsuse_ai500ai500_limituse_oi_topoi_top_limituse_oi_lowoi_low_limit
- Risk:
max_positionsmin_confidencemin_risk_reward_ratiobtceth_max_leveragealtcoin_max_leveragebtceth_max_position_value_ratioaltcoin_max_position_value_ratiomax_margin_usagemin_position_size
- Indicators / timeframe:
primary_timeframeprimary_countselected_timeframesema_periodsrsi_periodsatr_periodsboll_periodsenable_emaenable_macdenable_rsienable_atrenable_bollenable_volumeenable_oienable_funding_rate
- Prompt:
role_definitiontrading_frequencyentry_standardsdecision_processcustom_prompt
手工验收:
- 说“把策略 A 改成网格策略,网格数量改成 14,ATR 倍数改成 2.5,最大保证金使用率改成 0.6”时,能一次成功更新
- 说“把选币来源改成静态,静态币改成 BTC、ETH,排除 DOGE,AI500 关闭”时,能成功更新
- 说“选币来源有哪些”时,能回答当前面板的来源类型与相关选项,而不是重复草稿摘要
- 说“这个策略里面的参数和 prompt 分别是什么样的”时,能走 explain/detail,不会误更新
- 说“帮我创建一个不亏钱的策略”这类抽象请求时,不应直接强绑到字段创建;应该回退 planner 或引导细化
通过标准:
- 回复文本明确说明已更新策略参数或进入合理引导
- Strategy Studio 刷新后真实反映更新
- 不会把开放式目标误当作已可执行的精确配置
6. 跨 Skill 语义验收
- 模糊输入先过统一语义网关,再决定
continue_active / resume_snapshot / start_new - 一个 skill 进行中时,问页面字段选项,优先走 explain,不要硬落 execute
- 开放式目标型请求在参数不足时,优先回 planner,不要强行进 hard skill
- 同一句话改多个字段时,不会只改其中一个窄字段
/clear后,旧的 skill session / workflow / execution state / snapshots 都被清空- 切回旧话题时,snapshot restore 能恢复到正确对象,而不是凭 heuristics 误接
7. 回归记录模板
每次验收建议记录:
- 日期:
- 提交版本:
- 后端 PID:
- 前端地址:
- 本轮执行人:
逐项记录:
- 用例:
- 用户原话:
- 预期:
- 实际:
- 是否通过:
- 备注:
8. 当前结论口径
当本文档第 1 节自动化基线和第 2-6 节核心手工项全部通过后,才建议对外宣称:
“Agent 对 4 个 skill 已基本对齐当前页面可编辑能力,并具备稳定的 explain / execute / planner fallback 行为。”