未来规划 Roadmap

本页作为网站详细版页面维护，集中承接后续演进方向、优化目标与可量化验收指标。

建议使用方式：

面试时先讲“现在已经完成了什么”
再补“下一阶段准备怎么继续优化”
最后用“当前基线 + 目标指标”体现工程规划能力

0. 这些规划建立在什么现有基础上

这份 Roadmap 不是脱离代码的愿望清单，而是建立在当前已经落地的这些基础上：

16 个业务模块、19 个服务应用，已经形成完整的用户端、商家端、平台管理端三类入口
18 个 @FeignClient、30 个 @RabbitListener、26 个 @XxlJob 处理器，说明服务协同、异步消息和调度补偿都已经是主链路能力
4 个 Gateway 前置过滤器：AuthFilter / XssFilter / ValidateCodeFilter / BlackListUrlFilter
4 类向量检索空间：店铺 / 商品 / 博客 / 评价，并且已经支持 SimpleVectorStore 降级
NettyServer + NettyChatHandler + Chat 持久化 + MQ 广播 组成了实时通讯基础架构
当前仓库 Java 测试文件 = 0，GitHub Actions workflow = 1，说明后续工程质量和自动化能力仍有很大补强空间

所以这页后面的规划，核心不是“再加一些新功能”，而是围绕当前已具备的结构，把一致性、稳定性、可观测性和工程质量继续做深。

1. 交易一致性分层治理

当前基线：核心交易链路已经采用 RabbitMQ + Redis 幂等 + ACK/NACK + 延迟 / 死信队列 + XXL-JOB 形成最终一致性闭环，适合高并发与异步解耦场景。
优化动作：在 钱包余额支付、退款回退、优惠券核销 / 使用 等低并发但强一致诉求更高的链路中，逐步引入 Seata 分布式事务能力，重点覆盖 订单状态、钱包资金变动、券状态流转 三类跨服务数据库写操作。
量化目标：
- 钱包支付 / 退款 / 券核销 三条链路至少各落地 1 条可演示的强一致事务闭环。
- 资金类场景人工对账发现的严重不一致问题收敛到 0，非严重状态不一致控制在 1 / 万单 以内。
- 异步补偿链路继续保持 补偿成功率 > 99.9%，且引入强一致后核心交易吞吐不低于当前基线。

2. 强一致与最终一致边界梳理

当前基线：秒杀下单、Feed 推送、搜索同步、审核分发等链路已经明确采用最终一致性方案，但文档与监控层对“为什么不用强事务”还可以进一步结构化沉淀。
优化动作：补齐一份“场景选型矩阵”，按 强一致 / 最终一致 / 可补偿 / 不可补偿 四个维度给出统一判断标准，并把订单、钱包、积分、搜索、审核等典型业务分类归档。
量化目标：
- 文档中 100% 的核心链路补齐一致性选型说明，至少覆盖 订单 / 支付 / 钱包 / 积分 / 搜索 / 审核 / IM / AI 八类业务。
- 新增业务链路时统一走选型模板，做到“上线前有设计说明、上线后可回查”，避免再出现口径不一致。
- 面试或答辩时可以直接用 1 张矩阵 + 3 个典型案例 解释清楚强一致与最终一致的边界。

3. 可观测性与稳定性闭环

当前基线：项目已具备基础监控与日志能力，也保留了监控组件接入空间，但还没有形成统一的 Prometheus + Grafana 指标看板和告警闭环。
优化动作：补齐服务级、接口级、MQ 级、缓存级四层监控，重点观测 接口可用性、错误率、消息积压、Redis 命中率、ES/Milvus 同步延迟、死信队列积压量。
量化目标：
- 核心接口可用性达到 99.9%，核心链路接口错误率控制在 < 0.5%。
- 消息重试成功率达到 > 95%，死信补偿最终收敛率达到 > 99%，死信队列积压在 10 分钟 内可清空。
- Redis 热点链路命中率达到 > 85%，搜索同步延迟控制在 1 分钟 内。
- 常见线上异常实现 10 分钟内定位到模块，并能在看板中直接展示 TP95 / TP99 / 错误率 / 消息积压。

4. 搜索、推荐与高并发性能继续优化

当前基线：当前文档中已经沉淀了本地基准压测结果，例如首页聚合推荐流 QPS > 4500、秒杀链路 QPS > 3200、详情缓存 TP99 < 5ms。
优化动作：继续优化 LBS 搜索、首页聚合推荐、热榜洗牌 与 Feed 深翻页 四类读链，补充分词策略、索引字段裁剪、本地缓存层、热点数据预热与更细粒度的缓存淘汰策略。
量化目标：
- 首页聚合推荐流从当前 QPS > 4500 优化到 QPS > 6000，同时 TP99 < 35ms。
- 秒杀链路从当前 QPS > 3200 继续提升到 QPS > 4500，并把 TP99 压到 < 100ms。
- 详情缓存链路继续保持 TP99 < 5ms，LBS 搜索链路补齐压测后目标控制在 TP99 < 100ms。
- 所有新增优化必须带有“优化前 / 优化后”对比数据，至少保留 QPS、TP99、错误率、缓存命中率 四项指标。

5. AI 能力评估与经营助手增强

当前基线：用户端已经落地 AI 问答、博客生成、评价生成，商家端已经落地 评价回复、经营分析、商品营销文案、经营改进建议，并且已经具备 Milvus -> SimpleVectorStore 的降级能力，但当前更多偏功能展示，缺少效果量化。
优化动作：为 AI 模块补齐 路由命中率、生成成功率、兜底率、用户采纳率、商家建议采纳率 等指标，同时继续增强 RAG grounding、历史会话记忆与结构化推荐卡片能力。
量化目标：
- AI 生成成功率达到 > 95%，兜底率控制在 < 5%。
- AI 博客生成、AI 评价生成 的用户采纳率目标分别达到 > 30%、> 40%。
- 商家助手中 评价回复 / 商品营销文案 / 经营建议 的建议采纳率达到 > 25%。
- AI 会话具备基本使用画像统计，能够输出 会话量、命中率、采纳率、失败原因 TopN。

6. 工程质量与自动化流水线

当前基线：当前仓库已有完整开源文档、真实页面截图和链路图，但 Java 测试文件当前为 0，GitHub Actions workflow 当前为 1，自动化测试、CI/CD、构建产物校验还没有形成真正的日常开发闭环。
优化动作：补齐 GitHub Actions / GitLab CI，覆盖单元测试、基础构建、文档构建、镜像构建和关键目录变更检查；为核心链路逐步补充集成测试和回归校验脚本。
量化目标：
- 每次提交至少自动完成 编译 + 文档构建 + 关键模块测试 三类校验。
- CI 成功率目标达到 > 95%，常规流水线执行时长控制在 10 分钟 内。
- 核心链路逐步补齐集成测试，优先覆盖 登录、下单、支付、退款、审核、AI 生成 六类场景。
- 后续对外展示时，可以直接展示一条绿色流水线和关键测试报告，而不只是 README 说明。

7. 数据治理与后台能力完善

当前基线：目前已经具备审核中心、评论管理、评价管理、博客管理、业务用户、积分记录、抽奖配置等后台能力，但更多偏基础运营展示。
优化动作：继续补齐 操作审计、治理报表、审核效率统计、异常工单追踪、业务数据回溯 等平台能力，让后台从“可操作”进一步走向“可治理”。
量化目标：
- 审核中心补齐 平均处理时长、待审核积压量、通过率 / 驳回率 等指标，并把平均处理时长控制在 < 30 分钟。
- 后台关键操作全部可追溯，核心治理动作实现 100% 审计留痕。
- 异常问题支持从“列表”追溯到“详情、关联目标、操作日志”，形成可复盘链路。

8. 网关安全与统一认证深化

当前基线：Gateway 已经落了 AuthFilter / XssFilter / ValidateCodeFilter / BlackListUrlFilter 四类前置过滤器，并且 AuthFilter 已经区分后台 /admin 的 JWT 登录态和 App /app 的 Redis Token 登录态。
优化动作：在现有双端鉴权基础上继续补齐 设备维度会话管理、统一风控标记、接口级限流、敏感操作留痕 与 异常请求画像，把“能鉴权”升级成“能治理”。
量化目标：
- 后台端和 App 端的登录态流转规则全部文档化，做到 100% 可回查。
- 高风险接口全部补齐网关侧限流与来源标记，敏感请求留痕覆盖率达到 100%。
- 常见未登录、过期、越权、验证码异常问题可在 5 分钟 内定位到网关层处理链。

9. IM 多端会话与消息体验完善

当前基线：当前已经具备 NettyServer + NettyChatHandler + RemoteChatService + MQ 广播 + Redis 在线状态 / 活跃会话 的实时通讯基础架构，但更多聚焦“能聊起来”，多端同步和体验层能力仍可继续增强。
优化动作：继续补齐 已读回执、消息撤回、离线消息补投、多端会话一致性、未读聚合 与 在线状态收敛，让 IM 从“功能可用”走向“体验完整”。
量化目标：
- 消息投递成功率达到 > 99.9%，会话未读聚合延迟控制在 < 3 秒。
- 在线状态收敛时间控制在 < 10 秒，离线消息补投成功率达到 > 99%。
- 至少补齐 已读回执 + 撤回 + 多端同步 三项可演示能力，并形成对应链路图与文档说明。

10. 我会优先做的优化顺序

第一优先级：补齐可观测性与稳定性指标，因为这是后续所有优化的量化基础。
第二优先级：优化交易一致性分层治理，把 强一致 和 最终一致 的边界真正收口。
第三优先级：继续增强 AI 效果评估体系，让 AI 模块从“有功能”升级到“有数据支撑”。
第四优先级：推进网关安全与 IM 多端体验，把入口层和会话层能力补完整。
第五优先级：再推进自动化流水线和后台治理能力，让项目在工程化和展示层都更完整。