Skip to content

未来规划 Roadmap

本页作为网站详细版页面维护,集中承接后续演进方向、优化目标与可量化验收指标。

建议使用方式:

  • 面试时先讲“现在已经完成了什么”
  • 再补“下一阶段准备怎么继续优化”
  • 最后用“当前基线 + 目标指标”体现工程规划能力

0. 这些规划建立在什么现有基础上

这份 Roadmap 不是脱离代码的愿望清单,而是建立在当前已经落地的这些基础上:

  • 16 个业务模块、19 个服务应用,已经形成完整的用户端、商家端、平台管理端三类入口
  • 18 个 @FeignClient30 个 @RabbitListener26 个 @XxlJob 处理器,说明服务协同、异步消息和调度补偿都已经是主链路能力
  • 4 个 Gateway 前置过滤器:AuthFilter / XssFilter / ValidateCodeFilter / BlackListUrlFilter
  • 4 类向量检索空间:店铺 / 商品 / 博客 / 评价,并且已经支持 SimpleVectorStore 降级
  • NettyServer + NettyChatHandler + Chat 持久化 + MQ 广播 组成了实时通讯基础架构
  • 当前仓库 Java 测试文件 = 0GitHub Actions workflow = 1,说明后续工程质量和自动化能力仍有很大补强空间

所以这页后面的规划,核心不是“再加一些新功能”,而是围绕当前已具备的结构,把一致性、稳定性、可观测性和工程质量继续做深。

1. 交易一致性分层治理

  • 当前基线:核心交易链路已经采用 RabbitMQ + Redis 幂等 + ACK/NACK + 延迟 / 死信队列 + XXL-JOB 形成最终一致性闭环,适合高并发与异步解耦场景。
  • 优化动作:在 钱包余额支付退款回退优惠券核销 / 使用 等低并发但强一致诉求更高的链路中,逐步引入 Seata 分布式事务能力,重点覆盖 订单状态钱包资金变动券状态流转 三类跨服务数据库写操作。
  • 量化目标
    • 钱包支付 / 退款 / 券核销 三条链路至少各落地 1 条可演示的强一致事务闭环。
    • 资金类场景人工对账发现的严重不一致问题收敛到 0,非严重状态不一致控制在 1 / 万单 以内。
    • 异步补偿链路继续保持 补偿成功率 > 99.9%,且引入强一致后核心交易吞吐不低于当前基线。

2. 强一致与最终一致边界梳理

  • 当前基线:秒杀下单、Feed 推送、搜索同步、审核分发等链路已经明确采用最终一致性方案,但文档与监控层对“为什么不用强事务”还可以进一步结构化沉淀。
  • 优化动作:补齐一份“场景选型矩阵”,按 强一致 / 最终一致 / 可补偿 / 不可补偿 四个维度给出统一判断标准,并把订单、钱包、积分、搜索、审核等典型业务分类归档。
  • 量化目标
    • 文档中 100% 的核心链路补齐一致性选型说明,至少覆盖 订单 / 支付 / 钱包 / 积分 / 搜索 / 审核 / IM / AI 八类业务。
    • 新增业务链路时统一走选型模板,做到“上线前有设计说明、上线后可回查”,避免再出现口径不一致。
    • 面试或答辩时可以直接用 1 张矩阵 + 3 个典型案例 解释清楚强一致与最终一致的边界。

3. 可观测性与稳定性闭环

  • 当前基线:项目已具备基础监控与日志能力,也保留了监控组件接入空间,但还没有形成统一的 Prometheus + Grafana 指标看板和告警闭环。
  • 优化动作:补齐服务级、接口级、MQ 级、缓存级四层监控,重点观测 接口可用性错误率消息积压Redis 命中率ES/Milvus 同步延迟死信队列积压量
  • 量化目标
    • 核心接口可用性达到 99.9%,核心链路接口错误率控制在 < 0.5%
    • 消息重试成功率达到 > 95%,死信补偿最终收敛率达到 > 99%,死信队列积压在 10 分钟 内可清空。
    • Redis 热点链路命中率达到 > 85%,搜索同步延迟控制在 1 分钟 内。
    • 常见线上异常实现 10 分钟内定位到模块,并能在看板中直接展示 TP95 / TP99 / 错误率 / 消息积压

4. 搜索、推荐与高并发性能继续优化

  • 当前基线:当前文档中已经沉淀了本地基准压测结果,例如首页聚合推荐流 QPS > 4500、秒杀链路 QPS > 3200、详情缓存 TP99 < 5ms
  • 优化动作:继续优化 LBS 搜索首页聚合推荐热榜洗牌Feed 深翻页 四类读链,补充分词策略、索引字段裁剪、本地缓存层、热点数据预热与更细粒度的缓存淘汰策略。
  • 量化目标
    • 首页聚合推荐流从当前 QPS > 4500 优化到 QPS > 6000,同时 TP99 < 35ms
    • 秒杀链路从当前 QPS > 3200 继续提升到 QPS > 4500,并把 TP99 压到 < 100ms
    • 详情缓存链路继续保持 TP99 < 5ms,LBS 搜索链路补齐压测后目标控制在 TP99 < 100ms
    • 所有新增优化必须带有“优化前 / 优化后”对比数据,至少保留 QPS、TP99、错误率、缓存命中率 四项指标。

5. AI 能力评估与经营助手增强

  • 当前基线:用户端已经落地 AI 问答博客生成评价生成,商家端已经落地 评价回复经营分析商品营销文案经营改进建议,并且已经具备 Milvus -> SimpleVectorStore 的降级能力,但当前更多偏功能展示,缺少效果量化。
  • 优化动作:为 AI 模块补齐 路由命中率生成成功率兜底率用户采纳率商家建议采纳率 等指标,同时继续增强 RAG grounding、历史会话记忆与结构化推荐卡片能力。
  • 量化目标
    • AI 生成成功率达到 > 95%,兜底率控制在 < 5%
    • AI 博客生成AI 评价生成 的用户采纳率目标分别达到 > 30%> 40%
    • 商家助手中 评价回复 / 商品营销文案 / 经营建议 的建议采纳率达到 > 25%
    • AI 会话具备基本使用画像统计,能够输出 会话量、命中率、采纳率、失败原因 TopN

6. 工程质量与自动化流水线

  • 当前基线:当前仓库已有完整开源文档、真实页面截图和链路图,但 Java 测试文件当前为 0GitHub Actions workflow 当前为 1,自动化测试、CI/CD、构建产物校验还没有形成真正的日常开发闭环。
  • 优化动作:补齐 GitHub Actions / GitLab CI,覆盖单元测试、基础构建、文档构建、镜像构建和关键目录变更检查;为核心链路逐步补充集成测试和回归校验脚本。
  • 量化目标
    • 每次提交至少自动完成 编译 + 文档构建 + 关键模块测试 三类校验。
    • CI 成功率目标达到 > 95%,常规流水线执行时长控制在 10 分钟 内。
    • 核心链路逐步补齐集成测试,优先覆盖 登录、下单、支付、退款、审核、AI 生成 六类场景。
    • 后续对外展示时,可以直接展示一条绿色流水线和关键测试报告,而不只是 README 说明。

7. 数据治理与后台能力完善

  • 当前基线:目前已经具备审核中心、评论管理、评价管理、博客管理、业务用户、积分记录、抽奖配置等后台能力,但更多偏基础运营展示。
  • 优化动作:继续补齐 操作审计治理报表审核效率统计异常工单追踪业务数据回溯 等平台能力,让后台从“可操作”进一步走向“可治理”。
  • 量化目标
    • 审核中心补齐 平均处理时长待审核积压量通过率 / 驳回率 等指标,并把平均处理时长控制在 < 30 分钟
    • 后台关键操作全部可追溯,核心治理动作实现 100% 审计留痕。
    • 异常问题支持从“列表”追溯到“详情、关联目标、操作日志”,形成可复盘链路。

8. 网关安全与统一认证深化

  • 当前基线:Gateway 已经落了 AuthFilter / XssFilter / ValidateCodeFilter / BlackListUrlFilter 四类前置过滤器,并且 AuthFilter 已经区分后台 /admin 的 JWT 登录态和 App /app 的 Redis Token 登录态。
  • 优化动作:在现有双端鉴权基础上继续补齐 设备维度会话管理统一风控标记接口级限流敏感操作留痕异常请求画像,把“能鉴权”升级成“能治理”。
  • 量化目标
    • 后台端和 App 端的登录态流转规则全部文档化,做到 100% 可回查。
    • 高风险接口全部补齐网关侧限流与来源标记,敏感请求留痕覆盖率达到 100%
    • 常见未登录、过期、越权、验证码异常问题可在 5 分钟 内定位到网关层处理链。

9. IM 多端会话与消息体验完善

  • 当前基线:当前已经具备 NettyServer + NettyChatHandler + RemoteChatService + MQ 广播 + Redis 在线状态 / 活跃会话 的实时通讯基础架构,但更多聚焦“能聊起来”,多端同步和体验层能力仍可继续增强。
  • 优化动作:继续补齐 已读回执消息撤回离线消息补投多端会话一致性未读聚合在线状态收敛,让 IM 从“功能可用”走向“体验完整”。
  • 量化目标
    • 消息投递成功率达到 > 99.9%,会话未读聚合延迟控制在 < 3 秒
    • 在线状态收敛时间控制在 < 10 秒,离线消息补投成功率达到 > 99%
    • 至少补齐 已读回执 + 撤回 + 多端同步 三项可演示能力,并形成对应链路图与文档说明。

10. 我会优先做的优化顺序

  • 第一优先级:补齐可观测性与稳定性指标,因为这是后续所有优化的量化基础。
  • 第二优先级:优化交易一致性分层治理,把 强一致最终一致 的边界真正收口。
  • 第三优先级:继续增强 AI 效果评估体系,让 AI 模块从“有功能”升级到“有数据支撑”。
  • 第四优先级:推进网关安全与 IM 多端体验,把入口层和会话层能力补完整。
  • 第五优先级:再推进自动化流水线和后台治理能力,让项目在工程化和展示层都更完整。