未来规划 Roadmap
本页作为网站详细版页面维护,集中承接后续演进方向、优化目标与可量化验收指标。
建议使用方式:
- 面试时先讲“现在已经完成了什么”
- 再补“下一阶段准备怎么继续优化”
- 最后用“当前基线 + 目标指标”体现工程规划能力
0. 这些规划建立在什么现有基础上
这份 Roadmap 不是脱离代码的愿望清单,而是建立在当前已经落地的这些基础上:
16 个业务模块、19 个服务应用,已经形成完整的用户端、商家端、平台管理端三类入口18 个@FeignClient、30 个@RabbitListener、26 个@XxlJob处理器,说明服务协同、异步消息和调度补偿都已经是主链路能力4个 Gateway 前置过滤器:AuthFilter / XssFilter / ValidateCodeFilter / BlackListUrlFilter4类向量检索空间:店铺 / 商品 / 博客 / 评价,并且已经支持SimpleVectorStore降级NettyServer + NettyChatHandler + Chat 持久化 + MQ 广播组成了实时通讯基础架构- 当前仓库
Java 测试文件 = 0,GitHub Actions workflow = 1,说明后续工程质量和自动化能力仍有很大补强空间
所以这页后面的规划,核心不是“再加一些新功能”,而是围绕当前已具备的结构,把一致性、稳定性、可观测性和工程质量继续做深。
1. 交易一致性分层治理
- 当前基线:核心交易链路已经采用
RabbitMQ + Redis 幂等 + ACK/NACK + 延迟 / 死信队列 + XXL-JOB形成最终一致性闭环,适合高并发与异步解耦场景。 - 优化动作:在
钱包余额支付、退款回退、优惠券核销 / 使用等低并发但强一致诉求更高的链路中,逐步引入Seata分布式事务能力,重点覆盖订单状态、钱包资金变动、券状态流转三类跨服务数据库写操作。 - 量化目标:
钱包支付 / 退款 / 券核销三条链路至少各落地1条可演示的强一致事务闭环。- 资金类场景人工对账发现的严重不一致问题收敛到
0,非严重状态不一致控制在1 / 万单以内。 - 异步补偿链路继续保持
补偿成功率 > 99.9%,且引入强一致后核心交易吞吐不低于当前基线。
2. 强一致与最终一致边界梳理
- 当前基线:秒杀下单、Feed 推送、搜索同步、审核分发等链路已经明确采用最终一致性方案,但文档与监控层对“为什么不用强事务”还可以进一步结构化沉淀。
- 优化动作:补齐一份“场景选型矩阵”,按
强一致 / 最终一致 / 可补偿 / 不可补偿四个维度给出统一判断标准,并把订单、钱包、积分、搜索、审核等典型业务分类归档。 - 量化目标:
- 文档中
100%的核心链路补齐一致性选型说明,至少覆盖订单 / 支付 / 钱包 / 积分 / 搜索 / 审核 / IM / AI八类业务。 - 新增业务链路时统一走选型模板,做到“上线前有设计说明、上线后可回查”,避免再出现口径不一致。
- 面试或答辩时可以直接用
1 张矩阵 + 3 个典型案例解释清楚强一致与最终一致的边界。
- 文档中
3. 可观测性与稳定性闭环
- 当前基线:项目已具备基础监控与日志能力,也保留了监控组件接入空间,但还没有形成统一的
Prometheus + Grafana指标看板和告警闭环。 - 优化动作:补齐服务级、接口级、MQ 级、缓存级四层监控,重点观测
接口可用性、错误率、消息积压、Redis 命中率、ES/Milvus 同步延迟、死信队列积压量。 - 量化目标:
- 核心接口可用性达到
99.9%,核心链路接口错误率控制在< 0.5%。 - 消息重试成功率达到
> 95%,死信补偿最终收敛率达到> 99%,死信队列积压在10 分钟内可清空。 - Redis 热点链路命中率达到
> 85%,搜索同步延迟控制在1 分钟内。 - 常见线上异常实现
10 分钟内定位到模块,并能在看板中直接展示TP95 / TP99 / 错误率 / 消息积压。
- 核心接口可用性达到
4. 搜索、推荐与高并发性能继续优化
- 当前基线:当前文档中已经沉淀了本地基准压测结果,例如首页聚合推荐流
QPS > 4500、秒杀链路QPS > 3200、详情缓存TP99 < 5ms。 - 优化动作:继续优化
LBS 搜索、首页聚合推荐、热榜洗牌与Feed 深翻页四类读链,补充分词策略、索引字段裁剪、本地缓存层、热点数据预热与更细粒度的缓存淘汰策略。 - 量化目标:
- 首页聚合推荐流从当前
QPS > 4500优化到QPS > 6000,同时TP99 < 35ms。 - 秒杀链路从当前
QPS > 3200继续提升到QPS > 4500,并把TP99压到< 100ms。 - 详情缓存链路继续保持
TP99 < 5ms,LBS 搜索链路补齐压测后目标控制在TP99 < 100ms。 - 所有新增优化必须带有“优化前 / 优化后”对比数据,至少保留
QPS、TP99、错误率、缓存命中率四项指标。
- 首页聚合推荐流从当前
5. AI 能力评估与经营助手增强
- 当前基线:用户端已经落地
AI 问答、博客生成、评价生成,商家端已经落地评价回复、经营分析、商品营销文案、经营改进建议,并且已经具备Milvus -> SimpleVectorStore的降级能力,但当前更多偏功能展示,缺少效果量化。 - 优化动作:为 AI 模块补齐
路由命中率、生成成功率、兜底率、用户采纳率、商家建议采纳率等指标,同时继续增强RAG grounding、历史会话记忆与结构化推荐卡片能力。 - 量化目标:
- AI 生成成功率达到
> 95%,兜底率控制在< 5%。 AI 博客生成、AI 评价生成的用户采纳率目标分别达到> 30%、> 40%。- 商家助手中
评价回复 / 商品营销文案 / 经营建议的建议采纳率达到> 25%。 - AI 会话具备基本使用画像统计,能够输出
会话量、命中率、采纳率、失败原因 TopN。
- AI 生成成功率达到
6. 工程质量与自动化流水线
- 当前基线:当前仓库已有完整开源文档、真实页面截图和链路图,但
Java 测试文件当前为 0,GitHub Actions workflow 当前为 1,自动化测试、CI/CD、构建产物校验还没有形成真正的日常开发闭环。 - 优化动作:补齐
GitHub Actions / GitLab CI,覆盖单元测试、基础构建、文档构建、镜像构建和关键目录变更检查;为核心链路逐步补充集成测试和回归校验脚本。 - 量化目标:
- 每次提交至少自动完成
编译 + 文档构建 + 关键模块测试三类校验。 - CI 成功率目标达到
> 95%,常规流水线执行时长控制在10 分钟内。 - 核心链路逐步补齐集成测试,优先覆盖
登录、下单、支付、退款、审核、AI 生成六类场景。 - 后续对外展示时,可以直接展示一条绿色流水线和关键测试报告,而不只是 README 说明。
- 每次提交至少自动完成
7. 数据治理与后台能力完善
- 当前基线:目前已经具备审核中心、评论管理、评价管理、博客管理、业务用户、积分记录、抽奖配置等后台能力,但更多偏基础运营展示。
- 优化动作:继续补齐
操作审计、治理报表、审核效率统计、异常工单追踪、业务数据回溯等平台能力,让后台从“可操作”进一步走向“可治理”。 - 量化目标:
- 审核中心补齐
平均处理时长、待审核积压量、通过率 / 驳回率等指标,并把平均处理时长控制在< 30 分钟。 - 后台关键操作全部可追溯,核心治理动作实现
100%审计留痕。 - 异常问题支持从“列表”追溯到“详情、关联目标、操作日志”,形成可复盘链路。
- 审核中心补齐
8. 网关安全与统一认证深化
- 当前基线:Gateway 已经落了
AuthFilter / XssFilter / ValidateCodeFilter / BlackListUrlFilter四类前置过滤器,并且AuthFilter已经区分后台/admin的 JWT 登录态和 App/app的 Redis Token 登录态。 - 优化动作:在现有双端鉴权基础上继续补齐
设备维度会话管理、统一风控标记、接口级限流、敏感操作留痕与异常请求画像,把“能鉴权”升级成“能治理”。 - 量化目标:
- 后台端和 App 端的登录态流转规则全部文档化,做到
100%可回查。 - 高风险接口全部补齐网关侧限流与来源标记,敏感请求留痕覆盖率达到
100%。 - 常见未登录、过期、越权、验证码异常问题可在
5 分钟内定位到网关层处理链。
- 后台端和 App 端的登录态流转规则全部文档化,做到
9. IM 多端会话与消息体验完善
- 当前基线:当前已经具备
NettyServer + NettyChatHandler + RemoteChatService + MQ 广播 + Redis 在线状态 / 活跃会话的实时通讯基础架构,但更多聚焦“能聊起来”,多端同步和体验层能力仍可继续增强。 - 优化动作:继续补齐
已读回执、消息撤回、离线消息补投、多端会话一致性、未读聚合与在线状态收敛,让 IM 从“功能可用”走向“体验完整”。 - 量化目标:
- 消息投递成功率达到
> 99.9%,会话未读聚合延迟控制在< 3 秒。 - 在线状态收敛时间控制在
< 10 秒,离线消息补投成功率达到> 99%。 - 至少补齐
已读回执 + 撤回 + 多端同步三项可演示能力,并形成对应链路图与文档说明。
- 消息投递成功率达到
10. 我会优先做的优化顺序
- 第一优先级:补齐可观测性与稳定性指标,因为这是后续所有优化的量化基础。
- 第二优先级:优化交易一致性分层治理,把
强一致和最终一致的边界真正收口。 - 第三优先级:继续增强 AI 效果评估体系,让 AI 模块从“有功能”升级到“有数据支撑”。
- 第四优先级:推进网关安全与 IM 多端体验,把入口层和会话层能力补完整。
- 第五优先级:再推进自动化流水线和后台治理能力,让项目在工程化和展示层都更完整。