I. 背景说明
case1: 程序出bug了
在我们的实际工作中,当我们遇到别人反馈代码出问题了吧,怎么返回的数据不对?
当应用持续跑了一段时间之后,这个时候我们的第一个反应基本是确认能复现么?如果能复现,那么调用的姿势是不是对的?如果确认姿势没问题,那么就是请求参数不对了!!! 如果请求参数还没有问题,卧槽,这下完了,真可能有bug了,这下怎么办?
接下来,一般的讨论是在测试环境复现一下,如果能复现,那么开启debug(或者远程debug),一行行调试,相信很快就能搞定了;
但是,最怕的就是但是,测试环境没法复现,至于线上环境才有问题,这下怎么搞?
case2: 缓存数据有问题
另外一个场景就是为了提升服务性能,缓存基本上会被大量的使用在各个系统之间;有缓存,那么就会有缓存不一致的问题,如果缓存用的是外部的如(redis/memcache)之类的,那么缓存数据的查询和订正,就相对简单了;但是,如果我们使用了内存作为数据的缓存,比如(hashmap, guava),这种时候,我想知道这个内存中的数据怎么办?我想修改这个内存的中的数据怎么办?
3. 小结
上面两个场景,归纳一下主要是两个问题
- 如何知道线上应用中,某个服务的方法的执行结果;
- 如何知道线上应用中,某些内存数据的结果