IT博文
MySQL 事务隔离级别详解
使用 docker compose 安装 tidb
架构师日记-如何写的一手好代码
生产事故-记一次特殊的OOM排查
Docker安装RabbitMQ——基于docker-compose工具
使用 docker-compose 部署单机 RabbitMQ
只需3步,即刻体验Oracle Database 23c
长达 1.7 万字的 explain 关键字指南!
Redis为什么能抗住10万并发?揭秘性能优越的背后原因
深度剖析Redis九种数据结构实现原理
【绩效季】遇到一个好领导有多重要,从被打差绩效到收获成长
为什么Redis不直接使用C语言的字符串?
Java阻塞队列中的异类,SynchronousQueue底层实现原理剖析
如何调整和优化 Go 程序的内存管理方式?
应用部署引起上游服务抖动问题分析及优化实践方案
Java 并发工具合集 JUC 大爆发!!!
卷起来!!这才是 MySQL 事务 & MVCC 的真相。
JDK8 到 JDK17 有哪些吸引人的新特性?
告别StringUtil:使用Java 11的全新String API优化你的代码
从JDK8飞升到JDK17,再到未来的JDK21
Java JMH Benchmark Tutorial
linux和macOS下top命令区别
Windows10关闭Hyper-V的三种方法
为什么应该选择 POSTGRES?
阿里云对象存储 OSS 限流超过阈值自动关闭【防破产,保平安】
Java高并发革命!JDK19新特性——虚拟线程(Virtual Threads)
“请不要在虚拟机中运行此程序”的解决方案
Spring中的循环依赖及解决
浅谈复杂业务系统的架构设计 | 京东云技术团队
面试题:聊聊TCP的粘包、拆包以及解决方案
操作日志记录实现方式
字节跳动技术团队-慢 SQL 分析与优化
Spring Boot 使用 AOP 防止重复提交
Controller层代码就该这么写,简洁又优雅!
SpringBoot 项目 + JWT 完成用户登录、注册、鉴权
重复提交不再是问题!SpringBoot自定义注解+AOP巧妙解决
SpringBoot 整合 ES 实现 CRUD 操作
SpringBoot 整合 ES 进行各种高级查询搜索
SpringBoot操作ES进行各种高级查询
SpringBoot整合ES查询
如何做架构设计? | 京东云技术团队
最值得推荐的五个VPN软件(便宜+好用+稳定),靠谱的V2ray梯子工具
我说MySQL每张表最好不超过2000万数据,面试官让我回去等通知?
vivo 自研鲁班分布式 ID 服务实践
使用自带zookeeper超简单安装kafka
推荐 6 个很牛的 IDEA 插件
喜马拉雅 Redis 与 Pika 缓存使用军规
「程序员转型技术管理」必修的 10 个能力提升方向
jdk17 下 netty 导致堆内存疯涨原因排查 | 京东云技术团队
如何优雅做好项目管理?
MySQL 到 TiDB:Hive Metastore 横向扩展之路
聊聊即将到来的 MySQL5.7 停服事件
Linux终端环境配置
微软 Edge 浏览器隐藏功能一览:多线程下载、IE 模式、阻止视频自动播放等
Hutool 中那些常用的工具类和实用方法
clash 内核删库?汇总目前常用的内核仓库和客户端
JDK11 升级 JDK17 最全实践干货来了 | 京东云技术团队
我是如何写一篇技术文的?
虚拟线程原理及性能分析
Java线程池实现原理及其在美团业务中的实践
Editplus和EmEditor配置一键编译java运行环境
用Spring Boot 3.2虚拟线程搭建静态文件服务器有多快?
SpringBoot中使用LocalDateTime踩坑记录 - 程序员偏安 - 博客园
程序员必备!10款实用便捷的Git可视化管理工具 - 追逐时光者 - 博客园
基于Netty开发轻量级RPC框架
开发Java应用时如何用好Log
复杂SQL治理实践 | 京东物流技术团队
火山引擎ByteHouse:分析型数据库如何设计并发控制?
多次崩了之后,阿里云终于改了
推荐程序员必知的四大神级学习网站
初探分布式链路追踪
新项目为什么决定用 JDK 17了
Java上进了,JDK21 要来了,并发编程再也不是噩梦了
mapstruct这么用,同事也开始模仿
再见RestTemplate,Spring 6.1新特性:RestClient 了解一下!
【MySQL】MySQL表设计的经验(建议收藏)
如何正确地理解应用架构并开发
解读工行专利CN112905176B
工商银行取得「基于 Spring Boot 的 web 系统后端实现方法及装置」专利
IDEA 2024.1:Spring支持增强、GitHub Action支持增强、更新HTTP Client等
TIOBE 2 月:Go 首次进入前十、“上古语言” COBOL 和 Fortran 排名飙升
Java 21 虚拟线程如何限流控制吞吐量
🎉 通用、灵活、高性能分布式 ID 生成器 | CosId 2.6.6 发布
20年编程,AI编程6个月,关于Copliot辅助编码工具,你想知道的都在这里
Java 8 内存管理原理解析及内存故障排查实践
消息队列选型之 Kafka vs RabbitMQ
从 MongoDB 到 PostgreSQL 的大迁移
腾讯云4月8日故障复盘及情况说明
PHP 在 2024 年还值得学习吗?
AMD集显安装显卡驱动之后出现黑屏,建议这样解决
使用 Docker 部署 moments 微信朋友圈 - 谱次· - 博客园
Java 17 是最常用的 Java LTS 版本
盘点Lombok的几个骚操作
Llama 3 + Ollama + Open WebUI打造本机强大GPT
如何优雅地编写缓存代码
Gmeek快速上手
笔记软件思源远程和本地接入大语言模型服务Ollama实现AI辅助写作(Windows篇)
Git Subtree:简单粗暴的多项目管理神器
这款轻量级规则引擎,真香!!
Ollama教程:本地LLM管理、WebUI对话、Python/Java客户端API应用
GLM-4-9B支持 Ollama 部署
智谱AI开源代码生成大模型第四代版本:CodeGeeX4-ALL-9B
美团二面:如何保证Redis与Mysql双写一致性?连续两个面试问到了!
免费开源好用,Obsidian和Omnivore真正实现一键联动剪藏文章,手把手教程!
得物 Redis 设计与实践
架构图怎么画?手把手教您,以生鲜电商为例剖析业务/应用/数据/技术架构图
使用Hutool要注意了!升级到6.0后你调用的所有方法都将报错 - 掘金
别再用雪花算法生成ID了!试试这个吧
无敌的Arthas!
Navicat Premium v16、v17 破解激活
🎉 分布式接口文档聚合,Solon 是怎么做的?
深入体验全新 Cursor AI IDE 后,说杀疯了真不为过!
Nacos 3.0 架构全景解读,AI 时代服务注册中心的演进
本文档使用 MrDoc 发布
-
+
无敌的Arthas!
前言:Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。 为了加深理解,本文准备了两个线上发生的实际例子,与大家一起分享(已做脱敏处理)。 ## 一、背景 通常,本地开发环境无法访问生产环境。如果在生产环境中遇到问题,则无法使用 IDE 远程调试。更糟糕的是,在生产环境中调试是不可接受的,因为它会暂停所有线程,导致服务暂停。 开发人员可以尝试在测试环境或者预发环境中复现生产环境中的问题。但是,某些问题无法在不同的环境中轻松复现,甚至在重新启动后就消失了。 如果您正在考虑在代码中添加一些日志以帮助解决问题,您将必须经历以下阶段:测试、预发,然后生产。这种方法效率低下,更糟糕的是,该问题可能无法解决,因为一旦 JVM 重新启动,它可能无法复现,如上文所述。 Arthas 旨在解决这些问题。开发人员可以在线解决生产问题。无需 JVM 重启,无需代码更改。 Arthas 作为观察者永远不会暂停正在运行的线程。 ## 二、能为你做什么? `Arthas` 是 Alibaba 开源的 Java 诊断工具,深受开发者喜爱。 当你遇到以下类似问题而束手无策时,`Arthas`可以帮助你解决: 1. 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception? 2. 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了? 3. 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗? 4. 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现! 5. 是否有一个全局视角来查看系统的运行状况? 6. 有什么办法可以监控到 JVM 的实时运行状态? 7. 怎么快速定位应用的热点,生成火焰图? 8. 怎样直接从 JVM 内查找某个类的实例? `Arthas` 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 `Tab` 自动补全功能,进一步方便进行问题的定位和诊断。 ## 三、下载安装 ```bash curl -O https://arthas.aliyun.com/arthas-boot.jar java -jar arthas-boot.jar ``` 注意事项: - 底层依赖 jps 命令,如果java进程与jps进程不在同一个虚拟机里面,那么有如下提示 ```csharp [] [] JAVA_HOME: /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.402.b06-2.0.1.1.al8.x86_64/jre [] arthas-boot version: 3.7.2 [] Can not find java process. Try to run `jps` command lists the instrumented Java HotSpot VMs on the target system. Please select an available pid. ``` - 当出现上述情况(jps无法找到java进程,但java进程确实存在),可以通过显式指定pid进行连接。 - 正常情况下,jps命令会发现可选的java进程,供用户选择。 ## 四、关键命令 ### 1、getstatic 通过 getstatic 命令可以方便的查看类的静态属性。使用方法为 `getstatic class_name field_name` 。 ```ruby [arthas@17098]$ getstatic site.xiaokui.blog.util.BlogUtil BLOG_CACHE No class found for: site.xiaokui.blog.util.BlogUtil [arthas@17098]$ getstatic site.xiaokui.blog.util.BlogUtil BLOG_CACHE field: BLOG_CACHE @HashMap[ @Long[1]:@BlogDetailList[site.xiaokui.blog.domain.BlogDetailList@4af2f154], ] Affect(row-cnt:1) cost in 14 ms. [arthas@17098]$ getstatic site.xiaokui.blog.util.BlogUtil BLOG_CACHE 'entrySet().iterator.{? #this.key=="1"}' field: BLOG_CACHE @ArrayList[ @Node[1=site.xiaokui.blog.domain.BlogDetailList@4af2f154], ] Affect(row-cnt:1) cost in 11 ms. getstatic site.xiaokui.blog.util.BlogUtil BLOG_CACHE -x 3 ``` ### 2、ognl 基础用法 ```scss # 调用静态方法 # 会在java控制台打印对应字符串 ognl '@java.lang.System@out.println("hello")' # 清空缓存,这里可以通过观察日志查看是否生效 ognl '@site.xiaokui.blog.util.BlogUtil@clearBlogCache(1)' # 清空缓存map,可以查看静态字段内容观察是否生效 ognl '@site.xiaokui.blog.util.BlogUtil@BLOG_CACHE.clear()' # 查看静态字段,如果为空,则不能展开为3层 ognl '@site.xiaokui.blog.util.BlogUtil@BLOG_CACHE' ognl '@site.xiaokui.blog.util.BlogUtil@BLOG_CACHE' -x 3 # 执行多行表达式,赋值给一个临时变量 ognl '#value1=@System@getProperty("java.home"), #value2=@System@getProperty("java.runtime.name"), {#value1, #value2}' ``` 进阶用法 ```scss # 通过beanName获取对象 ognl '@cn.hutool.extra.spring.SpringUtil@getBean("indexController")' # 查看对象值 ognl '@cn.hutool.extra.spring.SpringUtil@getBean("indexController").xiaokuiProperties.enableViewRestriction' # 调用对象方法 ognl '@cn.hutool.extra.spring.SpringUtil@getBean("indexController").index()' # 通过class获取 ognl '#EnvClass =@org.springframework.core.env.Environment@class,@cn.hutool.extra.spring.SpringUtil@getBean(#EnvClass)' # 查看环境变量,在web环境中,实现类一般为 StandardServletEnvironment ognl '#EnvClass =@org.springframework.core.env.Environment@class,@cn.hutool.extra.spring.SpringUtil@getBean(#EnvClass).getProperty("app.id")' # 所有配置变量存放数组 ognl '#EnvClass =@org.springframework.core.env.Environment@class,@cn.hutool.extra.spring.SpringUtil@getBean(#EnvClass).propertySources.propertySourceList' # 查看apollo配置,具体的值在 m_configProperties 字段 ognl '#EnvClass =@org.springframework.core.env.Environment@class,@cn.hutool.extra.spring.SpringUtil@getBean(#EnvClass).propertySources.get("ApolloBootstrapPropertySources").propertySources' -x 3 ``` 功能强大的一笔! ### 3、trace `trace` 命令能主动搜索 `class-pattern`/`method-pattern` 对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。 ```python trace site.xiaokui.blog.controller.IndexController blogSpace trace site.xiaokui.blog.controller.IndexController blogSpace -n 1 trace --skipJDKMethod true site.xiaokui.blog.controller.IndexController blogSpace trace site.xiaokui.blog.controller.IndexController blogSpace '#cost > 5' trace -E site.xiaokui.blog.controller.IndexController|site.xiaokui.blog.service.impl.SysBlogServiceImpl| site.xiaokui.blog.service.BlogCacheService|blogSpace|getMostViewTopN trace site.xiaokui.blog.controller.IndexController * --exclude-class-pattern cn.hutool.StrUtil trace javax.servlet.Filter * --exclude-class-pattern org.springframework.web.filter. trace -E site.xiaokui.blog.controller.IndexController|site.xiaokui.blog.service.impl.SysBlogServiceImpl|site.xiaokui.blog.service.BlogCacheService|site.xiaokui.blog.service.BaseService|org.beetl.sql.core.SQLManager blogSpace|match|getMostViewTopN|template '#cost > 5' ``` ### 4、watch 让你能方便的观察到指定函数的调用情况。能观察到的范围为:`返回值`、`抛出异常`、`入参`,通过编写 OGNL 表达式进行对应变量的查看。 ```bash watch site.xiaokui.blog.controller.IndexController blogSpace -x 2 watch site.xiaokui.blog.controller.IndexController blogSpace "{params[2],target,returnObj}" "params[2]=='dir'" -x 2 watch site.xiaokui.blog.controller.IndexController blogSpace "{params,target,returnObj}" '#cost>100' -x 2 watch site.xiaokui.blog.controller.TempTestController test "{params,throwExp}" -e -x 2 watch site.xiaokui.blog.controller.TempTestController test "{params,throwExp,returnObj}" -e -b -s -x 2 ``` ### 5、thread 查看当前线程信息,查看线程的堆栈。 ```yaml thread thread -n 5 thread -i 1000 thread -n 3 -i 1000 thread --all thread 130 thread -b thread --state WAITING ``` ### 6、logger 查看 logger 信息,更新 logger level。 ```perl logger logger -n org.springframework.web logger -n site.xiaokui logger --name ROOT --level debug logger --name site.xiaokui -level warn logger --name site.xiaokui.blog.config -level warn ``` ### 7、profiler `profiler` 命令支持生成应用热点的火焰图。本质上是通过不断的采样,然后把收集到的采样结果生成火焰图。 ```ini profiler start profiler start --event=cpu profiler getSamples profiler status profiler stop --format html profiler stop --format html --file /tmp/0528result.html ``` ### 8、查询命令 ```bash dashboard jvm memory sysenv sysprop vmoption ``` ### 9、奇技淫巧 仅供参考,线上环境,请慎重使用! ```bash vmoption vmoption PrintGC true vmoption PrintGCDetails true vmoption | tee /tmp/0529.txt vmoption | tee /tmp/0529.txt options save-result true cls 请使用idea插件:Arthas-idea ``` 更多相关命令:[命令列表](https://link.juejin.cn?target=https%3A%2F%2Farthas.aliyun.com%2Fdoc%2Fcommands.html)。 ## 五、两个线上问题 ### 1、线上接口偶尔响应时间长 线上有A、B、C共3套生产环境,同一份代码同一个接口,只有A会偶尔返回超时,时间长达5~6秒。正常情况下,接口返回在50ms之内。 ### 2、CPU上升明显 线上有A、B共2套生产环境,基本上还是同一份代码同一个接口,在相同QPS的情况下,B的CPU消耗是A的两倍。 未完待续,敬请期待....
admin
2024年7月26日 23:01
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档(打印)
分享
链接
类型
密码
更新密码