# A fatal error has been detected by the Java Runtime Environment:
#
# SIGSEGV (0xb) at pc=0x00007f218f93485d, pid=10, tid=58
#
# JRE version: OpenJDK Runtime Environment 18.9 (11.0.14.1+1) (build 11.0.14.1+1)
# Java VM: OpenJDK 64-Bit Server VM 18.9 (11.0.14.1+1, mixed mode, sharing, tiered, compressed oops, g1 gc, linux-amd64)
# Problematic frame:
# C [libstdc++.so.6+0xe585d] std::string::assign(std::string const&)+0x9d
#
# Core dump will be written. Default location: Core dumps may be processed with "/usr/share/apport/apport -p%p -s%s -c%c -d%d -P%P -u%u -g%g -- %E" (or dumping to /app/core.10)
#
# An error report file with more information is saved as:
# /app/hs_err_pid10.log
#
# If you would like to submit a bug report, please visit:
# https://bugreport.java.com/bugreport/crash.jsp
# The crash happened outside the Java Virtual Machine in native code.
# See problematic frame for where to report the bug.
#
xargs: java: terminated by signal 6
我们不卖关子,问题的原因就是,你使用了已经被销毁的sdk,或者重复销毁一个sdk。
这里说的销毁就是调用了sdk的这个方法:
Finance.DestroySdk(sdk);
这里我得吐槽一下,腾讯的sdk写的真的烂,哪怕是这样,报个错就行了,竟然直接把jvm搞挂了。
知道问题的原因,就好解决了。首先你得好好review一下你的代码,到底哪里重复销毁了相同的sdk,或者前面销毁了sdk,后面又尝试去用。
说一下我遇到问题,供大家参考一下。
首先我用的是github上的一个开源库:
<dependency>
<groupId>com.github.binarywang</groupId>
<artifactId>weixin-java-cp</artifactId>
<version>4.5.5.B</version>
</dependency>
我用这个库拉取企业微信的会话,然后存档。对接过企业微信会话存档的,应该都知道有两部分内容需要拉取:一部分是消息信息,一部分是媒体文件。
官方文档说不用每次都重新创建和初始化sdk,也就是可以复用。
所以我的处理流程是,先拉取消息,然后使用拉取消息的sdk拉取媒体文件,然后就遇到了本文说的这个问题。
开始我以为是因为文件太大了,内存不足,所以还限制了文件大小,重新发布了几次,没解决问题。
打印了文件大小,发现文件也只有几十kb,显然内存没压力。
多次对比我发现,只要有一个文件拉取失败,紧接着就会出现这个问题。发现了这个现象,我感觉距离真相很近了。
于是我开始查看这个库的拉取媒体文件的代码:
public void getMediaFile(long sdk, @NonNull String sdkfileid, String proxy, String passwd, long timeout, @NonNull Consumer<byte[]> action) throws WxErrorException {
if (sdkfileid == null) {
throw new NullPointerException("sdkfileid is marked non-null but is null");
} else if (action == null) {
throw new NullPointerException("action is marked non-null but is null");
} else {
String indexbuf = "";
int data_len = 0;
log.debug("正在分片拉取媒体文件 sdkFileId为{}", sdkfileid);
while(true) {
long mediaData = Finance.NewMediaData();
int ret = Finance.GetMediaData(sdk, indexbuf, sdkfileid, proxy, passwd, timeout, mediaData);
if (ret != 0) {
Finance.FreeMediaData(mediaData);
Finance.DestroySdk(sdk);
throw new WxErrorException("getmediadata err ret " + ret);
}
data_len += Finance.GetDataLen(mediaData);
log.info("正在分片拉取媒体文件 len:{}, data_len:{}, is_finis:{} \n", new Object[]{Finance.GetIndexLen(mediaData), data_len, Finance.IsMediaDataFinish(mediaData)});
try {
action.accept(Finance.GetData(mediaData));
} catch (Exception var15) {
var15.printStackTrace();
}
if (Finance.IsMediaDataFinish(mediaData) == 1) {
Finance.FreeMediaData(mediaData);
return;
}
indexbuf = Finance.GetOutIndexBuf(mediaData);
Finance.FreeMediaData(mediaData);
}
}
}
然后就看到了这个让我吐血的代码:
if (ret != 0) {
Finance.FreeMediaData(mediaData);
Finance.DestroySdk(sdk);
throw new WxErrorException("getmediadata err ret " + ret);
}
也就是文件拉取失败之后,会把sdk给销毁。好吧,销毁就销毁吧,那文件拉取成功你也销毁啊。结果它失败是销毁,成功就不销毁,这是典型的方法行文不一致。
因为这个sdk已经被销毁了,所以后续使用这个sdk拉取其他文件的时候就会报这个错误了。
因为这个方法的怪异行文,所以我们就不能复用拉取消息的sdk。在拉取媒体文件的时候就得重新创建一个sdk,重新初始化sdk。(如果你不是用的这个库,那就可以复用,只要你注意只在请求的最后finaly里面销毁sdk即可)。
既然我们选择自己创建sdk,就要自己销毁sdk。
public MediaData getMediaData(String sdkFileId) {
WxCpService wxCpService = WxCpConfiguration.getWxCpService(App.AUDIT);
WxCpMsgAuditService msgAuditService = wxCpService.getMsgAuditService();
MediaData mediaData = new MediaData();
long sdk = 0L;
boolean sdkDestroyed = false;
try {
sdk = Finance.NewSdk();
String msgAuditSecret = wxCpService.getWxCpConfigStorage().getMsgAuditSecret();
if (StringUtils.isEmpty(msgAuditSecret)) {
msgAuditSecret = wxCpService.getWxCpConfigStorage().getCorpSecret();
}
long ret = Finance.Init(sdk, wxCpService.getWxCpConfigStorage().getCorpId(), msgAuditSecret);
if (ret != 0L) {
Finance.DestroySdk(sdk);
throw new WxErrorException("init sdk err ret " + ret);
}
msgAuditService.getMediaFile(sdk, sdkFileId, null, null, 180L, mediaData::setBytes);
} catch (WxErrorException e) {
log.error("获取文件内容失败,sdk:{},sdkFileId:{},错误码:{},错误原因:{}", sdk, sdkFileId, e.getError().getErrorCode(), e.getError().getErrorMsg());
// 出现WxErrorException这个异常,库的内部已经销毁了sdk,不用再手动销毁了
sdkDestroyed = true;
} finally {
if (sdk != 0L && !sdkDestroyed) {
Finance.DestroySdk(sdk);
}
}
return mediaData;
}
注意我这里加了一个标记sdkDestroyed,一旦捕获到了WxErrorException,getMediaFile这个方法其实已经销毁了sdk,就不要重复销毁,否则还是会有这个问题。
这个问题就讲到这里,希望能帮到大家。
题外话,解决这个问题的时候,又发现了一个新的问题,这个库的getMediaFile方法是分批拉取文件的。如果文件太大的话,我这种写法获取的其实是最后一批的数据,并不是完成的文件。好吧,后面再更新如何解决这个问题。