在Java调用Python代码执行时遇到乱码,我们的第一反应可能是检查文件编码设置是否一致。但在本例中,无论是Java还是Python,编码格式均已设为“UTF-8”,因此排除了编码不一致的问题。乱码的真正原因,在于Python的print
函数输出时所用的默认编码格式。
执行以下Python代码,我们可以查看print
函数的默认编码:
import locale
print(locale.getdefaultlocale())
执行结果显示默认编码为('zh_CN', 'cp936')
,其中“cp936”代表GB2312,即中文编码。
经测试,有两种方法可有效解决中文乱码问题:一种是在Java代码中设置编码,另一种是在Python代码中设置。
使用Process
和Runtime
调用Python代码时,可以将获取到的输入流编码设置为"gb2312"。
try {
String result = "";
String exe = "python解释器所处的绝对路径";
String py = "python代码文件绝对地址";
Process process = Runtime.getRuntime().exec(exe + " " + py);
InputStreamReader isr = new InputStreamReader(process.getInputStream(),"gb2312");
LineNumberReader input = new LineNumberReader(isr);
result = input.readLine();
input.close();
isr.close();
int re = process.waitFor();
System.out.println(result);
} catch (InterruptedException | IOException e) {
System.out.println("调用python脚本并读取结果时出错:" + e.getMessage());
}
注意,不能读取完字节流后再用getByte
重新编码,这会导致另一种乱码。
当不确定Java中将以何种方式调用Python代码时(如不使用Process
),可以直接在Python代码中设置编码格式:
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
经过上述设置后,乱码问题将得到有效解决。如果您有更好的解决方式,欢迎在评论区留言交流。