使用NumPy进行统计分析通常涉及以下几个方面:
import numpy as np
data = np.array([1, 2, 3, 4, 5])
mean = np.mean(data) # 计算均值
median = np.median(data) # 计算中位数
std = np.std(data) # 计算标准差
min_val = np.min(data) # 计算最小值
max_val = np.max(data) # 计算最大值
print("Mean:", mean)
print("Median:", median)
print("Standard Deviation:", std)
print("Min:", min_val)
print("Max:", max_val)
import numpy as np
x = np.array([1, 2, 3, 4, 5])
y = np.array([6, 7, 8, 9, 10])
correlation_coefficient = np.corrcoef(x, y)
print("Correlation Coefficient:")
print(correlation_coefficient)
import numpy as np
# 生成服从正态分布的随机样本
mean = 0
std = 1
sample_size = 100
random_samples = np.random.normal(mean, std, sample_size)
print("Random Samples from Normal Distribution:")
print(random_samples)
import numpy as np
from scipy.stats import ttest_ind
# 生成两个样本数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([6, 7, 8, 9, 10])
# 执行t检验
t_statistic, p_value = ttest_ind(x, y)
print("T statistic:", t_statistic)
print("P value:", p_value)
以上只是一些简单的示例,NumPy还提供了更多的函数和方法来支持各种统计分析任务。与其他库(如Pandas、SciPy)结合使用,可以实现更复杂和全面的统计分析。