python&numpy十一: 借助numpy进行统计分析

发布时间:2024年01月11日

使用NumPy进行统计分析通常涉及以下几个方面:

1.数据描述性统计:可以使用NumPy的函数来计算数据的描述性统计量,如均值、中位数、标准差、最小值、最大值等。

import numpy as np

data = np.array([1, 2, 3, 4, 5])

mean = np.mean(data)  # 计算均值
median = np.median(data)  # 计算中位数
std = np.std(data)  # 计算标准差
min_val = np.min(data)  # 计算最小值
max_val = np.max(data)  # 计算最大值

print("Mean:", mean)
print("Median:", median)
print("Standard Deviation:", std)
print("Min:", min_val)
print("Max:", max_val)

2.相关性分析:可以使用NumPy的相关系数函数来计算变量之间的相关性。

import numpy as np

x = np.array([1, 2, 3, 4, 5])
y = np.array([6, 7, 8, 9, 10])

correlation_coefficient = np.corrcoef(x, y)

print("Correlation Coefficient:")
print(correlation_coefficient)

3.概率分布和随机抽样:NumPy提供了多种概率分布的函数,并可以生成指定概率分布的随机样本。

import numpy as np

# 生成服从正态分布的随机样本
mean = 0
std = 1
sample_size = 100
random_samples = np.random.normal(mean, std, sample_size)

print("Random Samples from Normal Distribution:")
print(random_samples)

4.假设检验:可以使用NumPy的统计函数来进行常见的假设检验,如t检验、卡方检验等。

import numpy as np
from scipy.stats import ttest_ind

# 生成两个样本数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([6, 7, 8, 9, 10])

# 执行t检验
t_statistic, p_value = ttest_ind(x, y)

print("T statistic:", t_statistic)
print("P value:", p_value)

以上只是一些简单的示例,NumPy还提供了更多的函数和方法来支持各种统计分析任务。与其他库(如Pandas、SciPy)结合使用,可以实现更复杂和全面的统计分析。

文章来源:https://blog.csdn.net/m0_63030819/article/details/135488410
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。