皮尔森相似度算法(python皮尔森相似度)

2年前 (2023-11-07)阅读336回复0

王大为

注册排名10016
经验值0
级别
主题0
回复0

楼主

Python 皮尔森相似度

在数据挖掘领域，相似度有着非常重要的作用。而皮尔森相似度是其中一种广泛运用的相似度计算方法。

皮尔森相似度的计算公式如下：

def pearson_sim(x, y):
n = len(x)
sum_x = sum(x)
sum_y = sum(y)
sum_xy = sum([x[i] * y[i] for i in range(n)])
sum_x2 = sum([x[i] ** 2 for i in range(n)])
sum_y2 = sum([y[i] ** 2 for i in range(n)])
numerator = sum_xy - (sum_x * sum_y / n)
denominator = ((sum_x2 - sum_x ** 2 / n) * (sum_y2 - sum_y ** 2 / n)) ** 0.5
return numerator / denominator if denominator != 0 else 0

其中，x和y都是一维向量。

总的来说，皮尔森相似度的计算方法非常简单，通过比较样本之间的相关性来计算相似度。它广泛运用于推荐系统、数据可视化等领域。

本文可能转载于网络公开资源，如果侵犯您的权益，请联系我们删除。

本文地址：https://www.pyask.cn/info/2642.html

回帖 python中追加语句怎么写(python的追加内容) python的迭代器对象

皮尔森相似度算法(python皮尔森相似度) 期待您的回复！

取消

皮尔森相似度算法(python皮尔森相似度)

皮尔森相似度算法(python皮尔森相似度) 期待您的回复！

插入网络图片