归一化法,以归一化的方法将有量纲的数据转换成无量纲的数据表达。作用是归纳统一样本的统计分布性。
归一化在0-1之间是统计的概率分布,归一化在-1–+1之间是统计的坐标分布。
即该函数在(-∞,+∞)的积分为1。例如概率中的密度函数就满足归一化条件。
def hot_fun(hot_num): // hot_num 需要压缩的值 data = [0, int(hot_num), 20000] # 找到最大值和最小值 max_val = max(data) // 设定数据范围最大值 min_val = min(data) // 设定数据范围最小值 # 压缩区间 例如压缩到1000以内 f_num = 1000 # 压缩数据 compressed_data = [] for x in data: compressed_x = ((x - min_val) / (max_val - min_val)) * f_num compressed_data.append(compressed_x) # 打印压缩后的数据 # print(compressed_data) return int(compressed_data[1])
例如:将一批数据 有千、有万、有几十、几百的整型数据 ,同比例压缩到1000以内,不影响这批数据的优先级权重