softmax - numpy实现

image
1
2
3
4
5
6
def softmax(x):
x -= np.max(x, axis= 1, keepdims=True)

f_x = np.exp(x) / np.sum(np.exp(x), axis=1, keepdims=True)

return f_x

第一步:减去最大值。

因为在求exp时,可能因为指数过大,出现溢出的情况。

而在softmax中,重要的是两个数字之间的差值,只要差值相同,softmax的结果就相同:

上下同乘一个常量C,结果不变。这个\(logC\)通常取\(max(f_j)\)

image

第二步:计算softmax

参见:https://blog.csdn.net/qibinyi2/article/details/103744446


softmax - numpy实现
https://jcdu.top/2022/07/31/softmax - numpy实现/
作者
horizon86
发布于
2022年7月31日
许可协议