最近看书的时候注意到了一个问题:Minkouski距离
$ d(i, j) = \sqrt [ p ]{ { ({ x }_{ i1 }-{ x }_{ j1 }) }^{ p }+{ ({ x }_{ i2 }-{ x }_{ j2 }) }^{ p }+…+{ ({ x }_{ il }-{ x }_{ jl }) }^{ p } } $
其有三个属性:
- Positivity : 必然为正数
- Symmetry 对称性 : $p_1$与$p_2$相互距离相等
- Triangle Inequality : 对于任意$p_i$、$p_j$、$p_k$,$d(i,j)\le d(i,k)+d(k,j)$
Minkouski ditance还可以分为:
- p = 1 , Manhattan (or city block) distance 曼哈顿距离
- E.g. the Hamming distance: 可以使用奇偶剪枝
$ d(i, j) = { \left| { x }_ { i1 }-{ x }_ { j1 } \right| +\left| { x }_ { i2 }-{ x }_ { j2 } \right| +…+\left| { x }_ { i3 }-{ x }_ { j3 } \right| } $
- E.g. the Hamming distance: 可以使用奇偶剪枝
p = 2 , Euclidean distance 欧几里得距离
$ d(i, j) = \sqrt{ { ({ x }_{ i1 }-{ x }_{ j1 }) }^{ 2 }+{ ({ x }_{ i2 }-{ x }_{ j2 }) }^{ 2 }+…+{ ({ x }_{ il }-{ x }_{ jl }) }^{ 2 } } $- p->oo , supremum distance 切比雪夫距离(两点各座标数值差绝对值的最大值)
$d(i,j)={ max(\left| { x }_ { i1 }-{ x }_ { j1 } \right| ,\left| { x }_ { i2 }-{ x }_ { j2 } \right| ,…,\left| { x }_ { i3 }-{ x }_ { j3 } \right| })$
距离的定义可以直接影响一些问题:
- 比如A*和IDA*启发函数的设计。。
- 比如描述两组数据的相似度,或者说是两组状态的相似度。。
- 比如k-means算法中距离的衡量的标准。。
- 比如knn算法中距离。。
- 。。。。。。