近似的同态比较:简单多项式的迭代计算

发布时间:2024年01月08日

参考文献:

  1. [Gold64] Goldschmidt R E. Applications of division by convergence[D]. Massachusetts Institute of Technology, 1964.
  2. [CKKLL19] Cheon J H, Kim D, Kim D, et al. Numerical method for comparison on homomorphically encrypted numbers[C]//International Conference on the Theory and Application of Cryptology and Information Security. Cham: Springer International Publishing, 2019: 415-445.
  3. [CKK20] Cheon J H, Kim D, Kim D. Efficient homomorphic comparison methods with optimal complexity[C]//Advances in Cryptology–ASIACRYPT 2020: 26th International Conference on the Theory and Application of Cryptology and Information Security, Daejeon, South Korea, December 7–11, 2020, Proceedings, Part II 26. Springer International Publishing, 2020: 221-256.
  4. [LLNK21] Lee E, Lee J W, No J S, et al. Minimax approximation of sign function by composite polynomial for homomorphic comparison[J]. IEEE Transactions on Dependable and Secure Computing, 2021, 19(6): 3711-3727.
  5. [LLKN22] Lee E, Lee J W, Kim Y S, et al. Optimization of homomorphic comparison algorithm on rns-ckks scheme[J]. IEEE Access, 2022, 10: 26163-26176.


CKKS 方案只能计算多项式,但是符号函数是阶跃的,难以表示为简单多项式。如果采取完全的插值,随着精度提高,多项式的度数将会是指数级。[CKK20] 提出可以通过迭代一个或两个简单多项式,来快速逼近符号函数,它达到了渐进最优。[LLNK21] 使用若干个 minimax approximate polynomials 的组合来逼近符号函数,用动态规划算法确定它们,实际效率更好。[LLKN22] 继续改进,但提升并不算大。

New Comparison Algorithm

Idea

待计算的两个函数,关系为 c o m p ( a , b ) = ( s g n ( a ? b ) + 1 ) / 2 comp(a,b)=(sgn(a-b)+1)/2 comp(a,b)=(sgn(a?b)+1)/2
s g n ( x ) = { 1 , x > 0 0 , x = 0 ? 1 , x < 0 c o m p ( a , b ) = { 1 , a > b 1 / 2 , a = b 0 , a < b \begin{aligned} sgn(x) &= \left\{\begin{aligned} 1, && x>0\\ 0, && x=0\\ -1, && x<0 \end{aligned}\right.\\ comp(a,b) &= \left\{\begin{aligned} 1, && a>b\\ 1/2, && a=b\\ 0, && a<b \end{aligned}\right.\\ \end{aligned} sgn(x)comp(a,b)?=? ? ??1,0,?1,??x>0x=0x<0?=? ? ??1,1/2,0,??a>ba=ba<b??
在 [CKKLL19] 中指出如下的公式,
c o m p ( a , b ) = lim ? k → ∞ a k a k + b k comp(a,b) = \lim_{k \to \infty} \frac{a^k}{a^k + b^k} comp(a,b)=klim?ak+bkak?
可以使用迭代算法,

  1. 初始化 a 0 = a , b 0 = b a_0=a,b_0=b a0?=a,b0?=b
  2. 迭代计算 a k + 1 ← a k 2 / ( a k 2 + b k 2 ) a_{k+1} \gets a_k^2/(a_k^2+b_k^2) ak+1?ak2?/(ak2?+bk2?) b k + 1 ← a k 2 / ( a k 2 + b k 2 ) b_{k+1} \gets a_k^2/(a_k^2+b_k^2) bk+1?ak2?/(ak2?+bk2?)
  3. 输出 a d = a 2 d / ( a 2 d + b 2 d ) ≈ c o m p ( a , b ) a_d=a^{2^d}/(a^{2^d}+b^{2^d}) \approx comp(a,b) ad?=a2d/(a2d+b2d)comp(a,b)

然而这种方法需要计算同态除法,同态方案并不自然支持。[CKKLL19] 使用了 Goldschmidt’s division 算法,但效率很低。

[CKK20] 的目标是找到一个好的简单多项式,并且它的迭代过程中不需要计算除法。首先将 [CKKLL19] 的迭代函数修改为 f ( x ) = x 2 / ( x 2 + ( 1 ? x 2 ) ) , x ∈ [ 0 , 1 ] f(x)=x^2/(x^2+(1-x^2)), x \in [0,1] f(x)=x2/(x2+(1?x2)),x[0,1],容易验证

  1. 它穿过了 ( 0 , 0 ) , ( 0.5 , 0.5 ) , ( 1 , 1 ) (0,0), (0.5, 0.5), (1,1) (0,0),(0.5,0.5),(1,1) 三个点
  2. 它在区间 [ 0 , 0.5 ] [0,0.5] [0,0.5] 上是凸的,在区间 [ 0.5 , 1 ] [0.5,1] [0.5,1] 上是凹的
  3. 随着函数迭代 f ( d ) f^{(d)} f(d),它将逼近区间 [ 0 , 1 ] [0,1] [0,1] 上的阶跃函数

事实上,我们只需要找出类似形状的多项式(不需要多项式分式),依旧可以通过迭代过程逼近这个阶跃函数。迭代过程如图所示:

在这里插入图片描述

Core Properties

任意区间 [ c 1 , c 2 ] [c_1,c_2] [c1?,c2?] 总是可以缩放平移到 [ ? 1 , 1 ] [-1,1] [?1,1] 上,因此我们只考虑符号函数 s g n ( x ) , x ∈ [ ? 1 , 1 ] sgn(x), x \in [-1,1] sgn(x),x[?1,1]

现在,我们确定形状近似 f ( x ) = x 2 / ( x 2 + ( 1 ? x 2 ) ) , x ∈ [ 0 , 1 ] f(x)=x^2/(x^2+(1-x^2)), x \in [0,1] f(x)=x2/(x2+(1?x2)),x[0,1] 的,用于迭代计算 s g n ( x ) , x ∈ [ ? 1 , 1 ] sgn(x), x \in [-1,1] sgn(x),x[?1,1] 的多项式应当具备的性质:

  1. 它应当是奇函数,假设它的度数为 2 n + 1 2n+1 2n+1,记为 f n f_n fn?
  2. 它应当穿过两个端点 f ( ? 1 ) = ? 1 , f ( 1 ) = 1 f(-1)=-1, f(1)=1 f(?1)=?1,f(1)=1,由于原点附近它是阶跃的,因此难以用多项式正确逼近,我们排除对区间 [ ? ? , ? ] [-\epsilon,\epsilon] [??,?] 的逼近
  3. 它应当在区间 [ ? 1 , 0 ] [-1,0] [?1,0] 上是凸的,在区间 [ 0 , 1 ] [0,1] [0,1] 上是凹的,并且凹凸性越强烈越好,我们设置多项式导数在两个端点上最大化重根

使用数学语言描述,

在这里插入图片描述

事实上,对于固定的参数 n n n,多项式 f n f_n fn? 和常数 c n c_n cn? 都是固定的,
f n ( x ) = ∑ i = 0 n ( 2 i i ) ? x ( 1 ? x 2 ) i 4 i c n = 2 n + 1 4 n ? ( 2 n n ) = Θ ( n ) \begin{aligned} f_n(x) &= \sum_{i=0}^n {2i \choose i} \cdot \frac{x(1-x^2)^i}{4^i}\\ c_n &= \frac{2n+1}{4^n} \cdot {2n \choose n} = \Theta(\sqrt n) \end{aligned} fn?(x)cn??=i=0n?(i2i?)?4ix(1?x2)i?=4n2n+1??(n2n?)=Θ(n ?)?
可以计算出某些多项式,

在这里插入图片描述

它们的形状如图所示:

在这里插入图片描述

我们称多项式 p ( x ) p(x) p(x) 在区间 [ ? 1 , 1 ] [-1,1] [?1,1] 上满足 ( α , ? ) (\alpha,\epsilon) (α,?)-close to 函数 f ( x ) f(x) f(x),假如
∥ p ( x ) ? f ( x ) ∥ ∞ , ?? [ ? 1 , ? ? ] ∪ [ ? , 1 ] ≤ 2 ? α \big\| p(x) -f(x) \big\|_{\infty,\,\, [-1,-\epsilon]\cup[\epsilon,1] } \le 2^{-\alpha} ?p(x)?f(x) ?,[?1,??][?,1]?2?α
可以证明上述多项式 f n f_n fn? 的迭代收敛性质:

在这里插入图片描述

NewComp

根据等式 c o m p ( a , b ) = ( s g n ( a ? b ) + 1 ) / 2 comp(a,b)=(sgn(a-b)+1)/2 comp(a,b)=(sgn(a?b)+1)/2 和近似式 f n ( d ) ≈ s g n ( n ) f_n^{(d)} \approx sgn(n) fn(d)?sgn(n),可以给出如下的近似比较算法,

在这里插入图片描述

实数多项式 f n f_n fn? 可以转化为整系数多项式,
h n ( x ) = f n ( 2 x ? 1 ) + 1 2 = ∑ i = 0 n ( 2 i i ) ? ( 2 x ? 1 ) ( x ? x 2 ) i h_n(x) = \frac{f_n(2x-1)+1}{2} = \sum_{i=0}^n {2i \choose i} \cdot (2x-1)(x-x^2)^i hn?(x)=2fn?(2x?1)+1?=i=0n?(i2i?)?(2x?1)(x?x2)i
并且它满足迭代公式 h n ( d ) ( x ) = ( f n ( d ) ( 2 x ? 1 ) + 1 ) / 2 h_n^{(d)}(x) = (f_n^{(d)}(2x-1)+1)/2 hn(d)?(x)=(fn(d)?(2x?1)+1)/2,于是 c o m p ( a , b ) ≈ g n ( d ) ( ( a ? b + 1 ) / 2 ) comp(a,b) \approx g_n^{(d)}((a-b+1)/2) comp(a,b)gn(d)?((a?b+1)/2)

采取 Paterson-Stockmeyer 算法,每轮迭代中计算 f n ( x ) f_n(x) fn?(x) 需要 C n : = Θ ( n ) C_n:=\Theta(\sqrt n) Cn?:=Θ(n ?) 次同态乘法, D n : = log ? n + O ( 1 ) D_n:=\log n + O(1) Dn?:=logn+O(1) 乘法深度。迭代次数的下界为
d n : = 1 log ? c n log ? ( 1 / ? ) + 1 log ? ( n + 1 ) log ? ( α ? 1 ) + O ( 1 ) d_n := \frac{1}{\log c_n}\log(1/\epsilon) + \frac{1}{\log(n+1)}\log(\alpha-1) + O(1) dn?:=logcn?1?log(1/?)+log(n+1)1?log(α?1)+O(1)
我们简记复杂度类 L ( a , b ) : = a log ? ( 1 / ? ) + b log ? ( α ? 1 ) + O ( 1 ) L(a,b) := a\log(1/\epsilon) + b\log(\alpha-1) + O(1) L(a,b):=alog(1/?)+blog(α?1)+O(1),那么 total computation 和 total depth 分别为:
T C n = d n ? C n = L ( Θ ( n ) log ? c n , Θ ( n ) log ? ( n + 1 ) ) T D n = d n ? D n = L ( log ? n + O ( 1 ) log ? c n , log ? n + O ( 1 ) log ? ( n + 1 ) ) \begin{aligned} TC_n &= d_n \cdot C_n = L\left( \frac{\Theta(\sqrt n)}{\log c_n}, \frac{\Theta(\sqrt n)}{\log(n+1)} \right)\\ TD_n &= d_n \cdot D_n = L\left( \frac{\log n + O(1)}{\log c_n}, \frac{\log n + O(1)}{\log(n+1)} \right)\\ \end{aligned} TCn?TDn??=dn??Cn?=L(logcn?Θ(n ?)?,log(n+1)Θ(n ?)?)=dn??Dn?=L(logcn?logn+O(1)?,log(n+1)logn+O(1)?)?
由于 c n = Θ ( n ) c_n = \Theta(\sqrt n) cn?=Θ(n ?),因此前者发散到无穷大,后者会接近 L ( 2 , 1 ) L(2,1) L(2,1)(但并不收敛)。计算表明 n = 4 n=4 n=4 的时候 T C 4 TC_4 TC4? 是最优的,此时有 T C 4 = Θ ( 1 ) ? log ? ( 1 / ? ) + Θ ( 1 ) ) ? log ? ( α ? 1 ) + O ( 1 ) TC_4 = \Theta(1)\cdot\log(1/\epsilon) + \Theta(1)) \cdot \log(\alpha-1) + O(1) TC4?=Θ(1)?log(1/?)+Θ(1))?log(α?1)+O(1),假如 ? = 2 ? α \epsilon=2^{-\alpha} ?=2?α 那么就是 T C 4 = Θ ( α ) TC_4 = \Theta(\alpha) TC4?=Θ(α),随近似精度的提升线性增长。

Acceleration

在迭代计算 f n ( d ) f_n^{(d)} fn(d)? 的过程中,实际上分为两步。对于 x ≥ ? x \ge \epsilon x?

  1. 首先计算 f n ( d ? ) f_n^{(d_\epsilon)} fn(d??)?,将区间 [ ? , 1 ] [\epsilon,1] [?,1] 映射到区间 [ 1 ? τ , 1 ] [1-\tau,1] [1?τ,1],其中 0 < τ < 1 0<\tau<1 0<τ<1 是某个常数
  2. 继续计算 f n ( d α ) f_n^{(d_\alpha)} fn(dα?)?,将区间 [ 1 ? τ , 1 ] [1-\tau,1] [1?τ,1] 映射到区间 [ 1 ? 2 ? α , 1 ] [1-2^{-\alpha},1] [1?2?α,1],它逼近 s g n ( x ) = 1 sgn(x)=1 sgn(x)=1

在第一阶段的迭代过程中,其实不需要 f n f_n fn? 的全部性质。[CKK20] 提出可以用另一个斜率更大的函数 g g g 来代替,从而更少的迭代次数 d ? d_\epsilon d?? 就可以达到区间。现在我们确定 g g g 应当具有的性质,

  1. 依旧应当是奇函数
  2. 存在常数 0 < δ < 1 0<\delta<1 0<δ<1,在区间 ( 0 , δ ] (0,\delta] (0,δ]严格递增
  3. 在区间 [ δ , 1 ] [\delta,1] [δ,1] 中总保持映射到区间 [ 1 ? τ , 1 ] [1-\tau,1] [1?τ,1]

使用数学语言描述,

在这里插入图片描述

对于固定的常数 τ \tau τ,为了使得 ( 0 , δ ] (0,\delta] (0,δ] 内的导数更大(从而迭代次数更少),我们确定多项式 g g g 使得最小化常数 δ 0 \delta_0 δ0?,采用迭代算法寻找:

在这里插入图片描述

可以证明这个过程收敛到某个多项式 g n , τ g_{n,\tau} gn,τ?,它是导数最大意义下最优的。

[CKK20] 固定 τ = 1 / 4 \tau=1/4 τ=1/4,虽然上述获得的 g n g_n gn? 并没有关于 n n n 的简单表达式,但是以精度 2 ? 10 2^{-10} 2?10 近似为

在这里插入图片描述

它们的形状和迭代,如图所示:

在这里插入图片描述

修改后的算法为

在这里插入图片描述

根据 g n g_n gn? 的某些启发式性质,可以确定 g n ′ ( 0 ) g_n'(0) gn?(0) 的大小和 g n ( x ) g_n(x) gn?(x) 逼近 ± 1 \pm1 ±1 的速率(详见 [CKK20]),最后计算出各自的迭代次数 d ? d_\epsilon d?? d α d_\alpha dα? 的下界。虽然不同的输入值 x x x 需要的迭代次数也不同,但它是密文状态的,难以用它来动态地确定迭代次数。

在这里插入图片描述

通过和 NewComp 的复杂度做比较,算法 NewCompG 在第一阶段的迭代深度降低了基本一半,因此乘法深度 T D n TD_n TDn? 和乘法复杂度 T C n TC_n TCn? 都显著降低。

Application to Min/Max

最大值/最小值可以用绝对值来构造,
min ? ( a , b ) = ( a + b ) ? ∣ a ? b ∣ 2 max ? ( a , b ) = ( a + b ) + ∣ a ? b ∣ 2 \begin{aligned} \min(a,b) &= \frac{(a+b) - |a-b|}{2}\\ \max(a,b) &= \frac{(a+b) + |a-b|}{2}\\ \end{aligned} min(a,b)max(a,b)?=2(a+b)?a?b?=2(a+b)+a?b??
而绝对值可以用符号函数来构造,
∣ x ∣ = x ? s g n ( x ) ≈ x ? ( f n ( d α ) ° g n ( d ? ) ) ( x ) |x| = x \cdot sgn(x) \approx x \cdot (f_n^{(d_\alpha)}\circ g_n^{(d_\epsilon)})(x) x=x?sgn(x)x?(fn(dα?)?°gn(d??)?)(x)

对应的收敛性:

在这里插入图片描述

Result

[CKK20] 选用了 HEAAN 同态加密库,设置参数 N = 2 17 N=2^{17} N=217 q L ≈ 2 2250 q_L \approx 2^{2250} qL?22250。由于 CKKS 是 Level FHE,不同层的复杂度不一样,因此它使用 T D n ? T C n TD_n \cdot TC_n TDn??TCn? 作为计算复杂度的描述。在设置 ? = 2 ? α \epsilon = 2^{-\alpha} ?=2?α 时,依旧是 n = 4 n=4 n=4 最优化,因此选用 f 4 , g 4 f_4,g_4 f4?,g4?

计算复杂度、乘法深度、性能测试:

在这里插入图片描述

文章来源:https://blog.csdn.net/weixin_44885334/article/details/135462535
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。