はじめに
この記事では1の論文を解説します。SPHINCSはランポート署名2を実用的に使えるようにした規格です。ハッシュ関数にのみ依存し、公開鍵と秘密鍵のサイズを小さく抑えることができます。
解説
用語と記法
SPHINCSはパラメータを取ることで署名を作成できるアルゴリズムの総称であり、安全とみなされるパラメータを実際のパラメータとして定義した個別のアルゴリズム規格は SPHINCS-256 のようにインスタンスごとの個別の名前で呼ばれる。この解説の中では、基本的にはSPHINCS-256を扱う。以下n=256のように具体的な数字が入っているのはSPHINCS-256の値である。
メインのセキュリティパラメータを n = 256 とする。
をサイズnからnに移すハッシュ関数とする。
をサイズ2nからnに移すハッシュ関数とする。
を、任意入力長のランダム化ハッシュ関数とする。
をパラメータλを取る疑似乱数生成関数の族とする。
をパラメータλを取る疑似乱数関数の族とする。
を任意の長さの入力を取る疑似乱数関数とする。
これらの関数はすべて同一のハッシュ関数から構築できるが、役割の都合上別のものとして記述している。
SPHINCSアルゴリズムで使われるハイパーツリー(hyper-tree)の高さをh = 60とする。
ハイパーツリーはd=12階層の層からなり、それぞれの層の高さはh/dである。
ヴィンターニッツ ワンタイム署名における時間空間計算量のトレードオフを決めるパラメータw = 16とする。少数回署名(few-time signature)アルゴリズムであるHORSTのパラメータ として を満たすk,tがあるが、これは k = 32,
とする。
ビット文字列xに対してx[i, j]はi番目のビットから始まるjビット分の部分ビット文字列を指すものとする。
ヴィンターニッツ ワンタイム署名 (Winternitz one-time signature; WOTS+)
ヴィンターニッツ ワンタイム署名(WOTS+)とは、ランポート署名のように一つの公開鍵に対して一度だけ署名できる署名方式(ワンタイム署名)であり、署名サイズと署名の計算時間の間にトレードオフがある。このトレードオフを規定するパラメータがwである。
n, wから以下のパラメータを定める。
SPHINCS-256の場合 l = 67となる。WOTS+では関数Fをつなげて以下のような連鎖関数cを作る。
入力
とカウンターi、ビットマスク
、
となるjに対して、 連鎖関数
と定義する。i=0のとき、
である。
すなわち、この関数はラウンドiにおいて一つ前の値とビットマスク
のビットごとXORを取り、その結果をハッシュ関数Fに通している。
ここで を
の部分文字列
として定義する。
の場合は空文字列とする。
以下、WOTS+の本体の3つのアルゴリズムを説明する。
鍵生成アルゴリズムkg
入力シードとビットマスク
を受取り、秘密鍵skと公開鍵pkを返す。
まずを生成する。つまり、長さnのシードを、l個の長さnの秘密鍵の値に拡張する。公開鍵は、
として計算する。
は秘密鍵skや公開鍵pkよりもサイズが小さく、skやpkは必要なタイミングで計算すればいいということに注意する。
署名アルゴリズムsign
nビットメッセージM、シード 、ビットマスク
を入力とし、署名値σを出力する。
まず、Mを整数値とみなしてw進数表現に変換する。とする。
次にチェックサムCを同様に計算し、w進数表現にする。ここでCの値は、各項の値から
のように上限が存在し、
の定義(上記の2進数logによる定義を参照)からCのw進数表現の長さは最大
となる。
次に をM,Cを結合させたl要素のw進数表現として定義する。内部秘密鍵
を鍵生成時と同様に
によって生成する。署名は
となる。
すなわち、連鎖関数cが何回適用されるかはメッセージによって決まる。
検証アルゴリズムvf
メッセージM、 署名σ、ビットマスクを入力とし、pk'の値を返す。本来はtrue(成功)かfalse(失敗)を出力する必要があるが、これはSPHINCSにおいては全体の検証アルゴリズムの方で行われるため、WOTS+では行わない。
検証者は上記同様を用意し、次の値pk'を計算する。
このpk'の値がpkと一致すれば成功、一致しなければ検証失敗となる。
公開鍵の値w-1に足りない回数だけ連鎖関数cを追加で実行している。秘密鍵を知らない攻撃者は、1~w-1の任意ラウンド回数ハッシュ関数を逆算する必要がある。w=1の場合はほとんどランポート署名と変わらない。
wの値を増やすと署名の長さは短くなる代わりに、計算量が増える。
バイナリハッシュ木 / L木
SPHINCSにおけるバイナリハッシュ木は以下のような図の木になる(間にビットマスクQが挟まっていること以外は普通のマークルツリーと同じ)。
バイナリハッシュ木は高さhで常にの葉ノードを持ち、それらの葉はnビットの値
を持つ。中間のそれぞれのノード
は
(iが横の番号、jが高さの番号)に対してnビットの値を持っている。
木を構築するには、hビットのビットマスクが使われる。葉ノードに対しては
と定義する。内部ノード
の値は
として計算される。ルート(根)に当たる部分の値
とする。
また、重要な概念として葉に対する認証パス
があり、下図に示されている。
葉と対応する認証パス
から以下のアルゴリズムでROOTの値を計算することができる。
アルゴリズム1(マークルツリーの整合性チェックアルゴリズムと同じ)
入力: 葉のインデックスi、葉、
の認証パス
出力: 葉を含む木のROOTの値
をセットする。
に対して
ならば
ならば
を代入
最後にを返して終了。
L木
L木は上記で説明したバイナリハッシュ木に小さな変更を加えたものである。バイナリハッシュ木の葉は2のべき乗になっている数の葉しか扱えないが、L木においては2のべき乗でない数lも葉の数として使える。L木はバイナリハッシュ木の「右ノードが不在の左ノード」の階層を上昇させ、「他のノードの右側子ノード」になる場所で止めるようなものになる。これはWOTS+の公開鍵の要素を保存しておくのに使われる。L木の高さはになり、ビットマスクも
だけ必要になる。
HORST
HORSTは長さmのメッセージに対する署名でを満たす値
を用いる。HORSTはHORSの改良版でバイナリハッシュ木を使って公開鍵のサイズをtnビットからnビットに減らし(※ビットマスクを使いまわすことで、サイズを0とした場合。もしビットマスクを使い回さない場合、公開鍵サイズは
となる)、署名と公開鍵を結合させた文字列のサイズをtnビットから
ビットに減らすことになった。xはt,kに応じて決まる値で、
が最小になるように決める。SPHINCS-256においてはx = 6である。
WOTS+とは違い、HORSTは複数回同じ鍵で署名ができる。しかし、署名をするたびにセキュリティが低下していく。
鍵生成アルゴリズムkg
シード, ビットマスク
を入力として、公開鍵
を出力する。
まず内部秘密鍵 を計算する。
に対して葉ノードは
として計算され、高さ
のバイナリハッシュ木がビットマスクQを使って計算される。
署名アルゴリズムsign
メッセージ、 シード
、ビットマスク
を入力として、署名値
を出力する。
まず内部秘密鍵skがアルゴリズムkg同様に計算される。次にMを長さlog(t)ビットずつ最大kブロックに分割し、それぞれのブロックを最大 log(t) ビットの符号なし整数とみなす。つまりとなる。
署名値σ は と表され、
から
は
になる。
これは 番目の秘密鍵と、木の下からの高さ
(=上からの深さx)までの認証パス
を含む。(※これだけでは葉から根までの完全な認証パスの検証は行えない)
また、最後の署名要素であるに関してはバイナリハッシュ木の高さ
における全
要素、すなわち
が入る。
この署名値σに加えて、アルゴリズムは公開鍵pkを出力する。
検証アルゴリズムvf
メッセージ、 署名値σ、ビットマスク
を入力として値pk'を出力する。
まずアルゴリズムsignと同様に、各を計算する。次に各
に対して
として、インデックス
に対してアルゴリズム1を適用する。
アルゴリズム1の入力は である。
はそれぞれの署名配列のi番目の値における第一項、第二項である。
アルゴリズム1の出力は となる。
その後、すべてのに対してアルゴリズム1の出力である
と、
の中身である
が一致するかどうかを確認する。もし一致するならば、
の値から
を計算し、その値を返す。一致しなければ、
を返す。
理論上のパフォーマンス
以下ではビットマスクの計算領域については(共通化出来るため)省略している。
また以下では疑似乱数生成の回数とハッシュ関数の実行の回数を、ハッシュ関数の区別は行わずに記載する。
サイズ
HORSTの秘密鍵はnビットシード値で表現される。公開鍵は単一のnビットハッシュになる。署名値はk個の内部秘密鍵要素と、k個の「log(t)-xの長さを持つ認証パス」を持つ。これに加えて最後の要素である は
個のノード(サイズnビット)を持ち、合計サイズは
ビットになる。
実行速度
鍵生成は1回のの実行と、葉ノードを生成するためのt回のハッシュ計算、公開鍵を生成するためのt-1回のハッシュ計算が必要になり、合計のハッシュ計算回数は 2t-1回になる。
署名実行時にはROOTの計算が必要になるため鍵生成と同じ回数のハッシュ計算回数(2t-1)が必要になる。
署名検証時には、葉ノードの値を計算するためにk回のハッシュ計算が必要になる。また、高さlog(t)-xにおけるノードを計算するためにはk要素に対してそれぞれ log(t)-x回のハッシュ計算が必要になる。さらに、からROOTの値を計算するためには
回のハッシュ計算が必要になる。よって合計
回のハッシュ計算が必要になる。
まとめ
まとめると、このHORSTというスキームでは署名対象のメッセージをランダム化して、バイナリハッシュ木の葉をランダムにいくつか選ぶように対応させる。
そのランダムに選んだ葉と一致するように元のハッシュ原像を公開する。当然、一番最初に作成し公開した署名の場合はどのハッシュ原像も公開されていなかったものであるため、ランポート署名と同程度のセキュリティである。2回目以降の署名では、すでに公開されたハッシュ原像と一致していないものが含まれれば、安全である。
何回も署名を繰り返すことによって、「まだ公開されていない原像をランダムに選択できる確率」は低くなっていく。そのうち、攻撃者が何らかのメッセージに対して「すでに公開された原像のみから構成できる署名値」を発見してしまった場合、攻撃者は署名の偽造が可能になる。
例えば、以下の図のように初回のメッセージMが赤文字で記された原像を選択し、2回目のメッセージM'が青文字で記された原像を選択したとする。は
と同じ原像を選択してしまっているが、
はこれまで公開されていなかった原像を選択しているので、2回目のメッセージM'に対して有効な署名が作れている。
SPHINCS
上記のHORST, WOTS+, L木などを用いて、SPHINCSのアルゴリズムを定義する。
SPHINCSの鍵ペアは、SPHINCSアルゴリズム自体の「仮想的な」構造の表現にもなっている。
SPHINCSは高さh/dの木がd層重なってできた、高さhのハイパーツリーからなる。
それぞれの木は以下のようになっている。
それぞれの木における 個の葉ノードは
個のL木のルートノードであり、それぞれのL木のルートノードはWOTS+鍵ペアを圧縮した表現と見なす。
すなわち、それぞれの木は 個のメッセージに署名できる鍵ペアであり、ハイパーツリーはそれがd個重なったものと見ることができる。
d-1層(上から1つ目の層)においては、ハイパーツリーは1つだけ木を持つ。d-2層(上から2つ目の層)においては、ハイパーツリーは個の木を持つ。d-2層の木のルートノードは、d-1層の木のWOTS+署名によって署名されている。
一般に、i層は個の木から構成されており、これらの木のルートノードはi+1層のWOTS+鍵ペアによって署名されていることになる。
最後に、第0層においては、それぞれのWOTS+署名鍵ペアは、HORST公開鍵を署名するために使われる。
最初に「仮想的な」構造と表現したのは、シード値とビットマスクを選択することによって構造の全ての値が決まり、全体の構造が計算されることはないからである。
シード値は秘密鍵の一部であり、疑似乱数による鍵生成に使われる。
理解のため、SPHINCSの署名を表現した以下の図を見よ。すなわち、SPHINCSの署名はこのハイパーツリーの中の一つのパスとして表現される。
このパスはd個の木からなり、それぞれのバイナリハッシュ木は
個のL木のルートノードを認証し、それぞれのL木はWOTS+鍵ペアの公開鍵を葉ノードとして持っている。
それぞれの木は1階層下にある木をWOTS+署名を認証している。例外は最下層の木
で、これはWOTS+の署名によってHORSTの公開鍵を認証している。
最後に、HORSTの鍵ペアが実際のメッセージを署名するのに使われる。ハイパーツリー内においてどの木が使われるのか(したがって署名においてどのWOTS+署名値を使うか)は、この図には記載されていないが、疑似乱数によって選択されたインデックスによって決定される。
ここで、疑似乱数による鍵生成のために簡単なアドレススキーム(番地を決定するスキーム)を決めておく。アドレスとは長さ の ビット列である。
WOTS+鍵ペアのアドレスを得るには、まず木が所属している層の番号をlog(d+1)ビットの文字列としてエンコードする。(最上位の1つだけ木がある層はd-1層とする。)
さらに、層内部の木の番号を(d-1)(h/d)ビットの文字列としてエンコードし、先の層の番号の文字列の末尾に追加する。(ここで層内部の木の番号は左から数えて0から始まり、最も右の木まで数える)
最後に、木内部のWOTS+鍵ペアのインデックスを(h/d)ビットの文字列としてエンコードし、上記の文字列の末尾に追加する。(ここでもWOTS+鍵ペアは左から数えて0から始まり、最も右の木まで数える)
HORST鍵ペアのアドレスは、HORST鍵ペアを署名するのに使ったWOTS+鍵ペアのアドレスから作成するが、先頭の「木が所属している層の番号をlog(d+1)ビットの文字列としてエンコードする」部分で、番号をdとして固定してエンコードする。
SPHINCS-256においては、このアドレスは64ビットになる。
鍵生成アルゴリズム
鍵生成アルゴリズムはまずの2つの値を生成する。
は疑似乱数鍵生成に使われる。
は署名時に、予期できないインデックスを生成するのと、署名対象のメッセージをハッシュ化する際に、値をランダム化するのに使われる。
また、個のnビット一様ランダム値を
がビットマスクとして生成される。これらのビットマスクはWOTS+、HORST、各種のバイナリハッシュ木に使われる。以下において、
をQのうち最初のw-1個の、長さnのビットマスクとして定義する。同様に
をQのうち最初の
個のビットマスクとして定義し、
をQのうち最初の
個のビットマスクとして定義し、
をQのうち最初の
個のビットマスクとして定義する。
鍵生成アルゴリズムの残りの部分は、d-1層におけるルートノードを生成することだけになる。d-1層における単一の木の葉ノードにあたるWOTS+鍵ペアが複数生成される。
アドレスにおける鍵ペアのシードは
として、疑似乱数生成関数にAと
を与えることで生成する。
一般に、アドレスAに対する鍵ペアのシードは とし、
を知っているならば、この鍵ペアシードの生成アルゴリズムにもアクセスできるものとする。WOTS+公開鍵は
で生成する。
木のi番目の葉ノードであるはビットマスク
を使って
を(l要素lnビットから1要素nビットへと)圧縮したL木のルートノードになる(下図参照)。
以下の図は https://www.mdpi.com/2076-3417/11/5/2082 から。
最後に、葉ノードからバイナリハッシュ木を生成し、そのルートノードを
とする。SPHINCSの秘密鍵と公開鍵は
であり鍵生成アルゴリズムはこの鍵ペアを返す。
署名アルゴリズム
メッセージと秘密鍵
を入力として、署名値
を返す。
まず、メッセージと秘密鍵に対してランダム化メッセージダイジェストを計算する。
最初に疑似乱数が
として計算される。次に
がRの最初のnビットをランダムネスとして使ってメッセージMのランダム化ハッシュとして計算される。Rの後半nビットはHORSTの鍵ペアを選択するのに使われる。すなわち、
の最初のhビットがhビットインデックス
として計算される。
署名は決定的アルゴリズムであり、全ての「ランダムネス」は疑似乱数生成関数によって生成されるため真のランダムネスは必要としていないことに注意せよ。
インデックスiが与えられた上で、アドレス によって指定されるHORST鍵ペアがメッセージダイジェストDを署名するのに選択される。すなわち、インデックスiのうち、0ビット目から(d-1)h/dビット目までがd番目の層においてどの木を選択するかに使われ、残りの(d-1)h/d + 1ビット目からh/dビット目までが木の中においてどの葉ノードを選択するかに使われる。
HORSTの署名と公開鍵 は、HORSTのビットマスクと
を用いて計算される。
SPHINCS署名は、インデックスiの他にはランダムネス
、HORST署名
、ハイパーツリーの層一つにつきWOTS+署名と認証パスのペア
を含む。
これらのWOTS+署名は以下のように計算できる。
アドレスに対応するWOTS+鍵ペアは
を署名するのに使われる。ここで
は
の最初の
ビットを0に置き換えたものである。
HORST公開鍵に対してWOTS+のビットマスクを使いWOTS+で署名すると、
のような署名値を入手できる。そして、署名に使ったWOTS+鍵ペアの公開鍵に対する認証パス(最下層のバイナリハッシュ木の内部における認証パス)
が計算できる。次に、WOTS+公開鍵
を計算する。
をL木を使って圧縮してnビットの葉ノードの値としてセットした後、アルゴリズム1を適用することによって、「L木のルートノード」(=バイナリハッシュ木の葉ノード)と「最下層のバイナリハッシュ木の内部における認証パス」と、「WOTS+鍵ペアを選択したインデックス」から「最下層のバイナリハッシュ木のルートノード」
が計算される。
このプロセスがレイヤー1からd-1まで繰り返されるが、以下の2点のみ違いがある。
(1) まずj層においてWOTS+は 前のステップで生成された
を署名するのに使われる。
(2)またj層におけるWOTS+鍵ペアのアドレスは として計算される。
すなわち、それぞれの層において、「木を指定している部分のアドレス」の最後のh/dビットの部分が新しく「葉ノードを指定するアドレス」に加わり、「もともと(前の層において)木を指定していたアドレスのうちの、最後のh/dビットの部分を除いた残りの部分」が新しく「木を指定している部分のアドレス」になる。
これは、層を上がるにつれて層の中に含まれる木の数は (h/d) 分の 1に減っていくことが理由である(ただし、同じインデックスiを部分的に使いまわすことによって、層ごとに指定する木のインデックスが偏ってしまうリスクがあるのではないか?)。
最終的にこの署名アルゴリズムはを返却する。
検証アルゴリズム
メッセージ、署名値
、公開鍵
を入力として、検証成功の場合trueを、失敗の場合falseを返す。
まずメッセージダイジェスト を署名に含まれるランダムネス
を使って計算する。
に含まれるビットマスク
とHORST署名からHORST公開鍵
を計算する。もしHORST.vfがfailを返すならば、検証アルゴリズムもfalseを返す。
WOTS+ビットマスクとWOTS+署名とHORST.vfに返された公開鍵からWOTS+公開鍵
を計算する。
に対応する葉ノード
を計算するためにL木が使われる。その後アルゴリズム1によって、インデックス i[(d-1)h/d, h/d]と、葉ノード
と、認証パス
によって最下層の木のルートノード
を計算する。
その後、このプロセスが第1層からd-1層まで繰り返されるが、以下の2点の違いがある。
(1) まず、層j においてWOTS+公開鍵
を計算するために、一つ前の層のルートノード
が使われる。
(2) L木を使ってから計算される葉ノードは
となる。すなわち、木の中における葉ノードのインデックスはiの後ろj(h/d)ビットを切り捨てたビット文字列のうち、末尾のh/dビット分を使用するものとする。
第d-1層におけるプロセスを実行した後、という値がトップの層の単一の木におけるルートノードとなる。この値が、公開鍵における第一項の値と比較される。すなわち、
と
が等しいかを確認する。
もし等しければ検証関数はtrueを返し、等しくなければfalseを返す。
理論上のパフォーマンス
以下では疑似乱数生成関数PRFと、疑似乱数生成器PRGとハッシュの理論的な実行回数を調べるが、異なるPRF, PRG, ハッシュを同一にカウントしている。
サイズ
SPHINCSの秘密鍵は2個のnビットシードと個からなるnビットのビットマスクからなり、合計では(2+p)nビットになる。公開鍵は単一のnビットハッシュとビットマスクを含むので、合計サイズは(1+p)nビットになる。署名は1つのhビットインデックスとnビットのランダムネスを含む。さらに、署名はHORST署名(
ビット)と、d個のWOTS+署名(それぞれlnビット)と、h個の認証パスノード(それぞれnビット)を含んでいる。そのため、署名全体のサイズは
ビットになる。
実行速度
SPHINCSの鍵生成はハイパーツリーのトップの木を構築することで行われる。
葉ノードを生成するために以下の処理が回行われる。
- 1回の疑似乱数生成関数実行
- 1回の疑似乱数生成器実行
- 1回のWOTS+鍵生成実行(lw個のハッシュ計算)
- L木の計算(l-1回のハッシュ計算)
木を構築するために、さらに 回のハッシュ計算が必要になる。
合計すると、回の疑似乱数生成関数と疑似乱数生成器の実行、
回のハッシュ計算となる。
署名時には以下が必要である。
- インデックス、メッセージダイジェスト生成のための乱数、メッセージハッシュ計算のために、1回の疑似乱数生成関数実行
- さらにHORSTのシードを生成し、HORST署名を生成するために1回の疑似乱数生成関数実行
- 加えて、d個のバイナリハッシュ木を構築する必要があり、鍵生成時のd倍の回数の木構築の実行
- WOTS+署名はWOTS+鍵生成を実行する間に生成することができるため、追加のコストはかからない
合計すると、回の疑似乱数生成関数実行、
回の疑似乱数生成器実行、
回のハッシュ計算となる。
最後に、署名検証には
- メッセージダイジェストのハッシュ
- 1回のHORST検証
- d回のWOTS+検証(最大lw回のハッシュ計算)
- L木の計算
- ルートノードを計算するためのh/d-1回のハッシュ計算
が必要であり、合計すると回のハッシュ計算が必要になる。
感想
SPHINCS-256の署名サイズ(41kB)がECDSA(64B)と比較すると1000倍近くあるのでそのままブロックチェーンに載せるのは厳しいと思うのですが、SPHINCSをベースにすると暗号学的仮定を最小限まで減らせるので、計算検証履歴を圧縮できるSTARKと併用することで、純粋なハッシュベースの暗号通貨を構築することは可能性としてありえるのではないかと思いました。
PoW、署名、ブロックチェーン圧縮の全要素が共通のハッシュ関数に依存する形で構成できるならば、より安全性の高いシステムに繋がると考えます。
なお改良版のSPHINCS+3という方式ではさらに署名サイズが小さくなっているようです。実用的には、既存の楕円曲線暗号方式(例えばEd25519)と組み合わせ、両方の署名検査をパスすることを要求するハイブリッド署名方式4がより安全なスキームとして提案されています。
ハッシュベース暗号なのにXMSS5と違いステートレスで扱える方法の発明は純粋に面白かったです。
※関連する脆弱性6についても興味があったら見てみてください。
参考文献
-
SPHINCS: practical stateless hash-based signatures https://sphincs.cr.yp.to/sphincs-20150202.pdf ↩
-
ランポート署名 https://ja.wikipedia.org/wiki/%E3%83%A9%E3%83%B3%E3%83%9D%E3%83%BC%E3%83%88%E7%BD%B2%E5%90%8D ↩
-
SPHINCS+ https://sphincs.org/data/sphincs+-specification.pdf ↩
-
SuperSPHINCS https://github.com/cyph/pqcrypto.js/tree/master/packages/supersphincs ↩
-
RFC 8391 - XMSS: eXtended Merkle Signature Scheme 日本語訳 https://tex2e.github.io/rfc-translater/html/rfc8391.html ↩
-
論文“Breaking Category Five SPHINCS+ with SHA-256”の紹介 http://www2u.biglobe.ne.jp/~nuida/m/doc/SCAIS2023_20230123_Nuida.pdf ↩