【応用情報技術者試験】ハッシュ関数の「原像計算困難性」とは?「デジタル指紋」で学ぶセキュリティの基礎

noteへのバナー

応用情報技術者試験など、情報処理技術者試験のセキュリティ分野で、必ずと言っていいほど登場する「ハッシュ関数」

「一方向性」「衝突困難性」「原像計算困難性」…

言葉は聞いたことがあっても、それぞれの違いを正確に説明できますか? 特に、これらの性質を入れ替えた選択肢問題は、多くの受験者を悩ませる典型的なひっかけ問題です。

この記事では、そんなハッシュ関数の重要な性質を、「デジタル指紋」という非常にシンプルなイメージで解説します。
このたとえ話さえ理解すれば、もう迷うことはありません。

目次

そもそもハッシュ関数とは?「デジタル指紋」を作成する魔法の箱

まず、ハッシュ関数とは何か、その正体をつかみましょう。 ハッシュ関数とは、どんなデータ(文章、画像、ファイルなど)でも、「そのデータだけの固有の、短い文字列(指紋)」に変換してくれる魔法の箱だと考えてください。

[画像:文書ファイルが「ハッシュ関数」という箱に入り、短い文字列(指紋データ)に変換されて出てくるイラスト]
文書ファイルが「ハッシュ関数」という箱に入り、短い文字列(指紋データ)に変換されて出てくる

この「デジタル指紋(ハッシュ値)」には、3つの大きな特徴があります。

ハッシュ値の3つの特徴
  1. どんなに長いデータも、指紋は同じ長さになる: 1ページの文章でも、広辞苑一冊分のデータでも、生成される指紋(ハッシュ値)の長さは常に同じです。(例:256文字など)
  2. 元データが1文字でも違えば、全く別の指紋になる: 「こんにちは」と「こんにちわ」では、生成される指紋は似ても似つかない、全くの別物になります。
  3. 指紋から、元のデータを復元することは絶対にできない: あなたの指紋を見ても、あなたの顔や身長を誰も知ることができないのと同じです。これが「一方向性」と呼ばれる、ハッシュ関数の最も重要な性質です。

トリップ:身近なハッシュ値

昔のインターネット掲示板で使われていた技術

[画像:文字列がトリップに変換されて出てくるイラスト]
トリップは身近なハッシュ値

ハッシュ値の理解を深めるために、身近なハッシュ値である「トリップ」を紹介します。
昔のインターネット掲示板(2ちゃんねるなど)では、名前欄に「#」に続けて好きな文字列(パスワード)を入れると、でたらめな文字列が生成されました。このでたらめな文字列がトリップです。

トリップ値も以下のような特徴を持っています。

トリップの特徴
  • どんな文字列も、決まった長さの文字列に変わる
    #コンドウイサミ でも #もっと長いパスワードでもOK でも、生成されるトリップは常に同じ長さ(例:◆AbcDEfG12 のような形式)になります。
  • 元が1文字でも違うと、全く別の結果になる
    #password#Password では、生成されるトリップは似ても似つかない、全くの別物になります。
  • 結果から、元の文字列を推測するのは非常に難しい(一方向性)
    ◆AbcDEfG12 というトリップを見ても、元のパスワードが「コンドウイサミ」であることは、簡単には分かりません。これがハッシュ関数の「原像計算困難性」にあたります。
  • 同じ文字列からは、必ず同じ結果が生まれる
    「#コンドウイサミ」を使ったユーザーが、別の日に同じ掲示板で #コンドウイサミ と入力すれば、前回と全く同じトリップが生成されます。
    これにより、「ああ、あの時の人と同じ人だな」と、本人であることを証明する「デジタルの合言葉(合い札)」として機能します。

「トリップ」と「暗号学的ハッシュ関数」の違い

トリップとハッシュ関数の概念は全く同じですが、「目的」と「安全性(困難性のレベル)」に少し違いがあります。

掲示板のトリップ暗号学的ハッシュ関数 (SHA-256など)
目的本人であることの簡易的な証明 (匿名性を保ちつつ、発言者を区別する)データの改ざん検知、パスワード保護、デジタル署名 (より高度なセキュリティ目的)
安全性レベル比較的低い (昔のトリップは、総当たり攻撃で元のパスワードを見つけ出すことが可能でした)非常に高い (現代のスーパーコンピュータを使っても、ハッシュ値から元のデータを復元するのは事実上不可能)

たとえるなら、トリップは「自転車の鍵」、暗号学的ハッシュ関数は「銀行の金庫の鍵」のようなものです。どちらも「鍵」という役割は同じですが、その頑丈さが全く違います。
ただ、インターネット掲示板を使った人であれば、ハッシュ関数の理解としてトリップを思い出すと理解が深まるでしょう。

試験に出る!ハッシュ関数の3つの重要性質

さて、この「デジタル指紋」のたとえを使って、試験で問われる3つの重要な性質(困難性)を見ていきましょう。

性質日本語名デジタル指紋でたとえると…
Preimage Resistance原像計算困難性ある指紋を見ても、それが「誰の」指紋なのかは絶対に分からない
Second Preimage Resistance第二原像計算困難性Aさんの指紋を元に、Aさんとは別人のBさんで「全く同じ指紋」を持つ人を探し出すことはできない
Collision Resistance衝突困難性世界中の誰を探しても、「全く同じ指紋」を持つ「別人2人組」を見つけ出すことはできない

この3つの違いを理解することが、得点への鍵です。 特に、「原像計算困難性」は「指紋から本人を特定できない」という、ハッシュ関数の一方向性そのものを指していると覚えましょう。

過去問に挑戦!

それでは、この「デジタル指紋」のイメージを使って、添付の過去問を解いてみましょう。

応用情報技術者試験 春期 午前 問40より

【問題】 暗号学的ハッシュ関数における原像計算困難性,つまり一方向性の性質はどれか。

あるハッシュ値が与えられたとき,そのハッシュ値を出力するメッセージを見つけることが計算量的に困難であるという性質。

入力される可変長のメッセージに対して,固定長のハッシュ値を生成するという性質。

ハッシュ値が一致する二つの相異なるメッセージを見つけることが計算量的に困難であるという性質。

ハッシュの処理メカニズムに対して,外部からの不正な観測や改変を防御できるという性質。

解答と解説

正解は です。

各選択肢を「デジタル指紋」のたとえで検証してみましょう。

  • ア:ある指紋(ハッシュ値)を見ても、それが誰の(どのメッセージの)指紋なのかを見つけるのは困難である。 まさに「原像計算困難性」の説明そのものです。これが正解です。
  • イ:どんな相手(可変長メッセージ)でも、決まった長さの指紋(固定長ハッシュ値)を生成する。 これはハッシュ関数の基本的な機能の説明であり、「困難性」のようなセキュリティ上の性質を説明しているわけではありません。
  • ウ:「同じ指紋」を持つ「別人2人組(相異なるメッセージ)」を見つけるのは困難である。 これは「衝突困難性 (Collision Resistance)」の説明です。問題で問われている「原像計算困難性」とは異なる性質です。
  • エ:指紋を採るプロセスを、外部から邪魔されたり盗み見られたりしないように防御できる。 これは一般的なセキュリティ要件の話であり、ハッシュ関数固有の数学的な性質を指すものではありません。

このように、「デジタル指紋」のたとえを使えば、各選択肢がどの性質を説明しているのかを直感的に判断できます。

まとめ

  • ハッシュ関数とは、データを「デジタル指紋(ハッシュ値)」に変換する技術。
  • 原像計算困難性とは、「指紋から本人を特定できない」という一方向性のこと。
  • 衝突困難性とは、「同じ指紋を持つ他人同士を見つけられない」ということ。

試験では、これらの「〇〇困難性」の説明を入れ替えた問題が頻出します。それぞれの性質が「デジタル指紋」のどの側面に相当するのかをイメージで覚えて、確実な得点源にしましょう。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次