見出し画像

断定と情報量

こんにちは。澤村周平と申します。普段は暗号資産交換業者であるコインチェックの事業部門で事業責任者をやらせていただいています。日々の仕事や生活の中で、タイトルのトピックについて考えることがあり、実名での発信活動に興味が増してきた時期でもありましたので、Note記事を書くことにしました。


断定的な表現は情報量が多い

「断定的な表現」という言葉を聞いて、あなたはどのような印象を持ちますか?
なんだか、知的に不誠実でオラオラしたビジネスマン的な人が、よく知りもしない分野について、人から聞いた話をあたかも自分がよく理解しているように、その話の前提となる条件に言及しないで言い切り口調で話しているシーンを思い浮かべましたか?
これは話の導入として興味を持ってもらうためのかなり棘がある言い方で、私はそういった話ぶりに対して、上に書いたほどの強い不快感を持ってはいませんでした。

しかし、やはり私も過去には断定的な物言いをよく人に対して、そのような印象に近いものを持っていましたし、今もその発言の場面やその人の他の振る舞いなど、総合的な要素の組み合わせ次第で、そういった印象を持つことがあります。一方で最近では、自分自身の立場の変化に伴う変化や、一緒に働く人または書籍・動画などから得た情報を解釈していく過程で、このような発言・態度に対して、そういった悪い印象を持つだけでなく、それが必要で有効な場面がたくさんあり、なんなら現実世界の問題解決に取り組む場面においては、それができないと物事が進まないよね、という考えを持つに至っています。
断定的な言い方が有効で価値を持つという主張について、今日この記事では、

  • 情報学的な情報量の定義から考えて、なぜ断定的な物言いが有効で価値があるのか

  • 断定的な物言いはどういった立場の人に求められるか

という問いに答える形で、「断定的な物言いをすることが必要である」、という主張の正当性を裏付ける内容を書いていきたいと思います。

情報学的な情報量

あなたは、以下の2つの文章を読んで、どちらの表現が情報量が多いと感じるでしょうか?

  • ①北に進むのが正しい。

  • ②北の方に行くといいかもしれない。でも、北東に行ってもよさそう。それ以外はダメだ。

シンプルに文字数が多いという意味で、②だと思う方がいるかもしれません。たしかに、文字数ベースでは、①が11文字、②が40文字であります。実際に、この文章が記録されている媒体(世界のどこかにあるサーバ内のストレージ)上でのByte数は、②の方が多いです。
何を当たり前のことを言っているんだ?Byte数が多いなら、②の方が情報量が多いに決まっているだろうと思うかもしれません。しかし実は、情報学的な分野における情報量という意味では、①の方が情報量が多いのです。
情報学の分野では、ある事象xが起こる確率を$${P(x)}$$とし、「xが起こったという事実が分かったこと」の情報量$${i(x)}$$を、次のように表現します。


$$
{i(x) \coloneqq log(\frac{1}{P(x)}) = -log(P(x))}
$$


と書くと、意味が分からないかもしれませんが、この式は要するに、ある事象が起こる確率が低ければ低いほど、その事象が起こったという情報は、多くの情報量を持つという意味です。


これも抽象的ですので、もっと噛み砕いて具体例を言いますと、「2024/4/1に渋谷に日本人が1人以上いた」「2024/4/1に渋谷に大谷翔平がいた」という2つの情報があったとき、後者の方が情報量が多いということです。
この例であれば、情報学的な意味での情報量という概念の意味を、直感的に理解しやすいのではないでしょうか。
前者の「渋谷に日本人が1人以上いる」ことは、そうでない日の方がむしろ少ないという意味で、情報としての意味がほぼない(=その情報を手にいれる前と後で、自分の知っていることが増えていない)ように思いませんか?前者の事実は、「渋谷が日本にあること」「渋谷は日本の中で、たくさんの人が訪れる場所であり、日本人が訪れることが特に禁止されているような場所ではないこと」という、日本人のほとんどが当然に知っている情報から、当然に推定されることであるため、前者の情報を手に入れたとしても、特に知識が増えないということです。

断定的な表現と情報量

ここで冒頭の文章に戻り、どの方向に行くと、自らの目的が達成されるかということについて、全く事前知識がないBさんが、Aさんから①②の情報を聞いたときを考えます。
このとき、Bさんが「どの方向に行くと、自らの目的が達成されるかということについて、全く事前知識がない」ということを言い換えると、北・北東・東……西・北西の8方位それぞれに対して、全く同じ1/8の確率で目的が達成されると考えているということです。
このときAさんから、①のように「北に行けば目的が達成される」という情報をもらうケースと、②のように「北の可能性が高そうだけど、北東の可能性もある」ような情報をもらうケースだと、上の定義に従うなら、それぞれ①②は次の情報量を持つことになります。

  • ① $${-log(\frac{1}{8})) = 3}$$

  • ② $${-log(\frac{1}{8}+\frac{1}{8}) = 2}$$

(ここで、②の情報量を評価するときは、完全にランダムに方角を選んだ場合に、北に進む確率と北東に進む確率を、カッコ内で足し合わせています。)

そう定義したんだから当たり前だよね?というツッコミが聞こえてきますが、やはり①のような断定的な表現の方が、情報学的な意味での情報量が多いわけです。そしてこの情報学的な意味での情報量という概念は、上述した渋谷の例をはじめとする現実の様々な情報に当てはめたときに、直感的に多くの人が思う「情報量が多い情報(その情報を聞いた後に、聞く前よりも、自分が知っていることが増える情報)がどんなものであるか」という感覚を、適切に表現できる概念だと思います。


なお余談ではありますが、「情報量」に限らず、いろいろな言葉について、その言葉に厳密な定義を設けて使う専門家が理解している意味と、一般的に世の中の多くの人が理解している意味が、異なることはしばしばあります。身近なもので言うと、「期待値」という言葉は、ビジネスマンと確率・統計の専門家とで、意味の食い違いが起きやすい言葉の一例です。
ある特定の分野の専門家と相対してコミュニケーションを取るときに、その分野で重要な概念で、一般的な意味と異なる厳密な定義がある言葉を適切に使えることは、専門家の方から信頼を得るために重要な能力であり、そのためには、広範な知的教養を持つための努力ができる能力や、それを素早く理解できるような、ものごとの基礎的な理解能力の高さが必要なのはもちろんとして、根底には専門家に対するリスペクトがあるか?ということが、重要であるように思います。
そういったリスペクトがなければ、相手が専門性を持つ領域に対して、自らのリソースを投下して学習しようという気持ちを持てないからこそ、専門家側は、自分の専門領域に理解のある人・理解を持とうとする人を、信頼するのだと考えています。*3


さて、話が逸れましたが、このセクションで言いたいことは、「情報」とは何であるかということを、(私のようなにわか理解でない)非常に賢い情報学の博士号を持ち、真剣にその分野にコミットした研究者の方々が考えた結果として出てきた、情報学的な「情報量」という概念を元に考えても、断定的な物言いの方が情報量が多いと言えるということです。
このことは、たとえば以下のような文章を読んだときに、どっちの方が情報量が多い?と聞かれて即時に思い浮かぶ考え(=Bの方が多そうに見える)とは直感的に反するように思うかもしれませんが、よくよく深く考えると、たしかにそうなのです。

  • A. 今日のお店は、絶対にXという焼肉屋にするのが良いです。

  • B. 今日のお店悩みますね。焼肉屋Xもいいし、寿司屋Yもいいし、もしかしたらイタリアンZもいいかもしれません。


色々なことを決めてくれると楽

注釈
*1:情報量について、分かりやすい説明はこちらをご参照ください。:https://logics-of-blue.com/information-theory-basic/
*2:なお、冒頭のByte数のことは、データ量と呼びます。
*3:情報学に関して、私はちゃんとその分野の体系的な学習を積んだわけではないにわか者ですので、もしかするとこのセクションの内容に誤りがあるかもしれません。その場合は、(できれば優しく)ご指摘いただけると嬉しいです。

断定的な表現が求められるのはどんな人か

先のセクションでは、情報学的な情報量に言及しながら、なぜ断定的な言い方の方が、そうでない言い方よりも、情報量が多いのか?ということを理解しました。
それでは、情報量が多いとされる「断定的な言い方」でコミュニケーションを取ることが、仕事上必要とされる人とは、どんな人でしょうか?
これは結論を言ってしまうと、全ての人がそうであるということになります。
この記事を読んでいるあなたは、いやいや、全ての人がそうとか言うなら、「どんな人でしょうか?」とか言うなよと思ったでしょう。その通りです。
これは、A:「どうすればプログラミングできるようになりますか?」、B:「うーん学習する人次第だね。人による。」、A:「ですよね〜。(いやいや、そんなの当たり前だよね。そういうこと聞きたいわけじゃないんだけど……)」みたいな回答と同じで、それこそ情報量がない結論ですから、もう少し私なりの具体的な考えを説明します。

広い影響力または専門性を持つ人は断定することで価値を発揮できる

さて、断定的な言いぶりがどんな人に必要なのか、ということを理解するために、それがどういった効果を発揮するか、色々な言い方ができるものの、私は「相手が抱えている何らかの問題に対して、その不確実性を下げる効果」があると考えています。


たとえば、あなたが今日の夕食としてカレーを食べたいと思っていて、Googleマップで「カレー」と調べたときに、その検索結果として、自分の家から同じぐらいの距離のところに、3件のカレー屋があったとしましょう。このとき、ある店の口コミに「〇〇駅周辺のカレー屋なら、ここが最強。全部食べましたが、これ一択です。店の雰囲気も最高。」と書いてあったとします。これを見たあなたは、席の配置やメニューなど、色々な情報を調べた上で、複数要素を比較する苦労から解放され、即時にその店で夕食を取ることを決められるでしょう。


どのカレー屋に行こうか迷う人


このように言い切り表現には、相手が抱えている問題に対して、その問題の解の範囲を絞ってあげて(あるいは解そのものを与えてあげて)、解決に貢献する効果があります。
それを踏まえ、断定的な表現をすることが、自身が高い価値を発揮することにつながる度合いが高い人は、次の2類型であると考えています。

  1. 複数の分野にまたがる問題解決ができるような、汎用性の高い問題解決能力を持っていて、複数の部下または近接部門のメンバーに対して、直接的または間接的で広い範囲の影響を発揮するリーダー / マネージャーのような立場の人

  2. ある特定の分野に関する問題解決ができるような、深い専門性を持っていて、その分野の問題解決をリードする立場の人

1については、皆さんが普段目にするタイプの「断言」する人たちであり、経営者・部長のような、いわゆるリーダー・マネージャーは、現実世界を可能な限り正確に見たときに、「Aという可能性とBという可能性の両方がある」というような場面で、「Aを選ぶ」ことを決定して、自身が指揮系統を持つ人たちに、断定的に伝えることを職責として求められます。

専門家による断定と情報量

2については、エンジニア・弁護士・会計士・税理士・研究者・宅建士……etcのような専門家が該当します。もしかするとあなたは、直感的にはこれらの専門家的な立場の人々は、あまりむやみやたらと断定的なことを言わない印象をお持ちかもしれません。
しかし考えてみてください。皆さんが税理士の方に、「この支払いって、どのように計上すればいいですかね?減価償却すべきでしょうか?」と聞いたとして、「うーん、しても良いかもしれないし、しない方がいいかもしれませんね。お任せします。」と返ってきたら、その方は職責を放棄しているように感じると思います。
このような場面において、ある分野の専門家は、情報学的な情報量の文脈で説明するなら、次のような情報提供を求められています。

  • ①聞き手のあなたは、専門家に聞くまで「AかBどちらが正しいか」という問題について、Aが正しい確率とBが正しい確率について、両方がゼロでないという見通しを持っている

  • ②聞き手は、専門家の回答を聞いて、AまたはBどちらが正しいかという見通しについて、片方の確率がゼロで、もう片方の確率が1であるという見通しを持てるようになる

このとき、①において、聞き手が思うAが正しい確率を、$${P_{before}(A)}$$と置きます。(二者択一ですので、Bが正しい確率は、$${1-P_{before}(A)}$$です。)
そして、②において、仮にAが正しいと断定でき、Bが正しい確率がゼロと言える状態になったとします。
このとき、①と②であなたが持つ情報量は、平均情報量(エントロピー)という概念を使って、以下のように記述できます。($${P_{before}(A) = 1/2}$$である場合を仮定して、実際の値を算出したものを、箇条書きのインデントに記載します。)

  • ①$${-P_{before}(A)log(P_{before}(A))-(1-P_{before}(A))log(1-P_{before}(A))}$$

    • = 1

  • ②$${-log(P_{before}(A))}$$

    • = 2

細かいことは省きますが、この場面において、①式の最大値は、1であり、②式の最小値は1です。よって、
①の値 ≤ ②の値(等号成立は、 $${P_{before}(A) = 1}$$ の場合)となります。
このとき、専門家が提供した情報量がどれだけ多いのかは、②式と①式の値の差分を見れば分かるわけです。
今回は2者択一という問題を考えましたが、より選択肢が多いケースでは、専門家が選択肢を1つに絞り切れる場合について、①と②の情報量の差分が、より大きくなります。

さて、色々とややこしい数式っぽいものを記載しましたが、専門家は、その専門性を持つ領域について、一般の方がどの選択肢が正しいか分からない(各選択肢が正しい確率が、ゼロでない選択肢がたくさん存在する)場面において、情報を提供することによってその選択肢を絞るという価値を発揮することができます。
そして発揮される価値の定量的な把握は、聞き手が情報を聞く前に持つ各選択肢が正しい確率に基づいてできるというわけです。

もっと普通の言葉で言うと、専門家は、その分野に詳しくない人に対してほど、その分野の情報を断定的に与えることによって発揮できる価値の大きさが増大するということです。
ここでは、情報学的な情報量に基づいて専門家の価値発揮を考えましたが、直感的にもたしかに、自分の専門性が薄い領域に対してほど、専門家が意見をくれる価値が高いと考える方は多いのではないでしょうか。

結局、すべての人が断定しなければ仕事で価値発揮することはできない

ここまで、広く多くの人に影響を与える立場の人と、特定の領域に深い専門性を持つ人が、断定的な表現をすることによる価値発揮を特にできると述べました。


別の言い方をすると、あなたがリーダー・マネージャーであって、その管轄する人々の議論をまとめあげて決定する立場にある場合や、あなたが専門家の場合であって、その分野の議論をリードすることを求められている場合に、その議論について断定的なことを言えない場合、それは高い価値発揮ができていないということです。


そして、1の広い範囲に影響を与えるリーダー・マネージャーと、2の狭い範囲で深い専門性を持つ専門家の違いは、主には、解くことを期待される問題の性質の違いと、その性質からもたらされる問題解決のためのアプローチの違いにあると考えています。
1の立場にある人の場合、本質的に不確実性が高く、どれだけその問題解決に必要な知識・経験を増やしたとしても、その問題の解となりうる複数の選択肢に対して、確実に他の選択肢が正しい確率をゼロにはできないタイプの問題を解決することを求められる傾向があります。このタイプの問題解決においては、正しくない選択肢に対して、たとえば専門家に協力してもらうような手法によって、その選択肢が正しいと見通す確率を下げていくアプローチ(情報収集)だけでなく、最終的にはリスクテイクが求められます。
このリスクテイクこそが断定であり、リーダーやマネージャーは、本当は他の選択肢が正しい確率がゼロでない場合においても、たとえば他の選択肢の確率がゼロであるかのように発言をすることによって、組織の方向づけをして、組織内のリソースを適切な分野に集中させるという価値発揮をします。


一方で、2の立場にある専門家の場合には、主に正しくない選択肢が正しいとみなされる確率をゼロに近づけることができる種類の問題に取り組みます。そしてそのような問題の性質ゆえに、その専門家が持つ専門性を研ぎ澄ませていくことが、問題解決に対する主要なアプローチになります。


専門家たち


さて、両者が取り組む問題の性質の違いはあれど、「断定」することは結局のところ、すべての仕事において求められることです。あなたは、「いやいや、私は別にリーダーとかマネージャーではないし、何かの分野に深い専門性を持っているわけでもないですよ」と思ったかもしれません。
しかし私は、この能力の必要性について、そういった立場であるかどうかは究極的には関係ないと考えています。
たとえば一般に広く多くの人ができるとされているコンビニの店員(*1)という仕事のことを考えてみます。もしあなたがコンビニに行って、「ここでは切手を売っていますか?」と質問して、店員の方が「売っているかもしれないし、売っていないかもしれない。どう考えるかはあなた次第です」というようなことを言ってきたらどう思うでしょうか。「いやいやさすがに、仕事してくれよ」と思いませんか?


つまるところ、現実の問題解決のために仕事をするということには、自分が職責を負っている範囲に関して、何かを判断をして(決めて)、相手との情報の差を埋めることが必ず含まれ、その職責の広さや深さは異なれど、全ての人が自分の職責の範囲の判断において、「断言」しなければならないということです。


注釈
*1:ここでは、高校生〜高齢者までの広い年齢の様々なバックグラウンドの人が、アルバイトの選択肢として考えることができるという意味で、あくまでも一般論としてコンビニの店員の仕事を例として言及していて、特段「誰でもできるから価値が低い」というようなネガティブな意味合いを込めていません。

まとめと発展

さて、この記事の中で、「断言」「断定的」という言葉を何回使ったでしょうか?
同じ表現を何度も使ってしまうのは、一般的に拙い文章であるとされていますから、普段はそうしないように気をつけているのですが、数えてみたところ、なんと28回でした。ということで、大変拙い文章でありましたが、ここまでお読みいただきありがとうございました。
最後にまとめます。

  • 情報学的な情報量という概念を用いて、断定することの価値を定量的に表現できる

  • 断定することは仕事そのものであり、すべての人にそれが求められる

  • 広い範囲の問題解決を行う人と、狭く深い範囲の問題解決を行う人とでは、解決対象とする問題の性質とそれを解くときのアプローチが異なる

    • 前者では、本質的に解が特定のものに定まり切らない問題に対して、たとえばリスクテイクすることによって組織を方向づけるが求められることがある

    • 後者では、専門性を尖らせることによって、解の存在範囲を狭め、正しくない選択肢が正しいとみなされる確率を限りなくゼロに近づけるようなアプローチが求められる

今回は書ききれませんでしたが、今後の記事では、以下のようなトピックについても書いてみたいと思います。

  • アカデミックな仕事に携わる立場の方と断定

  • プロダクト開発と断定

それでは皆さん、良いNoteライフをお送りください。

参考:文章全体に対する注記

情報量に関する前提

本記事では、断定的な表現は情報量が多いという主張をしてきました。
しかし、本記事内での主張は、文書内で明示していない次の2つの事項を暗黙的前提としています。

  1. 断定的な表現が、聞き手が持つ「事象の予測不可能性」をより下げる方向の情報を提供していること(つまり、事象の発生確率が、その情報を知る前には非常に低かったが、断定的な表現によってその確率が高いことが明らかにされる場合)

  2. その表現の中身が、正確で事実に基づいていること

断定的表現の聞き手が事前に考えるある事象の発生確率に対し、その発生確率が断定的表現によって実際には事前の想定よりも高いことが分かる場合のみ、「断定的な表現は情報量が多い」と言えます。
さらに、もし断定的な表現が誤った情報や不正確なデータに基づいている場合、実際には誤解を招くか、無価値、あるいは有害な情報を提供することになります。このような場合、断定的な表現の情報量が有用であるとは限りません。
上記の前提を所与のものとする場合に、断定的な表現は高い情報量を持つと言えます。

コミュニケーションの文脈に関する補足

断定的な表現が有用であるという主張は、危機的状況や迅速な意思決定が求められるビジネス環境で成り立ちます。しかし、学術的な討論や探究的な議論の場面では、より開かれた、探索的な言説が望まれることがあります。

この記事が気に入ったらサポートをしてみませんか?