【第29回目】の今回は「ベイズ推定」について。ベイズ推定という言葉はご存じですか?これは統計学で用いられる用語で、僕たちが日々思考する中で何気なく日常で使っている知識です。
簡単に言うと「得られた情報を元にして情報を考え直すこと」です。もちろんですが、そんな簡単なモノではありません。しかし情報に溢れる現代では、あなたにとって素晴らしい武器となるはずです。
忙しいという言葉はあまり使いたくありません。が、忙しすぎてX運営が全然できてない。。。とはいえ意味のないポストをしたくないというこだわりが投稿できない日々を続かせてます。
もちろんマストでやるべきことではないのですが、継続することに意味があるので、出来る限りの時間を捻出して運営を継続させていきたいと思います。
少し落ち着くまでは投稿頻度が落ちるかもしれませんが、付き合いのある皆様。出来るだけ温かい目で見守っていただければと思います。今後ともよろしくお願いいたします。
「○○をやり遂げる」
![]()
つだてん @ritz_tyousa
何かに向かって努力している姿はカッコいい。
でも努力する方法が間違ってたら遠回りするし、
もしかしたら目標を達成できないかもしれません。
そんなとき思い出してほしいのが、
【少ない努力で済む方法】
になっていないか。
昔は「何でもヒトに聞くな」…— つだてん (@ritz_tyousa) July 19, 2024
ベイズ推定(Bayesian inference)とは、確率的な手法を用いて、事前情報と新たな観測データを組み合わせて未知の事象やパラメータについて確率的な推定を行う統計的手法です。
この手法は、トーマス・ベイズにちなんで名付けられました。ベイズ推定は、不確実性を考慮して推定を行うため、データが限られている場合や事前知識が不足している場合に有用です。
日常生活で受け取った情報と情報が生まれた背景、経験を組み合わせることで、その情報が正確なのかを測ることができます。つまりベイズ推定を使うことで、情報の真偽を見極める精度を向上させることができるのです。
ベイズ推定では、新しいデータが入手可能な際に、事前情報を更新して推定を改善することも可能です。ただ数式にするとめちゃめちゃ難しいです。もちろん理解力の高い方は数式で考えた方が確率的には高めやすいですが。
なので今回は数字を出来るだけ使わずに考え方を伝えられればと思います。ベイズ推定の手順は以下のようになります。
ここからは「戦争」の報道を例にして話を進めていきます。戦争が起こった時に、メディアの情報は「どの国が戦争を仕掛けたか?」がメインとなります。
この時の情報処理は主となる情報(対象)と、補助となる情報(要因)の2つに分けて考えましょう。まずは対象と要因について事前情報を出していきます。
主となる情報(対象)
補助となる情報(要因)
戦争の場合は過去の情報も重要ですが、現在の流れを正確に測るには「利益」に焦点を当てて、補助となる情報(要因)を出していく事で理解が深まります。
ある程度の要因が出た段階で、どの国が戦争を起こしたか、どの組織が戦争を起こしたかについてグラフとして出します。まずこの段階では自分の感じたままに、適当に示します。
これは「どの国に本当の原因があるのか(事前情報)」のような事前確率、つまり疑いの度合いを分布で示したものを事前分布と言います。そしてグラフの疑いの度合いの事を尤度関数と呼びます。
※尤度(Likelihood)とは、与えられた事象やデータが与えられた仮説(パラメータ値など)のもとで発生する確率です。尤度は既知のデータから得られる情報を表します。
次に事前確率と尤度を組み合わせて、事後確率を計算します。情報を精査していく段階です。例えば「〇国は■国を支配したい」について調べる時は、その背景にある情報を確かめる作業になります。
この情報を確認する作業で注意すべき点は、バイアスを取り除くこと。必ず中立的な視点で一つひとつの情報を確認していきましょう。そして確認した一つひとつの証拠に基づいて、事前分布を更新します。(ベイズ更新)
そして更新した分布を事後確率分布と呼び、この事後確率分布を次の事前分布として活用し、一つずつ確認作業を続けます。
ベイズ推定の主要な目的は、観測データが与えられた下での未知の事象やパラメータの確率を求めること。これが事後確率であり、事前確率と尤度を組み合わせていくことで威力を発揮するのです。
そして最後に正規化定数を用いて、事後確率を正規化します。集めた情報の中でバラつきがあると、学習速度の低下が起こる可能性があり、それを防ぐために正規化を行います。
正規化は、さまざまな分野で用いられる概念で、データや数値をある基準に合わせることを指します。戦争のようなケースでは具体的な値が分からないため、正規化定数は計算することが難しいですが、重要なコトは、
事後確率同士の相対的な大小を評価し、重要な情報を得ること
事後確率が高い事象は、より信頼性の高い情報や尤度によって支持されている可能性が高いことを示します。つまりベイズ推定とは、情報を適切に収集し、情報の信頼性や重要性を考慮して事象の真偽を推定する方法なのです。
「今まで聞こえていたからこれからも聞こえるだろう」
ピエール=シモン・ラプラス
とある日、パリの真昼の鐘の音が聞こえることを考慮した直感的な仮説。これは現代のベイズ統計学の基礎となるもの。
「確率とは、測度論的に定義されたものである」
アンドレイ・コルモゴロフ
「確率とは何ですか?」のコルゴロフ。これが現代の確率論を数学の一分野として確立させた。
確率をコントロールするために多くの人は苦労している。でも苦労の中にこそ、確立を高める何かがあるのではないでしょうか。
このアイデアを活用して、より良い選択を行い、あなたの人生がより良くなることを祈っています。
【第二十九話】無知は恐ろしい
なぜ人材紹介を辞めたのか。それは建設キャリアアップシステムの導入です。このシステムは表向き、技能者が技能・経験に応じて適切に処遇される建設業を目指すというモノ。
これがあると登録されていない作業員が作業できなくなるのです。もちろん不正に働かせている業者も多く存在しているので、素晴らしいとは思います。でも何かしらの理由があって働けないヒトもいる。
そんなヒトからすると職を失う。システムに登録しても結局は上からのピンハネで給料は上がらない。これには外国人労働者を受け入れやすくする意図も含まれています。
街中に外国人が溢れかえっている現代。建築現場も同じコト。これは僕が建設業界にいた頃の話ですが、今はもっと増えているでしょう。果たしてシステムが有効に働くのかは未来にしかわからない。
そんなシステムに抗えるわけも無く、職業紹介は潔く辞めることにしました。
このニュースレターでは常時みなさんからのご意見とご質問を募集してます。
今回は以上です。いかがでしたでしょうか?
無料なので、ぜひ購読してください。
あなたの日常生活の質を向上させる【より良い選択のためのアイデア】がメールで届きます。
それでは次回の投稿でお会いできるのを楽しみにしております。