最小二乗に関する3぀の蚘事確率論に関する教育プログラム

1幎半前、私は「指の数孊最小二乗法」ずいう蚘事を公開したした。これは、特にフクロりを描くこずを提案したずいう事実から成り立っおいたす。 さお、フクロりなので、もう䞀床説明する必芁がありたす。 1週間埌、このテヌマに぀いお正確に、地質孊の孊生にいく぀かの講矩を開始したす。 私はこの機䌚を利甚しお、ここで適合した䞻芁な点をドラフトずしお提瀺したす。 私の䞻な目暙は、おいしい健康的な食べ物に関する本から既補のレシピを提䟛するこずではなく、数孊の異なるセクション間の接続が最も興味深いので、それがそうである理由ず察応するセクションに他に䜕があるかを説明するこずです



珟時点では、次のようにテキストを分割する぀もりです。





最尀法の原理を介しお、最小二乗法を少し暪に移動したす。これには、確率論の方向性が最小限で枈みたす。 このテキストは、地質孊郚の3幎目のために蚭蚈されおいたす。぀たり、関係する機噚の芳点から適切な熱意を持った興味のある高校生はそれを理解できるはずです。



理論家はどのくらい健党ですか、たたは進化論を信じおいたすか



ある日、進化論を信じるかどうか尋ねられたした。 今すぐ䞀時停止し、どのように答えるかを考えおください。







個人的に、私は驚きたした、私はそれが信じられるず思うず答えたした、そしお、信仰の問題はここで党く生じたせん。 科孊理論は信仰ずはほずんど関係ありたせん。 芁するに、理論は私たちの呚りの䞖界のモデルを構築するだけであり、それを信じる必芁はありたせん。 さらに、 ポッパヌの基準では、反論できる科孊的理論が必芁です。 たた、健党な理論には、たず第䞀に予枬力が必芁です。 たずえば、䜜物自䜓が蟲薬を生産するように䜜物を遺䌝子組み換えした堎合、䜜物に耐性のある昆虫が珟れるのは論理的です。 しかし、通垞の怍物を遺䌝子組み換え怍物ず䞊べお栜培するこずにより、このプロセスが遅くなる可胜性はそれほど明癜ではありたせん。 進化論に基づいお、察応するシミュレヌションがそのような予枬を行い 、 確認されたようです。



そしお、最小二乗はそれず䜕の関係がありたすか


前に述べたように、最尀法を䜿甚しお最小二乗法に進みたす。 䟋で説明したしょう。 ペンギンの成長に関するデヌタに関心があるず仮定したすが、これらの矎しい鳥のほんの䞀郚しか枬定できたせん。 成長分垃モデルをタスクに導入するこずは非垞に論理的です-ほずんどの堎合、それは正垞です。 正芏分垃は、平均倀ず暙準偏差の2぀のパラメヌタヌによっお特城付けられたす。 パラメヌタヌの固定倀ごずに、䜜成した枬定倀が正確に生成される確率を蚈算できたす。 さらに、パラメヌタヌを倉化させるこずにより、確率を最倧化するパラメヌタヌを芋぀けたす。



したがっお、最尀法で䜜業するには、確率論の芳点から操䜜する必芁がありたす。 少し䞋の、指で、確率ず尀床の抂念を定矩したすが、最初に別の偎面に焊点を圓おたいず思いたす。 驚くべきこずに、「確率論」ずいうフレヌズの䞭で「理論」ずいう蚀葉を考えおいる人はほずんどいたせん。



孊習理論ずは䜕ですか


確率掚定の起源、意味、範囲に関しおは、100幎以䞊にわたっお激しい議論が続いおいたす。 䟋えば、 ブルヌノ・デ・フィネッティは、確率は䜕かが起こる確率の䞻芳的分析に過ぎず、この確率は心の倖には存圚しないず述べたした。 これは、起こっおいるこずに賭ける人の意欲です。 この意芋は、同じむベントが䜕床も繰り返される可胜性があるず想定されおいる特定の結果の確率に関する叀兞/フリヌベントの芋解ず正反察であり、特定の結果の「確率」は、繰り返されるテスト䞭に特定の結果が萜ちる頻床に関連しおいたす。 䞻芳䞻矩者ず熱狂䞻矩者に加えお、確率は芳枬者の自信の皋床の説明ではなく、宇宙の本圓の偎面であるず䞻匵する客芳䞻矩者もいたす。



実際のずころ、3぀の科孊孊校はすべお、コルモゎロフの公理に基づいお同じ装眮を䜿甚しおいたす。 コルモゎロフの公理に基づいお構築された、確率論を支持しお、䞻芳䞻矩的な芳点から間接的な議論をしたしょう。 公理自䜓は少し埌で説明したすが、最初は次のワヌルドカップに賭けるブックメヌカヌがあるず仮定したす。 2぀のむベントがありたす。a=りルグアむのチヌムがチャンピオンになり、b =ドむツのチヌムがチャンピオンになりたす。 ブックメヌカヌは、りルグアむのチヌムが勝぀チャンスを40、ドむツのチヌムが勝぀チャンスを30ず芋積もっおいたす。 明らかに、ドむツずりルグアむの䞡方が同時に勝぀こずはできないため、a∧bのチャンスはれロです。 同時に、ブックメヌカヌは、りルグアむたたはドむツアルれンチンたたはオヌストラリアではないが勝぀確率は80であるず考えおいたす。 次の圢匏で曞きたしょう。







ブックメヌカヌが、むベントaに察する自信の床合いが0.4、぀たりPa = 0.4であるず䞻匵する堎合、プレむダヌはブックメヌカヌの自信の皋床に合ったベット額を賭けるかどうかを遞択できたす。 これは、プレヌダヌがブックメヌカヌの6ルヌブルに察しお4ルヌブルをベットするこずで、むベントが発生するこずに賭けるこずができるこずを意味したす。 たたは、プレヌダヌは、むベントが起こらないブックメヌカヌの4ルヌブルの代わりに6ルヌブルを賭けるこずができたす。



ブックメヌカヌの信頌床が䞖界の状態を正確に反映しおいない堎合、長期的には信念がより正確なプレむダヌにお金を倱うずいう事実を圓おにするこずができたす。 さらに、この特定の䟋では、プレヌダヌはブックメヌカヌが垞にお金を倱うずいう戊略を持っおいたす。 それを説明したしょう







プレヌダヌは3回ベットし、チャンピオンシップの結果がどうであれ、垞に勝ちたす。 優勝賞金の怜蚎には、原則ずしおりルグアむずドむツのどちらがチャンピオンシップのお気に入りかは含たれたせん。ブックメヌカヌの損倱は保蚌されおいたす この状況は、ブックメヌカヌがコルモゎロフの第3公理に違反する確率論の基瀎に導かれおいないずいう事実によっお導かれたした。







テキスト圢匏では、次のようになりたす。





1931幎、デフィネッティは非垞に匷力な声明を発衚したした。

ブックメヌカヌが確率論の公理に違反する倚くの自信に導かれおいる堎合、各ベットでブックメヌカヌの損倱プレむダヌの勝利を保蚌するようなプレむダヌベットの組み合わせがありたす。



確率の公理は、䞀郚の゚ヌゞェントが保持できる確率的信念のセットを制限するものず芋なすこずができたす。 ブックメヌカヌのコルモゎロフの公理に埓うこずは、圌が勝぀こずを意味するものではないこずに泚意しおくださいコミッションの問題は別にしたしょうが、埓わない堎合、圌は負けるこずが保蚌されたす。 確率の適甚を支持する他の議論が提唱されおいるこずに泚意しおください。 しかし、確率論に基づいた掚論システムの実際的な成功が、倚くの芋解の修正を匕き起こした魅力的なむンセンティブであるこずが刀明したした。



それで、Theorverが理にかなっおいる理由のベヌルを少し開きたしたが、どのようなオブゞェクトを操䜜したすか 理論党䜓は3぀の公理のみに基づいおいたす。 3぀すべおには、いく぀かのマゞック関数Pが関係しおいたす。 さらに、これらの公理を芋るず、シェむプ゚リア関数が非垞に思い出されたす。 面積が確率を決定するように機胜するかどうかを確認しおみたしょう。



「むベント」ずいう蚀葉を「単䜍正方圢のサブセット」ず定矩したす。 「むベントの確率」ずいう蚀葉を「察応するサブセットの領域」ず定矩したす。 倧たかに蚀えば、倧きな段ボヌルのタヌゲットがあり、目を閉じおそれを撃ちたす。 特定のセットに匟䞞が萜ちる可胜性は、セットの面積に盎接比䟋したす。 この堎合の信頌できるむベントは、正方圢党䜓であり、たずえば正方圢の任意のポむントなど、明らかに停です。 確率の定矩から、完党にポむントに到達するこずは䞍可胜であるこずがわかりたす私たちの匟䞞は重芁なポむントです。 私は本圓に絵が奜きで、倚くの絵を描きたす。理論家も䟋倖ではありたせん 3぀の公理すべおを説明したしょう。







したがっお、最初の公理は満たされたす。面積は負ではなく、単䜍を超えるこずはできたせん。 信頌できるむベントは正方圢党䜓であり、意図的に誀ったむベントはれロ゚リアのセットです。 そしお、それは遞蚀ず完党に機胜したす



䟋による最倧の信頌性



䟋1コむンフリップ


コむントスの最も単玔な䟋、別名ベルヌヌむのスキヌムを芋おみたしょう。 N回の実隓が行われ、それぞれ2぀のむベント「成功」たたは「倱敗」が発生する可胜性がありたす。1぀は確率pで、もう1぀は確率1-pです。 私たちのタスクは、これらのn回の実隓で正確にk回成功する確率を芋぀けるこずです。 この確率により、ベルヌヌむの公匏が埗られたす。







通垞のコむン p = 0.5 を10回投げ n = 10 、テヌルが䜕回萜ずされるかを考えたす







確率密床のグラフは次のずおりです。







したがっお、「成功」の開始の確率0.5を修正し、実隓の数10も修正する堎合、「成功」の可胜な数は0〜10の任意の敎数になりたすが、これらの結果は等しくありたせん。 5぀の「成功」を取埗するこずは、1぀ではないよりもはるかに高い可胜性があるこずは明らかです。 たずえば、7぀の頭を数える確率は玄12です。



次に、反察偎から同じタスクを芋おみたしょう。 本圓のコむンはありたすが、先隓的な確率「成功」/「倱敗」の分垃はわかりたせん。 ただし、10回投げお「成功」の数を数えるこずができたす。 たずえば、7぀のテヌルがありたす。 これはどのようにpを評䟡するのに圹立ちたすか



ベルヌヌむの公匏でn = 10ずk = 7を修正し、 pに自由なパラメヌタヌを残しおみたす。







次に、ベルヌヌむの匏は、掚定されたパラメヌタヌの尀床ずしお解釈できたすこの堎合はp 。 関数の文字を倉曎したしたが、今ではLです 英語のように。 ぀たり、尀床は、パラメヌタヌの特定の倀に察しお芳枬デヌタ10回の実隓から7回の尟を生成する確率です。



たずえば、バランスの取れたコむン p = 0.5の可胜性は、10トスの7぀のテヌルがドロップされた堎合、玄12です。 関数Lをプロットできたす







そのため、私たちが持っおいる芳枬倀を取埗する可胜性を最倧化するパラメヌタヌの倀を探しおいたす。 この特定のケヌスでは、1぀の倉数の関数があり、その最倧倀を探しおいたす。 怜玢を簡単にするために、 Lではなく、 Lの最倧倀を探したす。 察数は厳密に単調な関数であるため、䞀方ず他方を最倧化するこずはたったく同じこずです。 そしお、察数は補品を区別するのにはるかに䟿利な量に分割したす。 したがっお、この関数の最倧倀を探しおいたす。







これを行うには、その導関数をれロず同等にしたす。







log x = 1 / xの導関数は次のようになりたす。







぀たり、最倧尀床玄27に到達したす。







念のため、2次導関数を蚈算したす。







p = 0.7では負であるため、この点は実際にはLの最倧倀です。







そしお、ここにp = 0.7のベルヌヌむスキヌムの確率密床がありたす







䟋2ADC


枬定する特定の䞀定の物理量があるこずを想像しおみたしょう。定芏を䜿った長さでも、電圧蚈を䜿った電圧でも。 どんな枬定でもこの量の近䌌倀が埗られたすが、量自䜓は瀺されたせん。 ここで説明する方法は、18䞖玀の終わりに倩䜓の軌道を枬定したガりスによっお開発されたした。



たずえば、バッテリヌの電圧をN回枬定するず、N個の異なる枬定倀が埗られたす。 どっちがいい それだけです したがっお、N個の数量Ujがありたす。







各枬定倀Ujが理想倀ずガりスノむズに等しく、ガりスベルの䜍眮ずその「幅」ずいう2぀のパラメヌタによっお特城付けられるず仮定したす。 これは確率密床がどのように芋えるかです







぀たり、N個のUjの倀を䜿甚しお、尀床倀を最倧化するこのようなパラメヌタヌUを芋぀けるこずがタスクです。 信頌性私はすぐにそれから察数を取りたすは次のように曞くこずができたす







さお、すべおが以前ずたったく同じで、探しおいるパラメヌタヌに関しお偏埮分をれロに等しくしたす







未知の量Uの最も可胜性の高い掚定倀は、すべおの枬定倀の平均ずしお芋぀けるこずができたす。







さお、最も可胜性の高いシグマパラメヌタヌは通垞の暙準偏差です。









回答のすべおの枬定倀の単玔な平均を取埗するのは面倒な䟡倀がありたしたか 私の奜みにずっお、それは䟡倀がありたした。 ずころで、枬定倀の粟床を高めるために䞀定倀の耇数の枬定倀を平均化するこずは暙準的な方法です。 たずえば、 ADC平均化 。 ちなみに、このガりスノむズは必芁ないので、ノむズがバむアスされおいなければ十分です。



䟋3、そしお再び1次元


䌚話を続けたす。同じ䟋を取り䞊げたすが、少し耇雑になりたす。 特定の抵抗の抵抗倀を枬定したい。 実隓宀の電源の助けを借りお、特定の暙準数のアンペアを通過させ、これに必芁な電圧を枬定するこずができたす。 ぀たり、抵抗゚バリュ゚ヌタヌの入力にN組の数倀Ij、Ujがありたす。







チャヌトにこれらのポむントを描画したす。 オヌムの法則は、青い線の募配を探しおいるこずを瀺しおいたす。







パラメヌタヌRの尀床の匏を蚘述したす。







たた、察応する偏導関数をれロに等しくしたす。







次に、もっずもらしい抵抗Rは次の匏で求められたす。







この結果は、すでにすべおの枬定倀の単玔な平均よりもやや䞍明瞭です。 1アンペアの領域で100回の枬定を行い、1キロアンペアの領域で1回の枬定を行った堎合、以前の100回の枬定は実際には結果に圱響しないこずに泚意しおください。 この事実を思い出したしょう。次の蚘事で圹立぀でしょう。



4番目の䟋最小二乗に戻る



確かに、最埌の2぀の䟋では、尀床察数を最倧化するこずは、掚定誀差の二乗和を最小化するこずず同じであるこずにすでに気付いおいたす。 別の䟋を芋おみたしょう。 基準重量を䜿甚しおスチヌルダヌドのキャリブレヌションを行いたす。 質量xjのN個の参照荷重があり、それらをスチヌルダヌドに掛けお、スプリングの長さを枬定するず、N個のスプリング長yjが埗られたす。







フックの法則によれば、バネの䌞びは加えられた力に盎線的に䟝存し、この力には商品の重量ずバネ自䜓の重量が含たれたす。 バネの剛性をパラメヌタaずしたすが 、自重でのバネの匵力はbパラメヌタです。 次に、この方法で枬定の尀床の匏を蚘述できたす以前ず同様、ガりス枬定ノむズの仮説の䞋で。







Lの尀床最倧化は、掚定誀差の二乗和を最小化するこずず同等です。぀たり、次のように定矩される関数Sの最小倀を探すこずができたす。







蚀い換えるず、緑のセグメントの長さの平方和を最小化する盎線を探しおいたす。







さお、驚くこずではありたせんが、偏導関数をれロずみなしたす。







2぀の未知数を持぀2぀の線圢方皋匏のシステムを取埗したす。







孊校の7幎生を思い出し、解決策を曞きたす。







おわりに



最小二乗法は、確率密床がガりスである堎合の尀床を最倧化する特別な堎合です。 密床がたったくではないガりスの堎合、最小二乗は最倧尀床掚定MLEずは異なる掚定を䞎えたす。 ちなみに、ガりスはか぀お、分垃は圹割を果たさず、テストの独立性のみが重芁であるず仮定しおいたした。



この蚘事からわかるように、森の奥に行くほど、この問題に察するより厄介な分析゜リュヌションになりたす。 ええ、そうです、18䞖玀ではありたせん。コンピュヌタヌがありたす。 次回は、OLSの問題に察する幟䜕孊的アプロヌチずプログラムアプロヌチを芋おいきたす。



All Articles