💃🏽 😨 👩🏼‍💼 8年生で数学を学んだすべての人のための機械学習 🏂🏻 🎻 ➕

こんにちは、Habr！カイル・ガラティンによる記事「8年生で数学を学んだ人のための機械学習」の翻訳をお見せします。

機械学習

私は通常、人工知能は2つの方法のいずれかで説明できることに気づきます：さまざまなメディアのますますセンセーショナルなプリズムを通して、または過剰な言語および地域固有の用語が染み込んだ密な科学文献を通して。

これらの両極端の間に、私は、文学がもう少し活発になるべきだと思う、あまり公表されていない領域があります。愚かなソフィアロボットのような最新ニュースは、人工知能を誇大宣伝し、人間の心のように見えるかもしれませんが、実際にはソフィアはAOLインスタントメッセンジャーのSmarterChildほど賢くはありません。

科学文献はさらに悪化する可能性があり、最も洗練された研究者でさえ、無意味な疑似知的ゴミのいくつかの段落の後、目を閉じることを余儀なくされます。 AIを適切に評価するには、人々は一般にAIが実際に何であるかを理解する必要があります。そして、人工知能の基本を理解するために必要なのは、少し高校の数学だけです。

私は過度に単純化する傾向があるかもしれません-そして、数学、データ科学、工学のすべての同僚に私の説明を容認するように頼みます-時々これは芸術的な科学が必要とするものです。

人工知能と機械学習の基礎

典型的な古典的な人工知能は、人間の知能を模倣するものすべてです。ビデオゲームボットから、 Deepmind Alphagoなどの複雑なプラットフォームまで、あらゆるものを使用できます。

人工知能;機械学習;深層学習

ディープラーニングを無視-このコンテキストでは、機械学習と同じです。画像：地理空間の世界

機械学習は人工知能のサブセットです。これにより、マシンは事前定義された一連のルールに基づいて動作する代わりに、実際のデータから「学習」できます。

しかし、学習とはどういう意味ですか？見た目ほど未来的ではないかもしれません。

私のお気に入りの説明：機械学習はただ $y = mx + b$ ひび割れ。ブラックミラーのようなものを見た場合、現代の人工知能を意識的な存在、つまり困難な決定を考え、感じ、そして決定するものとして想像するのは非常に簡単です。これはメディアでさらに一般的であり、AIは順次擬人化され、ターミネーターのスカイネットまたは映画「マトリックス」と比較されます。

実際、これはまったくそうではありません。現在の状態では、人工知能は単なる数学です。複雑な数学である場合もあれば、コンピューターサイエンス、統計などの分野で深い知識が必要な場合もあります。しかし、結局のところ、最新のAIはその中心にあるのは単なる数学関数です。

あなたが数学関数を覚えていないか、使用しないので、あなたが数学関数と友達でなくても心配しないでください。要点を理解するには、いくつかの簡単なことだけを覚えておく必要があります。入力があります（ $x$ ）そして出口があります（ $y$ ）、および関数は、入力と出力の間で発生するものです-それらの間の接続。

コンピューターに受信トレイを表示させることができます（ $x$ ）および発信（ $y$ ）データを収集し、それらを結び付けるものを見つけます。

超単純化された人工知能の例は、次のように表される関数です。 $y = mx + b$ 。もう知ってる $x$ そして $y$ （下の表から）; 見つける必要があります $m$ そして $b$ 間の関係が何であるかを理解する $x$ そして $y$ 。

$x$ （入力）	$y$ （終了）
1	2
2	3
3	4
4	5

表：カイル・ガラティン

このテンプレートを取得するには $y$ から $x$ 掛ける必要がある $x$ 1に（ $m$ ）と1を追加（ $b$ ）だから機能が出てきます $y = 1x + 1$ 。

いいね！私たちはそれを決定しました $m = 1$ そして $b = 1$ 。（上の表から）いくつかのデータを取得し、それらを説明する関数を作成しました。本質的に、これは機械学習です。ここで、取得した関数を使用して、等しいものを仮定できます $y$ 他の入力データ用 $x$ 。

興味深い部分は、どの関数がデータを最も適切に説明するかを見つけるためにマシンをどのように教えるかですが、それが完了したら、通常は何らかの形が得られます $y = mx + b$ 。この関数を取得したら、グラフにプロットすることもできます。

一次方程式

Tecmathビデオのスクリーンショット

関数の詳細な説明については、 Math Is Funには直感的でシンプルなサイトがあります（名前があなたにとって潜在的な危険であり、そのサイトは2000年代初期にWebデザイナーが逃げたように見えます）。

人々は数えられないだろう、車はできるだろう

明らかに $y = 1x + 1$ 非常に簡単な例です。機械学習が存在する唯一の理由は、人々が何百万ものインおよびアウトデータポイントを見て、結果を説明する複雑な機能を考え出すことができないためです。代わりに、これを行うためにコンピューターをトレーニングできます。

いずれにしても、適切な機能を見つけるのに十分なデータが必要です。データポイントが1つしかない場合 $x$ そして $y$ 、私たちも機械も、1つの正確な関数しか予測できませんでした。元の例では、 $x = 1$ そして $y = 2$ 機能は $y = 2x$ 、 $y = x + 1$ 、 $y =（[x + 1] \ cdot 5-9）^ 5 + 1$ または他の多くの。十分なデータがない場合、マシンが検出した機能により、さらに多くのデータに使用しようとすると、多くのエラーが発生する可能性があります。

さらに、実際のデータは必ずしも完璧ではありません。以下の例では、マシンはほとんどのデータに対応するいくつかの機能を特定していますが、線は各ポイントを通過していません。数学クラスのテーブルを使用した前の例とは異なり、現実世界から収集されたデータは予測不可能であり、完全に説明することはできません。

回帰分析

この基本的な例は、提示されたデータを最もよく記述するためにマシンがどのように学習するかを示しています。画像：データサイエンスに向けて

最後に、人々が最後にできないことは、たくさんの変数を見ることです。ただ使っています $x$ そして $y$ しかし、さらに入力変数がある場合はどうでしょうか？もしも $y$ 影響する $x ^ 1$ 、 $x ^ 2$ 、... $x ^ {100}$ 。非常に迅速に、機能はより複雑になります（人にとって）。

現実世界の機械学習と人工知能

実際の例を見てみましょう。私は医薬品の分野で働いているので、腫瘍のサイズに対応する2つの入力変数（半径と周囲、出力）があり、腫瘍が良性か転移性か（潜在的に危険）の癌関連データセットがあるとします一生）。複雑に見えるかもしれませんが、慣れ親しんだ概念を適用するだけです $y = mx + b$ ：

$y$ は診断であり、0（良性）または1（転移性）の場合があります。
$x_1$ -半径。
$x_2$ -境界線。
それぞれ $x$ あなたの知らないことがある $m$ ; それらを呼び出しましょう $something_1$ そして $something_2$ 。
$b$ -不明な定数。

線形方程式は今どのように見えますか？上記の例と大差ない：

診 断 = （ s o m e t h i n g_{1} c d o t 半 径 ） + （ s o m e t h i n g_{2} c d o t 境 界 ） + 不 明

$診断=（something_1 \ cdot半径）+（something_2 \ cdot境界）+不明$

上で説明したように、私たちは人間の能力の範囲を超えて動いています。したがって、データを見て変数で何を掛けるべきかを把握する代わりに、マシンを使用します。彼らは私たちのためにそれを行い、診断の正確な評価を得ます。これが機械学習です！

もちろん、最も詳細な多要素データでさえ理想的ではないため、機械学習モデルもそのようにはなりません。ただし、100％のケースでそれらが正しい必要はありません。ほとんどの場合に適した、可能な限り最高の機能を提供するために必要なだけです。

この作品は、機械学習に入る信じられないほどの数学とコンピューターサイエンスのほんの一部をかじっただけです。しかし、複雑なレベルであっても、概念は同じです。機械学習や人工知能がどれほど印象的または奇妙に見えても、それはすべて、データを最もよく記述するために機械が学習した機能に由来します。

8年生で数学を学んだすべての人のための機械学習

人工知能と機械学習の基礎

人々は数えられないだろう、車はできるだろう

現実世界の機械学習と人工知能

More articles: