データサイエンスと機械学習

8月 20, 2021
admin

予測モデルの精度を高めるには、機械学習の技術が必要です。 取り組むビジネス問題の性質により、データの種類や量に応じた様々なアプローチがある。 このセクションでは、機械学習のカテゴリについて説明します。

教師あり学習

教師あり学習は通常、確立されたデータ セットとそのデータの分類方法に関する一定の理解から開始されます。 教師あり学習は、分析プロセスに適用できるデータ内のパターンを見つけることを目的としています。 このデータは、データの意味を定義するラベル付けされた特徴を持っている。 たとえば、画像と記述された説明に基づいて、何百万もの動物を区別する機械学習アプリケーションを作成できます。

教師なし学習

教師なし学習は、問題が大量のラベルなしデータを必要とする場合に使用します。 たとえば、Twitter、Instagram、Snapchat などのソーシャルメディア アプリケーションには、大量のラベルのないデータがあります。 このデータの背後にある意味を理解するには、発見したパターンやクラスターに基づいてデータを分類するアルゴリズムが必要です。

教師なし学習では、反復プロセスを行い、人間の介入なしにデータを分析します。 これは、電子メールのスパムを検出する技術で使用されています。 正規のメールとスパムメールにはあまりにも多くの変数があるため、アナリストが迷惑なバルクメールにタグ付けすることはできません。 その代わりに、クラスタリングと関連付けに基づく機械学習分類法を適用して、不要な電子メールを識別します。

強化学習

強化学習は、行動学習モデルの 1 つです。 アルゴリズムは、データ分析からフィードバックを受け、ユーザーを最良の結果に導きます。 強化学習は、システムがサンプルデータセットで訓練されないので、他のタイプの教師あり学習と異なります。 むしろ、システムは試行錯誤を通じて学習する。 したがって、一連の成功した決定は、手元の問題を最もよく解決するため、プロセスが強化されることになります。

Deep Learning

Deep Learning は、機械学習の特定の方法で、連続した層のニューラル ネットワークを取り入れて、反復方法でデータから学習するものです。 ディープ ラーニングは、構造化されていないデータからパターンを学習しようとする場合に特に有用です。

ディープ ラーニングの複雑なニューラルネットワークは、人間の脳の働きをエミュレートするように設計されているので、コンピュータを訓練して、定義性の低い抽象概念や問題を処理できるようにすることが可能です。 平均的な 5 歳の子どもは、先生の顔と横断歩道の警備員の顔の違いを簡単に認識できます。 それに対して、コンピュータは誰が誰であるかを把握するために多くの作業をしなければならない。 ニューラルネットワークと深層学習は、画像認識、音声、コンピュータビジョンのアプリケーションでよく使われている

コメントを残す

メールアドレスが公開されることはありません。