分類と回帰の違い

2019

分類と回帰は、通常データマイニングで扱われる2つの主要な予測問題です。予測モデリングは、新しいデータを予測するために履歴データを使用してモデルまたは機能を開発する手法です。分類と回帰の大きな違いは、分類によって入力データオブジェクトがいくつかの離散ラベルにマッピングされることです。一方、回帰は入力データオブジェクトを連続実数値にマッピングします。

比較表

比較基準	分類	回帰
基本	オブジェクトのマッピングが事前定義されたクラスに行われるモデルまたは機能の発見。	オブジェクトのマッピングが値にされる工夫されたモデル。
の予測を含みます	離散値	連続値
アルゴリズム	決定木、ロジスティック回帰など	回帰木（ランダムフォレスト）、線形回帰など
予測データの性質	順不同	順序付けられました
計算方法	測定精度	二乗平均平方根誤差の測定

分類の定義

分類とは、データを複数のカテゴリクラスに分類するのに役立つモデル（関数）を見つける、または発見するプロセスです。分類では、問題のグループメンバーシップが識別されます。これは、データがいくつかのパラメータに従って異なるラベルの下に分類されてからラベルがデータに対して予測されることを意味します。

導出モデルは、「ＩＦ − ＴＨＥＮ」規則、決定木またはニューラルネットワークなどの形で示すことができる。 決定木は基本的に、各内部ノードが属性についてのテストを表す木構造に似たフローチャートである。そしてその枝はテストの結果を示しています。分類プロセスでは、データを2つ以上の離散ラベル、つまり2つ以上の互いに素なセットに分割できるという問題に対処します。

いくつかのパラメータに基づいて、ある地域で雨が降る可能性を予測したいとします。それから、2つのラベルrainがあり、雨が降らないで、その下で異なる地域を分類することができます。