データから分類を学習する問題において,ある点 の分類を,学習データの中でその点に最も近い 個の点を選び,それらの中で一番多いクラスに分類するアルゴリズムである. -nearest neighbor classificationあるいは最近接法などと,を付けて記されることが多い. 端的になぞらえると「各自が自分に最も近い人の意見を集めて,その中の多数決で物事を決めるアルゴリズム」である.
分類のための学習機械(入力が属性ベクトル,出力が分類結果のクラスであり,データからパラメータを学習することによって挙動を調整できるような関数)としてのパラメータは,各点のクラスを決める際に参考にする点の数 ,および点と点の間の距離を決める関数 の2つのみである.
Rでは class というパッケージの中に knn() という関数が実装されていて,利用できる.