機械学習アルゴリズムのトップ10:2021年になぜそれほど重要なのですか?
公開: 2019-06-10目次
機械学習のうさぎの穴を下る
実際のアプリケーション
機械学習アルゴリズムとは何を意味しますか?
機械学習の種類
トップ10の機械学習アルゴリズム
要約
2021では、コンピュータが見ることができるだけでなく、彼らが読んで、自分のアコードを書くことができます。
さて、私たちが実際に住んでいる現代のホラーストーリーを見てみましょう。
たとえば、仕事の30%がまもなく自動化に置き換えられると誰かが言った場合、どのように反応しますか? とんでもないですね。
そして、それは機械学習アルゴリズムと何の関係があるのでしょうか?
ありがたいことに、トンネルの終わりにライトがあります。 それについて説明させてください。
2021年、コンピューターは次のことができるようになりました。
- 声、顔、手書きを認識します。 (CSIスタイル…)
- 写真を自動的にキャプションします。
- 画像の内容を認識し、特定の機能に従って分類する方法を学びます。
- あなたのためにタスクを実行します。 (そして、それらを実行するために必要なアルゴリズムを作成します。)
もちろん、リストは続きます。
私たちは毎日ウェブ検索を行い、ウェブサイトやソーシャルメディアにアクセスしています。 そして、私たちは自分自身に根本的な質問をすることは決してありません:
AIテクノロジーはどこまで進んだのでしょうか?
どうぞ!
テクノロジーの成果は、人類の未来について疑問を投げかけています。
たぶん、これらの事実は私たちにいくつかの洞察を与えるでしょう:
(出典:未来派、 Dezyre )
- 韓国では、 100人の労働者のうち平均4.78人がロボットです。
- エチオピアの従業員の88%は、ロボットに職を失うリスクがあります。
- ニューヨーク市では、絶滅の危機に瀕している従業員は40.7%です。
- 機械学習プログラムを作成するには、 9行のコードが必要です。
- ファーストフードの料理の仕事の97%は機械に置き換えられます。
- 農民の98%は機械で仕事を失うでしょう。
- 機械学習は、製薬業界で年間最大10億ドルを生み出す可能性があります。
- 今後10年間で、機械学習が仕事の25%に取って代わると推定されています。
2021年には、実際に自宅でロボットを所有できるようになりました。
JiboやTapiaと流暢に会話できます。 彼らは理由からソーシャルロボットと呼ばれています。
彼らはあなたの友人や家族の名前、顔、声を覚えています(これはまったく不気味ではありません!)、彼らはあなたの子供をベビーシッターすることができます(そうです!)そしてあなたが家で事故を起こした場合彼らは911に電話しますあなた。 最後の1つは、周りに誰もいないときに特に役立ちます。 しかし、それについては後で説明します。
今日、アルゴリズムは言語を「自分で教える」ことができ、平均的なネイティブの中国語話者の流暢さと同時に、話された英語を書かれた中国語に翻訳することさえできます。 遅かれ早かれ、外国語の勉強は必然的に時代遅れになるでしょう。
そしてこれはどうですか:
私たちのスマートフォンは文字通り私たちをスパイしています…あなたは私が話していることを正確に知っていると確信しています! 想像してみてください–あなたが言及したオフィスランチで(口頭で!)ルシファーを見始めたいと思います。 デスクに戻って、携帯電話でPinterestまたはFacebookを開くと、悪魔自身がいます…(はい、トム・エリスは夢のようですが、それは重要ではありません!)
レコメンデーションシステムは私たちの周りにあります。 「レゴ」を検索すると、飛び出してレゴに分類される関連画像がAIによって認識されていました。 言い換えれば、レゴが人間によってブロックされるため、手動で注釈が付けられていませんでした…
アルゴリズムは、何百万もの画像を見て、これが何であるかを自分自身に教えていました。
グースバンプ!
これらの機能のすべてとそれ以上のものは、すでに企業によって利用されています。
ここでの意味は次のとおりです。
まず、コンピュータはみんな、自分で教えて! 将来のすべてのロボット労働者について考えてください。 彼らは人間の労働者よりもはるかに速くタスクを学び、実行します。
そして第二に-私はあなたが何を考えているか知っています-OMG、人類はとても運命づけられています!
多くの人がこのように反応します。
前世紀の多くの著者は、ロボットが人間を支配する未来について書いています。 人工知能は繁栄しており、ロボットは世界を支配し、人間を食べます。 特異点は近いです。
OK、これは立ち止まるのに良い場所です。
これでシステムからそれが得られたので、実際に何が真実であるかを実際に見てみましょう。
機械学習のうさぎの穴を下る
最初にいくつかのコンテキストが必要です。
15、000年前、世界で最も愛されているゲームの1つが発明されました。 12世紀から14世紀のどこかで、そのゲームはチェスとして知られるようになりました。
これは、(末尾に40個のゼロと1'S)40の可能な結果の電源10を有しています。
2017年、GoogleのAlphaZeroアルゴリズムは、機械学習を使用して、ゲームをプレイして勝つことを自分自身に教えました。
ゲームの導入からアルゴリズムへの導入から、世界で最も強力なチェスエンジンの1つであるStockfishとの最初のゲームに勝つまでのプロセス全体には、次のようなものがありました。
(気を引き締めてください!)
4時間。
痛い!
はい、私たちは機械学習革命の危機に瀕しています。
振り返ってみると、これはこの種の最初の混乱ではありません。 19世紀末から20世紀初頭にかけての産業革命も社会的混乱を引き起こしましたが、最終的には人類と機械は均衡を保ちました。
はい、物事は変化しています、そしてそれは実際には良いことです!
機械学習ソフトウェアは、新鮮な目で問題を調べ、未知の環境をナビゲートする能力を備えています。
ですから、これから見ていくように、それは結局のところホラーストーリーではありません。
技術的な奇跡のようなものです。
今:
なぜ分類がそれほど重要なのですか?
手始めに、定義により、機械学習は何ですか?
基本的に、マシンは、プログラムの作成方法とソリューションの作成方法を自分自身に教えるようにプログラムされています。 機械学習は常に可能な限り最も正確な数値(および必要に応じて予測)を生成します。
まったく異なるさまざまな問題を解決できるテクノロジーを考えてみてください。
そしてそれはそれの美しさです!
システムの主な目的は、を分類することです。 これはコンピュータビジョンとも呼ばれます。 それは区別するためにそれ自身で学びます。 そして、一見単純な分類のタスクに減らすことができる世界のさまざまな問題の数は、絶対に気が遠くなるようなものです。
次の間で分類する機能を想像してみてください。
- 良いチェスと悪いチェスの位置(ゲーム)
- 文法的に正しい文と間違った文(翻訳)
- 空の道路とその上に車または歩行者がいる道路(自動運転車)
- 健康な細胞とがん細胞(医療診断)
そのため、多くの分野の専門家は時代遅れになります。 このようなタスクを実行するコードを作成するのに、専門家である必要はありません。 英語から中国語への同時通訳プログラムを書いた人たちは中国語を一言も話さなかった。
アルゴリズムは、専門家になる方法を自分自身に教えます。
そして、はい、それらについて学び、それらを知ることが重要です…私たちが最初にコンピューターを知るようになった方法。
私たちは今、コンピューターが得意です。 とても良いので、私たちはそれらを擬人化する傾向があります(または多分それは私だけですか?)。
今が自分自身に問いかける時のようです。
最終的にAIや機械学習プログラムで職を失うすべての人々はどうなるでしょうか。
ベーシックインカムと呼ばれる小さなことを聞いたことがありますか?
ここに行きます:
将来的には、市民は彼らが仕事をすることを伴わない収入を得るでしょう。 お金は自動化が提供する非常識な効率とそれから来る節約から来るでしょう。
これか、もう少し現実的なシナリオのどちらかで、多くの新しいタイプの仕事が出現します。 19世紀の終わりには、米国の人口の約50%が農業に従事していました。 現在、強力な機械のおかげで、2%未満が農民であり、それでも人々は雇用されています。
さて、機械学習は何に使用できますか?
実際のアプリケーション
機械学習を使用して、データベースから新しい事実を推測できます。
のは、機械学習が大きな違いを生むだろう領域のいくつかを見てみましょう:
- アシスト運転–目の前の車両に近づくと、車が自動的にブレーキを踏むことができます。 したがって、将来のある時点で、人類は自動車事故の意味をほとんど忘れてしまうでしょう。 自動運転車が近づいています。
- ヘルスケア–医療専門家の効率を高めます。 機械学習の助けを借りて、病気の認識と診断がはるかに簡単かつ正確になります。 たとえば、プログラムは、人間よりも優れた癌組織の画像をスキャンして識別するだけでなく、医療記録の膨大なデータベースに基づいて患者の生存率を計算することもできます。 (ジェレミーハワードと彼のプロジェクトであるEnliticの作品をチェックしてください。素晴らしいです!)
- 薬物の発明–機械学習の助けを借りて、各患者は自分のために特別に設計された治療を受けることができます。
- 農業–農業は、コンピュータービジョンとロボット制御(作物の品質と予測、病気の検出、家畜の福祉、生産)によって自動化されます。
- AIを活用した言語機能–近い将来、AIを使用してリアルタイムの翻訳で口頭でコミュニケーションできるようになります。
機械学習は単なるツールであり、当面は1つのツールであり続けるでしょう。
だから、心配する必要はありません。 座ってリラックスしてください。
機械学習とは何かを見てきましたので、次の質問をしてみましょう。
機械学習アルゴリズムとは何を意味しますか?
したがって、将来の機械学習にとってどれほど重要で有益であるかを確立した後、魔法を実現するアルゴリズムを詳しく見ていきましょう。
機械学習アルゴリズムを説明する優れた方法は、それらを従来のプログラミングと比較することです。
従来のプログラミングでは、プログラマは、開発対象となる分野の専門家とチームで動作します。 タスクが複雑になるほど、コードが長くなり、コードの記述が難しくなります。
機械学習アルゴリズムの動作はまったく異なります。 アルゴリズムは、入力用のデータセットと、出力用のオプションのデータセットを受け取ります。 次に、それ(またはそれら)を分析し、有用な結果が発生するために実行する必要のあるプロセスを計算します。 今日、これは人間のプログラマーのために予約された仕事です。 将来的には、それも変わるでしょう。
機械学習の種類
機械学習アルゴリズムには4つの異なるタイプがあります。
はい、どうぞ:
1.教師あり学習
教師あり学習アルゴリズムの入力データにはラベルが付けられ、出力は既知で正確です。 このクラスのアルゴリズムを使用するには、大量のラベル付きデータが必要になります。 そして、それは必ずしも簡単な作業ではないかもしれません。
教師ありアルゴリズムは、回帰と分類の2つのカテゴリに分類されます。 それぞれが異なるデータセットを調べます。
回帰アルゴリズムは、予測と予測を行うアルゴリズムです。 とりわけ、これらには天気予報、人口増加、平均余命の推定、市場予測が含まれます。
分類アルゴリズムは、診断、個人情報詐欺の検出、顧客維持、およびその名前が示すように、画像分類に使用されます。
2.教師なし学習
入力データにラベルが付いていない場合に発生します。 データをクラスターの構造に編成します。 したがって、入力データはすぐに分析できるようになります。
データにはラベルが付いていないため、結果の精度を評価する方法はありません。 とはいえ、教師なしアルゴリズムが追求するように設計されているのは正確ではありません。 アルゴリズムが作成するクラスターは、プログラムに馴染みがありません。 したがって、アイデアは、データを入力して分析し、クラスターにグループ化することです。
教師ありアルゴリズムと同様に、教師なしのいとこは、次元削減とクラスタリングの2つのカテゴリに分類されます。
クラスタリングアルゴリズム自体は明らかにこれらすべての一部です。 データをカテゴリにグループ化すると便利なので、すべての部分を個別に処理する必要はありません。 これらのアルゴリズムは、とりわけ顧客のセグメンテーションとターゲットを絞ったマーケティングに使用されます。
次元削減アルゴリズムは、構造の発見、ビッグデータの視覚化、特徴の引き出し、および意味のある圧縮に使用されます。 クラスタリングがコインの片側である場合、次元削減は反対側になります。 データをクラスターにグループ化することにより、アルゴリズムは必然的に、データのセットを記述する意味のある変数(次元)の数を減らします。
現在、前の2つのクラスを組み合わせた機械学習アルゴリズムのクラスがあります。
3.半教師あり学習
これは、ラベル付きデータ、およびラベルなしデータと教師なしアルゴリズムと教師の間で立っています。
半教師ありアルゴリズムは、少量のラベル付きデータと大量のラベルなしデータを使用します。 これにより、学習精度が向上する可能性があります。
ラベル付けされたデータを生成するには大量のリソースが必要になるため、データ収集の面でも大きな安心です。
4.強化学習
前の3つのタイプとは異なり、強化アルゴリズムはデータセットに基づいてアクションを選択します。 次に、結果を評価し、必要に応じて戦略を変更します。
強化アルゴリズムでは、ネットワークとアクションのループを作成します。それだけです。 データベースを作成しなくても、勝者が得られます。 どうして?
さて、チェッカー、チェス、囲碁のゲームを理解したのは強化アルゴリズムでした。
強化学習は試行錯誤の原則に基づいて行われます。 システムには、成功率の測定に役立つ何らかの報酬が与えられます。 ゲームの場合–報酬はスコアボードになります。 システムがポイントを獲得するたびに、システムは成功した移動としてそれを評価し、この移動のステータスが高くなります。 すべての移動が成功するまで、ループを繰り返し続けます。
そして、それが私たちが4時間でチェスのゲームをマスターできるアルゴリズムを持っている方法です。
今、私たちは知っています!
大丈夫。 アルゴリズム自体を見てみましょう。
トップ10の機械学習アルゴリズム
さて、始める前に、機械学習のコアコンセプトの1つを見てみましょう。 回帰は、機械学習回帰アルゴリズムに関しては、アルゴリズムが2つの変数間の関係を確立しようとすることを意味します。
回帰には、線形、ロジスティック、多項式、通常の最小二乗回帰など、多くの種類があります。 今日は最初の2つのタイプだけを取り上げます。そうしないと、記事ではなく本として出版される方がよいからです。
すぐにわかるように、上位10個のアルゴリズムのほとんどは教師あり学習アルゴリズムであり、Pythonで最もよく使用されます。
ここでは、トップ10の機械学習アルゴリズムのリストが付属しています。
1.線形回帰
これは、最も人気のある機械学習アルゴリズムの1つです。 観測データに線形方程式を当てはめることにより、2つの変数間の関係を確立するように機能します。
言い換えれば、このタイプのアルゴリズムは、結論を出すためにさまざまな機能を監視します。 変数の数が2より大きい場合、アルゴリズムは重回帰と呼ばれます。
線形回帰は、Pythonでうまく機能する教師あり機械学習アルゴリズムの1つでもあります。 これは強力な統計ツールであり、消費者行動の予測、予測の推定、傾向の評価に適用できます。 企業は、線形分析を実行し、将来の期間の売上を予測することで利益を得ることができます。
我々は2つの変数を持っているのであれば、そのうちの一つが説明され、他方が依存しています。 従属変数は、調査または予測する値を表します。 説明変数は独立しています。 従属変数は常に説明を頼りにしています。
線形機械学習のポイントは、2つの変数の間に有意な関係があるかどうかを確認し、ある場合は、それが何を表しているかを正確に確認することです。
線形回帰は単純な機械学習アルゴリズムと見なされているため、科学者の間で人気があります。
現在、線形回帰があり、ロジスティック回帰があります。 違いを見てみましょう:
2.ロジスティック回帰
これは、基本的な機械学習アルゴリズムの1つです。 これは、 2つの状態、つまり2つの値しかない二項分類器であり、 入力データは圧縮されてから分析されます。
線形回帰とは異なり、ロジスティックアルゴリズムは非線形関数を使用して予測を行います。 ロジスティック回帰アルゴリズムは、回帰タスクではなく分類に使用されます。 名前の「回帰」は、アルゴリズムが線形モデルを使用し、それを将来の空間に組み込むことを示唆しています。
ロジスティック回帰は、教師あり機械学習アルゴリズムであり、線形回帰と同様に、Pythonでうまく機能します。 数学的な観点から、研究の出力データが病気/健康または癌/癌なしの観点から予想される場合、ロジスティック回帰は使用するのに最適なアルゴリズムです。
出力データが異なる値を持つ可能性がある線形回帰とは異なり、ロジスティック回帰は出力として1と0のみを持つことができます。
ロジスティック回帰には、カテゴリ別の応答に基づいて3つのタイプがあります。 これらは:
- バイナリロジスティック回帰–これは、出力がさまざまな「はい」/「いいえ」の場合に最も頻繁に使用されるタイプです。
- 多項ロジット回帰–順序付けなしで3つ以上の回答が得られる可能性がある場合。
- 通常のロジスティック回帰–ここでも3つ以上の回答がありますが、順序付けがあります。 たとえば、期待される結果が1から10のスケールである場合。
別の優れた分類アルゴリズムを見てみましょう。
3.線形判別分析
このメソッドは、異なる入力データを分離する特徴の線形結合を見つけます。 LDAアルゴリズムの目的は、信頼できる変数を特徴の線形和集合として調べることです。 これは優れた分類手法です。
このアルゴリズムは、入力データの統計的品質を調べ、各クラスの計算を行います。 クラスの値を測定し、次にすべてのクラス間の分散を測定します。
クラス間の違いをモデル化するプロセス中に、アルゴリズムは独立変数に従って入力データを調べます。
出力データには、最も高い値を持つクラスに関する情報が含まれています。 線形判別分析アルゴリズムは、既知のカテゴリを分離するのに最適です。 いくつかの要因を数学的にカテゴリに分類する必要がある場合は、LDAアルゴリズムを使用します。
4.K最近傍法
kNNアルゴリズムは、初心者向けの優れた機械学習アルゴリズムの1つです。 さまざまな特性に基づいてデータをカテゴリに分類するために、利用可能な古いデータに基づいて予測を行います。
これは、主に分類に使用される教師あり機械学習アルゴリズムリストに含まれています。 利用可能なデータを保存し、それを使用して新しいケースの類似性を測定します。
kNNのKは、「多数決プロセス」に含まれる最近傍の数を示すパラメーターです。 このようにして、各要素の隣人は彼のクラスを決定するために「投票」します。
kNNアルゴリズムを使用する最良の方法の1つは、ノイズのない小さなデータセットがあり、すべてのデータがラベル付けされている場合です。 アルゴリズムは迅速なものではなく、汚れたデータを認識すること自体を教えていません。 データセットが大きい場合、kNNを使用することはお勧めできません。
kNNアルゴリズムは、次のように機能します。最初に、パラメーターKが指定され、その後、アルゴリズムが新しいデータサンプルに近いエントリのリストを作成します。 次に、エントリの最も一般的な分類を見つけ、最後に、新しいデータ入力に分類を与えます。
実際のアプリケーションに関しては、検索エンジンはkNNアルゴリズムを使用して、検索結果がクエリに関連しているかどうかを確認します。 彼らは、ユーザーが検索を行う時間を節約する、歌われていないヒーローです。
次はTree-Trio: Regression Trees 、 Random Forest 、 AdaBoostです。
どうぞ:
5.回帰ツリー(別名デシジョンツリー)
はい、それらは木と呼ばれますが、機械学習アルゴリズムについて話しているので、根が上に、枝と葉が下にあると想像してください。
Pythonでうまく機能驚き、 -回帰木はことを、教師付き学習アルゴリズムの一種です。 (ちなみに、ほとんどのMLアルゴリズムはそうします。)
これらの「ツリー」は決定木とも呼ばれ、予測モデリングに使用されます。 入力データの量に関して、ユーザーの労力は比較的少なくて済みます。
それらの表現は二分木であり、分類の問題を解決します。 名前が示すように、このタイプのアルゴリズムは、ツリーのような決定モデルを使用します。 それらは、可変スクリーニングまたは特徴選択を実行します。 入力データは、数値とカテゴリの両方にすることができます。
翻訳をお願いします!
もちろん。 あなたが決定を下すときはいつでも、あなたは新しい状況に移行します–新しい決定がなされることで。 あなたが取ることができる可能なルートのそれぞれは「ブランチ」であり、決定自体は「ノード」です。 最初の開始点はプライマリノードです。
これが、デシジョンツリーアルゴリズムが一連のノードとリーフを作成する方法です。 ここで重要なことは、それらすべてが1つのノードからのものであるということです。 (対照的に、ランダムフォレストアルゴリズムは、それぞれがプライマリノードを持つ多数のツリーを生成します。)
実際のアプリケーションに関しては、回帰ツリーを使用して、さまざまな要因に基づいて、生存率、保険料、および不動産の価格を予測できます。
回帰ツリーは、停止基準に達するまで決定木の分岐を「成長」させます。 少量の入力データでうまく機能します。そうしないと、偏った出力データセットが得られる可能性があるためです。
アルゴリズムは、複数のアルゴリズムに基づいて、決定から分割して新しいブランチを形成する場所を決定します。 データはサブノートの領域に分割され、使用可能なすべての変数を収集します。
6.ランダムフォレスト
ランダムフォレストアルゴリズムは、教師機械学習の別の形態です。 回帰ツリーのように1つだけではなく、複数の決定木を生成します。 ノードはランダムに分散されており、その順序は出力データにとって重要ではありません。 木の数が多いほど、結果はより正確になります。
このタイプのアルゴリズムは、分類と回帰の両方に使用できます。 ランダムフォレストアルゴリズムのすばらしい機能の1つは、データの大部分が欠落している場合でも機能することです。 また、大規模なデータセットを処理する能力もあります。
回帰の場合、これらのアルゴリズムは、モデルの動作をあまり制御できないため、最良の選択ではありません。
ランダムフォレストアルゴリズムは、eコマースで非常に役立ちます。 顧客が特定の靴を好むかどうかを確認する必要がある場合は、以前に購入した情報を収集するだけで済みます。
かかとの有無、購入者の性別、注文した以前のペアの価格帯など、靴の種類を含めます。 これが入力データになります。
アルゴリズムは、正確な推定値を提供するのに十分なツリーを生成します。
どういたしまして!
そして、これが最後のツリーシステムアルゴリズムです。
7. AdaBoost
AdaBoostはAdaptiveBoostingの略です。 このアルゴリズムは、 2003年にその作成者に対してゲーデル賞を受賞しました。
前の2つと同様に、これもツリーのシステムを使用します。 複数のノードと葉の代わりに、AdaBoostのツリーは1つのノードと2つの葉、つまり切り株のみを生成します。
AdaBoostアルゴリズムは、決定木やランダムフォレストとは大幅に異なります。
どれどれ:
それが出力を生成する前に、決定木アルゴリズムは、多くの変数を使用します。 切り株だけで意思決定をするために1つの変数を使用することができます。
ランダムフォレストアルゴリズムの場合、すべてのツリーが最終決定にとって等しく重要です。 AdaBoostアルゴリズムは、一部の切り株を他の切り株よりも優先します。
そして最後に大事なことを言い忘れましたが、ランダムフォレストツリーは、いわばより混沌としているのです。 木の順序は無関係であることを意味します。 結果は、木が生産された順序に依存しません。 対照的に、AdaBoostアルゴリズムの場合–順序は不可欠です。
すべての木の結果は、次の基礎となります。 したがって、途中で間違いがあった場合、後続のすべてのツリーが影響を受けます。
では、このアルゴリズムは実際に何ができるのでしょうか。
AdaBoostアルゴリズムは、研究者が病気のリスクを測定するためにそれらを使用するヘルスケアですでに輝いています。 あなたはデータを持っていますが、異なる要因は異なる重力を持っています。 (あなたが腕に倒れ、医師がアルゴリズムを使用して腕が壊れているかどうかを判断するとします。入力データに腕のX線写真と壊れた指の爪の写真の両方が含まれている場合、どちらの切り株かは非常に明白です。より重要になります。)
今、私たちは森の外にいる、いわば、他の3種類の機械学習アルゴリズムを見てみましょう。
8.ナイーブベイズ
これは、テキスト分類の問題がある場合に便利です。 これは、スパムフィルタリングやニュース記事の分類などの高次元のデータセットを処理する必要がある場合に使用される機械学習アルゴリズムです。
アルゴリズムは、各変数を独立していると見なすため、このシグニチャ名を持ちます。 つまり、入力データのさまざまな特徴は完全に無関係であると見なされます。 これにより、シンプルで効果的な確率的分類器になります。
名前の「ベイズ」の部分は、アルゴリズムに使用される定理を発明した人、つまりトーマスベイズを指します。 彼の定理は、ご想像のとおり、イベントの条件付き確率を調べます。
確率は2つのレベルで計算されます。 まず、各クラスの確率。 そして第二に、与えられた因子による条件付き確率。
9.ベクトル量子化の学習
学習ベクトル量子化アルゴリズム(LVQ)は、より高度な機械学習アルゴリズムの1つです。
kNNとは異なり、LVQアルゴリズムは人工ニューラルネットワークアルゴリズムを表します。 言い換えれば、それは人間の脳の神経学を再現することを目的としています。
LVQアルゴリズムは、コードブックベクトルのコレクションを表現として使用します。 これらは基本的に数値のリストであり、トレーニングデータと同じ入力および出力品質を持っています。
10.サポートベクターマシン
これらは、最も人気のある機械学習アルゴリズムの1つです。
サポートベクターマシンアルゴリズムは、極端な分類の場合に適しています。 意味–入力データの決定境界が不明確な場合。 SVMは、入力クラスを最適に分離するフロンティアとして機能します。
SVMは多次元データセットで使用できます。 アルゴリズムは、非線形空間を線形空間に変換します。 2次元では、変数を線として視覚化できるため、相関関係を簡単に特定できます。
SVMは、実際の生活のさまざまな分野ですでに使用されています。
- 医用画像および医療分類タスク
- 人口の多い地域の空気の質を研究する
- 財務分析を支援するため
- 検索エンジンのページランク付けアルゴリズム
- テキストとオブジェクトの認識用。
MLアルゴリズムのスイスナイフのようですね。
要約
人間とコンピューターはうまく連携できます。
研究者は、このパートナーシップができることを私達を保証し、驚くべき結果が得られます。 機械学習アルゴリズムは、すでにさまざまな方法で人類を支援しています。
機械学習とAIアルゴリズムの最も重要な機能の1つは、分類することです。
機械学習アルゴリズムのトップ10をもう一度簡単に見てみましょう。
- 線形回帰–ロジスティック回帰–二項分類器。各クエリの可能な結果は2つだけです。
- 線形判別分析–既知のカテゴリ間でデータを分類するのに最適です。
- K最近傍法–データをカテゴリに分類します。
- 回帰ツリー–予測モデリングに使用されます。
- ランダムフォレスト–大規模なデータセットで使用され、入力データの大部分が欠落している場合に使用されます。
- AdaBoost –二項分類。
- ナイーブベイズ–予測モデリング。
- 学習ベクトル量子化–人工ニューラルネットワークアルゴリズム。
- サポートベクターマシン–多次元データセットでの分類の極端なケース。
これらすべてのアルゴリズム(およびこれから登場する新しいアルゴリズム)は、人類の繁栄の新時代の基盤を築きます。 それは、能力の低い人々の生存を確保するためのベーシックインカムを可能にします(そして必要でさえあります) 。 (さもなければ誰が私たちの社会を反乱し、混乱させるでしょう。ああ、まあ。)
さて、機械学習アルゴリズムに関する記事はとてもおかしなことだと誰が思ったでしょう。 さて、今日は以上です。
またね、みんな!
よくある質問
機械学習は素晴らしく、テクノロジーの未来に光を当てます。 それにはいくらかのコストがかかります。 たとえば、機械学習プログラムをホストするコンピューターは、非常に多くの電力とリソースを消費します。 これまでの機械学習のもう1つの欠点は、エンティティの曖昧性解消です。 たとえば、アン・ハサウェイの名前とバークシャー・ハサウェイの株価を機械が区別できない場合があります。 女優がメディアの注目を集めるたびに、会社はお金を稼ぎます…
機械学習は計算方法です。 「従来の」アルゴリズムでは、プログラマーがそれらを作成する必要がありますが、機械学習アルゴリズムは基本的に自分でトレーニングします。 はい、冗談ではありません!
それはあなたが実行する必要があるタスクに依存します。 手元のタスクに最適なアルゴリズムの選択は、入力のサイズ、品質、多様性、およびユーザーが要求している出力データの種類によって異なります。
他のすべてのものと同様に、プロセスは、問題に対して選択したアルゴリズムの基本を理解することから始まります。 さまざまな学習ソースを参照して、自分に最適なものを選択する必要があります。 次に、アルゴリズムを小さな単位に分割することから始めます。 簡単な例から始めて、物事を把握したら、信頼できる実装で検証します。 そして、プロセス全体を完了します。 おそらくそれよりも難しいように聞こえます。 しかし、それは完全に試す価値があります!