Výuka pod dohledem Apache Mahout



Supervised Learning je technika strojového učení, při které je funkce odvozena z označených příkladů tréninkových dat.

Kontrolované učení je metoda, při níž tréninková data zahrnují jak vstup, tak požadované výsledky. Výcvik systému s příklady se nazývá supervizované učení. Nebo trénink algoritmu s učitelem lze také považovat za učení pod dohledem. Po procvičení algoritmu se všemi ukázkovými daty nebo označenými daty, který má oba prediktory v cílové proměnné, lze algoritmus trénovat a použít neviditelný příklad pro další klasifikaci.





Zde jsou některé z důležitých funkcí supervidovaného učení v Mahout:

  • Konstrukce řádného tréninku, validace a testovací sady (Bok) je zásadní.
  • Tyto metody jsou obvykle rychlé a přesné.
  • Metody supervidovaného učení musí být schopny zobecnit.
  • Dávají správné výsledky, když jsou na vstupu zadána nová data, aniž by věděli aa prioricílová.
  • V některých případech jsou známé správné výsledky (cíle), které jsou uvedeny v modelu během procesu učení.

Příklad supervidovaného učení

V případě, že chcete trénovat misi, dostanete dvě různé skupiny obrázků spolu s označenými daty, např. na obrázku nahoře má jedna skupina obrazy slona a druhá obrázky lva. Označená data znamenají, že každá sada dat má cílovou hodnotu. Ve výše uvedeném příkladu jsou datovou sadou obrazy slonů, zatímco štítky, které jsou jí dány, tj. „Slon“, jsou cílovou hodnotou datové sady. Takto označená datová sada se používá pro tréninkový proces, takže tréninkový algoritmus může na této datové sadě využít a vytvořit nějaký model, který lze dále použít ke klasifikaci neviditelných příkladů bez označených dat nebo cílové proměnné.



Pojďme identifikovat vlastnosti, které pomáhají při identifikaci objektu jako slona nebo lva:

Vlastnosti mohlo by být - velikost, barva, výška, velikost uší, kmen, kel

To lze nazvat sadou funkcí, které budou použity pro účely školení. Tato sada funkcí ovlivní konečnou cílovou proměnnou. Tyto proměnné jsou známé jako predikční proměnné , protože nám pomáhají při určování konečná cílová proměnná . Konečnou proměnnou lze také nazvat štítek. Konečná proměnná tady je slon / lev.



table-word

co je vlákno démona

V tomto příkladu je každá ze záznamů v kategoriích, velikost, barva, výška, velikost ucha, trup a kel proměnnou prediktoru, zatímco cílové proměnné jsou Elephant a Lion. Tyto proměnné lze považovat za příklady tréninku a tréninkové datové sady.

Supervised Learning je tedy způsob, pomocí kterého trénujete spolu se štítky, kde požádáte algoritmus, aby z něj extrahoval určité funkce, a na základě toho, kdykoli uvidíte neviditelný příklad, bude algoritmus schopen jej klasifikovat do správné třídy.

Máte na nás dotaz? Uveďte je v sekci komentáře a my se vám ozveme.

Související příspěvky: