Techniky modelování v Business Analytics s R.



Blog poskytuje krátké seznámení s modelovacími technikami v Business Analytics s R.

Různé techniky modelování:

Jakýkoli problém můžeme rozdělit na menší procesy:





Klasifikace - je místo, kde klasifikujeme data. Např. nemoci všechny nemoci vykazují určité chování a můžeme je dále klasifikovat.

Například: nemoci snižující imunitu, nemoci způsobující bolesti hlavy atd.



Regrese - zahrnuje zjištění vztahu mezi více proměnnými.

Například: jak váha člověka souvisí s jeho výškou.

co je vícenásobné dědictví v Javě

AnomolyDetekce - je v podstatě fluktuace.



Například: V případě vysokého nebo nízkého napětí.

Dalším příkladem může být regulované chování, které zahrnuje řízení na pravé nebo levé straně podle země. Anomolií je tu někdo, kdo řídí opačný směr.

Dalším příkladem může být narušení sítě. Zde se přihlásí ověřený uživatel na web vaší společnosti a poté, co se přihlásí někdo neověřený, jedná se oAn0moly.

Důležitost atributu - V zásadě poskytuje více atributů, jako je výška, váha, teplota, tep. Je třeba poznamenat, že všechny tyto atributy jsou pro úkol důležité.

propojený seznam v programu c

Například: Někdo se snaží předvídat, kdy se člověk dostane do kanceláře. Každý atribut hraje důležitou roli, ale ne všechny atributy jsou důležité.

Pravidla přidružení - Jednoduše řečeno, je to analyzovat nebo předpovědět další chování, kde se točí kolem motoru doporučení.

Například: Osoba kupující chléb může také koupit mléko. Pokud analyzujeme minulé nákupní chování, všechny položky v košíku mají vztah. V takovém případě by mohla existovat pravděpodobnost, že osoba kupující chléb také koupí mléko.

Shlukování - Je to jedna z nejstarších technik ve statistice. Ve skutečnosti lze vždy modelovat jakýkoli problém, ať už jde o klasifikaci nebo shlukování, což znamená seskupování podobných entit.

Například:

1) Vezměte košík jablek a pomerančů, ve kterém můžeme oddělit jablka od pomerančů.

2) Důležitým případem použití pro shlukování je zdravotní péče. Téměř všechny statistiky a analýzy začaly případy použití zdravotní péče. Abychom šli hlouběji, existuje pojem shlukování nazývaný kohorty (lidé s podobnými chorobami), aby je bylo možné studovat odděleně od stávajících zákazníků. Například pokud 10 lidí trpí horečkou a dalších 10 lidí bolesti hlavy, zjistíme, co je mezi nimi běžné, a vytvoříme léky.

Extrakce funkcí - V přesnosti extrakce funkcí je platnost a selhání docela relevantní. Jinými slovy lze extrakci funkcí nazvat rozpoznáváním vzorů.

třída skeneru v java příkladu

Například:

Když uživatel ve vyhledávání Google zadá výraz, přijde s výsledky. Nyní je třeba si položit důležitou otázku, jak bylo možné zjistit, která stránka je pro daný výraz relevantní a nerelevantní? Na to lze odpovědět extrakcí funkcí a rozpoznáním vzoru, kde přidává prominentní funkce. Řekněme, že je dána fotografie, některé fotoaparáty detekují obličeje, zvýrazňují obličej a vytvářejí nádherné obrázky, které také využívají rozpoznávání funkcí.

Učení pod dohledem vs. Učení pod dohledem

na) Kategorie předpovědi - Techniky zahrnují regresi, logistiku, neuronové sítě a rozhodovací stromy. Některé příklady zahrnují detekci podvodů (kde se počítač učí a předpovídá další podvod z předchozí historie podvodů). V učení bez dohledu nelze předvídat pomocí příkladů, protože neexistují žádná historická data.

b) Klasifikační kategorie - Vezmeme-li příklad, ať už je transakce podvodná nebo ne, vstupuje do klasifikační kategorie. Zde vezmeme historická data a klasifikujeme je pomocí rozhodovacích stromů nebo v případě, že vůbec žádná historická data nebudeme, pak začneme přímo na datech a pokusíme se využívat funkce sami. Například pokud potřebujeme znát zaměstnance, kteří pravděpodobně opustí organizaci nebo pravděpodobně zůstanou. V případě, že se jedná o novou organizaci, kde nemůžeme použít historická data, můžeme k extrakci dat vždy použít shlukování.

C) Kategorie průzkumu - Toto je přímočará metoda, která přichází s tím, co znamenají velká data. V učení bez dozoru se tomu říká principiální komponenty a shlukování.

d) Afinitní kategorie - zde je zahrnuto více prvků, jako je křížový prodej / prodej, analýza tržního koše. V analýze koše neexistuje žádné kontrolované učení, protože neexistují žádná historická data. Bereme tedy data přímo a nacházíme asociace, sekvenování a faktorovou analýzu.

Máte na nás dotaz? Uveďte je v sekci komentáře a my se vám ozveme.

Související příspěvky: