Co je neuronová síť? Úvod do umělých neuronových sítí

Tento blog o tom, co je Neural Networks, vám představí základní pojmy neuronových sítí a jak mohou řešit složité problémy založené na datech.

S pokrokem ve strojovém učení se vydal po vysoké silnici. Deep Learning je považován za nejpokročilejší technologii postavenou k řešení složitých problémů, které využívají obrovské datové sady. Tento blog o tom, co je Neural Networks, vám představí základní pojmy neuronových sítí a jak mohou řešit složité problémy založené na datech.

Chcete-li získat podrobné znalosti o umělé inteligenci a hlubokém učení, můžete se zaregistrovat naživo od společnosti Edureka s nepřetržitou podporou a doživotním přístupem.





Zde je seznam témat, kterým se bude toto věnovat Blog:

  1. Co je to neuronová síť?
  2. Co je to Deep Learning?
  3. Rozdíl mezi AI, ML a DL
  4. Potřeba hlubokého učení
  5. Případ použití Deep Learning
  6. Jak fungují neurální sítě?
  7. Neuronová síť vysvětlena na příkladu

Jednoduchá definice neuronové sítě

Modelováno v souladu s lidským mozkem, a Neuronová síť byla postavena tak, aby napodobovala funkčnost lidského mozku . Lidský mozek je neurální síť složená z několika neuronů, podobně jako umělá neurální síť (ANN) je tvořena několika perceptrony (vysvětleno dále).



Neuronová síť - Co je to neuronová síť - Edureka

Neuronová síť se skládá ze tří důležitých vrstev:

  • Vstupní vrstva: Jak název napovídá, tato vrstva přijímá všechny vstupy poskytované programátorem.
  • Skrytá vrstva: Mezi vstupní a výstupní vrstvou je sada vrstev známých jako Skryté vrstvy. V této vrstvě se provádějí výpočty, jejichž výsledkem je výstup.
  • Výstupní vrstva: Vstupy procházejí řadou transformací skrz skrytou vrstvu, která nakonec vede k výstupu, který je dodáván prostřednictvím této vrstva.

Než se dostaneme do hloubky fungování neuronové sítě, pojďme pochopit, co je Deep Learning.



Co je hluboké učení?

Deep Learning je pokročilá oblast strojového učení, která využívá koncepty neuronových sítí k řešení vysoce výpočetních případů použití, které zahrnují analýzu vícerozměrných dat. Automatizuje proces extrakce funkcí a zajišťuje, že je nutný minimální zásah člověka.

Co přesně je Deep Learning?

Deep Learning je pokročilý dílčí pole strojového učení, které využívá algoritmy inspirované strukturou a funkcí mozku s názvem Artificial Neural Networks.

Rozdíl mezi AI, ML a DL (Artificial Intelligence vs Machine Learning vs Deep Learning)

Lidé si to často myslí , , a Hluboké učení jsou stejné, protože mají společné aplikace. Například Siri je aplikace umělé inteligence, strojového učení a hlubokého učení.

Jak tedy tyto technologie souvisejí?

jak nainstalovat Eclipse ide
  • Umělá inteligence je věda o tom, jak přimět stroje, aby napodobovaly chování lidí.
  • Strojové učení je podmnožinou umělé inteligence (AI), která se zaměřuje na to, aby přiměly stroje k rozhodování na základě jejich dat.
  • Hluboké učení je podmnožina strojového učení, která využívá koncept neuronových sítí k řešení složitých problémů.

Abychom to shrnuli, AI, Machine Learning a Deep Learning jsou vzájemně propojená pole. Strojové učení a hluboké učení pomáhá umělé inteligenci tím, že poskytuje sadu algoritmů a neuronových sítí k řešení problémy založené na datech.

Nyní, když jste obeznámeni se základy, pojďme pochopit, co vedlo k potřebě Deep Learning.

Need for Deep Learning: Limitations of Traditional Machine Learning Algorithms and Techniques

Machine Learning bylo velkým průlomem v technickém světě, vedlo k automatizaci monotónních a časově náročných úkolů, pomohlo vyřešit složité problémy a učinit chytřejší rozhodnutí. Ve strojovém učení však bylo několik nevýhod, které vedly ke vzniku hlubokého učení.

Zde jsou některá omezení Machine Learning:

  1. Nelze zpracovat vysoce dimenzionální data: Machine Learning dokáže zpracovat pouze malé dimenze dat, která obsahují malou sadu proměnných. Pokud chcete analyzovat data obsahující 100 proměnných, pak Machine Learning nelze použít.
  2. Funkce je manuální: Zvažte případ použití, kdy máte 100 predikčních proměnných a potřebujete zúžit pouze ty významné. K tomu musíte ručně prostudovat vztah mezi každou z proměnných a zjistit, které z nich jsou důležité při předpovídání výstupu. Tato úloha je pro vývojáře extrémně zdlouhavá a časově náročná.
  3. Není ideální pro provádění detekce objektů a zpracování obrazu: Vzhledem k tomu, že detekce objektů vyžaduje vysoce dimenzionální data, nelze strojové učení použít ke zpracování sad obrazových dat, je tedy ideální pouze pro datové sady s omezeným počtem funkcí.

Než se dostaneme do hlubin Neuronové sítě, pojďme zvážit skutečný případ použití, kde je implementováno Deep Learning.

Případ / aplikace Deep Learning Use

Věděli jste, že PayPal zpracovává platby ve výši 235 miliard USD ze čtyř miliard transakcí u více než 170 milionů zákazníků? Využívá toto obrovské množství dat k identifikaci možných podvodných aktivit mimo jiné.

S pomocí algoritmů Deep Learning PayPal kromě kontroly vzorců pravděpodobných podvodů uložených v jeho databázích těžil také data z historie nákupu jejich zákazníků a předvídal, zda je konkrétní transakce podvodná či nikoli.

Společnost spoléhá na technologii Deep Learning & Machine Learning přibližně 10 let. Zpočátku tým pro sledování podvodů používal jednoduché lineární modely. V průběhu let však společnost přešla na pokročilejší technologii strojového učení s názvem Deep Learning.

Fraud risk manager and Data Scientist ve společnosti PayPal, Ke Wang, citoval:

'To, co nás baví z modernějšího a pokročilejšího strojového učení, je jeho schopnost spotřebovat mnohem více dat, zvládnout vrstvy a vrstvy abstrakce a být schopni 'vidět' věci, které by jednodušší technologie nebyla schopna vidět, dokonce i lidské bytosti by mohly nebudu moci vidět. “

Jednoduchý lineární model je schopen spotřebovat přibližně 20 proměnných. S technologií Deep Learning však lze provozovat tisíce datových bodů. Proto implementací Díky technologii Deep Learning může PayPal konečně analyzovat miliony transakcí a identifikovat jakékoli podvodné transakce aktivita.

Pojďme nyní do hloubky neuronové sítě a pochopme, jak fungují.

Jak funguje neurální síť?

Abychom porozuměli neuronovým sítím, musíme to rozebrat a porozumět nejzákladnější jednotce neuronové sítě, tj. Perceptronu.

Co je to Perceptron?

Perceptron je neuronová síť s jednou vrstvou, která se používá ke klasifikaci lineárních dat. Má 4 důležité komponenty:

  1. Vstupy
  2. Váhy a zkreslení
  3. Funkce sumace
  4. Funkce aktivace nebo transformace

Základní logika za Perceptronem je následující:

Vstupy (x) přijaté ze vstupní vrstvy se vynásobí přiřazenými váhami w. Vynásobené hodnoty se poté přidají k vytvoření váženého součtu. Vážený součet vstupů a jejich příslušných vah se poté použije na příslušnou aktivační funkci. Aktivační funkce mapuje vstup na příslušný výstup.

co je vícenásobné dědictví v Javě

Váhy a zkreslení v hlubokém učení

Proč musíme každému vstupu přiřadit váhy?

Jakmile je vstupní proměnná přivedena do sítě, je náhodně zvolená hodnota přiřazena jako váha tohoto vstupu. Váha každého vstupního datového bodu udává, jak důležitý je tento vstup při predikci výsledku.

Parametr zkreslení na druhé straně umožňuje upravit křivku aktivační funkce tak, aby bylo dosaženo přesného výstupu.

Funkce sumace

Jakmile je vstupům přiřazena nějaká váha, je odebrán produkt příslušného vstupu a hmotnosti. Přidáním všech těchto produktů získáte vážený součet. To se provádí pomocí funkce součtu.

Aktivační funkce

Hlavním cílem aktivačních funkcí je namapovat vážený součet na výstup. Příkladem transformačních funkcí jsou aktivační funkce, jako jsou tanh, ReLU, sigmoid atd.

Chcete-li se dozvědět více o funkcích Perceptrons, můžete projít tímto Blog.

Než jsme shrnout tento blog, pojďme si vzít jednoduchý příklad, abychom pochopili, jak funguje Neural Network.

Neuronové sítě vysvětleny na příkladu

Zvažte scénář, kde máte vytvořit umělou neurální síť (ANN), která klasifikuje obrázky do dvou tříd:

  • Třída A: Obsahující obrazy nemocných listů
  • Třída B: Obsahující obrazy nemocných listů

Jak tedy vytvořit neuronovou síť, která třídí listy na nemocné a nemocné plodiny?

Proces vždy začíná zpracováním a transformací vstupu takovým způsobem, aby jej bylo možné snadno zpracovat. V našem případě bude každý listový obrázek rozdělen na pixely v závislosti na jeho rozměru.

Například pokud je obraz složen z 30 na 30 pixelů, pak bude celkový počet pixelů 900. Tyto pixely jsou reprezentovány jako matice, které jsou poté přivedeny do vstupní vrstvy neuronové sítě.

Stejně jako naše mozky mají neurony, které pomáhají při budování a spojování myšlenek, má ANN perceptrony, které přijímají vstupy a zpracovávají je jejich předáváním ze vstupní vrstvy do skryté a nakonec výstupní vrstvy.

Když je vstup předáván ze vstupní vrstvy do skryté vrstvy, je každému vstupu přiřazena počáteční náhodná váha. Vstupy se poté vynásobí jejich odpovídajícími váhami a jejich součet se odešle jako vstup do další skryté vrstvy.

Zde je každému perceptronu přiřazena číselná hodnota zvaná zkreslení, která je spojena s váhou každého vstupu. Dále každý perceptron prochází aktivací nebo transformační funkcí, která určuje, zda se konkrétní perceptron aktivuje nebo ne.

K přenosu dat do další vrstvy se používá aktivovaný perceptron. Tímto způsobem se data šíří (šíření vpřed) neurální sítí, dokud perceptrony nedosáhnou výstupní vrstvy.

Na výstupní vrstvě je odvozena pravděpodobnost, která rozhodne, zda data patří do třídy A nebo třídy B.

Zní to jednoduše, že? Koncept za neuronovými sítěmi je založen čistě na fungování lidského mozku. Vyžadujete důkladné znalosti různých matematických konceptů a algoritmů. Zde je seznam blogů, které vám pomohou začít:

  1. Co je to Deep Learning? Začínáme s hlubokým učením
  2. Deep Learning with Python: Beginners Guide to Deep Learning

Pokud vám tento blog připadá relevantní, podívejte se na Edureka, důvěryhodná online vzdělávací společnost se sítí více než 250 000 spokojených studentů po celém světě. Kurz Edureka Deep Learning with TensorFlow Certification Training pomáhá studentům stát se odborníky v oblasti školení a optimalizace základních a konvolučních neuronových sítí pomocí projektů a úkolů v reálném čase spolu s koncepty, jako je funkce SoftMax, automatické kódování neuronových sítí, omezený Boltzmann Machine (RBM).