Neurónová sieť

Výpočtový model voľne inšpirovaný mozgom, zložený z prepojených uzlov vo vrstvách, ktorý sa učí vzory z dát.

Definícia

Neurónová sieť je výpočtový model voľne inšpirovaný ľudským mozgom. Skladá sa z prepojených uzlov (neurónov) usporiadaných do vrstiev: vstupnej, jednej alebo viacerých skrytých a výstupnej. Každý neurón prijme čísla, prenásobí ich svojimi váhami a výsledok pošle ďalej. Práve váhy sa počas učenia ladia tak, aby výstup čo najlepšie zodpovedal správnym odpovediam. Neurónové siete sú základom hlbokého učenia aj moderných jazykových modelov.

Kľúčové čísla

Vrstvy

Vstupná, skryté a výstupná vrstva

Váhy

Hodnoty, ktoré sa počas tréningu ladia

Základ DL

Neurónové siete poháňajú deep learning

Príklady

1Rozpoznávanie číslic a objektov na obrázkoch
2Predikcia a klasifikácia v podnikových dátach
3Veľké jazykové modely sú obrovské neurónové siete

Ako sa neurónová sieť učí

Učenie prebieha opakovaním jednoduchej slučky. Sieť dostane príklad, vygeneruje odhad, porovná ho so správnou odpoveďou a vypočíta chybu. Potom pomocou techniky zvanej spätné šírenie chyby upraví všetky váhy tak, aby bola chyba o niečo menšia. Tento cyklus sa zopakuje veľmi veľakrát, až kým sieť nedáva dobré výsledky. Predstaviť si to možno ako sústavu ladiacich gombíkov, ktoré sa postupne nastavujú.

Praktické tipy

1Viac vrstiev znamená väčšiu schopnosť, ale aj vyššie nároky na dáta a výkon
2Architektúra siete sa volí podľa úlohy, pre jazyk je to dnes Transformer
3Bez kvalitných dát ani dobre navrhnutá sieť nedá dobré výsledky

Často kladené otázky

Je neurónová sieť to isté ako ľudský mozog?

Nie. Neurónová sieť je len voľne inšpirovaná mozgom. Pracuje s číslami a maticami, nemá vedomie ani biologické neuróny.

Súvisí neurónová sieť s deep learningom?

Áno. Keď má sieť mnoho skrytých vrstiev, hovoríme o hlbokej sieti a o deep learningu. Hĺbka jej umožňuje zachytiť zložitejšie vzory.

Čo sú váhy v neurónovej sieti?

Váhy sú nastaviteľné hodnoty, ktorými neurón násobí svoje vstupy. Práve ich sieť počas tréningu ladí, aby dávala správne odpovede.

Súvisiace pojmy

Deep learning (Hlboké učenie)

Podoblasť strojového učenia, ktorá využíva viacvrstvové neurónové siete na učenie zložitých vzorov z dát.

Transformer

Architektúra neurónovej siete s mechanizmom pozornosti, ktorá umožnila vznik dnešných veľkých jazykových modelov.

Strojové učenie (Machine Learning)

Odvetvie umelej inteligencie, v ktorom sa počítač učí riešiť úlohy zo vzorov v dátach namiesto explicitných pravidiel.

Veľký jazykový model (LLM)

Typ AI modelu trénovaného na obrovskom množstve textu, schopný generovať, porozumieť a spracovať ľudský jazyk — základ AI vyhľadávačov.

Ďalšie informácie

Článok: Neurónové siete a Transformer Článok: Čo je deep learning

Monitorujte svoju AI viditeľnosť

Zistite, či AI vyhľadávače citujú vašu stránku. Vyskúšajte zadarmo.

Začať zadarmo