Neurónová sieť
Výpočtový model voľne inšpirovaný mozgom, zložený z prepojených uzlov vo vrstvách, ktorý sa učí vzory z dát.
Definícia
Neurónová sieť je výpočtový model voľne inšpirovaný ľudským mozgom. Skladá sa z prepojených uzlov (neurónov) usporiadaných do vrstiev: vstupnej, jednej alebo viacerých skrytých a výstupnej. Každý neurón prijme čísla, prenásobí ich svojimi váhami a výsledok pošle ďalej. Práve váhy sa počas učenia ladia tak, aby výstup čo najlepšie zodpovedal správnym odpovediam. Neurónové siete sú základom hlbokého učenia aj moderných jazykových modelov.
Kľúčové čísla
Príklady
- 1Rozpoznávanie číslic a objektov na obrázkoch
- 2Predikcia a klasifikácia v podnikových dátach
- 3Veľké jazykové modely sú obrovské neurónové siete
Ako sa neurónová sieť učí
Učenie prebieha opakovaním jednoduchej slučky. Sieť dostane príklad, vygeneruje odhad, porovná ho so správnou odpoveďou a vypočíta chybu. Potom pomocou techniky zvanej spätné šírenie chyby upraví všetky váhy tak, aby bola chyba o niečo menšia. Tento cyklus sa zopakuje veľmi veľakrát, až kým sieť nedáva dobré výsledky. Predstaviť si to možno ako sústavu ladiacich gombíkov, ktoré sa postupne nastavujú.
Praktické tipy
- 1Viac vrstiev znamená väčšiu schopnosť, ale aj vyššie nároky na dáta a výkon
- 2Architektúra siete sa volí podľa úlohy, pre jazyk je to dnes Transformer
- 3Bez kvalitných dát ani dobre navrhnutá sieť nedá dobré výsledky
Často kladené otázky
Je neurónová sieť to isté ako ľudský mozog?
Nie. Neurónová sieť je len voľne inšpirovaná mozgom. Pracuje s číslami a maticami, nemá vedomie ani biologické neuróny.
Súvisí neurónová sieť s deep learningom?
Áno. Keď má sieť mnoho skrytých vrstiev, hovoríme o hlbokej sieti a o deep learningu. Hĺbka jej umožňuje zachytiť zložitejšie vzory.
Čo sú váhy v neurónovej sieti?
Váhy sú nastaviteľné hodnoty, ktorými neurón násobí svoje vstupy. Práve ich sieť počas tréningu ladí, aby dávala správne odpovede.
Súvisiace pojmy
Deep learning (Hlboké učenie)
Podoblasť strojového učenia, ktorá využíva viacvrstvové neurónové siete na učenie zložitých vzorov z dát.
Transformer
Architektúra neurónovej siete s mechanizmom pozornosti, ktorá umožnila vznik dnešných veľkých jazykových modelov.
Strojové učenie (Machine Learning)
Odvetvie umelej inteligencie, v ktorom sa počítač učí riešiť úlohy zo vzorov v dátach namiesto explicitných pravidiel.
Veľký jazykový model (LLM)
Typ AI modelu trénovaného na obrovskom množstve textu, schopný generovať, porozumieť a spracovať ľudský jazyk — základ AI vyhľadávačov.
Ďalšie informácie
Monitorujte svoju AI viditeľnosť
Zistite, či AI vyhľadávače citujú vašu stránku. Vyskúšajte zadarmo.
Začať zadarmo