
3 minute read
истоки и принципы работы
by borov665
Стукало Илья Сергеевич, студент
Advertisement
Казанский национальный исследовательский технологический университет
В статье исследуют понятие искусственный нейрон, принципы работы и сравнения с биологическим нейроном. Ключевые слова: искусственный нейрон, функции активации, искусственная нейронная сеть, нейрокомпьютеры.
Всвязи с цифровизацией современного общества и интеграции информационных технологий во все сферы современного общества, наблюдается лавинообразное нарастание данных, измеряемое зетабайтами. Данное явление именуется «информационный взрыв», где основные его аспекты были разобраны, к примеру, в работе Еремнина А.Л. [1].
Так как данных становится всё больше, а человек, по своей биологической природе, не способен обрабатывать столь большое количество информации, появляется направление Data Science, что конкретно переводится как Наука о данных, где используются математические модели и вычислительные мощности современных компьютеров для систематизации, классификации данных, которые нарастают с каждым днем.
В Data Science существует и отдельное направление, которое даёт возможность не только систематизировать данные, но также находить в них закономерности, функциональные зависимости, что позволяет находить такие закономерности в других данных или же предсказывать будущие события. Такое направление имеет название Machine Learning (далее ML), что переводится как Машинное Обучение. Отличительной особенностью ML является способностью обучать информационную модель, а не программировать её. Таким образом, машина полностью берет на себя построение зависимостей, функций, закономерностей, которые поступают в ней и самостоятельно определяет классификацию данных, без участия человека.
В ML существуют самые разные направления обучения машины, но нас будет интересовать крайне актуальная, эффективная и перспективная модель обучения — нейронные сети и его составной элемент—искусственный нейрон.
На сегодняшний день, нейронные сети являются одними из самых популярных направлений в Computer Science, они показывают себя в самых разных направлениях. К примеру, чатботы, распознавание голоса, компьютерное зрение и т.д.
Целью нашего исследования является выяснения определения искусственного нейрона, его происхождения и принципов работы.
Откуда появчился термин искусственные нейронные сети?
Термин ИНС (искусственные нейронные сети) изначально был позаимствован из биологии, аименно из клетки нервной системы—нейрона. Термин «нейрон» для обозначения нервных клеток введён Г.В. Вальдейером в 1891 году [2]. Нейрон может находиться в двух состояниях — возбуждение и торможение. Нейрон (Рис. 1) следующие составные элементы: дендриты — короткие отростки, принимающие сигнал, аксоны — длинные
отростки, передающие сигнал и тело нейрона — функциональный элемент, отвечающий за питание, управление ресурсами, деление и т.д.
На конце аксона находится синапс —место контактов нейронов друг с другом, отличительная особенность синапса — однонаправленность, то есть синапс передает возбуждение(сигнал) от аксона к дендриту, только в одном направлении.
Любой тип нейрона имеет важное свойство — суммирование раздражений, то есть нейрон при помощи дендритов умеет принимать больше количество возбуждений и суммировать их в один сигнал, который передает через аксон следующему нейрону. Это и есть объяснение сложности взаимодействий частей организма и наших умственных возможностей.
Нейрокомпьютеры
Идея о создании нейрокомпьютеров появилась благодаря коннекционизму—раздел ИИ, связанным ссозданием искусственного мозга и моделирование мышления человека при помощи компьютеров. Сточки зрения коннекционизма (отангл. connection—связь), отдельные нейроны можно моделировать простыми автоматами, ався сложность мозга определяется связями между нейронами[3]. Из этого утверждения выделяются следующие свойства:
– однородность системы (все элементы просты по строению); – надежность системы (благодаря большому количеству связей); – «голографичность», обеспечивающая сохранение свойств системы при разрушении ее части.
Важно отметить то, что компьютеры могут работать сбоев только следуя алгоритму, а суть нейрокомпьютера в том, что даже если данных не вполне достаточно или они неполны ил даже повреждены, компьютер выполняет программу все равно и связано с высоким уровнем параллелизма связей.
В [3] дано следующее определение ИНС: нейронная сеть — это распределенный параллельный процессор, состоящий из элементарных единиц обработки информации, накапливающих экспериментальные знания и предоставляющих их для последующей обработки.
Если мы рассматриваем с вами традиционный компьютер, то он состоит из четырех блоков: центральный процессор, память, устройство ввода и вывода. Причем центральный процессор представляет собой арифметико-логическое устройство и устройство управление.
В нейрокомпьютере арифметико-логическое устройство используется на базе искусственных нейронных сетей у которого имеется блок обучения (Рис. 2).

Рис. 2. Схема нейрокомпютера
Понятие искусственный нейрон
Искусственный нейрон — это узел искусственной нейронной сети, являющийся упрощённой моделью естественного нейрона [4].
На вход искусственной нейронной сети поступает набор данных, для каждого элемента данных имеется свой собственный вход. Каждый вход взвешивается, то есть умножается на некий коэффициент. Далее, каждое произведение суммируется и получается уровень активации нейрона. Блок, где находится сумма всех входных значений и весов соответствует телу нейрона (рис.3).
Искусственный нейрон представляет собой нелинейную функцию, которая получает определенный отрезок значений. Такая функция называется функция активации. К примеру, в биологических нейронных сетях функция активации обычно является абстракцией, представляющей скорость возбуждения потенциала действия в клетке [5]. Полученные данные обычно находится в пределах [–1;1] или [0;1], а для того, чтобы определить уровень активации нейрона, используют разные виды функций активации (рис. 4).
Выводы
Проведя глубокий литературный и аналитический анализ, мы разобрали источники происхождения искусственных нейронных сетей, их принципы работы: входные данные, веса и функции активации. Также выяснили в каких пределах находятся определяются функции активации икаких видов они бывают.