Начался в
1943 году, когда нейрофизиолог Уоррен МакКаллох и математик Уолтер Питтс написали статью
«Логическое исчисление идей, относящихся к нервной активности». Изучив принципы работы головного мозга, учёные выдвинули математическую модель нейрона. Здесь же возникло такое понятие как
«пороговый элемент» — устройство, оперирующие двоичными числами. Исследователи предположили, что, как и их биологический прототип, нейроны способны обучаться и выполнять практические любые числовые и логические операции. Эта работа заложила основы двух основных подходов к изучению нейронных сетей. Один из них занимается непосредственно изучением биологических процессов в человеческом мозгу, а другой ориентирован на разработку искусственного интеллекта.
В
1949 году канадский нейропсихолог Дональд Хебб, которого считают одним из создателей теории искусственных нейронных сетей, предложил первый рабочий алгоритм их обучения в своей книге
«Организация поведения: нейропсихологическая теория». Учёный предположил, что в процессе обучения формируются нейронные структуры, которые развиваются в результате стимуляции связей нейронов друг с другом. А уже в
1954 году учёные Массачусетского технологического института Уэсли Кларк и Бельмонт Фарли впервые смоделировали сеть Хебба на компьютере.
В
1958 году американский психолог Фрэнк Розенблатт предложил
перцептрон — базовую модель машинного обучения, которая имитировала работу человеческого мозга. Такой прогресс, казалось, должен был ещё больше подогреть интерес к нейросетям, но в
1969 году была опубликована работа Марвина Минского и Сеймура Паперта
«Перцептроны», в которой учёные рассказали об основных проблемах, связанных с искусственными нейронными сетями. Первая проблема заключалась в том, что однослойные нейросети не могли совершать функцию «Исключающее ИЛИ». Второй проблемой стало отсутствие достаточно мощных компьютеров, на которых можно производить нужный объём вычислений. Это несколько замедлило исследования в данной области.
Очередной рывок случился в
1975 году, когда японский учёный Кунихико Фукусима представил одну из первых многослойных нейросетей —
когнитрон. Пять лет спустя он же разработал ещё одну модель —
неокогнитрон, которая, в отличие от своего предшественника, гораздо в большей степени близка по устройству зрительной системе человека и способна распознавать объекты вне зависимости от их искажений и изменений масштаба.