Штучний інтелект

У фільмі «Матриця» 1999 року показана моторошна картина майбутнього світу, в якому владу над людьми захопили розумні комп'ютери. І хоча більшість людей вважає проблеми такого роду надуманими і неактуальними, вчені вже давно намагаються за допомогою обчислювальних машин імітувати роботу людського мозку. Ця галузь науки отримала назву штучний інтелект (ШІ).

При складанні програми для комп'ютера завдання, яке ним розв'язується, розбивається на послідовність простих команд, названу алгоритмом. У 1997 році був проведений шаховий матч гросмейстера Гаррі Каспарова з комп'ютером «Діп Блу», запрограмованим на аналіз всіх ходів, можливих у будь-який момент партії. У цьому матчі Каспаров зазнав поразки (проте в інших виграв). Завдання, подібні тим, що вирішував «Діп Блу», дуже важко уявити у вигляді ряду простих команд. Ще складніше відтворити процес людського мислення, що досі не під силу сучасним комп'ютерам.

В будь-якій ситуації для осмисленої реакції людський мозок повинен вирішувати надзвичайно складні задачі. Наприклад, під час розмови людина вимовляє звуки, складові слова, які потім об'єднуються у фрази. Схожі слова часто мають різні значення або декілька різних слів означають одне і те ж. Велику роль у процесі спілкування відіграють такі чинники, як вираз обличчя співрозмовника або тон його голосу. Наш мозок може однозначно інтерпретувати всі згадані вище сигнали, що значно складніше, ніж виконання повторюваних обчислень.

Історія розвитку

Перші експерименти в галузі штучного інтелекту були виконані британським математиком Аланом Тюрінгом (1912–54). У 1950 році він поставив дослід, відомий зараз як тест Тюрінга, що полягав у дистанційному спілкуванні обчислювальної машини і людини, які знаходяться в різних кімнатах. Перебуваючи в третій кімнаті, вчений використовував спосіб зв'язку, що не дозволяв визначати, хто, людина чи машина, є співрозмовником в даний момент. Тюрінг вважав, що якби машина і людина відповідали на поставлені запитання однаково, то таку машину можна було б вважати розумною.

Тест Тюрінга був багато в чому недосконалим. Наприклад, в ньому ігнорувалися такі людські якості, як чуттєве сприйняття і можливість виконання активних дій. Невірним також є припущення дослідника, що машину можна вважати розумною, навіть якщо при складанні відповіді вона просто слідує набору заданих правил. Він також не брав до уваги необхідність насамперед зрозуміти питання. Однак тест Тюрінга став важливою відправною точкою для подальших досліджень у галузі штучного інтелекту.

У 1955 році в дослідницькій організації «Ренд Корпорейшн» (м. Санта- Моніка, шт. Каліфорнія, США) Герберт Саймон, Аллен Ньюелл і Дж. К. Шоу розробили першу програму штучного інтелекту – «Лоджік сієріст». Ця комп'ютерна програма для вибору кращого рішення використовувала евристичний (базований на неформальних, заснованих на інтуїтивних міркуваннях правилах, які дозволяють скоротити кількість розглянутих варіантів) підхід. Існуючі в той час мови програмування, такі як ФОРТРАН (скорочення від англійських слів FORmula TRANslation – «перетворення формули»), призначалися для виконання чисельних розрахунків, в той час як «Лоджік сієріст» працювала з інформацією, представленою у вигляді символів. Американський дослідник Джої Маккарті з Массачусетського технологічного інституту та підставі цієї методики створив мову програмування ЛІСП (від LISt Processing – «обробка списків»), яка незабаром стала основною мовою досліджень в галузі штучного інтелекту.

Обробка інформації

Рік потому на конференції в Нью-Гемпширі було дане визначення нової наукової дисципліни – штучного інтелекту. Тут прозвучав висновок про те, що «людський розум не взаємодіє з зовнішнім світом фізично, а інтерпретує і обробляє інформацію, що надходить до нього від органів чуття. Аналогічну обробку може виконати і комп'ютер».

Існує три основних способи представлення знань: логіка предикатів, фрейми та експертні системи.

У логіці предикатів для опису висловлювань і умов, за яких вони можуть бути істинними або помилковими, використовуються математичні символи. Висловлювання виражаються у вигляді послідовностей таких символів. Цей метод дуже зручний для комп'ютерних програм, які також мають справу з послідовностями символів бінарного коду. Однак логіка предикатів – не кращий спосіб представляти такі людські поняття, як, наприклад, оцінка висловлення з погляду здорового глузду.

Ближчий до людського мислення спосіб представлення знань за допомогою фреймів – одиниць, що описують класи об'єктів або понять, а також визначають їх взаємини. Наприклад, фрейм, названий «автомобілем», означає автомобіль будь-якого виду. Сині автомобілі можуть бути описані додатком іншого фрейму, названого «синій». Перевага такого способу подання інформації полягає в простоті опису предметів і процесів, але при визначенні складних умов, залежно від яких твердження може бути істинним або хибним, кращі результати дає логіка предикатів.

Експертні системи – програми, що працюють в певних галузях знань (геологія, медицина та ін.). Ґрунтуючись на застосуванні твердо встановлених правил, програма самостійно формулює висновки. Системи з ланцюжком зворотного виведення починають роботу з формулювання твердження, яке потім буде доведене (працюють у зворотному напрямку), визначаючи набір правил, необхідний як доказ затвердження. Системи прямого формування роблять висновки на підставі введених в систему даних.

Розпізнавання образів

Важливий момент у створенні штучного інтелекту – можливість розпізнавати образи, які дозволяють комп'ютерним системам відбирати і зберігати конкретні дані для їх подальшого використання в іншій ситуації. В даний час системи розпізнавання образів знаходяться в процесі розвитку, їх практичне застосування вже включає в себе аналіз візуальних даних, подібних до метеорологічних карт і рукописних текстів.

Спроби розробити системи, що працюють на тих же принципах, що і людський мозок, привели до створення нейронних мереж – пристроїв, в яких ланцюги комп'ютера володіють характеристиками, аналогічними до характеристик ланцюгів нервових клітин головного мозку. Нейронні мережі можуть навчатися як і людський мозок, сприймаючи нову інформацію і змінюючи електричні зв'язки між різними частинами мережі.

У процесі розпізнавання образів комп'ютерні системи розбивають весь масив інформації на ряд простих компонентів (розкладання на складові частини). Потім система знову збирає дані, щоб сформувати вихідний образ з використанням створеної нею моделі. Останній етап – розпізнавання. Це аналіз компонентів нового образу з метою встановити, чи відповідає він моделі.

Найважчий момент в розпізнаванні образів – ідентифікація набору даних. Більшість систем розпізнавання образів здатні працювати з обмеженою кількістю параметрів. Але в цій області вже створені досить складні і досконалі системи, наприклад система сканування райдужної оболонки ока, що забезпечує надійний засіб ідентифікації особистості. Такі сканери вже встановлені в деяких аеропортах світу.

Розпізнавання голосу

Розпізнавання і синтез людської мови представляє одну з найбільш досліджуваних областей штучного інтелекту. Такі технології використовуються в автоматизованих банківських системах і програмах обробки мовної інформації. Наприклад, телефонні повідомлення, призначені для глухих людей, можна друкувати на папері або виводити на екран комп'ютера, а письмове повідомлення, адресоване сліпій людині, може бути вимовлене вголос. На розпізнаванні голосу ґрунтується робота багатьох систем безпеки, ключем до такої системи служить голос конкретної людини.

Системи розпізнавання голосу базуються на математичному аналізі амплітуд і частот звукових коливань. Слова складаються з серії звуків, названих фонемами. Складність полягає в тому, що існує багато інших голосових сигналів, таких як свист, шипіння, збільшення гучності, що ускладнюють розпізнавання фонем. оскільки одна і та ж фонема в різних обставинах може звучати зовсім по-різному, більшість сучасних систем реагують на обмежену кількість слів. У процесі навчання система фіксує в пам'яті вимовлені слова і зіставляє їх з буквеною формою. Потім, після статистичного аналізу та обліку правил мови, послідовність фонем перетвориться в слова.

Наступний етап – порівняння результатів аналізу із базовими словами, що зберігаються в пам'яті. Потім йде перевірка пропозиції на граматичні помилки, і фраза виводиться на монітор або принтер.

Системи синтезу мови також стикаються з аналогічними проблемами, тільки в цьому випадку завдання вирішується в зворотному порядку. Синтез мови – більш проста проблема в порівнянні з розпізнаванням, оскільки необхідно тільки зрозуміло відтворити слова, а не створювати величезний масив варіантів їх можливих вимов.

Штучний інтелект і робототехніка

Роботи – це машини, призначені для виконання механічних дій (операцій). Зараз вони широко використовуються в промисловості. Вони повинні правильно реагувати на конкретну ситуацію (реакція робота або програмується заздалегідь, або він навчається в процесі функціонування). У всіх ситуаціях роботові потрібно проаналізувати стан навколишнього середовища, потім переміститися в необхідне місце і виконати завдання при мінімальному втручанні людини. Для цього він повинен мати здатність «відчувати» середовище (мозок людини отримує інформацію про події навколо нього за допомогою органів відчуттів). На сьогоднішній день одне з головних завдань робототехніки – моделювання органів чуття.

 

Читайте також: