Революція браузерів в епоху ШІ: від пошукових систем до розумної платформи代理

2025-07-09 21:54:49

Революція браузерів в епоху ШІ: від пошуку до розумних агентів

Третя війна браузерів тихо розгортається. Від Netscape і IE від Microsoft у 90-х роках до Firefox з відкритим кодом і Chrome від Google, боротьба браузерів завжди була концентрованим відображенням контролю над платформою та зміни технологічних парадигм. Chrome завоював домінуючу позицію завдяки швидкості оновлень та екологічній інтеграції, а Google сформував замкнуту структуру інформаційного входу через "подвійний олігарх" у пошуку та браузері.

Однак ця структура починає хитатися. Поява великих мовних моделей (LLM) призводить до того, що все більше користувачів виконують завдання на сторінці результатів пошуку без "кліків", традиційна поведінка натискання на веб-сторінки зменшується. Водночас чутки про те, що певний технологічний гігант може замінити пошукову систему за замовчуванням у своєму браузері, ще більше загрожують прибуткам материнської компанії Google, і ринок вже починає виявляти занепокоєння щодо "ортодоксії пошуку".

Браузер сам по собі також стикається з перебудовою ролі. Він більше не просто інструмент для відображення веб-сторінок, а є контейнером, що об'єднує різні можливості, такі як введення даних, поведінка користувачів, конфіденційність та ідентичність. AI Agent хоч і потужний, але для здійснення складних взаємодій на сторінці, виклику локальних даних про особу, контролю елементів веб-сторінки все ще потрібно покладатися на довірчі межі та функціональний пісочницю браузера. Браузер перетворюється з людського інтерфейсу на платформу системних викликів для агентів.

Справжнім можливим зламом поточної ринкової структури браузерів стане не ще один "кращий Chrome", а нова структура взаємодії: не лише показ інформації, а виклик завдань. Майбутні браузери мають бути спроектовані для AI Agent - вони повинні не лише читати, а й писати і виконувати. Деякі проекти намагаються семантизувати структуру сторінки, перетворюючи візуальний інтерфейс на структурований текст, доступний для виклику LLM, що значно знижує витрати на взаємодію.

Основні проекти на ринку вже почали тестувати нові підходи: один AI пошуковик створює рідний браузер, замінюючи традиційні результати пошуку AI; один браузер поєднує захист конфіденційності з локальним висновком, використовуючи LLM для покращення функцій пошуку та блокування; а деякі проекти, що є рідними для Web3, намагаються знайти нові входи для взаємодії AI з активами на блокчейні. Спільною рисою цих проєктів є спроба реконструювати вхідну частину браузера, а не покращувати його вихідний рівень.

Для підприємців можливості приховані в трикутних відносинах між введенням, структурою та агентством. Браузер як інтерфейс для виклику світу в майбутньому агента означає, що той, хто може надати структуровані, викликаємі, надійні "блоки можливостей", стане частиною нового покоління платформ. Від SEO до AEO (оптимізація двигунів агентів), від трафіку сторінок до викликів ланцюга завдань, форма продукту та дизайнерське мислення зазнають реконструкції. Третя війна браузерів відбувається в "введенні", а не в "представленні"; вирішальним фактором більше не є те, хто приверне увагу користувачів, а хто завоює довіру агента та отримає доступ до виклику.

Історія розвитку браузерів

На початку 90-х років минулого століття з'явився Netscape Navigator, який відкрив двері до цифрового світу для мільйонів користувачів. Цей браузер не був першим, але став першим продуктом, який справді став популярним серед широкої аудиторії і сформував інтернет-досвід.

Microsoft швидко усвідомив важливість браузера і вирішив примусово вбудувати Internet Explorer у операційну систему Windows, зробивши його браузером за замовчуванням. Ця стратегія стала "вбивцею платформ", що безпосередньо підірвало домінування Netscape на ринку.

У складних обставинах інженери Netscape обрали радикальний і ідеалістичний шлях — вони відкрили вихідний код браузера, закликавши відкриту спільноту. Цей код згодом став основою проекту браузера Mozilla, який врешті-решт отримав назву Firefox.

Водночас з'явився браузер Opera, який походить з Норвегії і спочатку був лише експериментальним проектом. Але з версії 7.0 2003 року він впровадив власний двигун Presto, першим підтримав CSS, адаптивну верстку, голосове керування та кодування Unicode та інші передові технології.

Того ж року один з технологічних гігантів випустив свій власний браузер. Це стало знаковим поворотом. Тоді Майкрософт інвестував 150 мільйонів доларів у цю компанію, яка була на межі банкрутства, щоб підтримувати конкуренцію та уникнути антимонопольного розслідування.

У 2007 році IE7 вийшов разом із Windows Vista, але відгуки на ринку були посередніми. Натомість Firefox, завдяки швидшому темпу оновлень, більш дружній механіці розширень та природному привабленню для розробників, стабільно збільшив свою частку на ринку до близько 20%. Панування IE поступово слабшає, вітри змінюються.

Google є ще одним підходом. Chrome з'явився в 2008 році, створений на основі відкритого проекту Chromium і движка WebKit, який використовує Safari. Його жартівливо називають "громіздким" браузером, але завдяки глибоким знанням Google у рекламі та формуванні бренду він швидко зріс.

Ключовою зброєю Chrome є не функції, а часті оновлення версій (кожні шість тижнів) та єдиний досвід на всіх платформах. У листопаді 2011 року Chrome вперше перевищив Firefox, досягнувши 27% частки ринку; через шість місяців він знову обігнав IE, завершивши перехід від конкурента до домінуючого.

У 2020-х роках домінування Chrome вже закріплене, глобальна частка ринку стабільно становить близько 65%. Варто зазначити, що хоча пошукова система Google та браузер Chrome належать одній компанії, з ринкової точки зору вони є двома незалежними гегемонічними системами --- перша контролює близько дев'яносто відсотків пошукових входів у світі, тоді як друга контролює більшість користувачів, які входять в інтернет через "перше вікно".

Щоб утримати цю подвійні монопольну структуру, компанія не шкодує витрат. У 2022 році вона сплатила приблизно 20 мільярдів доларів певному технологічному гіганту лише для того, щоб Google залишався за замовчуванням пошуковою системою в її браузері. Ця сума витрат еквівалентна 36% доходів від пошукової реклами, які Google отримує з трафіку цього браузера. Іншими словами, Google платить "захисний збір" за свій захисний вал.

Але вітер знову змінився. Зі зростанням великих мовних моделей (LLM) традиційний пошук почав зазнавати удару. У 2024 році частка ринку пошуку Google впала з 93% до 89%, хоча він все ще домінує, але тріщини вже проявляються. Ще більш руйнівним є чутка про те, що один з технологічних гігантів може запустити власну AI пошукову систему - якщо їхній пошук за замовчуванням перейде до власного табору, це не тільки перепише екологічний ландшафт, але й може похитнути основні прибутки материнської компанії Google. Ринок швидко реагує, акції компанії впали з 170 доларів до 140 доларів, що відображає не лише паніку інвесторів, але й глибокий неспокій щодо майбутнього епохи пошуку.

Від Navigator до Chrome, від ідеалів відкритого коду до комерціалізації реклами, від легкого браузера до AI-пошукового помічника, боротьба браузерів завжди була війною про технології, платформи, контент та контроль. Поле бою постійно змінюється, але суть ніколи не змінюється: хто контролює вхід, той визначає майбутнє.

У очах венчурних капіталістів, спираючись на нові потреби людей у пошукових системах епохи LLM та AI, третя війна браузерів поступово розгортається.

Старовинна архітектура сучасних браузерів

Щодо архітектури браузера, класична традиційна архітектура виглядає наступним чином:

Клієнт - фронтальний вхід

Запит через HTTPS до найближчого фронтенду, завершення TLS-розшифрування, QoS-ін sampling та географічний маршрутизація. Якщо виявлено аномальний трафік (DDoS, автоматичне збори), на цьому рівні можна обмежити потік або кинути виклик.

Розуміння запиту

Передня частина повинна розуміти значення слів, введених користувачем, і має три етапи: нейронна перевірка правопису, виправлення "recpie" на "recipe"; розширення синонімів, розширення "how to fix bike" на "repair bicycle". Аналіз намірів, визначення запиту як інформаційного, навігаційного чи торгового наміру та розподіл запитів Vertical.

Вибірковий виклик

Технологія запитів, яка використовується в пошукових системах, називається: зворотний індекс. У прямому індексі ми можемо проіндексувати файл, просто знаючи його ID. Однак користувач не може знати номер вмісту серед тисяч мільярдів файлів, тому використовується дуже традиційний зворотний індекс, що дозволяє шукати файли за ключовими словами. Далі використовується векторний індекс для обробки семантичного пошуку, тобто для пошуку вмісту, схожого за значенням на запит. Він перетворює текст, зображення та інші вмісти в багатовимірні вектори (embedding) і здійснює пошук на основі схожості між цими векторами. Наприклад, навіть якщо користувач шукає "як приготувати тісто для піци", пошукова система може повернути результати, пов'язані з "посібником по приготуванню тіста для піци", оскільки вони семантично схожі. Після зворотного індексу та векторного індексу приблизно сто тисяч веб-сторінок буде відфільтровано.

Багаторівневе сортування

Системи зазвичай фільтрують кандидати з масштабу ста тисяч сторінок до приблизно 1000 статей за допомогою тисячі легких ознак, таких як BM25, TF-IDF, оцінка якості сторінки тощо, формуючи попередній набір кандидатів. Такі системи загалом називаються рекомендуючими системами. Вони залежать від великої кількості ознак, створених різними сутностями, включаючи поведінку користувачів, властивості сторінок, наміри запитів та контекстуальні сигнали. Наприклад, вони комбінують інформацію про історію користувача, відгуки інших користувачів, семантику сторінки, значення запиту тощо, а також враховують контекстуальні фактори, такі як час (періоди дня, конкретні дні тижня) та зовнішні події, такі як актуальні новини.

Глибоке навчання для основного ранжування

На етапі попереднього пошуку використовуються такі технології, як RankBrain та Neural Matching, щоб зрозуміти семантику запиту та відфільтрувати попередньо відповідні результати з величезної кількості документів. RankBrain – це система машинного навчання, яку Google впровадив у 2015 році, щоб краще зрозуміти значення запитів користувачів, особливо тих, які виникають вперше. Вона перетворює запити та документи на векторні подання, обчислює їхню схожість, щоб знайти найбільш релевантні результати. Наприклад, для запиту "як зробити тісто для піци", навіть якщо в документі немає повного збігу ключових слів, RankBrain може визначити вміст, пов'язаний з "основою піци" або "приготуванням тіста".

Neural Matching — це ще одна технологія, яку Google представив у 2018 році, що має на меті глибше зрозуміти семантичні зв'язки між запитами та документами. Вона використовує моделі нейронних мереж для виявлення неясних зв'язків між словами, що допомагає краще узгоджувати запити та вміст веб-сторінок. Наприклад, для запиту "чому мій вентилятор ноутбука так голосно працює", Neural Matching може зрозуміти, що користувач, можливо, шукає інформацію про усунення несправностей, пов'язаних з перегрівом, накопиченням пилу або високим використанням ЦП, навіть якщо ці слова не з'являються безпосередньо у запиті.

Глибоке перепорядкування: застосування моделі BERT

Після попереднього відбору відповідних документів, модель BERT (Bidirectional Encoder Representations from Transformers) використовується для більш детального ранжування цих документів, щоб забезпечити, що найбільш релевантні результати знаходяться на передніх позиціях. BERT є попередньо навченою мовною моделлю на основі Transformer, здатною розуміти контекстуальні зв'язки слів у реченні. У пошуку BERT використовується для повторного ранжування попередньо знайдених документів. Він шляхом спільного кодування запиту та документів обчислює оцінку релевантності між ними, що дозволяє повторно ранжувати документи. Наприклад, для запиту "паркування на безкрайній схилі" BERT може зрозуміти значення "без краю" і повернути рекомендацію водієві повернути колеса у бік узбіччя, а не неправильно зрозуміти ситуацію з наявністю краю.

Це типова робоча схема пошукових систем. Але в умовах сучасної ери вибуху штучного інтелекту та великих даних, у користувачів виникли нові вимоги до взаємодії з браузерами.

Чому ШІ переосмислює браузери

По-перше, нам потрібно чітко зрозуміти, чому браузер у такій формі все ще існує? Чи існує третя форма, крім агентів штучного інтелекту та браузерів?

Ми вважаємо, що існування є незамінним. Чому штучний інтелект може використовувати браузер, але не може повністю його замінити? Тому що браузер є універсальною платформою, не лише входом для читання даних, але й загальним входом для введення даних. У цьому світі не може бути лише введення інформації, також необхідно генерувати дані та взаємодіяти з веб-сайтами, тому браузери, які інтегрують персоналізовану інформацію користувачів, все ще будуть широко існувати.

Ми схопили цю думку: браузер як загальний вхід не тільки для читання даних, користувачам часто потрібно взаємодіяти з даними. Сам браузер є відмінним місцем для зберігання відбитків пальців користувачів. Більш складна поведінка користувачів та автоматизовані дії повинні базуватися на браузері.

AGENT-4.57%

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

23 лайків