Trình duyệt AI dẫn dắt cuộc chiến trình duyệt lần thứ ba, tái cấu trúc tìm kiếm và mô hình tương tác.

Do vì bạn không cung cấp danh sách hình ảnh nào, tôi sẽ giữ nguyên nội dung gốc mà không chèn bất kỳ hình ảnh nào. Dưới đây là nội dung gốc đầy đủ:

Trình duyệt AI: Khởi đầu của cuộc chiến trình duyệt lần thứ ba

Cuộc chiến trình duyệt lần thứ ba đang âm thầm diễn ra. Nhìn lại lịch sử, từ Netscape của những năm 90, IE của Microsoft, đến Firefox với tinh thần mã nguồn mở và Chrome của Google, cuộc chiến trình duyệt luôn là biểu hiện tập trung của quyền kiểm soát nền tảng và sự thay đổi của các mô hình công nghệ. Chrome đã giành được vị trí thống trị nhờ tốc độ cập nhật và sự liên kết hệ sinh thái, trong khi Google thông qua cấu trúc "đôi độc quyền" giữa tìm kiếm và trình duyệt đã hình thành một vòng tròn khép kín của thông tin.

Tuy nhiên, hôm nay, cấu trúc này đang bị lung lay. Sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM) khiến ngày càng nhiều người dùng hoàn thành nhiệm vụ trên trang kết quả tìm kiếm mà không cần nhấp chuột, hành vi nhấp chuột vào các trang web truyền thống đang giảm. Đồng thời, tin đồn về việc Apple có thể thay thế công cụ tìm kiếm mặc định trong Safari càng đe dọa đến lợi nhuận cốt lõi của Alphabet, thị trường đã bắt đầu bộc lộ sự bất an đối với "chính thống tìm kiếm".

Trình duyệt cũng đang đối mặt với việc tái cấu trúc vai trò. Nó không chỉ là công cụ hiển thị trang web, mà còn là một tập hợp các khả năng như nhập dữ liệu, hành vi người dùng, danh tính riêng tư, v.v. AI Agent rất mạnh, nhưng để hoàn thành các tương tác trang phức tạp, gọi dữ liệu danh tính địa phương và điều khiển các yếu tố trên trang web, vẫn cần dựa vào ranh giới tin cậy và hộp cát chức năng của trình duyệt. Trình duyệt đang chuyển từ giao diện con người sang nền tảng gọi hệ thống của Agent.

Điều thực sự có thể phá vỡ cấu trúc thị trường trình duyệt hiện tại không phải là một "Chrome tốt hơn", mà là một cấu trúc tương tác mới: không phải là việc trình bày thông tin, mà là việc gọi nhiệm vụ. Trình duyệt tương lai cần được thiết kế cho AI Agent - không chỉ có thể đọc, mà còn có thể viết và thực thi. Các dự án như Browser Use đang cố gắng ngữ nghĩa hóa cấu trúc trang, biến giao diện trực quan thành văn bản có cấu trúc có thể được LLM gọi, thực hiện ánh xạ từ trang đến lệnh, giảm thiểu chi phí tương tác một cách đáng kể.

Các dự án chính thống trên thị trường đã bắt đầu thử nghiệm: Perplexity xây dựng trình duyệt gốc Comet, sử dụng AI để thay thế kết quả tìm kiếm truyền thống; Brave kết hợp bảo vệ quyền riêng tư với suy luận cục bộ, sử dụng LLM để tăng cường chức năng tìm kiếm và chặn; trong khi các dự án gốc Crypto như Donut lại nhắm đến một cổng mới cho sự tương tác giữa AI và tài sản trên chuỗi. Những dự án này có đặc điểm chung là: cố gắng tái cấu trúc đầu vào của trình duyệt, thay vì làm đẹp lớp đầu ra của nó.

Đối với các doanh nhân, cơ hội nằm trong mối quan hệ tam giác giữa đầu vào, cấu trúc và đại lý. Trình duyệt như một giao diện để các Agent gọi thế giới trong tương lai, có nghĩa là ai có thể cung cấp các "khối khả năng" có thể cấu trúc, có thể gọi và đáng tin cậy, người đó sẽ trở thành một phần của nền tảng thế hệ mới. Từ SEO đến AEO (Tối ưu hóa động cơ đại lý), từ lưu lượng trang đến gọi chuỗi nhiệm vụ, hình thức sản phẩm và tư duy thiết kế đang được tái cấu trúc. Cuộc chiến trình duyệt lần thứ ba diễn ra ở "đầu vào" chứ không phải "trình bày"; người quyết định thắng thua không còn là ai thu hút được sự chú ý của người dùng, mà là ai giành được lòng tin của Agent, để có được lối vào để gọi.

Lịch sử phát triển của trình duyệt

Vào đầu những năm 90, khi internet chưa trở thành một phần trong cuộc sống hàng ngày, Netscape Navigator đã xuất hiện như một chiếc thuyền buồm mở ra một vùng đất mới, mở ra cánh cửa vào thế giới số cho hàng triệu người dùng. Trình duyệt này không phải là trình duyệt đầu tiên, nhưng là sản phẩm đầu tiên thực sự hướng tới đại chúng, định hình trải nghiệm internet. Vào thời điểm đó, con người lần đầu tiên có thể dễ dàng duyệt web qua giao diện đồ họa, như thể toàn bộ thế giới bỗng chốc trở nên trong tầm tay.

Tuy nhiên, vinh quang thường ngắn ngủi. Microsoft nhanh chóng nhận ra tầm quan trọng của trình duyệt và quyết định ép buộc Internet Explorer vào hệ điều hành Windows, biến nó thành trình duyệt mặc định. Chiến lược này được coi là "vũ khí sát thương của nền tảng", trực tiếp làm sụp đổ vị thế thị trường của Netscape. Nhiều người dùng không phải tự chọn IE, mà là vì nó được hệ thống mặc định chấp nhận. IE, nhờ vào khả năng phân phối của Windows, nhanh chóng trở thành bá chủ trong ngành, trong khi Netscape rơi vào con đường suy tàn.

Trong hoàn cảnh khó khăn, các kỹ sư của Netscape đã chọn một con đường cấp tiến và lý tưởng - họ đã công khai mã nguồn của trình duyệt, kêu gọi cộng đồng mã nguồn mở. Quyết định này như một "sự nhượng bộ kiểu Macedonia" trong giới công nghệ, báo hiệu sự kết thúc của một kỷ nguyên cũ và sự trỗi dậy của sức mạnh mới. Đoạn mã này sau đó trở thành nền tảng cho dự án trình duyệt Mozilla, ban đầu được đặt tên là Phoenix (có nghĩa là Phượng Hoàng tái sinh), nhưng do vấn đề thương hiệu đã trải qua nhiều lần đổi tên, cuối cùng được gọi là Firefox.

Firefox không chỉ đơn thuần là bản sao của Netscape, mà còn đạt được nhiều đột phá trong trải nghiệm người dùng, hệ sinh thái plugin, và an ninh. Sự ra đời của nó đánh dấu chiến thắng của tinh thần mã nguồn mở, đồng thời tiếp thêm sức sống mới cho toàn ngành. Có người mô tả Firefox là "người kế thừa tinh thần" của Netscape, giống như Đế chế Ottoman kế thừa ánh hào quang còn lại của Đế chế Byzantine. So sánh này mặc dù có phần phóng đại, nhưng lại rất có ý nghĩa.

Nhưng trước khi Firefox chính thức phát hành, Microsoft đã phát hành sáu phiên bản IE, với lợi thế về thời gian và chiến lược gói hệ thống, khiến Firefox ngay từ đầu đã ở vị trí phải chạy đuổi, định sẵn rằng cuộc đua này không phải là một cuộc cạnh tranh công bằng với xuất phát điểm bình đẳng.

Trong khi đó, một người chơi sớm khác cũng âm thầm xuất hiện. Năm 1994, trình duyệt Opera ra mắt, xuất xứ từ Na Uy, ban đầu chỉ là một dự án thử nghiệm. Nhưng từ phiên bản 7.0 vào năm 2003, nó đã giới thiệu động cơ Presto tự phát triển, tiên phong hỗ trợ CSS, bố cục thích ứng, điều khiển bằng giọng nói và mã hóa Unicode cùng các công nghệ tiên tiến khác. Mặc dù số lượng người dùng hạn chế, nhưng về mặt công nghệ, nó luôn đi đầu trong ngành và trở thành "món yêu thích của những người đam mê công nghệ".

Cùng năm đó, Apple đã ra mắt trình duyệt Safari. Đây là một bước ngoặt đầy ý nghĩa. Lúc đó, Microsoft đã đầu tư 150 triệu đô la vào Apple, đang bên bờ vực phá sản, để duy trì vẻ bề ngoài cạnh tranh và tránh sự xem xét chống độc quyền. Mặc dù công cụ tìm kiếm mặc định của Safari từ khi ra đời là Google, nhưng mối quan hệ lịch sử với Microsoft tượng trưng cho sự phức tạp và tinh tế giữa các ông lớn Internet: hợp tác và cạnh tranh, luôn luôn song hành.

Năm 2007, IE7 được phát hành cùng với Windows Vista, nhưng phản hồi từ thị trường không mấy khả quan. Ngược lại, Firefox, nhờ vào nhịp độ cập nhật nhanh hơn, cơ chế mở rộng thân thiện hơn và sức hấp dẫn tự nhiên đối với các nhà phát triển, đã ổn định tăng thị phần lên khoảng 20%. Sự thống trị của IE đang dần bị lung lay, xu hướng đang thay đổi.

Google lại là một cách tiếp cận khác. Mặc dù bắt đầu chuẩn bị để phát triển trình duyệt riêng từ năm 2001, nhưng họ đã mất sáu năm để thuyết phục CEO Eric Schmidt phê duyệt dự án này. Chrome ra mắt vào năm 2008, được xây dựng dựa trên dự án mã nguồn mở Chromium và công nghệ WebKit mà Safari sử dụng. Nó bị châm biếm là một trình duyệt "cồng kềnh", nhưng nhờ vào khả năng sâu sắc của Google trong quảng cáo và xây dựng thương hiệu, nó đã nhanh chóng nổi lên.

Vũ khí chính của Chrome không phải là tính năng, mà là nhịp độ cập nhật phiên bản thường xuyên (mỗi sáu tuần một lần) và trải nghiệm thống nhất trên toàn nền tảng. Vào tháng 11 năm 2011, Chrome lần đầu tiên vượt qua Firefox với thị phần đạt 27%; sau sáu tháng, lại vượt qua IE, hoàn thành sự chuyển mình từ kẻ thách thức thành người thống trị.

Trong khi đó, internet di động của Trung Quốc cũng đang hình thành hệ sinh thái riêng của mình. Trình duyệt UC thuộc sở hữu của một công ty nào đó đã nhanh chóng nổi bật vào đầu những năm 2010, đặc biệt là ở các thị trường mới nổi như Ấn Độ, Indonesia và Trung Quốc, nhờ vào thiết kế nhẹ, nén dữ liệu tiết kiệm băng thông và các tính năng khác, đã chiếm được cảm tình của người dùng thiết bị giá rẻ. Năm 2015, thị phần trình duyệt di động toàn cầu của nó đã vượt qua 17%, và tại Ấn Độ, từng đạt tới 46%. Tuy nhiên, chiến thắng này không kéo dài. Khi chính phủ Ấn Độ tăng cường kiểm tra an ninh đối với các ứng dụng của Trung Quốc, trình duyệt UC buộc phải rút lui khỏi thị trường quan trọng và dần mất đi sự huy hoàng trước đây.

Bước vào thập kỷ 2020, vị thế thống trị của Chrome đã được thiết lập, với thị phần toàn cầu ổn định ở khoảng 65%. Đáng chú ý là, mặc dù công cụ tìm kiếm Google và trình duyệt Chrome đều thuộc về Alphabet, nhưng từ góc độ thị trường, chúng lại là hai hệ thống độc quyền độc lập - cái trước kiểm soát khoảng chín phần mười lối vào tìm kiếm toàn cầu, trong khi cái sau nắm giữ "cửa sổ đầu tiên" mà hầu hết người dùng vào mạng.

Để bảo vệ cấu trúc độc quyền kép này, Google không tiếc tiền đầu tư. Năm 2022, Alphabet đã trả khoảng 20 tỷ USD cho Apple chỉ để giữ cho Google ở vị trí tìm kiếm mặc định trong Safari. Một số phân tích chỉ ra rằng khoản chi này tương đương với 36% doanh thu quảng cáo tìm kiếm mà Google thu được từ lưu lượng truy cập Safari. Nói cách khác, Google đang trả "phí bảo vệ" cho bức tường thành của mình.

Nhưng hướng gió lại một lần nữa thay đổi. Với sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM), tìm kiếm truyền thống bắt đầu bị ảnh hưởng. Năm 2024, thị phần tìm kiếm của Google giảm từ 93% xuống 89%, mặc dù vẫn thống trị, nhưng đã xuất hiện vết nứt. Điều mang tính phá cách hơn, là tin đồn về việc Apple có thể ra mắt công cụ tìm kiếm AI riêng - nếu Safari chuyển đổi tìm kiếm mặc định sang hệ sinh thái của chính mình, điều này không chỉ sẽ viết lại cấu trúc sinh thái, mà còn có thể làm rung chuyển trụ cột lợi nhuận của Alphabet. Thị trường phản ứng nhanh chóng, giá cổ phiếu Alphabet từ 170 đô la giảm xuống 140 đô la, phản ánh không chỉ là sự hoảng loạn của nhà đầu tư, mà còn là sự bất an sâu sắc về hướng đi tương lai của thời đại tìm kiếm.

Từ Navigator đến Chrome, từ lý tưởng mã nguồn mở đến thương mại hóa quảng cáo, từ trình duyệt nhẹ đến trợ lý tìm kiếm AI, cuộc chiến trình duyệt luôn là một cuộc chiến về công nghệ, nền tảng, nội dung và quyền kiểm soát. Chiến trường liên tục di chuyển, nhưng bản chất không bao giờ thay đổi: ai nắm giữ cổng vào, người đó sẽ định nghĩa tương lai.

Trong con mắt của VC, dựa trên nhu cầu mới của con người đối với công cụ tìm kiếm trong thời đại LLM và AI, cuộc chiến trình duyệt lần thứ ba đang dần được mở ra. Dưới đây là một số thông tin về tình hình tài chính của các dự án nổi tiếng trong lĩnh vực trình duyệt AI.

Kiến trúc cũ của trình duyệt hiện đại

Khi nói về kiến trúc của trình duyệt, kiến trúc truyền thống cổ điển được thể hiện trong hình dưới đây:

Khách hàng - Cổng vào phía trước

Kiểm tra Google Front End gần nhất được gửi qua HTTPS, hoàn thành giải mã TLS, lấy mẫu QoS và định tuyến địa lý. Nếu phát hiện lưu lượng bất thường (DDoS, tự động thu thập), có thể giới hạn lưu lượng hoặc thách thức ở tầng này.

Hiểu biết về truy vấn

Phía trước cần hiểu ý nghĩa của từ mà người dùng nhập, có ba bước: sửa lỗi chính tả thần kinh, sửa "recpie" thành "recipe"; mở rộng từ đồng nghĩa, mở rộng "how to fix bike" thành "repair bicycle". Phân tích ý định, xác định truy vấn là thông tin, định hướng hay ý định giao dịch, và phân bổ yêu cầu Vertical.

Khôi phục đề cử

Công nghệ truy vấn được sử dụng bởi một công cụ tìm kiếm nào đó được gọi là: chỉ mục đảo ngược. Trong chỉ mục tuần tự, chúng ta chỉ cần một ID là có thể chỉ mục đến tệp. Tuy nhiên, người dùng không thể biết nội dung mà họ muốn nằm ở số thứ tự nào trong hàng trăm tỷ tệp, vì vậy họ đã sử dụng một chỉ mục đảo ngược rất truyền thống, để tìm kiếm những tệp nào có từ khóa tương ứng thông qua nội dung. Tiếp theo, công cụ tìm kiếm này đã áp dụng chỉ mục vector để xử lý tìm kiếm ngữ nghĩa, tức là tìm kiếm nội dung có nghĩa tương tự với truy vấn. Nó sẽ chuyển đổi văn bản, hình ảnh và các nội dung khác thành vector nhiều chiều (embedding), và thực hiện tìm kiếm dựa trên độ tương đồng giữa các vector này. Ví dụ, ngay cả khi người dùng tìm kiếm "cách làm bột pizza", công cụ tìm kiếm cũng có thể trả về kết quả liên quan đến "hướng dẫn làm bột pizza", vì chúng có sự tương đồng về ngữ nghĩa. Qua quá trình chỉ mục đảo ngược và chỉ mục vector, khoảng hàng trăm nghìn trang web sẽ được sàng lọc ban đầu.

Sắp xếp nhiều cấp

Hệ thống thường sử dụng BM25, TF-IDF, điểm chất lượng trang và hàng nghìn đặc trưng nhẹ khác, để lọc hàng trăm nghìn trang ứng cử viên xuống còn khoảng 1000 trang, tạo thành bộ ứng cử viên ban đầu. Những hệ thống này được gọi chung là công cụ gợi ý. Chúng phụ thuộc vào nhiều đặc trưng khổng lồ được tạo ra từ nhiều thực thể, bao gồm hành vi người dùng, thuộc tính trang, ý định truy vấn và tín hiệu ngữ cảnh. Ví dụ, một công cụ tìm kiếm sẽ tổng hợp lịch sử người dùng, phản hồi hành vi của người dùng khác, ngữ nghĩa trang, ý nghĩa truy vấn và các thông tin khác, đồng thời cũng xem xét các yếu tố ngữ cảnh như thời gian (thời điểm trong ngày, ngày cụ thể trong tuần) và các sự kiện bên ngoài như tin tức thời sự.

Học sâu để thực hiện phân loại chính

Trong giai đoạn tìm kiếm ban đầu, một công cụ tìm kiếm sử dụng các công nghệ như RankBrain và Neural Matching để hiểu nghĩa của truy vấn và lọc ra các kết quả ban đầu liên quan từ một khối lượng tài liệu khổng lồ. RankBrain là một hệ thống học máy được công cụ tìm kiếm này giới thiệu vào năm 2015, nhằm hiểu rõ hơn về ý nghĩa của các truy vấn của người dùng, đặc biệt là những truy vấn xuất hiện lần đầu. Nó chuyển đổi các truy vấn và tài liệu thành các biểu diễn vector, tính toán sự tương đồng giữa chúng để tìm ra các kết quả liên quan nhất. Ví dụ, đối với truy vấn "làm thế nào để làm bột pizza", ngay cả khi tài liệu không có từ khóa khớp hoàn toàn, RankBrain vẫn có thể nhận diện nội dung liên quan đến "cơ sở pizza" hoặc "làm bột".

Neural Matching là một công nghệ khác được một công cụ tìm kiếm ra mắt vào năm 2018, nhằm hiểu sâu hơn về mối quan hệ giữa truy vấn và tài liệu.

AGENT-3.14%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
RooftopVIPvip
· 08-16 22:12
Cảm giác IE sắp trở lại rồi nhỉ
Xem bản gốcTrả lời0
BlockchainFriesvip
· 08-16 22:10
Lại là người đổi da nữa.
Xem bản gốcTrả lời0
WalletsWatchervip
· 08-16 22:10
Bây giờ việc tìm kiếm giống như một vật trang trí.
Xem bản gốcTrả lời0
fren.ethvip
· 08-16 21:54
À lại nhớ đến sự giật lag ngột ngạt của ie
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)